RAG (RAG) — 쉬운 기술 사전

시험을 보는 방법은 두 가지예요. 아무것도 없이 들어가서 기억에 의존해 답하거나, 책을 펼쳐 놓고 필요한 페이지를 찾아 답하거나. AI는 기본적으로 전자예요. RAG는 AI에게 그 책을 건네는 방법이에요.

닫힌 책의 문제는 이렇게 생겨요. 모델은 훈련 중에 흡수한 내용으로 답해요. 마치 학생이 평생 읽은 것을 머릿속에서 끌어내듯이요. 그런데 내 것을 물어보면 벽에 부딪혀요. 우리 회사 계약서, 가격표, 지난주 수치, 고객 지원 문서. 그 모델이 공부한 책에는 그런 내용이 없거든요. 그래서 환각이 생겨요. 모델은 그래도 자신 있게 답해요. 맞는 것처럼 들리는 무언가를 만들어내요. 자신감은 있지만, 틀렸어요.

RAG는 시험을 오픈북으로 바꿔줘요. RAG는 retrieval-augmented generation의 약자로, 길어 보이지만 개념은 단순해요. 모델이 답하기 전에, 내 문서에서 관련 페이지를 먼저 가져와 컨텍스트 윈도우에 집어넣어요. 그러면 모델은 기억이 아니라 눈앞에 펼쳐진 페이지를 보고 답하게 돼요.

이 구조의 엔진은 벡터 데이터베이스예요. 질문을 의미의 지도 위에 올려놓고 가장 가까운 문서 조각을 가져오는 과정, 그게 바로 "검색(retrieval)" 절반이에요. RAG는 그 전체 흐름이에요.

질문을 던져요.
문서 전체를 대상으로 검색이 실행돼요. 정확한 단어가 아닌 의미 기준으로 가장 관련 있는 조각 몇 개를 가져와요. 이게 임베딩이에요.
그 조각들이 프롬프트에 붙여 넣어져요. 모델은 추측이 아니라 실제로 찾은 내용을 바탕으로 답을 써요.

전부 이것뿐이에요. 모델이 더 똑똑해진 게 아니에요. 그저 기억에서 꺼내는 대신, 먼저 찾아보기 시작한 거예요.

"우리 회사를 아는 AI"라는 패턴의 배경이 바로 이거예요. 고객 지원 센터 문서를 바탕으로 답하는 챗봇, 사내 정책을 그대로 인용해주는 어시스턴트, 200페이지 계약서를 읽고 중요한 조항 하나를 짚어주는 도구. 이것들 중 어느 것도 별도로 훈련된 게 아니에요. 누군가가 평범한 모델을 문서 더미에 연결하고, 말하기 전에 먼저 찾아보라고 한 거예요.

솔직히 말하면, 벡터 데이터베이스와 같은 함정이 있어요. RAG는 검색 결과만큼만 잘 답해요. 엉뚱한 페이지를 건네면, 그 엉뚱한 페이지를 자신 있게 인용해요. 질문이 문서에서 다루지 않는 내용에 닿으면, 그래도 가장 가까워 보이는 페이지를 가져와 거기서 답해요. 비슷하게 생겼지만 틀린 내용일 수 있어요. AI가 내 문서를 근거로 답하는데 뭔가 미묘하게 어긋나 있다면, 대부분 여기서 어긋난 거예요. 올바른 페이지가 아니라, 가장 비슷해 보이는 페이지를 찾은 거니까요.

AI가 내 세계를 알게 하는 두 번째 방법도 있어요. 반대 방향의 접근이에요. 책을 건네는 대신, 머릿속에 든 것 자체를 바꾸는 거예요. 그게 파인튜닝이에요.

닫힌 책의 AI는 추측해요. 열린 책의 AI는 먼저 찾아봐요. RAG는 그 열린 책이에요.