미식가의 개발 일기

RAG: LLM의 한계를 넘은 검색하는 인공지능 본문

ML, DL

RAG: LLM의 한계를 넘은 검색하는 인공지능

대체불가 핫걸 2025. 5. 7. 10:42

1️⃣ RAG(Retrieval-Augmented Generation)란?

LLM이 스스로 알지 못하는 정보도 "찾아서" 답변할 수 있게 만들어주는 방식

출처: https://blog-ko.allganize.ai/retrieval-augmented-generation-rag-reduce-hallucinations-enterprise-ai/

 

RAG는 Retrieval(검색)과 Generation(생성)을 결합한 AI 아키텍처이다.

기존의 언어 모델이 모든 정보를 "암기"한 상태에서 응답을 생성하는 방식이었다면, RAG는 외부 지식원을 실시간으로 "검색"하여 그 정보를 바탕으로 응답을 생성한다. 이는 특히 최신 정보 반영이 어려운 LLM의 구조적 한계를 극복하기 위한 접근 방식이다.

 

2️⃣ RAG의 구성 요소

🔔 1. Retriever (검색기)

사용자의 질문과 관련된 정보를 외부 데이터(문서, 위키피디아, 데이터베이스 등)에서 검색해 벡터화한다.

벡터화란, 텍스트를 수치화된 고차원 공간 상의 임베딩(embedding)으로 변환하는 과정을 의미한다.

이후 검색된 벡터들 중 질문과 가장 관련성이 높은 것들을 선별하게 된다.

 

<검색 방식 종류>

  • Cosine Similarity 기반 Top-K 검색: 유사도가 높은 문서를 상위 K개 선택한다.
  • MMR(Maximal Marginal Relevance): 중복 없이 다양하면서도 관련성 높은 결과를 선택한다.
  • Hybrid Search (BM25 + Embedding 기반): 전통적인 키워드 기반 검색(BM25)과 의미 기반 검색(임베딩)을 결합하여 검색의 정밀도를 높인다.

 

🔔 2. Augmentation (증강기)

검색된 정보는 그대로 사용할 수 없기 때문에, 길이 제한이나 문맥 정합성을 고려해 전처리된다.

긴 문서는 청킹(chunking)을 통해 잘게 나누고, 요약 또는 정제 과정을 거쳐 언어 모델이 이해 가능한 문맥으로 가공된다.

 

🔔 3. Generator (생성기)

최종적으로 언어 모델(예: GPT, LLaMA 등)이 전처리된 정보를 바탕으로 자연어 응답을 생성한다.

이때 생성되는 응답은 기존 LLM의 추론 능력과 검색 정보가 결합된 결과물이다.

 

3️⃣ RAG의 장점

  • 최신 정보 반영 가능
    모델이 사전에 학습하지 않은 최신 데이터도 검색을 통해 활용할 수 있다.
  • 모델 용량 한계 극복
    모든 지식을 모델에 넣지 않고도 외부 DB를 통해 유연하게 대응할 수 있다.
  • 환각(hallucination) 감소
    생성 모델이 무작위로 추론하지 않고, 실제 정보에 기반한 응답을 생성하기 때문에 신뢰도가 높다.

 

4️⃣ RAG의 한계점

  • 검색 품질에 따라 생성 품질이 결정
    검색기가 적절한 정보를 찾지 못하면 생성 결과도 부정확해진다.
  • 응답 시간
    실시간 검색 및 전처리 과정이 추가되어 일반적인 LLM보다 느릴 수 있다.
  • 정보가 제한적이면 효과가 떨어짐 
    내부 DB나 문서가 부실하다면 RAG의 장점이 크게 감소한다.

 

5️⃣ Chroma vs Neo4j: RAG 시스템의 대표 DB

Chroma

RAG에서 의미 기반 검색(Semantic Search)을 위해 벡터(임베딩) 데이터를 저장하고 검색할 수 있게 해주는 벡터 DB

  • 유사도 기반
  • 경량 오픈소스 → 빠름
  • 서버 필요 X
  • LangChain과 직접 연동이 간편

Neo4j

노드(Node)와 간선(Relationship) 구조로 데이터를 표현하고 저장하는 그래프 기반 DB

  • 유사도 기반 + 객체 간의 관계 최적화
  • 복잡한 연결, 추론, 추천에 강력
  • Cypher 언어로 질의하며, LangChain에서도 연동 가능

 

6️⃣ 실제 적용 예시

  • 사내 문서 Q&A 챗봇: 기업 내부의 기술 문서, 가이드라인을 기반으로 답변하는 시스템
  • 의료/법률 분야 정보 탐색: 외부 논문, 판례 등을 검색해 법률적 답변을 생성
  • 고객센터 자동화: 제품 매뉴얼, FAQ 등을 검색하여 정확한 응답을 제공
반응형