시작하기
학습가이드
Subscribe
3️⃣

문서 검색의 두 가지 눈: AI는 어떻게 가장 알맞은 정보를 찾아낼까요?

질문에 답하려면, AI는 먼저 “관련된 문서”를 찾아야 합니다

AI가 좋은 답변을 만들기 위해서는 먼저 "이 질문에 관련된 문서가 뭐지?"를 정확히 찾는 것이 중요합니다.
그런데 어떤 문서가 관련 있는지를 판단하는 방식은 한 가지가 아닙니다.
벨루가는 두 가지 서로 다른 방식을 동시에 사용해 더 정확한 문서를 찾아냅니다.

두 가지 검색 방식: 의미 기반 vs. 단어 기반

구분
설명
비유
의미 기반 검색 (Dense)
질문의 의미를 이해해서 관련 문서를 찾음
"말투가 달라도 뜻이 통하면 연결해주는 친구"
단어 기반 검색 (Sparse)
질문에 들어간 단어 그대로 문서에서 찾아냄
"딱 맞는 단어를 기억하는 꼼꼼한 친구"

🧠 의미 기반 검색이란?

질문이 꼭 똑같은 단어로 쓰이지 않아도, 뜻이 비슷하면 관련 문서를 찾아줍니다.
예:
질문: "고객 성공 사례는 뭐야?"
문서에는 "사용자 도입 사례"라고 쓰여 있어도 연결됨
이런 걸 Dense Search라고 부르지만, 쉽게 말하면 "AI가 뜻을 파악해서 유사한 내용을 연결"해주는 거예요.

🔍 단어 기반 검색이란?

질문에 정확히 포함된 단어를 중심으로 검색합니다.
예:
질문에 "KPI"가 들어가면,
문서 중 "KPI"라는 단어가 정확히 들어간 부분을 우선적으로 보여줍니다.
이건 우리가 익숙한 키워드 검색(포털 사이트 검색)과 비슷하고, 기술적으로는 Sparse Search라고 합니다.

벨루가는 둘 다 합니다: 하이브리드 검색

대부분의 RAG 기반 AI 챗봇은 하나의 방식만 사용하지만,
벨루가는
의미 기반 + 단어 기반을 동시에 활용합니다. (하이브리드 검색)
이런 조합은 다음과 같은 장점이 있어요:
장점
예시
뜻이 다른 표현도 연결 가능
"고객 사례" ↔ "성공 스토리"
중요한 키워드를 놓치지 않음
질문에 포함된 '법률', 'KPI' 같은 키워드 중심 정보도 반영
의미도 챙기고, 정확도도 높임
질문의 맥락과 핵심 단어 둘 다 고려해서 더 안정적인 답변 생성

요약: AI는 두 가지 시선으로 문서를 봅니다

뜻을 이해하는 눈: 비슷한 의미라도 연결할 수 있게
단어를 기억하는 눈: 중요한 용어나 키워드를 놓치지 않게
이 두 가지 시선을 동시에 활용해, 가장 적절한 문서를 정확하게 찾고, 그걸 바탕으로 대답합니다.

✅ 정리

벨루가는 질문을 받을 때 문서의 의미와 단어를 함께 고려합니다.
단순히 단어가 포함된 문서를 찾는 게 아니라,
질문의 숨은 의미까지 파악해서 더 정확한 정보를 찾아냅니다.
이 과정을 통해, 사용자 입장에선 더 똑똑하고 자연스러운 대화를 경험할 수 있어요.