# 문서 검색의 두 가지 눈: AI는 어떻게 가장 알맞은 정보를 찾아낼까요?

## 질문에 답하려면, AI는 먼저 “관련된 문서”를 찾아야 합니다

- AI가 좋은 답변을 만들기 위해서는 먼저 "이 질문에 관련된 문서가 뭐지?"를 정확히 찾는 것이 중요합니다.

- 그런데 어떤 문서가 관련 있는지를 판단하는 방식은 한 가지가 아닙니다.

- 벨루가는 **두 가지 서로 다른 방식**을 동시에 사용해 더 정확한 문서를 찾아냅니다.

## 두 가지 검색 방식: 의미 기반 vs. 단어 기반

| 구분 | 설명 | 비유 |
| --- | --- | --- |
| 의미 기반 검색 (Dense) | 질문의 의미를 이해해서 관련 문서를 찾음 | "말투가 달라도 뜻이 통하면 연결해주는 친구" |
| 단어 기반 검색 (Sparse) | 질문에 들어간 단어 그대로 문서에서 찾아냄 | "딱 맞는 단어를 기억하는 꼼꼼한 친구" |

### 🧠 의미 기반 검색이란?

- 질문이 꼭 똑같은 단어로 쓰이지 않아도, 뜻이 비슷하면 관련 문서를 찾아줍니다.

- 예:

    - 질문: "고객 성공 사례는 뭐야?"

    - 문서에는 "사용자 도입 사례"라고 쓰여 있어도 연결됨

- 이런 걸 Dense Search라고 부르지만, 쉽게 말하면 "AI가 뜻을 파악해서 유사한 내용을 연결"해주는 거예요.

### 🔍 단어 기반 검색이란?

- 질문에 정확히 포함된 단어를 중심으로 검색합니다.

- 예:

    - 질문에 "KPI"가 들어가면,

    - 문서 중 "KPI"라는 단어가 정확히 들어간 부분을 우선적으로 보여줍니다.
    - 

- 이건 우리가 익숙한 키워드 검색(포털 사이트 검색)과 비슷하고, 기술적으로는 Sparse Search라고 합니다.

## 벨루가는 둘 다 합니다: 하이브리드 검색

대부분의 RAG 기반 AI 챗봇은 하나의 방식만 사용하지만,
벨루가는 **의미 기반 + 단어 기반**을 동시에 활용합니다. (하이브리드 검색)
이런 조합은 다음과 같은 장점이 있어요:

| 장점 | 예시 |
| --- | --- |
| 뜻이 다른 표현도 연결 가능 | "고객 사례" ↔ "성공 스토리" |
| 중요한 키워드를 놓치지 않음 | 질문에 포함된 '법률', 'KPI' 같은 키워드 중심 정보도 반영 |
| 의미도 챙기고, 정확도도 높임 | 질문의 맥락과 핵심 단어 둘 다 고려해서 더 안정적인 답변 생성 |

---

## 요약: AI는 두 가지 시선으로 문서를 봅니다

- 뜻을 이해하는 눈: 비슷한 의미라도 연결할 수 있게

- 단어를 기억하는 눈: 중요한 용어나 키워드를 놓치지 않게

- 이 두 가지 시선을 동시에 활용해, 가장 적절한 문서를 정확하게 찾고, 그걸 바탕으로 대답합니다.
- 

## ✅ 정리

- 벨루가는 질문을 받을 때 문서의 의미와 단어를 함께 고려합니다.

- 단순히 단어가 포함된 문서를 찾는 게 아니라,

- 질문의 숨은 의미까지 파악해서 더 정확한 정보를 찾아냅니다.

- 이 과정을 통해, 사용자 입장에선 더 똑똑하고 자연스러운 대화를 경험할 수 있어요.

For the site tree, see the [root Markdown](https://slashpage.com/velugadoc.md).
