# 문서 검색 방식과 우선순위 설정: 채널이 답변에 사용할 문서는 어떻게 선택될까요?

## 여러 문서를 올려도, AI는 ‘질문과 가장 관련된 내용’만 찾아요

- 벨루가는 사용자의 질문에 대해** 업로드된 모든 문서 조각 중에서 가장 관련 있는 내용**을 찾아 답변합니다.

- 문서 간 순서나 제목은 중요하지 않고, **질문과의 의미 유사도**가 기준입니다.
- 

- ℹ️ 관련 배경 개념은  [3번 문서](https://slashpage.com/velugadoc/ndvwx7281pqw6m3z6jpg)를 참고하세요.

- 벨루가는 의미 기반(Dense) + 키워드 기반(Sparse)을 결합한 하이브리드 검색을 사용합니다.
- 

## 문서에 ‘검색 필터’를 설정하면 범위 제한 검색이 가능합니다

- 문서를 업로드할 때, **문서에 태그(검색 필터)**를 걸 수 있습니다.**특정 필터만 선택하여 그 범위 내 문서만 대상으로 검색**할 수 있습니다.
- 예시:
- 문서 A: #서비스안내
- 문서 B: #이용약관
- 사용자가 채팅창에서 #서비스안내 필터 선택 → 문서 A 범위 내에서만 검색 진행
- ✅ 이 기능은 향후 고도화되어, 고객이 원하는 정보 범위만 좁혀서 정확한 답변을 받을 수 있는 기반이 됩니다.
- 문서가 엉켜 있으면 AI도 헷갈려요 — 꼭 정리해주세요!
- 😵 이런 경우, 채널이 적절한 답을 못할 수 있어요

- 이후 채널 채팅창에서 **특정 필터만 선택하여 그 범위 내 문서만 대상으로 검색**할 수 있습니다.

- 예시:

    - 문서 A: #서비스안내

    - 문서 B: #이용약관

    - 사용자가 채팅창에서 #서비스안내 필터 선택 → 문서 A 범위 내에서만 검색 진행

- ✅ 이 기능은 향후 고도화되어, 고객이 원하는 정보 범위만 좁혀서 정확한 답변을 받을 수 있는 기반이 됩니다.

---

## 문서가 엉켜 있으면 AI도 헷갈려요 — 꼭 정리해주세요!

😵 이런 경우, 채널이 적절한 답을 못할 수 있어요

| 문제 상황 | 예시 | 영향 |
| --- | --- | --- |
| 같은 내용이 여러 문서에 분산됨 | 요금 안내가 문서 A, B, C에 나눠져 있음 | 검색된 조각이 나눠져 응답이 흐려짐 |
| 오래된 정보와 최신 정보가 공존 | 이전 정책과 현재 정책이 함께 있음 | 둘 다 검색돼 모순된 답변 생성 가능 |
| 표현 방식이 일관되지 않음 | 어떤 문서엔 ‘비용’, 어떤 문서엔 ‘요금’ 사용 | 검색 누락 또는 품질 저하 |

### 💡 해결 방법

- 중복된 내용은 하나의 최신 문서로 정리하거나, 구버전 문서에는 명시적 표시를 남겨주세요.

- 중요 키워드는 문서 전반에서 통일된 표현을 사용하는 것이 좋습니다.

- 문서 업로드 시 필터를 통해 문서의 성격을 명확히 분류해두면 큰 도움이 됩니다.
- 

---

## 요약을 요청하는 질문에는 현재 한계가 있어요

> “이 문서를 요약해줘”
>  “핵심만 알려줘”
>  같은 질문은 아직 벨루가 챗봇이 완벽하게 처리하지 못할 수 있어요.

- 현재 벨루가는 질문에 유사한 문서 조각을 찾아 답변을 구성하지만,
- 

- **긴 문서를 읽고 전반적인 요점을 요약하는 파이프라인은 아직 포함되어 있지 않습니다.**
- 

- ✅ 추후에는 전용 요약 파이프라인이 추가되어 **문서 전체를 요약하거나, 특정 섹션만 요약하는 기능이 정식 지원될 예정**입니다.

---

## Top-K 설정: 얼마나 많은 문서를 참고할지 설정할 수 있어요

벨루가는 질문에 대해 여러 문서 조각을 참고해 응답을 생성합니다.
이때 사용되는 **문서 조각 개수(K)**를 설정할 수 있으며, 이를 **Top-K**라고 부릅니다.

| 설정 | 기본값 | 설정 위치 | 영향 |
| --- | --- | --- | --- |
| Top-K | 3~4개 | 채널 설정 > 고급 설정 | 값이 클수록 더 많은 문서를 참고함 |

- Top-K를 늘릴수록 응답의 맥락이 넓어질 수 있지만, 

- 동시에 더 많은 토큰을 사용하게 되어 V-크레딧 소모량도 증가합니다.
- 

> ⚠️ Top-K는 상황에 따라 적절히 조정하세요.
>  복잡한 질문이나 문서가 짧을 땐 34개가 가장 적절한 범위입니다.
> 

---

## ✅ 요약

- 벨루가는 의미 유사도 기반으로 문서 조각을 선택합니다.
-  (문서 간 우선순위는 없고, ‘내용의 관련성’이 가장 중요해요)

- 문서 업로드 시 필터를 설정하면 검색 범위를 제한할 수 있습니다.

- 중복·구버전·비일관 표현은 검색 품질을 크게 낮출 수 있으니 주의해주세요.

- 요약 기능은 현재 한계가 있으며, 향후 전용 파이프라인으로 개선될 예정입니다.

- Top-K를 조절해 응답 품질을 높일 수 있지만, 사용량(V-크레딧) 증가에 유의하세요.

For the site tree, see the [root Markdown](https://slashpage.com/velugadoc.md).
