시작하기
학습가이드
Subscribe
8️⃣

문서 검색 방식과 우선순위 설정: 채널이 답변에 사용할 문서는 어떻게 선택될까요?

여러 문서를 올려도, AI는 ‘질문과 가장 관련된 내용’만 찾아요

벨루가는 사용자의 질문에 대해 업로드된 모든 문서 조각 중에서 가장 관련 있는 내용을 찾아 답변합니다.
문서 간 순서나 제목은 중요하지 않고, 질문과의 의미 유사도가 기준입니다.
ℹ️ 관련 배경 개념은 3번 문서를 참고하세요.
벨루가는 의미 기반(Dense) + 키워드 기반(Sparse)을 결합한 하이브리드 검색을 사용합니다.

문서에 ‘검색 필터’를 설정하면 범위 제한 검색이 가능합니다

문서를 업로드할 때, 문서에 태그(검색 필터)를 걸 수 있습니다.특정 필터만 선택하여 그 범위 내 문서만 대상으로 검색할 수 있습니다.
예시:
문서 A: #서비스안내
문서 B: #이용약관
사용자가 채팅창에서 #서비스안내 필터 선택 → 문서 A 범위 내에서만 검색 진행
✅ 이 기능은 향후 고도화되어, 고객이 원하는 정보 범위만 좁혀서 정확한 답변을 받을 수 있는 기반이 됩니다.
문서가 엉켜 있으면 AI도 헷갈려요 — 꼭 정리해주세요!
😵 이런 경우, 채널이 적절한 답을 못할 수 있어요
이후 채널 채팅창에서 특정 필터만 선택하여 그 범위 내 문서만 대상으로 검색할 수 있습니다.
예시:
문서 A: #서비스안내
문서 B: #이용약관
사용자가 채팅창에서 #서비스안내 필터 선택 → 문서 A 범위 내에서만 검색 진행
✅ 이 기능은 향후 고도화되어, 고객이 원하는 정보 범위만 좁혀서 정확한 답변을 받을 수 있는 기반이 됩니다.

문서가 엉켜 있으면 AI도 헷갈려요 — 꼭 정리해주세요!

😵 이런 경우, 채널이 적절한 답을 못할 수 있어요
문제 상황
예시
영향
같은 내용이 여러 문서에 분산됨
요금 안내가 문서 A, B, C에 나눠져 있음
검색된 조각이 나눠져 응답이 흐려짐
오래된 정보와 최신 정보가 공존
이전 정책과 현재 정책이 함께 있음
둘 다 검색돼 모순된 답변 생성 가능
표현 방식이 일관되지 않음
어떤 문서엔 ‘비용’, 어떤 문서엔 ‘요금’ 사용
검색 누락 또는 품질 저하

💡 해결 방법

중복된 내용은 하나의 최신 문서로 정리하거나, 구버전 문서에는 명시적 표시를 남겨주세요.
중요 키워드는 문서 전반에서 통일된 표현을 사용하는 것이 좋습니다.
문서 업로드 시 필터를 통해 문서의 성격을 명확히 분류해두면 큰 도움이 됩니다.

요약을 요청하는 질문에는 현재 한계가 있어요

“이 문서를 요약해줘”
“핵심만 알려줘”
같은 질문은 아직 벨루가 챗봇이 완벽하게 처리하지 못할 수 있어요.
현재 벨루가는 질문에 유사한 문서 조각을 찾아 답변을 구성하지만,
긴 문서를 읽고 전반적인 요점을 요약하는 파이프라인은 아직 포함되어 있지 않습니다.
✅ 추후에는 전용 요약 파이프라인이 추가되어 문서 전체를 요약하거나, 특정 섹션만 요약하는 기능이 정식 지원될 예정입니다.

Top-K 설정: 얼마나 많은 문서를 참고할지 설정할 수 있어요

벨루가는 질문에 대해 여러 문서 조각을 참고해 응답을 생성합니다.
이때 사용되는
문서 조각 개수(K)를 설정할 수 있으며, 이를 Top-K라고 부릅니다.
설정
기본값
설정 위치
영향
Top-K
3~4개
채널 설정 > 고급 설정
값이 클수록 더 많은 문서를 참고함
Top-K를 늘릴수록 응답의 맥락이 넓어질 수 있지만,
동시에 더 많은 토큰을 사용하게 되어 V-크레딧 소모량도 증가합니다.
⚠️ Top-K는 상황에 따라 적절히 조정하세요.
복잡한 질문이나 문서가 짧을 땐 34개가 가장 적절한 범위입니다.

✅ 요약

벨루가는 의미 유사도 기반으로 문서 조각을 선택합니다.
(문서 간 우선순위는 없고, ‘내용의 관련성’이 가장 중요해요)
문서 업로드 시 필터를 설정하면 검색 범위를 제한할 수 있습니다.
중복·구버전·비일관 표현은 검색 품질을 크게 낮출 수 있으니 주의해주세요.
요약 기능은 현재 한계가 있으며, 향후 전용 파이프라인으로 개선될 예정입니다.
Top-K를 조절해 응답 품질을 높일 수 있지만, 사용량(V-크레딧) 증가에 유의하세요.