시작하기
학습가이드
Subscribe
🔟

문서를 ‘보는’ AI, 벨루가의 비전 처리 기능

벨루가는 두 가지 방식으로 문서를 처리합니다

문서를 벨루가에 업로드하면, 채널(AI 어시스턴트)이 해당 문서를 바탕으로 질문에 답할 수 있게 됩니다.
이때 문서 업로드 방식은 크게 두 가지로 나뉩니다:
업로드 방식
특징
일반 업로드
텍스트를 중심으로 문서를 처리합니다 (PDF, XLSX, DOCX 등)
비전 학습
이미지·표·레이아웃까지 AI가 ‘보고’ 해석합니다 (PDF, 이미지 등)

일반 업로드는 빠르고 효율적입니다

✅ 장점

텍스트 추출 속도가 빠릅니다
문서가 단순하거나, 대부분 텍스트 위주일 때 적합합니다
V-크레딧이 소모되지 않습니다

⚠️ 제한 사항

표가 무너진 PDF, 이미지로 된 문서, 레이아웃이 중요한 문서는 제대로 처리되지 않을 수 있습니다

비전 학습은 AI가 문서를 ‘보며’ 이해합니다

문서를 한 페이지씩 이미지로 만들어 AI가 직접 해석합니다.
이미지를 읽고 → 텍스트로 변환 → 문서 구조를 이해한 상태로 벡터화합니다.

✅ 이런 경우 추천합니다

PDF에 표, 다단 레이아웃, 이미지가 섞여 있는 경우
스캔된 문서, 양식지, 설명서처럼 비정형 구조인 경우
이미지에 포함된 텍스트까지 AI가 파악해야 하는 경우

Vision 학습 모드를 고를 수 있어요

모드
설명
V-크레딧 사용량
Vision 베이직
빠르게 이미지 텍스트를 변환
없음
Vision 프로A
복잡한 테이블과 레이아웃에 적합
높음 (3차감 이상)
Vision 프로B
흐릿한 글자까지 정밀하게 인식
높음 (3차감 이상)
페이지 수에 따라 사용량이 누적되며,
고도화된 인식일수록 V-크레딧이 더 차감됩니다.

5. 일반 업로드 vs 비전 학습 비교 정리

항목
일반 업로드
비전 학습
대상 문서
텍스트 기반 문서
이미지, 복잡 구조 문서
처리 속도
빠름
다소 느림
처리 정확도
단순 문서에 강함
레이아웃, 이미지 포함 문서에 강함
크레딧 사용
❌ 없음
✅ 있음 (페이지당 차감)
추천 용도
계약서, 안내문, 매뉴얼
스캔 문서, 정책서, 보도자료, 양식 등

✅ 정리

단순한 문서는 일반 업로드만으로도 충분합니다.
구조가 복잡하거나 이미지가 중요한 문서는 비전 학습으로 업로드하는 것이 정확도를 높이는 핵심입니다.
비전 학습은 AI 모델을 사용하기 때문에 V-크레딧이 소모되며, 문서의 성격에 따라 모드를 선택할 수 있습니다.