# 문서를 ‘보는’ AI, 벨루가의 비전 처리 기능

## 벨루가는 두 가지 방식으로 문서를 처리합니다

문서를 벨루가에 업로드하면, 채널(AI 어시스턴트)이 해당 문서를 바탕으로 질문에 답할 수 있게 됩니다.
 이때 문서 업로드 방식은 크게 두 가지로 나뉩니다:

| 업로드 방식 | 특징 |
| --- | --- |
| 일반 업로드 | 텍스트를 중심으로 문서를 처리합니다 (PDF, XLSX, DOCX 등) |
| 비전 학습 | 이미지·표·레이아웃까지 AI가 ‘보고’ 해석합니다 (PDF, 이미지 등) |

---

## 일반 업로드는 빠르고 효율적입니다

### ✅ 장점

- 텍스트 추출 속도가 빠릅니다
- 

- 문서가 단순하거나, 대부분 텍스트 위주일 때 적합합니다

- V-크레딧이 소모되지 않습니다
- 

### ⚠️ 제한 사항

- 표가 무너진 PDF, 이미지로 된 문서, 레이아웃이 중요한 문서는 제대로 처리되지 않을 수 있습니다

---

## 비전 학습은 AI가 문서를 ‘보며’ 이해합니다

> 문서를 한 페이지씩 이미지로 만들어 AI가 직접 해석합니다.
> 이미지를 읽고 → 텍스트로 변환 → 문서 구조를 이해한 상태로 벡터화합니다.

### ✅ 이런 경우 추천합니다

- PDF에 표, 다단 레이아웃, 이미지가 섞여 있는 경우
- 

- 스캔된 문서, 양식지, 설명서처럼 비정형 구조인 경우
- 

- 이미지에 포함된 텍스트까지 AI가 파악해야 하는 경우

---

## Vision 학습 모드를 고를 수 있어요

| 모드 | 설명 | V-크레딧 사용량 |
| --- | --- | --- |
| Vision 베이직 | 빠르게 이미지 텍스트를 변환 | 없음 |
| Vision 프로A | 복잡한 테이블과 레이아웃에 적합 | 높음 (3차감 이상) |
| Vision 프로B | 흐릿한 글자까지 정밀하게 인식 | 높음 (3차감 이상) |

> 페이지 수에 따라 **사용량이 누적**되며,
> 고도화된 인식일수록 V-크레딧이 더 차감됩니다.

---

## 5. 일반 업로드 vs 비전 학습 비교 정리

| 항목 | 일반 업로드 | 비전 학습 |
| --- | --- | --- |
| 대상 문서 | 텍스트 기반 문서 | 이미지, 복잡 구조 문서 |
| 처리 속도 | 빠름 | 다소 느림 |
| 처리 정확도 | 단순 문서에 강함 | 레이아웃, 이미지 포함 문서에 강함 |
| 크레딧 사용 | ❌ 없음 | ✅ 있음 (페이지당 차감) |
| 추천 용도 | 계약서, 안내문, 매뉴얼 | 스캔 문서, 정책서, 보도자료, 양식 등 |

---

## ✅ 정리

- 단순한 문서는 일반 업로드만으로도 충분합니다.
- 

- 구조가 복잡하거나 이미지가 중요한 문서는 비전 학습으로 업로드하는 것이 정확도를 높이는 핵심입니다.
- 

- 비전 학습은 AI 모델을 사용하기 때문에 V-크레딧이 소모되며, 문서의 성격에 따라 모드를 선택할 수 있습니다.

For the site tree, see the [root Markdown](https://slashpage.com/velugadoc.md).