# 1-5.AI 데이터 분석 체험하기

> 참고도서: 이기복(2025), 진짜 업무에 쓰는 챗GPT 노코드 데이터 분석, 디지털북스

## 📌 챗GPT 가상환경에 업로드할 수 있는 데이터

- 챗GPT는 다양한 파일 형식을 지원함

- 엑셀(.xlsx), CSV(.csv), 텍스트(.txt), 이미지(.jpg) 등 업로드 가능함

---

### 1. 텍스트 파일(.txt) 업로드

- 가장 단순한 형태의 데이터 형식임

- 엑셀이나 응용 프로그램 없이도 쉽게 확인 가능함

- 실무에서도 자주 사용되는 데이터 형식임

- 범용 응용프로그램 없어도 분석 가능하다는 장점이 있음

- 확장자는 .dat, .blk, .bor 등으로도 표현될 수 있음

- 확장자가 바뀌어도 메모장으로 열 수 있음

※ 실습 파일 ([다운로드](https://drive.google.com/drive/folders/1Ho4IeqPGNFQII2zkM89pcOEfZa8vlDSa?usp=drive_link))

- 파일: 1-1.(텍스트데이터) 대한민국 남여 기대수명 통계.txt
- (출처: 대한민국 통계청 웹페이지 [https://www.index.go.kr/unity/potal/main.do](https://www.index.go.kr/unity/potal/main.do))

- 프롬프트

```
TXT 데이터를 업로드 했어.  

내용을 살펴보고 데이터에 대해 설명해 줘.  
그리고 필요한 경우 시각화를 통해 데이터를 설명해 줘

system prompt
프로젝트 파일로 업로드한 라이브러리를 설치하고 Matplotlib 한글 사용 환경을 설정한 다음 NanumBarunGothic.ttf 파일로 한글을 표현해 줘
```

- GPT 결과

![Image](https://upload.cafenono.com/image/slashpageHome/20250829/152657_PpFF9ZUxK11HWnhHA6?q=80&s=1280x180&t=outside&f=webp)

---

### 2. 이미지 파일 업로드

- 그림 파일에서 데이터를 추출할 때 챗GPT를 활용하면 유용

- 이미지를 업로드 > 데이터 추출 > 데이터 분석

- ※ 실습 파일 ([다운로드](https://drive.google.com/drive/folders/1Ho4IeqPGNFQII2zkM89pcOEfZa8vlDSa?usp=drive_link))

    - 1-2.(그림파일데이터) 자동차 수명에 따른 유지비용.png

    - 아래 파일 이미지 복사 > 챗GPT 붙여넣기

![Image](https://upload.cafenono.com/image/slashpageHome/20250829/155702_p4LV1NfPqMdOtwOXZM?q=80&s=1280x180&t=outside&f=webp)

- 프롬프트

    - 디지타이징(Digitizing) : 그래프나 차트와 같은 이미지에서 수치 데이터를 추출하는 작업

```
그림 데이터를 업로드 했어.
데이터의 X축과 Y축을 보고 선 그래프의 데이터를 디지타이징해 줘.
디지타이징한 데이터는 테이블로 만들고, 데이터를 csv 파일로 다운로드할 수 있도록 링크를 만들어 줘.
사진에서 보이는 마커(Marker) 위치에 해당하는 X값, Y값을 추출해.
```

- GPT 결과

![Image](https://upload.cafenono.com/image/slashpageHome/20250829/160543_zbI486yjxYccVF4SeU?q=80&s=1280x180&t=outside&f=webp)

---

### 3. 데이터 업로드(spread sheet, xlsx, etc)

- 가장 기본적인 데이터 입출력 형식으로 사용

- 실무적으로 가장 많이 사용

- ※ 실습 파일 ([다운로드](https://drive.google.com/drive/folders/1Ho4IeqPGNFQII2zkM89pcOEfZa8vlDSa?usp=drive_link))

    - 1-3.(csv파일데이터) titanic_train.csv

- 프롬프트

```
엑셀 데이터를 업로드 했어.
내용을 살펴보고 데이터에 대해 설명해 줘.
그리고 필요한 경우 시각화를 통해 데이터를 설명해 줘
```

> GPT 결과

---

업로드하신 출판통계 (2011~2021) 엑셀 파일은 여러 시트로 구성되어 있습니다.

시트 목록

분야별발행종수 : 분야별 발행된 책 종수(연도별)

분야별발행부수 : 분야별 발행 부수(연도별)

분야별평균발행부수 : 분야별 평균 발행 부수

분야별평균정가 : 분야별 평균 책 정가

분야별평균면수 : 분야별 평균 책 페이지 수

분야별번역도서종수 : 분야별 번역 도서 종수

2021번역도서국가별종수 : 2021년 국가별 번역 도서 종수

- 추가 분석 요청

```
분야별발행종수 시트의 특정 분야별 발행종수 변화(예: 문학, 사회과학, 자연과학 등)를 각각 선 그래프로 비교해서 보여줘
```

- GPT 결과

![Image](https://upload.cafenono.com/image/slashpageHome/20250829/164636_1sfDd3i3OcOuE8EOBa?q=80&s=1280x180&t=outside&f=webp)

---

### 추가 실습

- 1-4.(csv파일데이터) titanic_train.csv

For the site tree, see the [root Markdown](https://slashpage.com/lion.md).
