1-5.AI 데이터 분석 체험하기

참고도서: 이기복(2025), 진짜 업무에 쓰는 챗GPT 노코드 데이터 분석, 디지털북스

📌 챗GPT 가상환경에 업로드할 수 있는 데이터

챗GPT는 다양한 파일 형식을 지원함
엑셀(.xlsx), CSV(.csv), 텍스트(.txt), 이미지(.jpg) 등 업로드 가능함

1. 텍스트 파일(.txt) 업로드

가장 단순한 형태의 데이터 형식임
엑셀이나 응용 프로그램 없이도 쉽게 확인 가능함
실무에서도 자주 사용되는 데이터 형식임
범용 응용프로그램 없어도 분석 가능하다는 장점이 있음
확장자는 .dat, .blk, .bor 등으로도 표현될 수 있음
확장자가 바뀌어도 메모장으로 열 수 있음
※ 실습 파일 (다운로드)
파일: 1-1.(텍스트데이터) 대한민국 남여 기대수명 통계.txt
(출처: 대한민국 통계청 웹페이지
https://www.index.go.kr/unity/potal/main.do)
프롬프트
TXT 데이터를 업로드 했어. 내용을 살펴보고 데이터에 대해 설명해 줘. 그리고 필요한 경우 시각화를 통해 데이터를 설명해 줘 system prompt 프로젝트 파일로 업로드한 라이브러리를 설치하고 Matplotlib 한글 사용 환경을 설정한 다음 NanumBarunGothic.ttf 파일로 한글을 표현해 줘
GPT 결과

2. 이미지 파일 업로드

그림 파일에서 데이터를 추출할 때 챗GPT를 활용하면 유용
이미지를 업로드 > 데이터 추출 > 데이터 분석
※ 실습 파일 (다운로드)
1-2.(그림파일데이터) 자동차 수명에 따른 유지비용.png
아래 파일 이미지 복사 > 챗GPT 붙여넣기
프롬프트
디지타이징(Digitizing) : 그래프나 차트와 같은 이미지에서 수치 데이터를 추출하는 작업
그림 데이터를 업로드 했어. 데이터의 X축과 Y축을 보고 선 그래프의 데이터를 디지타이징해 줘. 디지타이징한 데이터는 테이블로 만들고, 데이터를 csv 파일로 다운로드할 수 있도록 링크를 만들어 줘. 사진에서 보이는 마커(Marker) 위치에 해당하는 X값, Y값을 추출해.
GPT 결과

3. 데이터 업로드(spread sheet, xlsx, etc)

가장 기본적인 데이터 입출력 형식으로 사용
실무적으로 가장 많이 사용
※ 실습 파일 (다운로드)
1-3.(csv파일데이터) titanic_train.csv
프롬프트
엑셀 데이터를 업로드 했어. 내용을 살펴보고 데이터에 대해 설명해 줘. 그리고 필요한 경우 시각화를 통해 데이터를 설명해 줘
💬
GPT 결과
업로드하신 출판통계 (2011~2021) 엑셀 파일은 여러 시트로 구성되어 있습니다.
시트 목록
분야별발행종수 : 분야별 발행된 책 종수(연도별)
분야별발행부수 : 분야별 발행 부수(연도별)
분야별평균발행부수 : 분야별 평균 발행 부수
분야별평균정가 : 분야별 평균 책 정가
분야별평균면수 : 분야별 평균 책 페이지 수
분야별번역도서종수 : 분야별 번역 도서 종수
2021번역도서국가별종수 : 2021년 국가별 번역 도서 종수
추가 분석 요청
분야별발행종수 시트의 특정 분야별 발행종수 변화(예: 문학, 사회과학, 자연과학 등)를 각각 선 그래프로 비교해서 보여줘
GPT 결과

추가 실습

1-4.(csv파일데이터) titanic_train.csv
Contact : azureguy@empal.com / azureguy@cau.ac.kr