5-1. Box Plot - 사분위수 (IQR)

Source: 구자룡(2025), "챗GPT로 시작하는 데이터 리터러시", 마들렌북
이미지와 같은 분석하려면 무슨 데이터가 필요할까?
소스 파일 첨부 : 다운로드
첨부 데이터로 만들면 될 거 같아. 데이터 처리부터 하자
이후 시각화까지 모두 진행
💬
gpt
잠실(송파구청), 홍대입구 → 전체적으로 이용객 규모가 매우 큼
반포 → 일일 이용량이 작고 변동 폭이 좁음 → 안정적인 수요
서울역, 사당→ 평균 이용량은 중간이지만 이상치 다수 → 환승, 출퇴근 영향
강남, 선릉 → 변동성 크고 꼬리 두꺼움 → 첨도 높을 가능성 (출퇴근 집중형 역)
첨도, 왜도 시각화
각 역의 왜도(skewness), **첨도(kurtosis)**를 계산하여 비교표 또는 그래프로 시각화하자
💬
gpt
분류
대표 역
특징
집중형(첨도 > 3)
잠실(송파구청), 사당, 신림
출퇴근 집중 or 특정 요일 급등 패턴
정규형(≈3)
강남, 서울역, 반포
안정적 수요, 일상적 이용 중심
균형형(첨도 < 3)
홍대입구, 고속터미널, 선릉, 구로디지털단지
일정하고 분산된 이용, 극단값 적음
양의 왜도(→ 오른쪽 꼬리)
홍대입구, 고속터미널
"평소보다 매우 이용량 높은 날" 존재
(주말·공연·축제 등 영향)
Contact : azureguy@empal.com / azureguy@cau.ac.kr