# 5-1. Box Plot - 사분위수 (IQR)

- Source: 구자룡(2025), "챗GPT로 시작하는 데이터 리터러시", 마들렌북

- Data source: [https://data.seoul.go.kr/dataList/OA-12921/F/1/datasetView.do](https://data.seoul.go.kr/dataList/OA-12921/F/1/datasetView.do) 

[https://data.seoul.go.kr/dataList/OA-12921/F/1/datasetView.do](https://data.seoul.go.kr/dataList/OA-12921/F/1/datasetView.do)

![Image](https://upload.cafenono.com/image/slashpageHome/20251010/164601_db2O5RWKQGGKuFzXyW?q=80&s=1280x180&t=outside&f=webp)

```
이미지와 같은 분석하려면 무슨 데이터가 필요할까?
```

- 소스 파일 첨부 : [다운로드](https://drive.google.com/file/d/17mrC5py-d_s5rYhKa2FNZVPc7zhVBOU7/view?usp=drive_link)

```
첨부 데이터로 만들면 될 거 같아. 
데이터 처리부터 하자
```

- 이후 시각화까지 모두 진행

> gpt

![Image](https://upload.cafenono.com/image/slashpageHome/20251010/170735_0NQWRIHK1cX69j1M7q?q=80&s=1280x180&t=outside&f=webp)

- 잠실(송파구청), 홍대입구 → 전체적으로 이용객 규모가 매우 큼

- 반포 → 일일 이용량이 작고 변동 폭이 좁음 → 안정적인 수요

- 서울역, 사당→ 평균 이용량은 중간이지만 이상치 다수 → 환승, 출퇴근 영향 

- 강남, 선릉 → 변동성 크고 꼬리 두꺼움 → 첨도 높을 가능성 (출퇴근 집중형 역)

- 첨도, 왜도 시각화

```
각 역의 왜도(skewness), **첨도(kurtosis)**를 계산하여 비교표 또는 그래프로 시각화하자
```

> gpt

![Image](https://upload.cafenono.com/image/slashpageHome/20251010/173823_4YZJXYYRGcWKr0lWMg?q=80&s=1280x180&t=outside&f=webp)

![Image](https://upload.cafenono.com/image/slashpageHome/20251010/173316_hBi09UxcKvm5cZbONw?q=80&s=1280x180&t=outside&f=webp)

| 분류 | 대표 역 | 특징 |
| --- | --- | --- |
| **집중형(첨도 > 3)** | 잠실(송파구청), 사당, 신림 | 출퇴근 집중 or 특정 요일 급등 패턴 |
| **정규형(≈3)** | 강남, 서울역, 반포 | 안정적 수요, 일상적 이용 중심 |
| **균형형(첨도 < 3)** | 홍대입구, 고속터미널, 선릉, 구로디지털단지 | 일정하고 분산된 이용, 극단값 적음 |
| 양의 왜도(→ 오른쪽 꼬리) | 홍대입구, 고속터미널 | "평소보다 매우 이용량 높은 날" 존재 (주말·공연·축제 등 영향) |

For the site tree, see the [root Markdown](https://slashpage.com/lion.md).