# 데이터 시각화 - 차트 디자인

# Chart 선택 방법

- 앤드류 아벨라(Andrew V. Abela)의 챠트 선택 방법

    - 시각화 목적에 따라 **비교(Comparion), 분포(Distribution), 구성(Comparison), 관계(Relationship)** 
    - 
    - 그림 출처: [https://medium.com/@DataPlay/selecting-the-right-chart-for-your-data-501af25dc693](https://medium.com/@DataPlay/selecting-the-right-chart-for-your-data-501af25dc693)

![https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/X2edyyeOklVNdRQ58KZxxct3ms0.png](https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/X2edyyeOklVNdRQ58KZxxct3ms0.png)

![https://t1.daumcdn.net/thumb/R1280x0.fjpg/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/O-R36recAl92K6IySDWo4CgOEbM.JPG](https://t1.daumcdn.net/thumb/R1280x0.fjpg/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/O-R36recAl92K6IySDWo4CgOEbM.JPG)

    - 그림 출처 ([https://www.i-boss.co.kr/ab-74668-1747](https://www.i-boss.co.kr/ab-74668-1747))

---

- [ The Data Visualisation Catalogue](https://datavizcatalogue.com/) 사이트에서도 기능별 다양한 시각화 형태 탐색 가능

![Image](https://upload.cafenono.com/image/slashpageHome/20251216/115816_jzbWzMUWFZXKicD901?q=80&s=1280x180&t=outside&f=webp)

    - [ https://datavizcatalogue.com](https://datavizcatalogue.com/)

---

- 차트 선택시 유의 사항

1. 표현하고자 하는 데이터의 갯수와 특징 고려

2. 다양한 차트의 종류를 살펴보며 어떤 장단점이 있으며, 어떤 경우에 사용하는 것이 가장 효과적일지 많이 보고 연습

---

Source: [Jānis Gulbis 의 블로그 글](https://eazybi.com/blog/data_visualization_and_chart_types/) [[https://eazybi.com/blog/datavisualizationandcharttypes](https://eazybi.com/blog/data_visualization_and_chart_types)]

## 1. 시각화 차트 유형

## 테이블 (Tables)

![https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/obrGNZFFiem8kNSK_TYCeRQMz0w.png](https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/obrGNZFFiem8kNSK_TYCeRQMz0w.png)

- 테이블은 기본적으로 모든 차트의 소스

- 변수와 데이터 포인트가 적을 때 비교, 구성 또는 관계 분석에 가장 적합

- 테이블에서 데이터를 쉽게 해석 할 수 있다면 차트를 만드는 것은 의미가 없음

| 구분 | 표(Table) 사용 시 | 차트(Chart) 사용 시 |
| --- | --- | --- |
| 주요 목적 | 개별 값 비교·정확한 조회 reflectionsfromaredhead​ | 데이터 모양·관계·추세 전달 reflectionsfromaredhead​ |
| 사용 기준 | - 정밀 수치(소수점, 단위) 중요- 여러 항목 나란히 비교 필요 | - 변화율(rate of change) 보여줄 때- 패턴·기울기·전환점 강조 |
| 예시 | 제품 가격(원), 수량(개), 무게(kg) 동시 제시 reflectionsfromaredhead​ | 온도 급락처럼 기울기·변화 속도 직관 전달 reflectionsfromaredhead​ |
| 특징 | "얼마냐?"(정확한 값) 초점 | "어떻게 변하냐?"(형태·흐름) 초점 |
| 한계 | 추세 파악 어려움 | 개별 정밀 수치 전달 약함 |

---

## 세로 막대 차트 (Column Charts)

![https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/uNTrPtUNG05cLDxdcFqQzjN4GVo.png](https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/uNTrPtUNG05cLDxdcFqQzjN4GVo.png)

### 칼럼 차트 주요 용도

- 가장 많이 쓰이는 차트 타입.  

- 서로 다른 값들을 비교할 때 최적.  

- 사용자가 각 칼럼의 개별 값을 조회·비교할 것으로 예상될 때 사용.  

- 카테고리 간 값 비교 또는 한 카테고리의 시간 경과 변화 비교에 적합.

### 베스트 프랙티스

- **카테고리 수 제한**  

    - 5개까지는 좋음, 7개 초과 시 피함.

- **시간 축 설정**  

    - 시간(년, 분기, 월, 주, 일, 시간)은 항상 가로축(X축)에 배치.  

    - 시간은 왼쪽→오른쪽으로 흐름(위→아래 절대 안 됨).

- **수치 축 기준선**  

    - 세로축(Y축)은 반드시 0부터 시작.  

    - 칼럼 높이에 눈이 민감 → 잘린 막대는 잘못된 결론 유발.

- **시각 디자인**  

    - 패턴 선이나 채움 사용 금지.  

    - 테두리는 강조용으로만 제한적 사용.

- **추세 표시 제한**  

    - 데이터 포인트 20개 미만이고 모든 값이 명확히 보일 때만 추세로 사용.

---

## 세로 막대 히스토그램 (Column Histograms)

![https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/EKo2Q-ejY7T7-DTX9zIVbGRAh1A.png](https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/EKo2Q-ejY7T7-DTX9zIVbGRAh1A.png)

### 히스토그램 정의

- 히스토그램은 칼럼 차트(세로 막대 차트)의 일반적인 변형임.  

- 하나의 변수(single variable)가 여러 구간 또는 그룹으로 나뉘었을 때, 그 분포(distribution)와 관계를 보여주는 데 사용함.

### 히스토그램 용도

- 단일 변수의 값들이 각 구간(카테고리)에 어떻게 분포되어 있는지 보여줄 때 사용함.  

- "특정 값들이 어느 구간에 많이 몰려 있는지"를 시각적으로 파악할 수 있음.

### 예시

- 학교 시험에서 학생들의 성적 분포를 보여줄 때 사용 가능함.  

    - 예: 0–10점, 11–20점, 21–30점… 구간별 학생 수.

- 호박 축제에서 호박 크기 사이즈 그룹별 개수를 보여줄 때 사용 가능함.  

    - 예: 작은 사이즈, 중간 사이즈, 큰 사이즈 등으로 나누어 각 그룹의 호박 개수를 표현.

---

### 누적 세로 막대 차트 (Stacked Column Charts)

![https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/RmeCriV6KucOM0PDzJ1EzxuAd8M.png](https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/RmeCriV6KucOM0PDzJ1EzxuAd8M.png)

### 스택 칼럼 차트 용도

- 스택 칼럼 차트는 **구성비(composition)를 보여줄 때** 사용함.  

- 하나의 전체 값을 여러 부분(구성 요소)로 쌓아서, 전체와 각 부분의 크기를 동시에 표현함.

### 스택 칼럼 차트 베스트 프랙티스

- 구성 요소(스택 항목)를 너무 많이 넣지 말 것.  

    - 3~4개 이내로 제한하는 것이 좋음.

- 각 구성 요소의 크기가 **너무 차이 나지 않도록** 하는 것이 좋음.  

    - 크기 차이가 너무 크면 해석이 어렵고, 시각적으로도 지저분해짐.

- 구성 요소가 많고 크기 차이가 크면  

    - 차트가 금방 복잡해지고, 메시지가 흐려짐.

### 칼럼 차트 효과성 개선 포인트

- 다음 차트 유형으로 넘어가기 전에,  

    - 불필요한 요소를 줄여 **단순화(simplify)** 하면 칼럼 차트의 효과를 높일 수 있음.

- 색, 레이블, 구성 항목을 최소화해  

    - 사용자가 핵심 비교와 메시지에 집중하도록 만드는 것이 중요함.

---

## 막대 차트 (Bar Charts)

![https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/PQLS5X8UQixGhzg_9VWuV9R6Jmw.png](https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/PQLS5X8UQixGhzg_9VWuV9R6Jmw.png)

### 막대 차트(bar chart)

- 막대 차트는 본질적으로 **가로 방향의 칼럼 차트**임.  

- 막대가 가로로 뻗어 있고, 항목(카테고리)이 세로축에 나열됨.

### 막대 차트를 사용할 때

- 카테고리 이름이 길 때  

    - 긴 텍스트를 가로 방향으로 배치할 수 있어 가독성이 좋음.

- 카테고리 개수가 많을 때  

    - 카테고리 수가 7개를 초과하고 15개 이내일 때 막대 차트 사용 권장.

- 음수 값이 포함될 때  

    - 가로축을 기준으로 음수는 왼쪽, 양수는 오른쪽으로 직관적으로 표현 가능함.

### 막대 차트 활용 예시

- 상위 추천/유입 사이트별 방문자 수  

    - 추천 사이트 수가 5~7개를 넘는 경우가 많고, 사이트 이름도 긴 편이므로 가로 막대가 적합함.

- 영업사원별 매출 실적  

    - 영업사원 이름이 길 수 있고, 인원 수가 7명을 넘을 가능성이 있어 막대 차트가 더 적합함.

### 칼럼 차트 vs 막대 차트 선택 기준 한 줄 정리

- 카테고리가 적고 이름이 짧으면 → 칼럼 차트  

- 카테고리가 많거나 이름이 길면 → 막대 차트

---

### 막대 히스토그램 차트 (Bar Histogram Charts)

![https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/2o_b8VQZD3wXOjIJCmTQLLuxFcg.png](https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/2o_b8VQZD3wXOjIJCmTQLLuxFcg.png)

### 막대 차트와 히스토그램

- 막대 차트도 칼럼 차트와 마찬가지로 **히스토그램을 표현하는 데 사용할 수 있음**.  

- 즉, 가로 방향 막대를 사용해 분포를 보여주는 히스토그램 형태도 가능함.

### 히스토그램 예시: 인구 피라미드

- 좋은 히스토그램 예시는 **연령(및 성별)별 인구 분포**임.  

- 흔히 보는 "크리스마스 트리 모양" 그래프(인구 피라미드)가 여기에 해당함.

---

### 누적 막대 차트 (Stacked Bar Charts)

![https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/Kfwf6Kxtc1k__vRrFr_8_tBxpow.png](https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/Kfwf6Kxtc1k__vRrFr_8_tBxpow.png)

### 스택 막대 차트(stacked bar chart) 사용 상황

- 스택 막대 차트는 **변수가 적고, 구성 요소(파트) 수도 적을 때**만 사용하는 것이 적절함.  

- 강조점이 **값의 비교나 관계 분석이 아니라 '구성비(구성 요소가 전체를 어떻게 이루는지)'에 있을 때** 사용하는 것이 좋음.

### 스택 막대 차트의 한계

- 스택 막대 차트는 **비교나 관계 분석용으로는 좋지 않음**.  

- 공통 기준선(baseline)은 차트의 왼쪽 축에만 존재함.  

- 따라서 **첫 번째 시리즈(맨 아래에 쌓인 막대)**와 **전체 합(모든 시리즈의 합)**만 신뢰할 수 있게 비교 가능함.  

- 중간에 쌓인 시리즈들은 시작점이 제각각이라, 서로 정확히 비교하기 어려움.

---

## 선 차트 (Line Charts)

![https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/RfAk7YSPVFo5Mw5dbVzLy2Lj_kU.png](https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/RfAk7YSPVFo5Mw5dbVzLy2Lj_kU.png)

### 선 차트(line chart) 개요

- 선 차트는 학교에서 칠판에 자주 그리던, 가장 익숙한 차트 유형 중 하나임.  

- 가장 자주 사용되는 차트 타입에 속함.

### 선 차트를 사용할 때

- **연속형 데이터(continuous data set)**를 표현할 때 사용함.  

- 시간에 따른 데이터 변화 추세(trend)를 시각화할 때 가장 적합함.  

- 데이터 포인트 개수가 **많을 때(20개 초과)** 특히 효과적임.

### 선 차트의 강조점

- 값의 **연속성·흐름(트렌드)**에 초점을 둠.  

- 데이터 마커를 사용하면 **개별 값 비교**도 어느 정도 가능함.  

    - 단, 이 경우에는 데이터 포인트 수가 20개 미만일 때가 적절함.

### 선 차트 vs 칼럼 차트

- 차트 크기가 작을 때는 칼럼 차트 대신 **선 차트가 좋은 대안**이 될 수 있음.

---

---

## 선 차트(Line Chart) 사용 원칙

- 선 차트는 **구간 간 간격이 동일한 연속형 데이터**를 표현할 때 사용함.  

- 예: 시간(초, 분, 시, 일 등), 거리, 온도 등 일정 간격으로 측정된 데이터.

## 축 설정과 0 기준선

- 선 차트에서 축은 **반드시 0에서 시작할 필요는 없음**.  

    - 전달하고자 하는 메시지가 **변화율(rate of change)**이나 **전체 추세(trend)**일 때는 0이 아니어도 됨.

- 다만, **일반 대중/넓은 대상에게 보여줄 때는 0에서 시작하는 것이 안전함**.  

    - 그렇지 않으면 그래프가 과장되어 보이거나 오해를 부를 수 있음.

## 시간 축과 데이터 간격

- 시간은 항상 **왼쪽에서 오른쪽으로 흐르도록** 배치해야 함.  

- 일정한 간격의 데이터를 사용해 추세를 보여줄 때는  

    - 값이 0인 구간도 **건너뛰지 말고 포함**해야 함.  

    - 예: 특정 날짜에 값이 0이어도 그 날짜를 빼지 말고 0으로 표시해야 올바른 추세 표현이 가능함.

## 시각적 단순화

- 선 차트에서는 **보조선(guidelines, gridlines)을 제거**해  

    - 추세와 변화율을 더 잘 드러내고, 시각적 방해 요소를 줄이는 것이 좋음.

## 기울기와 종횡비(aspect ratio)

- 중요한 정보(추세, 변화)를 왜곡 없이 보여주기 위해  

    - **적절한 가로:세로 비율(aspect ratio)**을 사용해야 함.

- 기울기가 지나치게 가파르거나 완만해 보이지 않도록  

    - 대략 **45도 기울기**에 가깝게 보이도록 설정하는 것이 인지적으로 가장 이해하기 좋음.

---

## 영역 차트 (Area Charts)

![https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/mOKa43c9TF_I2m7Eig5GnRuOgog.png](https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/mOKa43c9TF_I2m7Eig5GnRuOgog.png)

## 영역 차트(area chart) 개요

- 에어리어 차트는 기본적으로 **선 차트의 한 종류**임.  

- 선 아래 영역을 색으로 채워, **추세(trend)**와 일부 **비교**를 보여주는 데 사용함.

### 영역 차트의 적절한 사용

- 선 아래 면적이 **시간에 따른 누적 변화(accumulative value changes)**를 잘 보여줄 때 적합함.  

- 예시  

    - 재고 수량 변화(시간에 따라 쌓이거나 줄어드는 양).  

    - 직원 수 변화(조직 인원 수의 누적 변화).  

    - 저축 계좌 잔액 변화(저축이 쌓이는 과정).

## 에어리어 차트 사용 시 주의점

- **값이 크게 들쭉날쭉(fluctuating)하는 경우에는 사용하지 말 것.**  

- 주식 시장 가격, 일반적인 가격 변동처럼 자주 오르내리는 데이터에는 부적합함.

---

### 누적 영역 (Stacked Area)

![https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/nnc0a9y3TCrSyYoOLGzAp6vBIjw.png](https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/nnc0a9y3TCrSyYoOLGzAp6vBIjw.png)

### 누적 영역 차트(stacked area chart) 용도

- 스택 에어리어 차트는 **시간에 따른 구성비 변화**를 보여줄 때 가장 적합함.  

- 예시  

    - 기간별 주요 경쟁사 간 **시장 점유율(market share) 변화**.  

    - 기간별 **제품 라인별 매출 비중(revenue share)** 변화.

### 누적 영역 차트 사용 시 주의점

- 시각적으로 화려하고 재미있게 보일 수 있지만, **쉽게 복잡하고 지저분해질 수 있음** → 주의해서 사용해야 함.  

- **정확한 비교가 필요할 때는 사용하지 말 것.**  

- 한 번에 **3~5개 카테고리 이상을 쌓지 말 것.**  

    - 그 이상 쌓으면 각 영역의 경계가 겹쳐져 해석이 어려워짐.

---

## 파이 차트 및 도넛 차트 (Pie Charts and Donut Charts)

![https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/kqhzHODqpc7otdm4muLwwmqthGE.png](https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/kqhzHODqpc7otdm4muLwwmqthGE.png)

### 파이 차트(pie chart) 개요

- 파이와 도넛 모양 차트는 사람들이 좋아하지만, **데이터 시각화에서는 가장 자주 사용되면서 동시에 가장 많이 오용되는 차트**임.  

- 예시로 든 나쁜 파이 차트처럼  

    - 구성 요소가 너무 많고  

    - 값들이 서로 너무 비슷하면
    - → 해석이 거의 불가능해져 "형편없고 쓸모없는 차트"가 됨.

### 파이 차트의 올바른 용도

- 파이 차트는 보통 **퍼센트(%) 값**을 표현함.  

- **전체 대비 부분의 비율(part-to-whole 관계, composition)**을 시각화할 때 사용함.

### 파이 차트의 한계

- 파이 차트는 **각 조각을 서로 정밀하게 비교하는 용도**가 아님.  

- 인간의 인지는 **길이(선형 정보)는 비교적 잘 판단**하지만,  

    - **각도(angle)**와 **면적(area)**에 대해서는 대부분 정확하게 구분·비교하지 못함.

- 따라서 비율 비교·정확한 판단이 중요한 상황에서는  

    - 파이·도넛 차트보다 막대 차트 등 선형 비교가 가능한 차트를 우선 고려해야 함.

![https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/-rYUuHXxFttn1VftSDzRZLBIH8o.png](https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/-rYUuHXxFttn1VftSDzRZLBIH8o.png)

---

### 누적 도넛 차트 (Stacked Donut C harts)

![https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/ca28bn6P51bxnN1i6VL8E_3-HHc.png](https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/ca28bn6P51bxnN1i6VL8E_3-HHc.png)

### 스택 도넛 차트(stacked donut chart)에 대한 권고

- **스택 도넛 차트는 사용하지 않는 것을 강력히 권장함.**  

- "구성을 보여주면서, 어느 정도 비교도 되겠지?"라고 생각할 수 있지만  

    - 구성비 표현도, 비교도 **둘 다 성능이 나쁨**.

### 대안 차트

- 구성비를 보여주면서 어느 정도 비교도 필요하다면  

    - **스택 칼럼 차트(stacked column chart)**를 사용하는 것이 훨씬 나음.

---

![Image](https://upload.cafenono.com/image/slashpageHome/20251216/150700_r6SZHhRebxmKRO1jAG)

### 파이 차트(Pie Chart) 사용 원칙

### 반드시 지켜야 할 것 (Dos)

- 모든 조각의 합은 **항상 100%가 되어야 함**.  

- 카테고리(조각) 수가 **6개 미만일 때만** 사용하는 것이 좋음.  

- 가장 이상적인 경우는  

    - **2개 카테고리**: 예) 웹사이트 방문자 중 남/녀 비율.  

    - **1개 카테고리 강조**: 예) 전체 시장 대비 우리 회사의 시장 점유율.

### 피해야 할 것 (Don'ts)

- 카테고리 값이 **거의 비슷하거나, 반대로 너무 차이가 클 때** 파이 차트 사용 금지.  

    - 라벨을 붙여서 해결하려 해도, 이는 개선이 아니라 임시 땜질에 불과함.

- **3D 효과**나 **조각 분리(blow apart) 효과** 사용 금지.  

    - 비율 인식이 왜곡되고, 실제 비율과 다른 인상을 줌.

---

## 분산 차트 (Scatter Charts)

![https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/e5cO98y1Aa-drWhG9ivLdGsLmbE.png](https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/e5cO98y1Aa-drWhG9ivLdGsLmbE.png)

### 산점도(Scatter Chart) 용도

- 산점도는 **상관관계(correlation)**와 **분포(distribution) 분석**에 주로 사용함.  

- 한 변수가 다른 변수와 **어떻게 관련되어 있는지(또는 전혀 관련이 없는지)** 보여줄 때 적합함.

### 산점도가 보여줄 수 있는 것

- 데이터의 분포 형태나 **클러스터링(군집) 패턴**을 파악하는 데 유용함.  

- **이상치(outlier)**나 다른 점들과 동떨어진 값들을 쉽게 발견할 수 있음.

### 산점도 예시

- **마케팅 비용 vs 매출**을 보여주는 차트가 좋은 예시임.  

    - 마케팅 지출이 늘어날수록 매출이 함께 늘어나는지(상관관계 여부)를 시각적으로 확인 가능함.

---

### 버블 차트 (Bubble Charts)

![https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/-LboKQQnX8YnMkK4mTDR9mvG_nQ.png](https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/-LboKQQnX8YnMkK4mTDR9mvG_nQ.png)

### 버블 차트(bubble chart) 개요

- 버블 차트는 산점도(scatter plot)에 **한 차원(변수)을 더 추가**하고 싶을 때 사용하는 차트임.  

- 기본 산점도는 두 값(x, y)을 비교하지만, 버블 차트는 **버블의 크기(size)를 세 번째 변수**로 사용해 비교를 가능하게 함.  

- 버블 크기가 서로 너무 비슷하면 **라벨을 사용해 값 표시**를 보조하는 것이 좋음.

### 차원 추가와 한계

- 네 번째 변수는 **색(color)** 농도(그라데이션)로 추가할 수 있음.  

- 또는 버블을 **작은 파이 차트 모양**으로 표현해 또 다른 변수를 넣을 수도 있음.  

- 하지만 이렇게까지 여러 변수를 한 번에 넣으면 **정보 과부하**가 되기 쉬워, 대부분의 경우에는 과도함.

### 버블 차트 활용 예시

- 좋은 예: **마케팅 비용 vs 매출 vs 이익**  

    - 산점도: 마케팅 비용과 매출 간 양의 상관관계를 보여줄 수 있음.  

    - 버블 차트: 같은 지점에 버블 크기로 **이익(profit)**을 표시해  

        - 마케팅 비용이 증가하면서 매출은 오르지만  

        - 동시에 이익이 깎이고 있는지(마케팅 비용이 이익을 잠식하는지)를 드러낼 수 있음.

### 산점도 & 버블 차트 공통 활용 목적

- **표현 목적**  

    - 산점도: 두 개의 수치형 변수 간 관계 표현.  

    - 버블 차트: 세 개의 수치형 변수 간 관계 표현.

- **좌표계 특성**  

    - 두 개(산점도) 혹은 세 개(버블)의 변수 세트를 하나의 **x–y 좌표 평면** 위에 표시함.  

    - 가로축을 **로그 스케일(logarithmic scale)**로 바꿔, 폭이 매우 넓게 퍼진 값들의 관계도 잘 보이게 할 수 있음.

### 어떤 데이터에 적합한가

- 데이터가 많은 경우(큰 데이터셋)에 적합함.  

    - 선형/비선형 패턴, 추세, 상관관계, 클러스터, 이상치 등을 시각적으로 파악하기 좋음.  

    - 시간 축 없이도, **많은 데이터 포인트를 한 번에 비교**할 수 있음.  

    - 산점도에는 데이터가 많을수록 관계 파악이 오히려 더 수월해짐.

- **"정확한 값 비교"보다 "관계와 패턴"을 보여주는 데 초점**을 맞춤.  

    - 개별 수치를 정확히 비교하려면 다른 차트가 더 적합함.

---

## 지도 차트 (Map Charts)

![https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/UH1hUp18O03CiYES2RU-4Shq4SQ.png](https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/UH1hUp18O03CiYES2RU-4Shq4SQ.png)

### 지도 차트(map chart) 용도

- 지도 차트는 수치에 **지리적 맥락**을 더해,  

    - 성과가 좋은 지역과 나쁜 지역,  

    - 지역별 추세, 이상치를 빠르게 파악하는 데 유용함.

- 좌표, 국가명, 주/도 이름, 약어, 주소 등 **위치 데이터**가 있으면 그에 대응하는 값을 지도 위에 표시할 수 있음.

### 지도 차트의 한계와 보완

- 지도 차트는 보통 **색상 스케일(color scale)**을 사용하므로,  

    - 사람 눈이 색깔 농도(명도·채도) 차이를 잘 구분하지 못해 **정확한 값 비교에는 적합하지 않음**.

- 정확한 값 전달이나 비교가 필요하다면  

    - 지도 위에 **버블(원)**을 덧씌우거나  

    - **숫자 레이블**을 추가해 보완하는 것이 좋음.

### 지도 차트 활용 예시

- 국가·주·도·시 단위의 **웹사이트 방문자 수** 표시.  

- 주/지역/도시별 **제품 판매량** 표시.

---

- 지도를 배경으로 **정량 정보(quantitative information)**를 보여주고 싶을 때 사용함.  

- 지역 간 **공간적 관계와 패턴(spatial relationships and patterns)**을 표현할 때 적합함.  

- 데이터 해석에서 **지역/공간적 맥락(regional context)**이 중요한 경우 사용함.  

- 여러 지리적 위치에 걸친 **분포 상황을 한눈에 파악**하고 싶을 때 효과적임.  

- 데이터가 **전체 영역에 대해 동일한 형식과 척도(standardized data format & scale)**를 가지고 있을 때만 사용하는 것이 바람직함.

### 지도 차트 사용 시 주의점

- 지리적 차원이 있다고 해서 **무조건 지도로 표현해서는 안 됨**.  

- 요즘 대부분의 데이터가 위치 정보를 포함하지만,  

    - 모든 데이터를 지도 차트로 보여주는 것이 항상 최선은 아님.

![https://t1.daumcdn.net/thumb/R1280x0.fjpg/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/2CRikV7xR9o6J-2pa21sJ2vVuPA.jpg](https://t1.daumcdn.net/thumb/R1280x0.fjpg/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/2CRikV7xR9o6J-2pa21sJ2vVuPA.jpg)

지도 차트는 언제 사용할까요?

- 지도에 정량적 정보를 표시

- 공간적 관계와 패턴을 제시

- 데이터에 대한 지역적 맥락이 중요한 경우

- 지리적 위치에 걸친 분포에 대한 개요를 얻기 위해

- 데이터가 표준화 된 경우 (즉, 전체 세트에 대해 동일한 데이터 형식 및 배율을 가짐)

## 간트 차트 (Gantt Charts)

![https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/pXtieoXCedwsBe1v30WGRrqLlmI.png](https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/pXtieoXCedwsBe1v30WGRrqLlmI.png)

![https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/1cmjxcz637OgoPArI2bcuPjgG7U.png](https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/1cmjxcz637OgoPArI2bcuPjgG7U.png)

### 간트 차트(Gantt chart) 기본 개념

- 간트 차트는 1896년 Karol Adamiecki가 바 차트를 프로젝트 계획용으로 처음 적응했으나, 이름은 1910년대에 독립적으로 이 유형을 발전시킨 Henry Gantt에서 유래함.

- 막대(bar)를 이용해 **프로젝트 일정과 작업 진행 상태를 시각적으로 표현하는 차트**임.[2]

### 간트 차트의 주요 용도

- 프로젝트를 **계획·스케줄링**할 때 사용함.[1]

- 무엇을 해야 하는지(작업 목록), 어떤 순서로 해야 하는지(의존 관계), 언제까지 끝내야 하는지(마감일)를 한눈에 보여주는 **프로젝트 지도(project map)** 역할을 함.[3][2]

- 전체 프로젝트에 필요한 총 소요 시간, 관련 리소스, 작업 간 선후 관계와 의존성을 시각화할 수 있음.[3][2]

### 프로젝트 외 활용 예시

- **렌털(대여) 비즈니스**에서도 활용 가능함.  

    - 예: 렌터카, 객실, 아파트 등의 **대여 가능한 항목 리스트**와 각 항목의 **대여 기간**을 막대로 표현하여 예약 현황을 한눈에 파악할 수 있음.[2]

### 간트 차트 작성에 필요한 최소 정보

- 기본적으로 **시작일(start date)**과 **종료일(end date)**이 필요함.[3]

- 더 고급 간트 차트에서는  

    - 각 작업의 **완료율(percentage complete)**  

    - 다른 작업에 대한 **의존 관계(dependency)**
    - 등을 추가로 입력하여, 진행 상황과 일정 리스크를 더 정확히 관리할 수 있음

---

## 게이지 차트 (Gauge Charts)

![https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/TaWAQ7Jq6ByKGxHbqPtdF2luFFw.png](https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/TaWAQ7Jq6ByKGxHbqPtdF2luFFw.png)

### 게이지 차트(gauge chart) 용도

- 게이지 차트는 **KPI(Key Performance Indicator, 핵심 성과 지표)**를 표시하는 데 적합함.  

- 일반적으로 단일 핵심 값을 표시하며, 이 값을 색으로 구분된 성과 수준(보통 초록은 "양호", 빨강은 "문제")과 비교함.

### 게이지 차트를 사용할 곳

- 가장 대표적인 활용처는 **대시보드(Dashboard)**임.  

- 여러 KPI를 한 화면에 배치해, 프로젝트나 회사의 전반적인 "건강 상태(health check)"를 빠르게 파악할 수 있게 함.

### 게이지 차트가 좋은 경우

- 목표 달성 진행 상황을 보여줄 때 적합함.  

- KPI와 같은 **백분위(퍼센타일)나 지표 값**을 표현할 때 유용함.  

- 하나의 지표에 대한 **정확한 값과 그 값의 의미**를 동시에 보여줄 때 좋음.  

- 사용자가 **한 눈에, 빠르게 이해해야 하는 단일 정보**를 보여줄 때 효과적임.

### 게이지 차트의 단점 및 대안

- 화면 공간을 많이 차지하는 데 비해, 보통 **데이터 포인트는 하나만** 보여줌.  

- 같은 성과 기준(스케일)을 기준으로 여러 게이지를 나란히 비교해야 한다면  

    - 게이지 여러 개보다 **임계값(threshold)을 표시한 칼럼 차트**가 더 효율적이고 컴팩트한 대안이 될 수 있음.

---

## 다중 축 차트 (Multi Axes Charts)

![https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/VSawDgAeeztxP5dKIejseFcORuI.png](https://t1.daumcdn.net/thumb/R1280x0.fpng/?fname=http://t1.daumcdn.net/brunch/service/user/QI8/image/VSawDgAeeztxP5dKIejseFcORuI.png)

### 멀티 축 차트(multi-axes chart) 개념

- 단일 차트로는 전체 이야기를 전달하기 어려울 때 사용하는 차트 유형임.  

- 서로 **스케일이 크게 다른 여러 변수**의 관계와 비교를 보여주고 싶을 때, 여러 개의 Y축과 하나의 공통 X축을 사용하는 방식임.

### 멀티 축 차트의 특징과 한계

- 하나의 X축을 공유하면서 **두 개 이상 Y축**에 데이터를 그릴 수 있음.  

- 대신 **읽고 이해하기 훨씬 어려워진다는 비용**이 따름.  

- 공통된 추세, 상관관계(또는 상관 없음), 여러 데이터셋 간 관계를 보여주는 데는 유용함.  

- 그러나 **축 스케일이 서로 달라서 정확한 값 비교에는 적합하지 않음**.  

- **정확한 값 자체를 보여주거나 비교해야 하는 목적이라면 사용하면 안 됨.**

### 멀티 축 차트를 사용할 때

- 같은 X축(예: 날짜)을 공유하는 **선 차트와 칼럼 차트를 함께** 보여주고 싶을 때.  

- 값의 범위가 다른 **여러 측정값(measures)**을 비교하고 싶을 때.  

- 두 개 이상 측정값 사이의 **관계·상관관계·상관 없음**을 한 시각화 안에서 보여주고 싶을 때.  

- 여러 개의 차트를 따로 그리는 대신, **화면(canvas) 공간을 아끼고 싶을 때**  

    - 단, 차트가 너무 복잡해지지 않는 선에서만.

---

# 데이터 시각화 Do & Don’t (일반 원칙 정리)

## 시간 축(Time axis)

- 시간 데이터는 항상 가로축(X축)에 두고, **왼쪽에서 오른쪽으로 흐르게** 설정함.  

- 특정 기간에 값이 없더라도 **시간 구간을 건너뛰지 않고 그대로 포함**해야 함.

## 값과 비례 관계(Proportional values)

- 막대, 면적, 버블 등 **시각적으로 그려지는 크기**는 반드시 실제 수치와 **정비례**해야 함.

## 데이터-잉크 비율(Data-Ink Ratio)

- 의미 없는 선, 색, 텍스트 등 **가치를 더하지 않는 요소는 제거**함.  

- 메시지 전달에 필요한 최소한의 시각 요소만 남기도록 함.

## 정렬(Sorting)

- 칼럼/막대/파이 차트에서 비교를 쉽게 하려면  

    - 값을 기준으로 **오름차순 또는 내림차순 정렬**함.  

    - 알파벳 순 정렬은 비교용 차트에서는 피함.

## 범례(Legend)와 레이블(Labels)

- 데이터 카테고리가 하나뿐이면 **범례는 필요 없음**.  

- 가능하면 선·막대·파이 조각 등 **요소 위에 직접 레이블**을 붙여, 범례를 통해 간접 조회하지 않게 함.

## 화폐·물가(Inflation adjustment)

- 장기 시계열에서 화폐 단위를 사용할 때는 **물가상승률(인플레이션)을 반영해 조정**해야 함.

## 색상(Colors) 기본 원칙

- 한 차트에서 **색상은 6개 이하**로 제한함.  

- 동일한 값을 다른 시점에 비교할 때는  

    - **같은 색의 명도 차이(연한색↔진한색)**로 표현함.

- 서로 다른 카테고리는 **서로 다른 색**을 사용함.  

    - 주로 사용되는 색: 검정, 흰색, 빨강, 초록, 파랑, 노랑.

- 동일 시리즈/리포트 안에서는  

    - **같은 색 팔레트와 스타일, 축, 레이블 형식**을 유지해 일관성을 높임.

## 색상과 출력·색맹 고려

- 회색조(그레이스케일)로 인쇄했을 때도 **구분이 되는지** 반드시 확인함.  

    - 구분이 어렵다면 색상의 **색조(hue)·채도(saturation)**를 조정함.

- 남성의 7–10%는 색각 이상이 있으므로  

    - 색맹 친화 팔레트 사용, 명도·패턴 등 **색 이외의 구분 요소**도 고려함.

## 데이터 복잡성(Data Complexity)

- 한 차트에 **너무 많은 정보**를 넣지 말 것.  

- 필요하다면  

    - 두 개 이상의 차트로 분리하거나  

    - 중요한 부분만 강조(highlighting)하거나  

    - 색을 단순화하거나  

    - 차트 유형을 변경하여 가독성을 높임.

For the site tree, see the [root Markdown](https://slashpage.com/lion.md).
