데이터 시각화 - 차트 디자인

Chart 선택 방법

앤드류 아벨라(Andrew V. Abela)의 챠트 선택 방법
시각화 목적에 따라 비교(Comparion), 분포(Distribution), 구성(Comparison), 관계(Relationship)

그림 출처:
https://medium.com/@DataPlay/selecting-the-right-chart-for-your-data-501af25dc693
The Data Visualisation Catalogue 사이트에서도 기능별 다양한 시각화 형태 탐색 가능
차트 선택시 유의 사항
1.
표현하고자 하는 데이터의 갯수와 특징 고려
2.
다양한 차트의 종류를 살펴보며 어떤 장단점이 있으며, 어떤 경우에 사용하는 것이 가장 효과적일지 많이 보고 연습

1. 시각화 차트 유형

테이블 (Tables)

테이블은 기본적으로 모든 차트의 소스
변수와 데이터 포인트가 적을 때 비교, 구성 또는 관계 분석에 가장 적합
테이블에서 데이터를 쉽게 해석 할 수 있다면 차트를 만드는 것은 의미가 없음
구분
표(Table) 사용 시
차트(Chart) 사용 시
주요 목적
개별 값 비교·정확한 조회 reflectionsfromaredhead​
데이터 모양·관계·추세 전달 reflectionsfromaredhead​
사용 기준
- 정밀 수치(소수점, 단위) 중요- 여러 항목 나란히 비교 필요
- 변화율(rate of change) 보여줄 때- 패턴·기울기·전환점 강조
예시
제품 가격(원), 수량(개), 무게(kg) 동시 제시 reflectionsfromaredhead​
온도 급락처럼 기울기·변화 속도 직관 전달 reflectionsfromaredhead​
특징
"얼마냐?"(정확한 값) 초점
"어떻게 변하냐?"(형태·흐름) 초점
한계
추세 파악 어려움
개별 정밀 수치 전달 약함

세로 막대 차트 (Column Charts)

칼럼 차트 주요 용도

가장 많이 쓰이는 차트 타입.
서로 다른 값들을 비교할 때 최적.
사용자가 각 칼럼의 개별 값을 조회·비교할 것으로 예상될 때 사용.
카테고리 간 값 비교 또는 한 카테고리의 시간 경과 변화 비교에 적합.

베스트 프랙티스

카테고리 수 제한
5개까지는 좋음, 7개 초과 시 피함.
시간 축 설정
시간(년, 분기, 월, 주, 일, 시간)은 항상 가로축(X축)에 배치.
시간은 왼쪽→오른쪽으로 흐름(위→아래 절대 안 됨).
수치 축 기준선
세로축(Y축)은 반드시 0부터 시작.
칼럼 높이에 눈이 민감 → 잘린 막대는 잘못된 결론 유발.
시각 디자인
패턴 선이나 채움 사용 금지.
테두리는 강조용으로만 제한적 사용.
추세 표시 제한
데이터 포인트 20개 미만이고 모든 값이 명확히 보일 때만 추세로 사용.

세로 막대 히스토그램 (Column Histograms)

히스토그램 정의

히스토그램은 칼럼 차트(세로 막대 차트)의 일반적인 변형임.
하나의 변수(single variable)가 여러 구간 또는 그룹으로 나뉘었을 때, 그 분포(distribution)와 관계를 보여주는 데 사용함.

히스토그램 용도

단일 변수의 값들이 각 구간(카테고리)에 어떻게 분포되어 있는지 보여줄 때 사용함.
"특정 값들이 어느 구간에 많이 몰려 있는지"를 시각적으로 파악할 수 있음.

예시

학교 시험에서 학생들의 성적 분포를 보여줄 때 사용 가능함.
예: 0–10점, 11–20점, 21–30점… 구간별 학생 수.
호박 축제에서 호박 크기 사이즈 그룹별 개수를 보여줄 때 사용 가능함.
예: 작은 사이즈, 중간 사이즈, 큰 사이즈 등으로 나누어 각 그룹의 호박 개수를 표현.

누적 세로 막대 차트 (Stacked Column Charts)

스택 칼럼 차트 용도

스택 칼럼 차트는 구성비(composition)를 보여줄 때 사용함.
하나의 전체 값을 여러 부분(구성 요소)로 쌓아서, 전체와 각 부분의 크기를 동시에 표현함.

스택 칼럼 차트 베스트 프랙티스

구성 요소(스택 항목)를 너무 많이 넣지 말 것.
3~4개 이내로 제한하는 것이 좋음.
각 구성 요소의 크기가 너무 차이 나지 않도록 하는 것이 좋음.
크기 차이가 너무 크면 해석이 어렵고, 시각적으로도 지저분해짐.
구성 요소가 많고 크기 차이가 크면
차트가 금방 복잡해지고, 메시지가 흐려짐.

칼럼 차트 효과성 개선 포인트

다음 차트 유형으로 넘어가기 전에,
불필요한 요소를 줄여 단순화(simplify) 하면 칼럼 차트의 효과를 높일 수 있음.
색, 레이블, 구성 항목을 최소화해
사용자가 핵심 비교와 메시지에 집중하도록 만드는 것이 중요함.

막대 차트 (Bar Charts)

막대 차트(bar chart)

막대 차트는 본질적으로 가로 방향의 칼럼 차트임.
막대가 가로로 뻗어 있고, 항목(카테고리)이 세로축에 나열됨.

막대 차트를 사용할 때

카테고리 이름이 길 때
긴 텍스트를 가로 방향으로 배치할 수 있어 가독성이 좋음.
카테고리 개수가 많을 때
카테고리 수가 7개를 초과하고 15개 이내일 때 막대 차트 사용 권장.
음수 값이 포함될 때
가로축을 기준으로 음수는 왼쪽, 양수는 오른쪽으로 직관적으로 표현 가능함.

막대 차트 활용 예시

상위 추천/유입 사이트별 방문자 수
추천 사이트 수가 5~7개를 넘는 경우가 많고, 사이트 이름도 긴 편이므로 가로 막대가 적합함.
영업사원별 매출 실적
영업사원 이름이 길 수 있고, 인원 수가 7명을 넘을 가능성이 있어 막대 차트가 더 적합함.

칼럼 차트 vs 막대 차트 선택 기준 한 줄 정리

카테고리가 적고 이름이 짧으면 → 칼럼 차트
카테고리가 많거나 이름이 길면 → 막대 차트

막대 히스토그램 차트 (Bar Histogram Charts)

막대 차트와 히스토그램

막대 차트도 칼럼 차트와 마찬가지로 히스토그램을 표현하는 데 사용할 수 있음.
즉, 가로 방향 막대를 사용해 분포를 보여주는 히스토그램 형태도 가능함.

히스토그램 예시: 인구 피라미드

좋은 히스토그램 예시는 연령(및 성별)별 인구 분포임.
흔히 보는 "크리스마스 트리 모양" 그래프(인구 피라미드)가 여기에 해당함.

누적 막대 차트 (Stacked Bar Charts)

스택 막대 차트(stacked bar chart) 사용 상황

스택 막대 차트는 변수가 적고, 구성 요소(파트) 수도 적을 때만 사용하는 것이 적절함.
강조점이 값의 비교나 관계 분석이 아니라 '구성비(구성 요소가 전체를 어떻게 이루는지)'에 있을 때 사용하는 것이 좋음.

스택 막대 차트의 한계

스택 막대 차트는 비교나 관계 분석용으로는 좋지 않음.
공통 기준선(baseline)은 차트의 왼쪽 축에만 존재함.
따라서 **첫 번째 시리즈(맨 아래에 쌓인 막대)**와 **전체 합(모든 시리즈의 합)**만 신뢰할 수 있게 비교 가능함.
중간에 쌓인 시리즈들은 시작점이 제각각이라, 서로 정확히 비교하기 어려움.

선 차트 (Line Charts)

선 차트(line chart) 개요

선 차트는 학교에서 칠판에 자주 그리던, 가장 익숙한 차트 유형 중 하나임.
가장 자주 사용되는 차트 타입에 속함.

선 차트를 사용할 때

**연속형 데이터(continuous data set)**를 표현할 때 사용함.
시간에 따른 데이터 변화 추세(trend)를 시각화할 때 가장 적합함.
데이터 포인트 개수가 많을 때(20개 초과) 특히 효과적임.

선 차트의 강조점

값의 **연속성·흐름(트렌드)**에 초점을 둠.
데이터 마커를 사용하면 개별 값 비교도 어느 정도 가능함.
단, 이 경우에는 데이터 포인트 수가 20개 미만일 때가 적절함.

선 차트 vs 칼럼 차트

차트 크기가 작을 때는 칼럼 차트 대신 선 차트가 좋은 대안이 될 수 있음.

타임 라인 차트 (Timeline Charts)

타임라인 차트(timeline chart) 개요

타임라인 차트는 선 차트(line chart)의 변형임.
일정 기간 동안의 값 변화를 보여주는 모든 선 차트는 사실상 타임라인 차트에 해당함.

타임라인 차트의 기능적 특징

일반 선 차트와의 차이는 **기능성(functionality)**에 있음.
대부분의 타임라인 차트는 다음과 같은 기능을 제공함.
시간 축을 확대/축소(zoom in/out)할 수 있음.
시간 축을 압축하거나 늘려서 전체 추세 또는 세부 구간을 선택적으로 볼 수 있음.

타임라인 차트 활용 예시

주가(주식 시장 가격)의 시간에 따른 변화.
지난 30일 동안의 일별 웹사이트 방문자 수.
지난 분기 동안의 일별 매출 수치.

선 차트(Line Chart) 사용 원칙

선 차트는 구간 간 간격이 동일한 연속형 데이터를 표현할 때 사용함.
예: 시간(초, 분, 시, 일 등), 거리, 온도 등 일정 간격으로 측정된 데이터.

축 설정과 0 기준선

선 차트에서 축은 반드시 0에서 시작할 필요는 없음.
전달하고자 하는 메시지가 **변화율(rate of change)**이나 **전체 추세(trend)**일 때는 0이 아니어도 됨.
다만, 일반 대중/넓은 대상에게 보여줄 때는 0에서 시작하는 것이 안전함.
그렇지 않으면 그래프가 과장되어 보이거나 오해를 부를 수 있음.

시간 축과 데이터 간격

시간은 항상 왼쪽에서 오른쪽으로 흐르도록 배치해야 함.
일정한 간격의 데이터를 사용해 추세를 보여줄 때는
값이 0인 구간도 건너뛰지 말고 포함해야 함.
예: 특정 날짜에 값이 0이어도 그 날짜를 빼지 말고 0으로 표시해야 올바른 추세 표현이 가능함.

시각적 단순화

선 차트에서는 보조선(guidelines, gridlines)을 제거
추세와 변화율을 더 잘 드러내고, 시각적 방해 요소를 줄이는 것이 좋음.

기울기와 종횡비(aspect ratio)

중요한 정보(추세, 변화)를 왜곡 없이 보여주기 위해
**적절한 가로:세로 비율(aspect ratio)**을 사용해야 함.
기울기가 지나치게 가파르거나 완만해 보이지 않도록
대략 45도 기울기에 가깝게 보이도록 설정하는 것이 인지적으로 가장 이해하기 좋음.

영역 차트 (Area Charts)

영역 차트(area chart) 개요

에어리어 차트는 기본적으로 선 차트의 한 종류임.
선 아래 영역을 색으로 채워, **추세(trend)**와 일부 비교를 보여주는 데 사용함.

영역 차트의 적절한 사용

선 아래 면적이 **시간에 따른 누적 변화(accumulative value changes)**를 잘 보여줄 때 적합함.
예시
재고 수량 변화(시간에 따라 쌓이거나 줄어드는 양).
직원 수 변화(조직 인원 수의 누적 변화).
저축 계좌 잔액 변화(저축이 쌓이는 과정).

에어리어 차트 사용 시 주의점

값이 크게 들쭉날쭉(fluctuating)하는 경우에는 사용하지 말 것.
주식 시장 가격, 일반적인 가격 변동처럼 자주 오르내리는 데이터에는 부적합함.

누적 영역 (Stacked Area)

누적 영역 차트(stacked area chart) 용도

스택 에어리어 차트는 시간에 따른 구성비 변화를 보여줄 때 가장 적합함.
예시
기간별 주요 경쟁사 간 시장 점유율(market share) 변화.
기간별 제품 라인별 매출 비중(revenue share) 변화.

누적 영역 차트 사용 시 주의점

시각적으로 화려하고 재미있게 보일 수 있지만, 쉽게 복잡하고 지저분해질 수 있음 → 주의해서 사용해야 함.
정확한 비교가 필요할 때는 사용하지 말 것.
한 번에 3~5개 카테고리 이상을 쌓지 말 것.
그 이상 쌓으면 각 영역의 경계가 겹쳐져 해석이 어려워짐.

파이 차트 및 도넛 차트 (Pie Charts and Donut Charts)

파이 차트(pie chart) 개요

파이와 도넛 모양 차트는 사람들이 좋아하지만, 데이터 시각화에서는 가장 자주 사용되면서 동시에 가장 많이 오용되는 차트임.
예시로 든 나쁜 파이 차트처럼
구성 요소가 너무 많고
값들이 서로 너무 비슷하면
→ 해석이 거의 불가능해져 "형편없고 쓸모없는 차트"가 됨.

파이 차트의 올바른 용도

파이 차트는 보통 퍼센트(%) 값을 표현함.
**전체 대비 부분의 비율(part-to-whole 관계, composition)**을 시각화할 때 사용함.

파이 차트의 한계

파이 차트는 각 조각을 서로 정밀하게 비교하는 용도가 아님.
인간의 인지는 길이(선형 정보)는 비교적 잘 판단하지만,
**각도(angle)**와 **면적(area)**에 대해서는 대부분 정확하게 구분·비교하지 못함.
따라서 비율 비교·정확한 판단이 중요한 상황에서는
파이·도넛 차트보다 막대 차트 등 선형 비교가 가능한 차트를 우선 고려해야 함.

누적 도넛 차트 (Stacked Donut C harts)

스택 도넛 차트(stacked donut chart)에 대한 권고

스택 도넛 차트는 사용하지 않는 것을 강력히 권장함.
"구성을 보여주면서, 어느 정도 비교도 되겠지?"라고 생각할 수 있지만
구성비 표현도, 비교도 둘 다 성능이 나쁨.

대안 차트

구성비를 보여주면서 어느 정도 비교도 필요하다면
**스택 칼럼 차트(stacked column chart)**를 사용하는 것이 훨씬 나음.

파이 차트(Pie Chart) 사용 원칙

반드시 지켜야 할 것 (Dos)

모든 조각의 합은 항상 100%가 되어야 함.
카테고리(조각) 수가 6개 미만일 때만 사용하는 것이 좋음.
가장 이상적인 경우는
2개 카테고리: 예) 웹사이트 방문자 중 남/녀 비율.
1개 카테고리 강조: 예) 전체 시장 대비 우리 회사의 시장 점유율.

피해야 할 것 (Don'ts)

카테고리 값이 거의 비슷하거나, 반대로 너무 차이가 클 때 파이 차트 사용 금지.
라벨을 붙여서 해결하려 해도, 이는 개선이 아니라 임시 땜질에 불과함.
3D 효과조각 분리(blow apart) 효과 사용 금지.
비율 인식이 왜곡되고, 실제 비율과 다른 인상을 줌.

분산 차트 (Scatter Charts)

산점도(Scatter Chart) 용도

산점도는 **상관관계(correlation)**와 분포(distribution) 분석에 주로 사용함.
한 변수가 다른 변수와 어떻게 관련되어 있는지(또는 전혀 관련이 없는지) 보여줄 때 적합함.

산점도가 보여줄 수 있는 것

데이터의 분포 형태나 클러스터링(군집) 패턴을 파악하는 데 유용함.
**이상치(outlier)**나 다른 점들과 동떨어진 값들을 쉽게 발견할 수 있음.

산점도 예시

마케팅 비용 vs 매출을 보여주는 차트가 좋은 예시임.
마케팅 지출이 늘어날수록 매출이 함께 늘어나는지(상관관계 여부)를 시각적으로 확인 가능함.

버블 차트 (Bubble Charts)

버블 차트(bubble chart) 개요

버블 차트는 산점도(scatter plot)에 한 차원(변수)을 더 추가하고 싶을 때 사용하는 차트임.
기본 산점도는 두 값(x, y)을 비교하지만, 버블 차트는 버블의 크기(size)를 세 번째 변수로 사용해 비교를 가능하게 함.
버블 크기가 서로 너무 비슷하면 라벨을 사용해 값 표시를 보조하는 것이 좋음.

차원 추가와 한계

네 번째 변수는 색(color) 농도(그라데이션)로 추가할 수 있음.
또는 버블을 작은 파이 차트 모양으로 표현해 또 다른 변수를 넣을 수도 있음.
하지만 이렇게까지 여러 변수를 한 번에 넣으면 정보 과부하가 되기 쉬워, 대부분의 경우에는 과도함.

버블 차트 활용 예시

좋은 예: 마케팅 비용 vs 매출 vs 이익
산점도: 마케팅 비용과 매출 간 양의 상관관계를 보여줄 수 있음.
버블 차트: 같은 지점에 버블 크기로 **이익(profit)**을 표시해
마케팅 비용이 증가하면서 매출은 오르지만
동시에 이익이 깎이고 있는지(마케팅 비용이 이익을 잠식하는지)를 드러낼 수 있음.

산점도 & 버블 차트 공통 활용 목적

표현 목적
산점도: 두 개의 수치형 변수 간 관계 표현.
버블 차트: 세 개의 수치형 변수 간 관계 표현.
좌표계 특성
두 개(산점도) 혹은 세 개(버블)의 변수 세트를 하나의 x–y 좌표 평면 위에 표시함.
가로축을 **로그 스케일(logarithmic scale)**로 바꿔, 폭이 매우 넓게 퍼진 값들의 관계도 잘 보이게 할 수 있음.

어떤 데이터에 적합한가

데이터가 많은 경우(큰 데이터셋)에 적합함.
선형/비선형 패턴, 추세, 상관관계, 클러스터, 이상치 등을 시각적으로 파악하기 좋음.
시간 축 없이도, 많은 데이터 포인트를 한 번에 비교할 수 있음.
산점도에는 데이터가 많을수록 관계 파악이 오히려 더 수월해짐.
"정확한 값 비교"보다 "관계와 패턴"을 보여주는 데 초점을 맞춤.
개별 수치를 정확히 비교하려면 다른 차트가 더 적합함.

지도 차트 (Map Charts)

지도 차트(map chart) 용도

지도 차트는 수치에 지리적 맥락을 더해,
성과가 좋은 지역과 나쁜 지역,
지역별 추세, 이상치를 빠르게 파악하는 데 유용함.
좌표, 국가명, 주/도 이름, 약어, 주소 등 위치 데이터가 있으면 그에 대응하는 값을 지도 위에 표시할 수 있음.

지도 차트의 한계와 보완

지도 차트는 보통 **색상 스케일(color scale)**을 사용하므로,
사람 눈이 색깔 농도(명도·채도) 차이를 잘 구분하지 못해 정확한 값 비교에는 적합하지 않음.
정확한 값 전달이나 비교가 필요하다면
지도 위에 **버블(원)**을 덧씌우거나
숫자 레이블을 추가해 보완하는 것이 좋음.

지도 차트 활용 예시

국가·주·도·시 단위의 웹사이트 방문자 수 표시.
주/지역/도시별 제품 판매량 표시.
지도를 배경으로 **정량 정보(quantitative information)**를 보여주고 싶을 때 사용함.
지역 간 **공간적 관계와 패턴(spatial relationships and patterns)**을 표현할 때 적합함.
데이터 해석에서 **지역/공간적 맥락(regional context)**이 중요한 경우 사용함.
여러 지리적 위치에 걸친 분포 상황을 한눈에 파악하고 싶을 때 효과적임.
데이터가 **전체 영역에 대해 동일한 형식과 척도(standardized data format & scale)**를 가지고 있을 때만 사용하는 것이 바람직함.

지도 차트 사용 시 주의점

지리적 차원이 있다고 해서 무조건 지도로 표현해서는 안 됨.
요즘 대부분의 데이터가 위치 정보를 포함하지만,
모든 데이터를 지도 차트로 보여주는 것이 항상 최선은 아님.
지도 차트는 언제 사용할까요?
지도에 정량적 정보를 표시
공간적 관계와 패턴을 제시
데이터에 대한 지역적 맥락이 중요한 경우
지리적 위치에 걸친 분포에 대한 개요를 얻기 위해
데이터가 표준화 된 경우 (즉, 전체 세트에 대해 동일한 데이터 형식 및 배율을 가짐)

간트 차트 (Gantt Charts)

간트 차트(Gantt chart) 기본 개념

간트 차트는 1896년 Karol Adamiecki가 바 차트를 프로젝트 계획용으로 처음 적응했으나, 이름은 1910년대에 독립적으로 이 유형을 발전시킨 Henry Gantt에서 유래함.
막대(bar)를 이용해 프로젝트 일정과 작업 진행 상태를 시각적으로 표현하는 차트임.[2]

간트 차트의 주요 용도

프로젝트를 계획·스케줄링할 때 사용함.[1]
무엇을 해야 하는지(작업 목록), 어떤 순서로 해야 하는지(의존 관계), 언제까지 끝내야 하는지(마감일)를 한눈에 보여주는 프로젝트 지도(project map) 역할을 함.[3][2]
전체 프로젝트에 필요한 총 소요 시간, 관련 리소스, 작업 간 선후 관계와 의존성을 시각화할 수 있음.[3][2]

프로젝트 외 활용 예시

렌털(대여) 비즈니스에서도 활용 가능함.
예: 렌터카, 객실, 아파트 등의 대여 가능한 항목 리스트와 각 항목의 대여 기간을 막대로 표현하여 예약 현황을 한눈에 파악할 수 있음.[2]

간트 차트 작성에 필요한 최소 정보

기본적으로 **시작일(start date)**과 **종료일(end date)**이 필요함.[3]
더 고급 간트 차트에서는
각 작업의 완료율(percentage complete)
다른 작업에 대한 의존 관계(dependency)
등을 추가로 입력하여, 진행 상황과 일정 리스크를 더 정확히 관리할 수 있음

게이지 차트 (Gauge Charts)

게이지 차트(gauge chart) 용도

게이지 차트는 **KPI(Key Performance Indicator, 핵심 성과 지표)**를 표시하는 데 적합함.
일반적으로 단일 핵심 값을 표시하며, 이 값을 색으로 구분된 성과 수준(보통 초록은 "양호", 빨강은 "문제")과 비교함.

게이지 차트를 사용할 곳

가장 대표적인 활용처는 **대시보드(Dashboard)**임.
여러 KPI를 한 화면에 배치해, 프로젝트나 회사의 전반적인 "건강 상태(health check)"를 빠르게 파악할 수 있게 함.

게이지 차트가 좋은 경우

목표 달성 진행 상황을 보여줄 때 적합함.
KPI와 같은 백분위(퍼센타일)나 지표 값을 표현할 때 유용함.
하나의 지표에 대한 정확한 값과 그 값의 의미를 동시에 보여줄 때 좋음.
사용자가 한 눈에, 빠르게 이해해야 하는 단일 정보를 보여줄 때 효과적임.

게이지 차트의 단점 및 대안

화면 공간을 많이 차지하는 데 비해, 보통 데이터 포인트는 하나만 보여줌.
같은 성과 기준(스케일)을 기준으로 여러 게이지를 나란히 비교해야 한다면
게이지 여러 개보다 임계값(threshold)을 표시한 칼럼 차트가 더 효율적이고 컴팩트한 대안이 될 수 있음.

다중 축 차트 (Multi Axes Charts)

멀티 축 차트(multi-axes chart) 개념

단일 차트로는 전체 이야기를 전달하기 어려울 때 사용하는 차트 유형임.
서로 스케일이 크게 다른 여러 변수의 관계와 비교를 보여주고 싶을 때, 여러 개의 Y축과 하나의 공통 X축을 사용하는 방식임.

멀티 축 차트의 특징과 한계

하나의 X축을 공유하면서 두 개 이상 Y축에 데이터를 그릴 수 있음.
대신 읽고 이해하기 훨씬 어려워진다는 비용이 따름.
공통된 추세, 상관관계(또는 상관 없음), 여러 데이터셋 간 관계를 보여주는 데는 유용함.
그러나 축 스케일이 서로 달라서 정확한 값 비교에는 적합하지 않음.
정확한 값 자체를 보여주거나 비교해야 하는 목적이라면 사용하면 안 됨.

멀티 축 차트를 사용할 때

같은 X축(예: 날짜)을 공유하는 선 차트와 칼럼 차트를 함께 보여주고 싶을 때.
값의 범위가 다른 **여러 측정값(measures)**을 비교하고 싶을 때.
두 개 이상 측정값 사이의 관계·상관관계·상관 없음을 한 시각화 안에서 보여주고 싶을 때.
여러 개의 차트를 따로 그리는 대신, 화면(canvas) 공간을 아끼고 싶을 때
단, 차트가 너무 복잡해지지 않는 선에서만.

데이터 시각화 Do & Don’t (일반 원칙 정리)

시간 축(Time axis)

시간 데이터는 항상 가로축(X축)에 두고, 왼쪽에서 오른쪽으로 흐르게 설정함.
특정 기간에 값이 없더라도 시간 구간을 건너뛰지 않고 그대로 포함해야 함.

값과 비례 관계(Proportional values)

막대, 면적, 버블 등 시각적으로 그려지는 크기는 반드시 실제 수치와 정비례해야 함.

데이터-잉크 비율(Data-Ink Ratio)

의미 없는 선, 색, 텍스트 등 가치를 더하지 않는 요소는 제거함.
메시지 전달에 필요한 최소한의 시각 요소만 남기도록 함.

정렬(Sorting)

칼럼/막대/파이 차트에서 비교를 쉽게 하려면
값을 기준으로 오름차순 또는 내림차순 정렬함.
알파벳 순 정렬은 비교용 차트에서는 피함.

범례(Legend)와 레이블(Labels)

데이터 카테고리가 하나뿐이면 범례는 필요 없음.
가능하면 선·막대·파이 조각 등 요소 위에 직접 레이블을 붙여, 범례를 통해 간접 조회하지 않게 함.

화폐·물가(Inflation adjustment)

장기 시계열에서 화폐 단위를 사용할 때는 물가상승률(인플레이션)을 반영해 조정해야 함.

색상(Colors) 기본 원칙

한 차트에서 색상은 6개 이하로 제한함.
동일한 값을 다른 시점에 비교할 때는
**같은 색의 명도 차이(연한색↔진한색)**로 표현함.
서로 다른 카테고리는 서로 다른 색을 사용함.
주로 사용되는 색: 검정, 흰색, 빨강, 초록, 파랑, 노랑.
동일 시리즈/리포트 안에서는
같은 색 팔레트와 스타일, 축, 레이블 형식을 유지해 일관성을 높임.

색상과 출력·색맹 고려

회색조(그레이스케일)로 인쇄했을 때도 구분이 되는지 반드시 확인함.
구분이 어렵다면 색상의 **색조(hue)·채도(saturation)**를 조정함.
남성의 7–10%는 색각 이상이 있으므로
색맹 친화 팔레트 사용, 명도·패턴 등 색 이외의 구분 요소도 고려함.

데이터 복잡성(Data Complexity)

한 차트에 너무 많은 정보를 넣지 말 것.
필요하다면
두 개 이상의 차트로 분리하거나
중요한 부분만 강조(highlighting)하거나
색을 단순화하거나
차트 유형을 변경하여 가독성을 높임.
👍
Contact : azureguy@empal.com / azureguy@cau.ac.kr