5-3. Advertising_Data

"광고 데이터 EDA"

1. 데이터 소개

데이터 이름: Product Advertising Data
실습 파일 다운로드

2. 컬럼 설명

TV: TV 광고비
Billboards: 옥외(빌보드) 광고비
Google_Ads: 구글 광고비
Social_Media: SNS 광고비
Influencer_Marketing: 인플루언서 마케팅 비용
Affiliate_Marketing: 제휴 마케팅 비용
Product_Sold: 해당 조건에서 팔린 제품 수량(타깃 변수)
Group: A, B (임의로 나눈 그룹 - A/B 테스트용)
💬
<목표>
광고비(TV, 빌보드, 구글, 소셜미디어 등) 기초 통계 분석
단변량 분석 및 이변량 분석

3. 실습

1.
각 광고 채널과 판매량(Product_Sold) EDA
2.
단변량 / 다변량 분석

4. 실습 순서

1.
데이터 불러오기 (CSV 읽기)
2.
기초 통계량·히스토그램·Box Plot 등의 EDA 시각화 진행
EDA 진행한다고 할때, 어떤 분석들을 진행하고 시각화할 수 있을까?
논문 보고 형식으로 기술통계표 만들어줘.
💬
GPT
Variable
Mean
SD
Min
Max
Skewness
Kurtosis
TV
517.43
288.11
1.04
998.10
0.01
-1.19
Billboards
502.64
275.84
3.63
995.32
-0.06
-1.16
Google Ads
512.44
285.42
14.86
999.23
-0.06
-1.20
Social Media
489.80
273.88
11.69
996.16
0.04
-1.07
Influencer Marketing
465.73
288.31
0.77
999.83
0.11
-1.18
Affiliate Marketing
484.43
277.96
6.74
987.58
0.10
-1.14
Product Sold
7031.52
1703.61
2259.00
12227.00
-0.05
-0.08
Advertising_Data.xlsx 파일을 불러와서 모든 수치형 변수에 대해 각 변수별 분포(히스토그램 + KDE)를 3행 레이아웃으로 배치하여 하나의 이미지에 통합해서 그려줘. 조건: 1. 각 subplot 제목은 “Distribution of 변수명” 2. 히스토그램은 파란 반투명색(alpha=0.5) 3. KDE(lineplot)는 진한 파란색 4. x축은 변수명, y축은 Count로 표기 5. figure 전체 크기는 (18, 12) 6. seaborn 스타일은 whitegrid 7. 모든 그래프의 눈금, 축 스타일은 깔끔하고 논문 스타일로 유지
💬
GPT
각 변수별 Boxplot을 3행 레이아웃으로 배치하여 하나의 이미지로 그려줘. 조건: 1) 각 subplot 제목은 “Boxplot of 변수명” 2) boxplot 색상은 파란색 3) x축은 숨기고 y축은 변수명 표시 4) figure 크기는 (18, 12) 5) seaborn whitegrid 스타일 적용 6) 미사용 subplot은 비워두기
💬
GPT
Contact : azureguy@empal.com / azureguy@cau.ac.kr