# 5-3. Advertising_Data

# "광고 데이터 EDA"

## 1. 데이터 소개

- 데이터 이름: Product Advertising Data  

- 실습 파일 다운로드

- https://docs.google.com/spreadsheets/d/1FL6yWK8-JL9cz4lHUrpD25_u9qI7U3NtNfczJbQeVKc/edit?usp=sharing

[8-2.Advertising_Data](https://docs.google.com/spreadsheets/d/1FL6yWK8-JL9cz4lHUrpD25_u9qI7U3NtNfczJbQeVKc/edit?usp=sharing)

---

## 2. 컬럼 설명

- TV: TV 광고비  

- Billboards: 옥외(빌보드) 광고비  

- Google_Ads: 구글 광고비  

- Social_Media: SNS 광고비  

- Influencer_Marketing: 인플루언서 마케팅 비용  

- Affiliate_Marketing: 제휴 마케팅 비용  

- Product_Sold: 해당 조건에서 팔린 제품 수량(타깃 변수)

- Group: A, B (임의로 나눈 그룹 - A/B 테스트용)

---

> <목표> 

광고비(TV, 빌보드, 구글, 소셜미디어 등) 기초 통계 분석 

단변량 분석 및 이변량 분석

## 3. 실습

1. 각 광고 채널과 판매량(Product_Sold) EDA 

2. 단변량 / 다변량 분석

---

## 4. 실습 순서

1. 데이터 불러오기 (CSV 읽기)  

2. 기초 통계량·히스토그램·Box Plot 등의 EDA 시각화 진행

```
EDA 진행한다고 할때, 어떤 분석들을 진행하고 시각화할 수 있을까?
```

```
논문 보고 형식으로 기술통계표 만들어줘.
```

> GPT

| Variable | Mean | SD | Min | Max | Skewness | Kurtosis |
| --- | --- | --- | --- | --- | --- | --- |
| **TV** | 517.43 | 288.11 | 1.04 | 998.10 | 0.01 | -1.19 |
| **Billboards** | 502.64 | 275.84 | 3.63 | 995.32 | -0.06 | -1.16 |
| **Google Ads** | 512.44 | 285.42 | 14.86 | 999.23 | -0.06 | -1.20 |
| **Social Media** | 489.80 | 273.88 | 11.69 | 996.16 | 0.04 | -1.07 |
| **Influencer Marketing** | 465.73 | 288.31 | 0.77 | 999.83 | 0.11 | -1.18 |
| **Affiliate Marketing** | 484.43 | 277.96 | 6.74 | 987.58 | 0.10 | -1.14 |
| **Product Sold** | 7031.52 | 1703.61 | 2259.00 | 12227.00 | -0.05 | -0.08 |

```
Advertising_Data.xlsx 파일을 불러와서 모든 수치형 변수에 대해 
각 변수별 분포(히스토그램 + KDE)를 3행 레이아웃으로 배치하여 하나의 이미지에 통합해서 그려줘. 

조건:
1. 각 subplot 제목은 “Distribution of 변수명”
2. 히스토그램은 파란 반투명색(alpha=0.5)
3. KDE(lineplot)는 진한 파란색
4. x축은 변수명, y축은 Count로 표기
5. figure 전체 크기는 (18, 12)
6. seaborn 스타일은 whitegrid
7. 모든 그래프의 눈금, 축 스타일은 깔끔하고 논문 스타일로 유지 
```

> GPT

![Image](https://upload.cafenono.com/image/slashpageHome/20251129/083048_sY2wkxJeo1cAVuTp0A?q=80&s=1280x180&t=outside&f=webp)

```
각 변수별 Boxplot을 3행 레이아웃으로 배치하여 하나의 이미지로 그려줘.

조건:
1) 각 subplot 제목은 “Boxplot of 변수명”
2) boxplot 색상은 파란색
3) x축은 숨기고 y축은 변수명 표시
4) figure 크기는 (18, 12)
5) seaborn whitegrid 스타일 적용
6) 미사용 subplot은 비워두기
```

> GPT

![Image](https://upload.cafenono.com/image/slashpageHome/20251129/083830_Na0kiJ35WZ2F2tiJ8s?q=80&s=1280x180&t=outside&f=webp)

For the site tree, see the [root Markdown](https://slashpage.com/lion.md).
