이 파일은 우리 회사의 온라인 스토어 주문 내역 2,000건이야.
너는 지금부터 CRM(고객 관계 관리) 전문 데이터 분석가야.
데이터를 먼저 훑어보고, 우리가 '고객 등급'을 나누려고 할 때 중요하게 봐야 할 핵심 컬럼(예: 매출, 이익, 할인율 등)이 무엇인지 찾아서 요약해줘
변수 | 의미 |
Total Sales | 전체 구매 금액 |
Total Profit | 회사에 기여한 순이익 |
Profit Margin | 이익률 = Profit / Sales |
변수 | 의미 |
Order Frequency | 구매 빈도 |
Avg Basket Size | 평균 구매 수량 |
Avg Discount | 할인 의존도 |
RFM 요소 | Superstore 컬럼 |
Recency | Order Date |
Frequency | Order ID (고객별 count) |
Monetary | Sales |
지금 데이터는 '주문 단위'라서 한 고객이 여러 줄에 걸쳐 있어.
이걸 '고객 ID(Customer ID)' 기준으로 하나로 합쳐서(Group by) 새로운 데이터셋을 만들어줘.
새로 만들 데이터에는 다음 3가지 컬럼을 꼭 포함해줘:
1.Total_Sales: 총 매출 합계 (구매력)
2.Total_Profit: 총 이익 합계 (수익성)
3.Avg_Discount: 평균 할인율 (할인 민감도)
결과 데이터의 상위 5개 행을 표로 보여줘."
Customer ID | Total_Sales | Total_Profit | Avg_Discount |
AA-10315 | 401.44 | 103.51 | 0.00 |
AA-10375 | 216.91 | 69.70 | 0.12 |
AA-10480 | 43.01 | 15.33 | 0.10 |
AB-10060 | 4,466.62 | 1,461.53 | 0.07 |
AB-10105 | 393.17 | -204.45 | 0.50 |
"이제 고객을 몇 개의 그룹으로 나누는 게 좋을지 정하고 싶어.
과학적인 결정을 위해 **'엘보우 기법(Elbow Method)'**을 사용해서 그래프를 그려주고,
수학적으로 가장 적절한 그룹 갯수(K)가 몇 개인지 추천해줘."
"추천해준 3개의 그룹으로 K-Means 군집분석을 실행해줘.
⚠️ 매우 중요: 매출액은 단위가 크고 할인율은 작으니까, 분석 전에 반드시 모든 변수를 **'표준화(Standardization)'**해서 단위를 맞춰줘.(이 과정을 안 하면 매출액만 결과에 영향을 미치게 돼).
결과는 **산점도(Scatter Plot)**로 그려줘.
- X축: 매출 합계 (Total_Sales)
- Y축: 수익 합계 (Total_Profit)
- 색상: 군집(Cluster)"
"각 그룹의 성격을 명확히 알고 싶어.
그룹별 '평균 매출(X축)', '평균 이익(Y축)', '평균 할인율('을 축으로 하는 **3차원 산점도(Radar Chart)**를 그려줘.
차트를 보고 각 그룹에 어울리는 별명을 지어줘.
(예: '알짜배기 VIP', '실속형 체리피커', '이탈 우려 고객' 등)"
Cluster | 평균 매출 | 평균 이익 | 평균 할인율 |
0(🟣) | 1,031 | -205 | 0.40 |
1(🟢) | 493 | 80 | 0.10 |
2(🟡) | 3,639 | 847 | 0.09 |
"우리가 분석한 각 그룹(클러스터)에 대해 마케팅 팀장이 의사결정을 내릴 수 있도록 **'전략 로드맵'**을 표로 정리해줘.
각 그룹별로 다음 4가지 항목을 포함해서 작성해:
1.그룹 정의 (Persona): 데이터 특징에 기반한 명확한 명칭 (예: 실속형 체리피커)
2.핵심 문제/기회 (Key Issue): 비즈니스 관점에서 이 그룹의 문제점이나 잠재력은 무엇인가?
3.액션 아이템 (Action Item): 이 그룹을 위해 우리가 당장 해야 할 구체적인 마케팅 활동 (할인 중단, VIP 초청 등)
4.관리 지표 (Primary KPI): 액션 실행 후 성과를 판단할 핵심 지표 (예: 객단가 상승률, 재구매율, 이익률 등)"
클러스터 | 그룹 정의 (Persona) | 핵심 문제 / 기회 (Key Issue) | 액션 아이템 (Action Item) | 관리 지표 (Primary KPI) |
Cluster 0 | 실속형 체리피커 | - 평균 매출은 중간 수준이나 평균 이익이 음수<br>- 할인 의존도 매우 높음<br>- 매출 증가가 곧 손실 증가로 이어지는 구조 | - 무차별 할인/쿠폰 즉시 중단<br>- 최소 구매금액 조건 설정<br>- 할인 대신 비금전적 혜택(배송, 포인트) 전환<br>- 수익 개선 불가 시 마케팅 접점 축소 | - 이익률(Profit Margin)<br>- 할인 사용률 감소율<br>- 고객 1인당 손실액 |
Cluster 1 | 안정형 일반 고객 | - 매출·이익 모두 양(+)이나 규모는 작음<br>- 할인 없이도 구매 가능<br>- VIP로 성장할 잠재 고객군 | - 번들 상품 / 업셀링 제안<br>- 구매 빈도 증가 캠페인<br>- 개인화 추천 강화<br>- VIP 전환 조건 명확화 | - 객단가(AOV)<br>- 재구매율<br>- 구매 빈도 |
Cluster 2 | 알짜배기 VIP | - 매출·이익 모두 압도적으로 높음<br>- 할인 의존도 낮음<br>- 이탈 시 비즈니스 타격 큼 | - VIP 전용 혜택 운영(선공개, 초청)<br>- 가격 할인보다 관계 강화 중심<br>- 전담 케어/우선 지원 제공 | - 고객 유지율(Retention Rate)<br>- VIP 매출 비중<br>- 고객 생애가치(LTV) |
