6-1. A/B Test 성별/연령별 고객 만족도 차이

자료 출처: 구자룡(2025), 강의-챗GPT로 시작하는 데이터 리터러시, 마들렌북

1.문제

우리 제품에 대한 고객 만족도가 성별로 혹은 연령별로 차이가 존재하는 것 같다!

2.가설 설정

"우리 제품에 대한 고객 만족도가 성별이나 연령에 따라 차이가 있을 것이다”
H₀ : 차이 없음. 아무 차이없는 안.
차이가 '0' = 없다!
귀무가설, 영가설
H₁ : 차이 있음. 우리가 검증하려는 가설.
차이가 '1' = 있다!
대립가설
💬
가설 1 - 성별
H₀: 성별에 따른 고객 만족도의 차이가 없을 것이다
H₁: 성별에 따른 고객 만족도의 차이가 있을 것이다
💬
가설 2 - 연령별
H₀: 연령에 따른 고객 만족도의 차이가 없을 것이다
H₁: 연령에 따른 고객 만족도의 차이가 있을 것이다

3. 분석 데이터

💬
6-1.AB-Test-survey_data.xlsx

4. 데이터 분석

데이터부터 파악
어떤 데이터인지 알려줘.
데이터 구조부터 기본적인 EDA, 가능한 분석들을 결과물로 안내할 것임
내가 수집한/알고있는 데이터라면 데이터를 알려주고, EDA 수행
분석하고자 하는 내용 프롬프팅
아래와 같은 문제가 있는 거 같아. 어떻게 하면 좋을까? - 우리 제품에 대한 고객 만족도가 성별로 혹은 연령별로 차이가 존재하는 것 같다
문제 및 가설을 정의하고 분석을 진행할 것임
ChatGPT A/B 테스트 분석 결과 (by 라이언)
📊 성별별 고객 만족도 분석 결과
구분
평균 만족도
t 통계량
p-value
해석
남자
3.12
-0.956
0.340
성별 간 만족도 차이 없음 (p > 0.05)
여자
3.22
📊 연령대별 고객 만족도 분석 결과 (10대 제외)
연령대
평균 만족도
F 통계량
p-value
해석
20대
3.15
0.256
0.857
연령대 간 만족도 차이 없음 (p > 0.05)
30대
3.08
40대
3.19
50대 이상
3.22
10대 제외 사유: 10대 데이터 불충분으로 분석 불가.
검정 통계량
차이나 관계의 유무를 확인하기(검정) 위한 차이값이다.
검정 통계량을 사용하여 귀무가설의 기각 여부를 확인할 수 있다.
T통계량, χ²통계량, F통계량
기준 대비 차이로 계산된 통계량은 '분포'를 가지며, 이 분포를 통해 타당성을 판단할 수 있다.
이때의 판단기준이 'P-value'
결론
💬
GPT
🧩 결론
성별: p = 0.34 → 남녀 간 유의한 차이 없음
연령대: p = 0.86 → 연령대별 만족도 차이 없음
전반적 결론:
→ 고객 만족도는 모든 성별·연령대에서 3점대 중반 수준으로 안정적이며 균일함.
Contact : azureguy@empal.com / azureguy@cau.ac.kr