이 질문에 "예"라고 답한 소비자 중, 실제로 지갑을 여는 비율이 얼마쯤 될까요? 설문조사 업계에서 오랫동안 알려진 불편한 진실이 있습니다. 사람들은 가상의 질문에 답할 때, 실제 행동과 다르게 응답합니다. 학술적으로는 이를 "가상적 편향(Hypothetical Bias)"이라 부릅니다. 행동경제학 연구에 따르면 가상 상황에서 보고되는 지불의향(WTP)은 실제 돈이 관련된 상황보다 약 3배 높습니다.
이건 응답자의 잘못이 아닙니다. 인간의 뇌가 원래 그렇게 작동합니다.
문제는, 수천만 원짜리 신제품 의사결정이 이 "선의의 거짓말" 위에 세워진다는 것입니다. AI 합성소비자(Synthetic Consumer)가 이 문제를 어떻게 해결하는지, 실제 인텔리시아의 프로젝트의 사례로 보여드리겠습니다.
아래 조사는 실제 인텔리시아 고객사 POC 사례를 근거로 재창조된 것입니다. (조사 제품이나 설문, 응답 데이터는 실제 케이스와 무관합니다)
사례 1. 지불의향(WTP)의 함정 — "내 돈 아니면 쿨하게"
한 프리미엄 그래놀라 브랜드가 신제품(400g)의 적정 가격을 조사했습니다. 실제 설문 응답자 300명과 AI 합성소비자 300명에게 동일한 질문을 던졌습니다. "이 프리미엄 그래놀라에 얼마까지 지불할 의향이 있으십니까?"
현실의 응답자와 AI 합성 소비자 설문 결과는 정반대였습니다. 실제 응답자 중 28%는 25,000원 이상을 지불하겠다고 답했고, 35%는 20,000~24,900원, 24%는 15,000~19,900원을 선택했습니다. 즉, 응답자의 87%가 15,000원 이상 지불할 수 있다고 답한 것입니다.
반면 AI 합성소비자는 지갑을 여는 데 훨씬 보수적이었습니다. 25,000원 이상을 선택한 비율은 3%에 불과, 가장 많은 응답(41%)이 10,000~14,900원에 집중되었습니다. 10,000원 미만이라고 답한 비율도 27%나 됐습니다. 전체의 68%가 14,900원 이하에 몰려 있었기 때문에 상대적으로 '짠돌이 소비자'였습니다.
왜 이런 차이가 나는 걸까요?
설문 응답자는 가상의 구매 상황에서 관대해집니다. 400g짜리 그래놀라에 25,000원을 내겠다고 답하는 것은, 실제 마트 진열대 앞에서 같은 선택을 하는 것과는 전혀 다른 심리적 맥락입니다. 설문지 위에서는 그 금액이 내 통장에서 빠져나가는 것이 체감되지 않기 때문입니다. 인텔리시아가 만난 많은 고객사분들이 "제품 출시 전 사전 조사에서 수집된 고객 지불 의사에 비해 판매량이 현저히 저조하다"고 이야기한 이유입니다.
AI 합성소비자는 '내일 통장 잔고를 생각하는 합리적 소비자'에 가깝습니다. 해당 소득 수준의 실제 식품 지출 패턴, 프리미엄 식품의 시장 가격대(그래놀라 시장 기준 9,900~15,900원), 카테고리별 가격 민감도 데이터를 기반으로 구축되기 때문에, 비현실적인 가격 수용 응답이 구조적으로 걸러집니다.
사례 2. 컨셉 테스트의 함정 — "다 비슷비슷해서 고를 수가 없다"
한 식물성 단백질 음료 브랜드가 4개 신제품 컨셉(A: 고단백 저칼로리, B: 오트밀크 블렌드, C: 비건 프로틴, D: 곡물 쉐이크)에 대해 소비자 선호도를 조사했습니다. 5점 척도로 구매 의향을 물었고, Top2(4~5점) 비율로 비교했습니다.
실제 응답자의 결과는 이랬습니다. 컨셉 A가 46%, B가 51%, C가 48%, D가 50%. 최대 편차가 5점에 불과합니다. 통계적으로 유의미한 차이가 없으니, 사실상 의사결정이 불가능합니다.
AI 합성소비자의 결과는 전혀 달랐습니다. 컨셉 A가 63%, B가 81%, C가 28%, D가 69%. 최대 편차 53점. 컨셉 B(오트밀크 블렌드)가 압도적 승자이고, 컨셉 C(비건 프로틴)는 확실한 탈락입니다.
이것은 '중앙 응답 편향(Central Tendency Bias)'이라 불리는 현상입니다. 설문 응답자들은 극단적인 점수를 주는 것을 심리적으로 꺼립니다. "이건 정말 별로야"라고 1점을 주거나 "이건 무조건 산다"라고 5점을 주기보다, 2~4점 사이의 무난한 점수를 택합니다. 결과적으로 모든 컨셉이 비슷한 점수대에 몰리게 됩니다.
AI 합성소비자는 다릅니다. 실제 구매 상황에서의 선택적 반응을 모사하기 때문에, '살 것'과 '안 살 것'을 선명하게 구분합니다. 마트 진열대 앞에 서서 손이 가는 제품과 그냥 지나치는 제품이 명확히 갈리는 것과 같은 이치입니다.
실제 인텔리시아에선 컨셉 수용도 비교 결과, 의사결정이 불가능한 상태에서 의뢰를 한 고객이 있습니다. 최종 의사결정 마감까지 일주일이 남지 않은 상황에서, AI 합성소비자를 대상으로 같은 컨셉 조사를 돌린 것입니다. 그 결과 편차가 확실한 결과를 얻었고, AI 합성소비자 조사 결과를 바탕으로 의사 결정을 내렸습니다. 이 변별력이 R&D와 마케팅의 의사결정을 근본적으로 바꿉니다.
글로벌 검증: EY × Aaru — 6개월 조사를 하루 만에
이런 합성소비자 기술은 글로벌 무대에서도 검증되고 있습니다. 2025년, 세계적 컨설팅사 EY는 미국의 합성응답자 스타트업 Aaru와 협업하여 자사의 '2025 EY Global Wealth Research Report'를 AI 합성소비자로 재현하는 대규모 실험을 진행했습니다. 이 보고서는 원래 30개국 3,600명의 부유층 투자자를 대상으로 6개월에 걸쳐 수행되는 업계 최대 규모 리서치 중 하나입니다.
Aaru의 합성소비자는 이 조사를 단 하루 만에 완료했고, 53개 단일선택 문항에서 중위 상관계수(Median Spearman Correlation) 0.90을 기록했습니다. 6개월짜리 조사를 24시간 만에, 90%의 정확도로 재현한 것입니다.
더 주목할 점은, 차이가 나는 영역에서 오히려 AI가 현실에 더 가까웠다는 것입니다. 예를 들어 "부모의 자산관리사를 계속 이용하겠느냐"는 질문에, 전통 설문에서는 82%가 "그렇다"고 답했지만, AI는 43%로 예측했습니다. 업계 실제 데이터는 20~30%입니다. 사람들은 가상의 질문에 사회적으로 바람직한 답변을 하지만("부모님 자산관리사를 바꾸겠다고? 그건 좀…"), AI는 실제 이탈 행동 패턴을 따릅니다.
EY는 이 결과를 바탕으로 AI 시뮬레이션이 "단순히 리서치를 가속화하는 것이 아니라, 진술된 의도가 아닌 실제 행동을 모델링함으로써 더 우수한 인사이트를 제공할 수 있다"고 평가했습니다. 18개월 내에 AI 시뮬레이션이 경쟁 우위에서 업계 표준으로 전환될 것이라는 전망도 내놓았습니다.
전통 설문이 틀렸다는 이야기가 아닙니다. 설문은 여전히 중요한 리서치 방법론입니다. 다만, 설문만으로는 잡아내기 어려운 두 가지 구조적 편향이 존재합니다. 첫째, 가상적 편향으로 인해 WTP와 구매 의향이 과대 추정됩니다. 둘째, 중앙 응답 편향으로 인해 컨셉 간 변별력이 사라집니다.
AI 합성소비자는 이 빈 곳을 채워주는 보완재입니다. 실제 인구통계 데이터, 소비 행동 패턴, 시장 가격 데이터를 기반으로 구축된 디지털 에이전트가 응답하기 때문에, 가상 편향이 구조적으로 제거됩니다.
Subscribe to 'TheSurvey.ai'
Subscribe to my site to be the first to receive notifications and emails about the latest updates, including new posts.
Join Slashpage and subscribe to 'TheSurvey.ai'!