해봄의 아카이브

도파민에 대한 모든 것 | 도파민 이해 끝내기

Haebom

Jan 23, 20242y ago

도파민의 핵심 도파민을 실제 서비스에 적용하기 본질은 예상치 못한 기쁨 인공지능도?도파민의 원리를 제대로 써먹기 알고 당하는 것과 모르고 당하는 것

우리의 뇌는 기본적으로 보상을 예측하는 형태로 동작합니다. 이는 원시 인류 때 부터, 살아남기 위한 생존 가치가 있는 칼로리가 풍부한 당 섭취를 '원함'이라는 지극히 생물학적인 이유 때문에 발달했습니다. 반면, '혐오함' 반응은 쓴맛 같은 나쁜 것들로부터 우리를 멀리하게 만들어 인류가 생존하는데 도움을 주었습니다. (독초는 멀리 과실은 가까이)

개인적으로 측좌핵, 글루타메이트 등의 언어는 너무 어렵다고 생각합니다.

이런 "생존" 때문에 존재했던 도파민은 현대 사회에서 너무 쉽게 구할 수 있게 되었습니다. 당류의 무언가는 초콜릿, 탕후루 하다못해 포도당류의 섭취만으로도 쉽게 충족이 됩니다. 생물의 생존도 사실 예전에 비하면 큰 위협을 받고있지 않기에 사실 도파민은 더 강한 자극에 반응하도록 임계점이 높아졌습니다. 생존에 익숙해졌다는 거죠.

도파민의 핵심

여기서 도파민의 재밌는 점이 작용합니다. 도파민은 우리가 무엇인가를 강렬하게 원할 때 증가하지만, 반드시 즐거움을 직접 생성하는 것은 아닙니다. 오히려 즐거운 감정이 도파민을 생성하게 만듭니다. 예를 들어, 술을 좋아하는 사람은 알코올을 원하지만 실제로 그것을 '알콜'이라는 성분이 생물학적으로 잘 받는지는 알 수 없습니다. 보통의 생명체에겐 일정량 이상의 알코올을 부정적 영향을 미칩니다. 이는 욕구와 즐거움이 분리될 수 있음을 보여줍니다. 하지만, 대부분은 술과 술자리 등이 주는 즐거운 감정, 기분 때문에 알콜을 좋아한다고 착각하게 됩니다.

좀 더 쉽게 말하면 도파민은 '원함'의 발생만 촉진합니다. 이는 일반적으로 '좋아함' 이후에 사람에 따라 강화 되는 것 입니다. 도파민은 이러한 즐거움을 생성하는 상황에 대한 욕구를 뇌에 인코딩합니다. 이걸 최근에 많은 유튜브 및 뇌과학자들이 말하는 도파민을 영리하게 사용하기 혹은 도파민 해킹이라고 하는 영역 입니다.

•

'좋아함'과 '원함'의 차이: 도파민은 '좋아함'과 '원함' 사이의 구분을 만드는 데 중요합니다. '좋아함'은 순수한 즐거움을 의미하는 반면, '원함'은 무언가를 추구하려는 욕구입니다. 때로는 우리가 어떤 것을 진정으로 좋아하지 않음에도 불구하고 강렬하게 원하는 경우가 있는데, 이는 도파민이 관여하는 복잡한 정서 반응 때문입니다.

•

습관 형성: 도파민은 습관 형성에도 중요합니다. 어떤 활동이 반복적으로 긍정적인 보상을 제공하면, 도파민은 그 활동을 더 자주 수행하도록 우리를 동기 부여합니다. 이것이 우리가 특정 습관을 형성하는 방식입니다.

•

예상과 예상치 못한 보상: 도파민은 예상치 못한 보상에 대한 우리의 반응과도 관련이 있습니다. 우리가 예상했던 것보다 더 좋은 결과를 얻을 때, 도파민 방출은 증가하고, 이는 우리에게 더 큰 즐거움을 제공합니다. 반대로, 기대에 못 미치는 결과는 도파민 방출을 감소시키지만, 완전히 중단시키지는 않습니다. 이는 실패에도 불구하고 우리가 다시 시도할 수 있는 동기를 제공합니다.

도파민을 실제 서비스에 적용하기

이제 도파민이 어떻게 되는지를 잘 이해가 되셨으리라 생각합니다. 개인적으로 이걸 가장 잘하는 곳은 게임업계와 소셜미디어 업계 입니다. 게임 디자이너의 치밀함과 추천 알고리즘 등이 이것을 가능하게 만들죠. 너무 뻔한 예시인가요? 다른 예시를 하나 들어드리면 개인적으로 LongBlack과 Ep9과 같은 타임앤코가 이것을 환상적으로 잘했다고 생각합니다.

https://www.longblack.co/

변화를 위한 플레이 Ep9

매일 하나의 테크 콘텐츠로, 당신의 탁월함을 습관으로 만드세요.

ep9.co

•

콘텐츠 별 제한 시간을 둬서 사용자가 보지 않으면 손해인 상황을 만들고,

•

하루에 하나의 콘텐츠만 다룸으로서 사용자가 집중 할 수 있는 상태를 만들고,

•

그 콘텐츠가 자신이 예상하지 않은 재미와 인사이트를 가지는 것을 보여줍니다.

예기치 못한 보상, 습관 형성, 좋아함을 원함으로 바꾸는 것 까지 깔끔하게 모델화가 성공한 보기 드문 사례 입니다. (Ep9 많은 관심 부탁드립니다!) 도파민의 보상체계는 아래와 같은 순서로 작동 됩니다.

긍정적 경험: 우리가 초콜릿과 같은 맛있는 음식을 먹거나, 운동을 하고, 사랑하는 사람과 시간을 보낼 때와 같이 즐거운 활동을 할 때, 뇌는 이를 긍정적인 경험으로 인식합니다.

보상 시스템 활성화: 긍정적인 경험이 우리의 보상 시스템을 활성화시킵니다. 이 시스템은 주로 뇌의 여러 영역, 특히 중추신경계에 위치한 '기쁨'과 '욕구'를 담당하는 부위에 영향을 미칩니다.

도파민 방출: 보상 시스템이 활성화되면, 도파민이라는 화학물질이 방출됩니다. 도파민은 다른 뇌 세포로 신호를 전달하여 긍정적인 감정을 강화하는 데 도움을 줍니다.

욕구와 동기 부여: 도파민은 단순히 우리가 즐거움을 느끼게 하는 것 이상의 역할을 합니다. 이는 우리의 행동에 대한 욕구와 동기를 부여하는 데 중요한 역할을 합니다. 예를 들어, 어떤 활동이 도파민을 방출하도록 자극한다면, 우리는 그 활동을 반복하고자 하는 강한 욕구를 느낍니다.

본질은 예상치 못한 기쁨

마케팅 등에서 흔히 사용되는 AIDA, ARRR 같은 모델이 전형적인 도파민 자극 모델 입니다. (이미지: 허브스팟)

기획에 이러한 지식을 적용할 때, 사용자가 다음 순간에 무엇을 기대하는지 예측하고, 그 기대를 초과하는 보상 경험으로 이끄는 것이 중요합니다. 예를 들어, 소셜 미디어는 예상치 못한 보상을 끊임없이 제공하므로, 사용자는 계속해서 소셜 미디어 피드를 확인하게 됩니다. 이는 사용자가 다음에 어떤 재밌는게 나올지 모르기 때문에 계속 시도하게 되고 재밌는 걸 보게 되면 도파민이 방출되어 이것이 습관화 되는 것이죠.

이러한 원리는 사실 게임 디자인에서는 이미 많이 사용되어 왔습니다. 사용자의 기대를 계속해서 뒤엎는 것이 주된 목표입니다. 예를 들어, 어떤 게임의 필승법을 알게 되면 그 게임은 더 이상 재미있지 않게 됩니다. 우리가 한 번 즐겁게 여겼던 것들에 지루해지는 것도 도파민의 작용 때문입니다. 예상했던 보상을 정확히 받게 되면, 뇌는 도파민 생산을 증가시키지 않습니다. 이는 더 이상의 학습, 탐험, 자동성이 필요하지 않기 때문입니다.

많이들 착각하는게 이 부분입니다. 보상이 핵심이 아닙니다. 예상하지 못한 보상이 핵심입니다.

상품에 대한 욕구는 학습이 불완전할 때 생성됩니다. 만약 실험실 쥐가 레버를 누를 때마다 달콤한 주스를 받게 된다면, 그것은 레버를 눌러 달콤한 주스를 얻을 수 있다는 것을 빠르게 배웁니다. 그러나 그것은 항상 달콤한 주스를 필요로 하는 것은 아닙니다. 그러나 달콤한 주스를 확률적으로 받게 되면, 학습은 영원히 완료되지 않습니다. 쥐는 레버를 눌러 달콤한 주스를 예측하는 요소를 알아내기 위해 계속 시도합니다.

인공지능도?

개인적으로 인공지능이 chatGPT 및 LLM 등이 엄청난 관심을 받게 된 것도 이러한 원리 때문이라고 봅니다. 알파고나 기존의 딥러닝에서 제안하는 방식들은 사용자 입장에선 "필승법" 혹은 "치트키"같은 정도로 보였을 것 입니다. 하지만 최근에 나온 생성형 모델은 기본적으로 결과값을 예측하기 어렵습니다. 이것은 예상치 못한 보상이고 사용자의 약간의 노력(Prompting)을 통해 확실한 변화를 가져다 주기에 효용감과 쾌감이 다른 기술들에 비해 월등한 점에서 왔다고 생각합니다. 그리고 결과가 매번 다르다 보니 사용자 입장에선 학습이 영원히 완료되지 않죠. (딥러닝이라는 것 자체가 허들이 높고 결과값을 예측하기 쉽지 않음)

도파민의 원리를 제대로 써먹기

해외에서 널리 퍼져있는 짤. 쉽게 얻을 수 있는 도파민은 오히려 보상 체계를 망가뜨린다.

도파민 생성 뉴런은 뇌의 다양한 네트워크에 광범위하게 연결되어 있습니다. 대부분의 경우, 도파민은 다음과 같은 하류 활동을 유발합니다. 과학적으로 볼 때, 도파민은 단순히 쾌락과 관련된 것이 아니라 학습, 동기 부여, 주의 집중 등 다양한 인지적 및 행동적 과정에 중요한 역할을 합니다.

•

보상의 매력: 도파민은 예상 보상을 실제 보상에 더 가깝게 조정하여 학습을 돕습니다. 이것이 처음에는 이상하게 들렸던 음악이 다음에는 조금 더 나아지게 들리는 이유입니다. 우리의 뇌는 무엇이 보상적인지 예측하는 데 더 나아지고 있습니다.

•

결정의 자동성: 결정을 내리는 것은 에너지가 많이 드는 일이므로, 보상적인 행동이 시간이 지남에 따라 습관적이고 자동적으로 변하는 것이 합리적입니다. 신경 가소성은 보상받은 행동이 점점 더 효율적이 되도록 보장합니다.

•

더 많은 보상을 위한 탐색: 예상보다 더 나은 보상은 지식에 대한 격차를 시사하므로, 동물은 단순히 보상에 만족하지 않고 환경에서 보상이 어떻게 생성되는지 알고 싶어합니다. 보상에 대한 정보는 보상 자체만큼 가치가 있으므로, 간헐적으로 보상을 제공하는 환경을 (안전하게) 탐색하는 것은 의미가 있습니다. 예를 들어, 소셜 미디어는 예측할 수 없는 보상을 끊임없이 제공하기 때문에, 사용자는 소셜 미디어 피드를 계속 확인하게 됩니다.

이러한 지식을 바탕으로, 상품 디자인을 할 때 사용자가 다음에 무엇을 기대하는지를 예상하고, 그 기대를 초과하는 보상 경험의 흔적을 만드는 것이 중요합니다. (다들 보상을 주는 거에 중심을 두는데 보상이 핵심이 아니라 기대 혹은 예상을 뛰어 넘는 걸 줘야합니다. → 이게 무조건 적인 더 좋은 보상이라는게 아닙니다. 색다른 것도 괜찮습니다.)

이는 도파민이 학습, 탐색 및 자동성의 적응적 행동을 유발한다는 사실과 일치합니다. 우리가 한 번 즐겁게 여겼던 것들에 지루해지는 것도 도파민의 작용 때문입니다. 예상했던 보상을 정확히 받게 되면, 뇌는 도파민 생산을 증가시키지 않습니다. 이는 더 이상의 학습, 탐험, 자동성이 필요하지 않기 때문입니다.

알고 당하는 것과 모르고 당하는 것

우리가 어떤 행동을 원하는 욕구는 효율적으로 보상을 획득하려는 욕구와 보상이 생성되는 방법을 배우려는 욕구 모두에 의해 생성됩니다. 도파민은 일종의 작업 가치를 나타내는 신호로 생각할 수 있습니다. 즉, 도파민이 많이 생성될수록, 행동에 대한 노력을 기울이는 것이 합리적입니다. 보상이 가치가 있거나, 얻은 정보가 노력을 상쇄할 것입니다. (사실 이것에 대해서 Hooked, Dopamination 등 다양한 책에서 다루고 있습니다.)

즉, 도파민에 지배를 안당하는 가장 쉬운 방법은 바로 익숙해져 버리는 것 입니다. 더 쉽게 말하면 재미 없게 만들어 버리는 겁니다. 앞서 말한 필승법 혹은 치트키 등 더 이상 이것에 흥미를 못 느끼게 하는 순간 해당 행동은 도파민 생성을 못하게 되고 인간은 그 행동을 반복하지 않습니다.

마지막으로 정말 쉽게 말하면 도파민 어쩌고 기획 혹은 전략의 핵심은 "잡힐듯 안잡힐듯" 입니다. 그리고 잡혔다면 곧 바로 다음에 잡아야 하는 걸 제시해서 잡힐듯 안잡힐듯 상태를 유지하면 이미 당신의 그물엔 물고기가 가득할 것 입니다.

'haebom' 구독하기

사이트를 구독하면 새 포스트 등 최신 업데이트를 알림과 메일로 가장 먼저 받아보실 수 있습니다.
Slashpage에 가입하고 'haebom'을 구독하세요!