게임 이론이 인공지능의 정확성과 효율성을 향상시키는 방법
게임 이론은 사람들이나 조직들이 어떤 상황에서 어떻게 결정을 내리는지를 연구하는 수학적 이론입니다. 이 이론은 각 개인이나 그룹이 자신의 이익을 최대화하기 위해 어떻게 행동하는지, 그리고 그러한 행동이 다른 사람들의 선택과 어떻게 상호 작용하는지를 분석합니다. 즉, 게임 이론은 다른 사람들의 선택에 영향을 받는 상황에서 최적의 결정을 찾는 방법을 연구합니다. 이렇게 말하면 어렵게 느껴질 수 있습니다만 예시를 몇가지 들어보죠. 돌고래와 고래가 서로 협력해서 더 많은 물고기를 잡으려고 합니다. 이들 각각은 협력하거나 협력하지 않을 수 있는 선택을 할 수 있습니다. 돌고래와 고래 모두 협력하면 둘 다 많은 물고기를 얻을 수 있습니다. 하지만 한 쪽만 협력하고 다른 한 쪽은 협력하지 않으면, 협력하지 않은 쪽이 더 많은 이득을 얻습니다. 둘 다 협력하지 않으면 둘 다 적은 물고기를 얻게 됩니다. 이런 식으로 게임 이론은 각각의 선택이 결과에 어떻게 영향을 미치는지를 설명합니다. 좀 더 가까이 직장에서의 사례를 보면 직장에서의 승진 기회를 두고 동료들이 서로 경쟁을 합니다. 여기서도 각자는 협력하거나 경쟁을 선택할 수 있습니다. 모두가 협력하면, 작업 환경이 좋아지고 전체적인 효율성이 높아져 회사가 모두에게 보너스를 줄 수 있습니다. 반면, 개인이 경쟁을 선택하면 일시적으로 개인의 이익은 증가할 수 있지만, 장기적으로는 직장 분위기가 나빠질 수 있습니다. 이런 식으로 설명을 하면 교통 체증에 대한 것도 게임 이론을 적용해 생각해 볼 수 있습니다. 모든 운전자가 가장 빠른 길을 선택하려 할 때 발생하는 교통 체증 문제도 게임 이론으로 분석할 수 있습니다. 모든 운전자가 최단 경로를 선택하면 그 길은 오히려 가장 느려질 수 있습니다. 반면, 운전자들이 조금 더 멀리 돌아가는 길을 선택하면 전체적인 교통 흐름이 개선될 수 있습니다. 게임 이론은 각각의 선택이 서로에게 어떤 영향을 미치는지 파악하고, 이를 바탕으로 최선의 전략을 세우는 것이 게임 이론의 핵심 입니다. 인공지능과 게임이론이 무슨 상관? 게임 이론은 AI, 특히 대규모 언어 모델의 효율성과 정확성을 향상시키는 데 효과적으로 활용될 수 있습니다. AI를 훈련시키는 전통적인 방법들은 때때로 일관성이 없거나 편향된 결과를 낳을 수 있습니다. 그러나 게임 이론을 적용하면, AI는 다양한 시나리오와 가능성을 고려하여 더 정확하고 공정한 결정을 내릴 수 있습니다. 예를 들어 언어 모델 내의 두 시스템, 즉 질문을 생성하는 '생성자'와 생성된 답변을 평가하는 '판별자' 사이의 일관성을 높이기 위해 설계되었습니다. 예를 들어, "프랑스의 수도는 무엇인가요?"라는 질문에 대해 생성자는 '파리'라고 답변할 가능성이 80%라고 초기에 판단합니다. 이후 생성자는 동전을 던져 진실하게 답변할지 거짓으로 답변할지를 결정하며, 이 선택은 판별자가 생성자의 답변을 평가하는 방식에 영향을 미칩니다. 판별자는 생성자가 제공한 답변이 진실인지 거짓인지를 판별하여, 진실로 판단되면 양쪽 모두에게 점수를 부여합니다. 반면, 거짓으로 판단되면 점수를 주지 않습니다. 이 과정은 약 1,000번 반복되며, 각 반복을 통해 생성자와 판별자는 서로의 반응을 학습하고 조정합니다. 이러한 상호 작용을 통해 두 시스템은 점차적으로 서로 일치하는 답변을 내놓게 되고, 이는 전체 모델의 일관성과 정확성을 크게 향상시킵니다. 이 게임은 언어 모델이 다양한 질문 형식에도 불구하고 동일한 답변을 일관되게 제공할 수 있도록 돕습니다. 이는 언어 모델의 신뢰성을 높이고 사용자가 모델의 답변을 더욱 신뢰할 수 있게 만드는 방법으로 내쉬 균형을 선택한 것입니다. 내쉬 균형 : 이는 두 플레이어가 자신의 전략을 변경해도 더 나은 결과를 얻을 수 없는 상태를 의미 합니다. 매사추세츠 공과대학(MIT)의 연구자들은 '컨센서스 게임'이라는 방법을 개발했습니다. 이는 모델이 스스로 두 가지 모드(생성 모드와 판별 모드)에서 동의할 수 있는 답변을 찾도록 유도하는 게임입니다. 이 게임을 통해 모델은 정확성과 내부 일관성을 향상시킬 수 있는 방식 입니다. 개인적으로 이 논문을 이번 ICLR 페이퍼를 보다가 발견했는데 작년 뉴립스에서 상을 받은 논문이더라구요. 요즘 들어 더욱 느끼는 거지만 인공지능이 사람'처럼' 작동하는 만큼 의외로 사회과학 쪽에서 사용되는 것들을 적용해보면 좋은 결과들이 나올 수 있는 좋은 예시 같습니다.