Piper 2: Arcade 게임 생성기, 53% → 80% 대폭 향상
아케이드를 2월에 출시했을 때, 우리는 교사들이 1분 이내에 맞춤형 학습 게임을 만들 수 있다는 약속을 기반으로 했습니다. 우리는 교사들의 시간을 절약하고 학생들을 위해 차별화된 자료를 만들 수 있게 해주고 싶었습니다. 그 약속에는 게임이 단순히 빠르게 생성되는 것뿐만 아니라 좋은 퀄리티여야 한다는 뜻이 담겨 있었습니다. 빠르게 만드는 것은 쉽지만, 교사가 거의 손을 대지 않고 바로 사용할 수 있을 만큼 높은 완성도가 필요했습니다. 또한 텍스트뿐만 아니라 오디오와 이미지도 함께 지원해야 했습니다. 모든 학년과 과목을 다루려면 텍스트만으로는 충분하지 않기 때문입니다. 지난 한 달 동안 우리는 AI 게임 생성기 'Piper'를 대대적으로 개선하는 데 집중했습니다. 첫 번째 생성기에 비해 큰 도약을 이룬 Piper 2를 소개하게 되어 정말 기쁩니다. 아래에서 우리의 접근 방식과 개선한 점을 자세히 알려드리겠습니다. 평가 시스템 구축하기 게임이 "좋다"는 것을 어떻게 정의할까요? 먼저 기준을 정하고, 그 기준에 맞는지 평가하는 시스템을 만들어야 했습니다. 내용: 모든 답이 완전하고 독점적으로 정확한가? 충실도: 게임이 교사가 요청한 내용과 일치하는가? 이미지: 이미지들이 게임의 내용에 정확하게 맞는가? 오디오: 오디오가 표현해야 할 소리를 제대로 나타내는가? 이 중 하나라도 실패하면 전체 평가를 통과하지 못하도록 했습니다. 첫 평가를 돌려보니 통과율은 52.5%였습니다. 생성된 게임의 거의 절반이 교사가 사용하기에 의미 있는 문제를 가지고 있었습니다. 완벽을 추구하다 이 숫자를 높이는 것이 팀의 최우선 과제가 되었습니다. 그 근본적인 약속을 지키지 못한다면 다른 어떤 노력도 의미가 없었기 때문입니다. 초기 목표는 80% 통과율이었고, 궁극적으로는 (아마도 도달하기 어려운) **100%**를 목표로 삼았습니다. 추가 평가를 진행하고 결과를 분석한 결과, 세 가지 흔한 실패 원인을 발견했습니다. 낮은 품질이거나 부정확한 이미지 틀리거나 모호한 답변 게임 내용이 요청한 것과 일치하지 않음
- ContenjooC
