본 논문은 대규모 언어 모델(LLM)의 클라우드 기반 서비스에서 사용되는 토큰당 가격 책정 메커니즘의 취약성을 분석합니다. 현재의 토큰 기반 가격 책정은 서비스 제공자가 모델이 생성하는 출력에 사용된 토큰 수를 허위 보고하여 이익을 극대화할 유인을 제공하며, 사용자는 이를 검증할 방법이 없습니다. 논문에서는 이러한 문제를 증명하고, 서비스 제공자가 의심을 받지 않고 과금하는 효율적인 휴리스틱 알고리즘을 제시합니다. 또한, 이러한 유인을 제거하기 위해서는 토큰의 문자 수에 선형적으로 가격을 책정해야 함을 보여주고, 이를 통해 평균 이윤을 유지하는 방법을 제안합니다. Llama, Gemma, Ministral 계열의 여러 LLM과 LMSYS Chatbot Arena 플랫폼의 프롬프트를 사용한 실험 결과를 통해 이론적 결과를 보완합니다.