본 논문은 대규모 언어 모델(LLM) 기반 클라우드 서비스에서 토큰 기반 과금 방식의 취약성을 지적한다. 현재의 토큰당 가격 책정은 서비스 제공자가 모델이 생성하는 데 사용한 토큰 수를 조작하여 과금할 유인을 제공하며, 사용자는 이를 검증할 수 없다는 것이다. 논문은 이러한 문제를 해결하기 위해, 모델의 생성 과정에 대한 투명성을 강화하거나, 문자 기반 과금 방식으로 전환하는 것을 제안한다. 또한, 제공자의 과금 조작을 위한 효율적인 휴리스틱 알고리즘을 제시하고, Llama, Gemma, Ministral 계열의 LLM과 LMSYS Chatbot Arena 플랫폼의 프롬프트를 사용한 실험 결과를 통해 이론적 결과를 보완한다.