대규모 언어 모델(LLM)이 수학적 발견에 기여할 수 있다는 주장에 대한 재평가를 수행한다. LLM 기반 유전자 알고리즘이 온라인 빈 포장 문제에 대한 새로운 통찰력을 제공했다는 보고를 바탕으로, LLM이 생성한 휴리스틱의 동작과 해석 가능성을 상세히 분석한다. 분석 결과, 휴리스틱은 인간이 읽을 수 있지만, 전문가조차 이해하기 어려웠다. 이를 바탕으로, 빈 포장 문제의 특정 인스턴스에 맞춰 설계된 새로운 알고리즘을 제안한다. 제안된 알고리즘은 기존 LLM 기반 휴리스틱보다 훨씬 간단하고, 효율적이며, 해석 가능하고, 일반화 가능했다. LLM이 이 문제에 기여했다는 주장의 한계를 논하며, LLM이 생성한 결과물의 과학적 가치를 평가할 때 엄격한 검증과 맥락화의 필요성을 강조한다.