본 논문은 소프트 로봇 설계 과정의 복잡성과 반복성을 해결하기 위해 대규모 언어 모델(LLM)을 활용하는 새로운 벤치마크인 RoboCrafter-QA를 제시합니다. RoboCrafter-QA는 EvoGym 시뮬레이터를 이용하여 다양한 소프트 로봇 설계 과제(이동, 조작, 균형 유지 등)를 생성하고, LLM이 고수준 작업 설명과 저수준 형태 및 재료 선택 간의 연결을 얼마나 효과적으로 학습하는지 평가합니다. 실험 결과, 최첨단 다중 모드 LLM은 설계 표현 학습에 있어 유망한 성능을 보이지만, 미묘한 성능 차이를 가진 설계 간의 세부적인 차별에는 어려움을 겪는다는 것을 보여줍니다. 또한, LLM을 로봇 설계 초기화에 활용할 수 있는 실용성을 입증하고, 향후 연구를 위한 코드와 벤치마크를 공개할 예정입니다.