본 논문은 연합 학습(FL)에서 무선 환경의 동적이고 이기종적인 특성 속에서 효율적인 디바이스 선택 및 자원 할당 문제를 해결하기 위해 도구 지원 진화형 대규모 언어 모델(T-ELLM) 프레임워크를 제안합니다. 기존 방법들의 복잡성과 도메인 특화 지식 의존성을 극복하기 위해, T-ELLM은 자연어 기반 시나리오 프롬프트를 활용하여 다양한 네트워크 조건에 대한 일반화 성능을 향상시킵니다. 디바이스 선택 정책 학습과 자원 할당 문제를 분리하여 처리 가능성을 높이고, 샘플 효율적인 모델 기반 가상 학습 환경을 통합하여 실제 환경과의 상호작용을 최소화하면서 정책 최적화를 수행합니다. 이론적 분석을 통해 가상 환경과 실제 환경 간의 차이를 경계짓고, 실험 결과를 통해 T-ELLM이 에너지 효율성과 환경 변화에 대한 적응력 면에서 기존 방법들을 능가함을 보여줍니다.