본 논문은 유기화학에서 로봇 합성에 대한 관심이 증가함에 따라 문헌에서 화학적 절차를 자동으로 추출하는 것이 중요해짐을 배경으로 한다. 화학 언어의 모호성과 신뢰할 수 있는 컴퓨터 지원 추출 프로토콜 개발에 필요한 높은 인력 비용으로 인해 이 작업은 여전히 어려움을 겪고 있다. 이에 본 논문에서는 비정형 실험 절차와 구조화된 작업 순서 간의 변환을 위한 화학 실행기로서 완전히 미세 조정된 대규모 언어 모델(LLM)인 ChemActor를 제시한다. 부족하고 품질이 낮은 주석 데이터의 문제를 해결하기 위해 순차적 LLM 생성 데이터 프레임워크를 제안한다. 이 프레임워크는 분포 분기 기반으로 데이터를 선택하는 데이터 선택 모듈과 단일 분자 입력으로부터 기계 실행 가능한 작업을 생성하는 범용 LLM을 통합한다. 또한, 모델의 고급 화학 실험 절차 이해도를 반영하는 새로운 다중 라운드 LLM 순환 검토 지표를 도입한다. 반응-설명(R2D) 및 설명-작업(D2A) 작업에 대한 광범위한 실험은 LLM 생성 데이터로 증강된 ChemActor가 기준 모델보다 10% 향상된 최첨단 성능을 달성함을 보여준다. 코드는 https://github.com/Zhanghahah/ChemActor 에서 확인할 수 있다.