본 논문은 데이터에서 방정식을 발견하는 Data2Eqn 과제에 대해 다룹니다. 기존의 유전 알고리즘이나 심층 학습 기반 접근 방식은 검색 비효율성과 작은 데이터셋에 대한 일반화 성능 저하 문제를 가지고 있습니다. 본 연구는 기존의 사전 훈련된 모델들이 일반적인 데이터 분포에 초점을 맞춰 도메인 특화 과제에 효과적이지 못하고, 수학적 의미론을 고려하지 않아 부정확한 방정식을 생성하는 문제점을 지적합니다. 이를 해결하기 위해, 강화 학습 기반의 미세 조정 프레임워크를 제시합니다. 이 프레임워크는 하위 과제의 수치적 적합성에서 파생된 보상 신호를 통해 사전 훈련된 모델의 생성 정책을 직접 최적화하여 특정하고 복잡한 데이터 분포에 적응하고 수학적으로 의미있는 방정식을 생성하도록 합니다. 실험 결과, 제안된 방법이 복잡한 분포 하에서 방정식 생성의 정확성과 강건성을 향상시킨다는 것을 보여줍니다.
시사점, 한계점
•
시사점:
◦
강화 학습 기반 미세 조정을 통해 사전 훈련된 모델의 도메인 적응력을 향상시켜 Data2Eqn 과제의 정확성과 강건성을 높일 수 있음을 제시.