본 논문은 장기간에 걸친 시간적 불일치 문제를 해결하기 위해 대규모 언어 모델(LLM)을 위한 "Ticktack" 방법론을 제안합니다. LLM은 수천 년에 걸친 시간 정보가 부족한 방대한 데이터로 학습되어 장기간에 걸친 시간적 불일치 문제를 겪습니다. Ticktack은 그레고리력 대신 60년 주기를 사용하는 간지(sexagenary year) 표현을 활용하여 연도 단위의 균일한 분포를 달성하고, 극좌표를 이용하여 60간지 주기와 각 주기 내 연도 순서를 모델링하며, 추가적인 시간적 인코딩을 통해 LLM의 이해도를 높입니다. 마지막으로, 사후 학습된 LLM의 시간적 표현 정렬 접근 방식을 제시하여 관련 지식이 있는 시간 지점을 효과적으로 구별하고, 특히 장기간에 걸친 시간 관련 작업의 성능을 향상시킵니다. 또한, 장기간에 걸친 성능 평가를 위한 벤치마크도 제시합니다. 실험 결과는 제안된 방법의 효과를 증명합니다.
시사점, 한계점
•
시사점:
◦
장기간에 걸친 시간적 불일치 문제를 해결하는 새로운 방법론 제시
◦
간지 표현과 극좌표 활용을 통한 효율적인 시간 정보 표현
◦
사후 학습을 통한 시간적 표현 정렬로 성능 향상
◦
장기간 시간 범위를 다루는 새로운 벤치마크 제공
•
한계점:
◦
제안된 방법의 일반성 및 다른 언어 모델이나 데이터셋에 대한 적용 가능성에 대한 추가 연구 필요