TathyaNyaya는 인도 법적 맥락에 맞춰 제작된, 사실 기반 판단 예측 및 설명(FJPE)을 위한 최대 규모의 주석 달린 데이터셋입니다. 인도 대법원과 여러 고등법원의 판결문을 포함하며, "Tathya"(사실)와 "Nyaya"(정의)라는 힌디어 단어에서 유래했습니다. 전체 법률 텍스트가 아닌 사실 진술에 초점을 맞춰 설계되었으며, 실제 사법 절차에서 사실 데이터가 결과를 좌우하는 점을 반영합니다. 이 데이터셋과 함께, FJPE 작업에서 고품질 설명 생성에 최적화된 LLaMa-3-8B 대규모 언어 모델(LLM)의 instruction-tuned 변형인 FactLegalLlama를 제시합니다. TathyaNyaya의 사실 데이터로 미세 조정된 FactLegalLlama는 예측 정확도와 일관성 있고 문맥에 맞는 설명을 통합하여 AI 지원 법률 시스템에서 투명성과 해석 가능성에 대한 중요한 요구를 해결합니다. 본 논문의 방법론은 이진 판단 예측을 위한 트랜스포머와 설명 생성을 위한 FactLegalLlama를 결합하여 인도 법 영역에서 FJPE를 발전시키는 강력한 프레임워크를 만듭니다. TathyaNyaya는 규모와 다양성 면에서 기존 데이터셋을 능가할 뿐만 아니라, 법률 분석에서 설명 가능한 AI 시스템을 구축하기 위한 벤치마크를 설정합니다. 연구 결과는 예측 성능과 해석 가능성을 향상시키는 데 있어 사실의 정확성과 도메인별 미세 조정의 중요성을 강조하며, TathyaNyaya와 FactLegalLlama를 AI 지원 법적 의사 결정을 위한 기본적인 자원으로 자리매김합니다.