Sign In

FiMI: A Domain-Specific Language Model for Indian Finance Ecosystem

Created by
  • Haebom
Category
Empty

μ €μž

Aboli Kathar, Aman Kumar, Anusha Kamath, Araveeti Srujan, Ashish Sharma, Chandra Bhushan, Dilip Asbe, Divya Sorate, Duddu Prasanth Kumar, Evan Acharya, Harsh Sharma, Hrithik Kadam, Kanishk Singla, Keyur Doshi, Kiran Praveen, Kolisetty Krishna SK, Krishanu Adhikary, Lokesh MPT, Mayurdeep Sonowal, Nadeem Shaikh, Navya Prakash, Nimit Kothari, Nitin Kukreja, Prashant Devadiga, Rakesh Paul, Ratanjeet Pratap Chauhan, Raunak Kalani, Raviraj Joshi, Shamanth MH, Shantanu Pandey, Shubham Soni, Siddharth Dixit, Smriti Jopat, Sunil Patel, Suraj Singh, Suvradip Paul, Tulasi Pilla, Utkarsh Vaidya, Vineeth Nambiar, Vishal Kanvaty, Yatharth Dedhia

πŸ’‘ κ°œμš”

λ³Έ 논문은 인도 금육 μƒνƒœκ³„, 특히 λ””μ§€ν„Έ 결제 μ‹œμŠ€ν…œμ„ μœ„ν•œ 도메인 νŠΉν™” μ–Έμ–΄ λͺ¨λΈμΈ FiMIλ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. Mistral Small 24B μ•„ν‚€ν…μ²˜λ₯Ό 기반으둜 ν•˜λ©°, λ°©λŒ€ν•œ 금육, λ‹€κ΅­μ–΄ 데이터λ₯Ό ν™œμš©ν•œ 연속 사전 ν•™μŠ΅κ³Ό μ‹€μ œ 금육 μ›Œν¬ν”Œλ‘œμš°λ₯Ό λͺ¨λ°©ν•˜λŠ” μ§€μΉ¨ νŒŒμΈνŠœλ‹μ„ 톡해 κ°œλ°œλ˜μ—ˆμŠ΅λ‹ˆλ‹€. FiMIλŠ” 금육 μΆ”λ‘ μ—μ„œ 20%의 μ„±λŠ₯ ν–₯상을 λ³΄μ˜€μœΌλ©°, 도메인별 도ꡬ 호좜 λŠ₯λ ₯μ—μ„œ 87%의 압도적인 μ„±λŠ₯ μš°μœ„λ₯Ό λ‹¬μ„±ν–ˆμŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
도메인 νŠΉν™” μ–Έμ–΄ λͺ¨λΈμ΄ νŠΉμ • μ‚°μ—… λΆ„μ•Όμ˜ λ³΅μž‘ν•œ 문제λ₯Ό ν•΄κ²°ν•˜λŠ” 데 κ°•λ ₯ν•œ μ„±λŠ₯을 λ°œνœ˜ν•  수 μžˆμŒμ„ λ³΄μ—¬μ€λ‹ˆλ‹€.
β€’
닀단계 ν•™μŠ΅ νŒŒμ΄ν”„λΌμΈκ³Ό μ‹€μ œ μ›Œν¬ν”Œλ‘œμš°λ₯Ό λ°˜μ˜ν•œ ν›ˆλ ¨ 데이터가 λͺ¨λΈ μ„±λŠ₯ ν–₯상에 μ€‘μš”ν•œ 역할을 ν•©λ‹ˆλ‹€.
β€’
μ œμ‹œλœ FiMI λͺ¨λΈμ€ 인도 금육 μ‹œμž₯에 λŒ€ν•œ 이해도λ₯Ό 높이고, 금육 μ„œλΉ„μŠ€ ν˜μ‹ μ— κΈ°μ—¬ν•  잠재λ ₯을 κ°€μ§‘λ‹ˆλ‹€.
β€’
일반적인 벀치마크 μ„±λŠ₯을 μœ μ§€ν•˜λ©΄μ„œλ„ νŠΉμ • λ„λ©”μΈμ—μ„œ λ›°μ–΄λ‚œ μ„±λŠ₯을 λ³΄μ΄λŠ” λͺ¨λΈ 개발 방법둠은 λ‹€λ₯Έ 도메인에도 적용 κ°€λŠ₯ν•  κ²ƒμœΌλ‘œ κΈ°λŒ€λ©λ‹ˆλ‹€.
β€’
λ³Έ μ—°κ΅¬λŠ” 인도 금육 μ‹œμž₯에 μ΄ˆμ μ„ λ§žμΆ”κ³  있으며, λ‹€λ₯Έ κ΅­κ°€μ˜ 금육 μƒνƒœκ³„μ— μ μš©ν•˜κΈ° μœ„ν•΄μ„œλŠ” 좔가적인 연ꡬ와 데이터가 ν•„μš”ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘