Sign In

Transcription and Recognition of Italian Parliamentary Speeches Using Vision-Language Models

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Luigi Curini, Alfio Ferrara, Giovanni Pagano, Sergio Picascia

πŸ’‘ κ°œμš”

λ³Έ μ—°κ΅¬λŠ” μŠ€μΊ”λœ 역사 문건 ν˜•νƒœλ‘œλ§Œ μ‘΄μž¬ν•˜λŠ” μ΄νƒˆλ¦¬μ•„ 의회 μ—°μ„€λ¬Έμ˜ ν…μŠ€νŠΈ μž¬κ΅¬μ„± 및 의미 λΆ„μ„μ˜ 어렀움을 ν•΄κ²°ν•˜κΈ° μœ„ν•΄ Vision-Language Model (VLM) 기반 νŒŒμ΄ν”„λΌμΈμ„ μ œμ•ˆν•©λ‹ˆλ‹€. μ œμ•ˆλœ νŒŒμ΄ν”„λΌμΈμ€ μ „λ¬Έ OCR λͺ¨λΈλ‘œ ν…μŠ€νŠΈλ₯Ό μΆ”μΆœν•˜κ³ , 이후 λŒ€κ·œλͺ¨ VLM이 μ‹œκ°μ  λ ˆμ΄μ•„μ›ƒκ³Ό ν…μŠ€νŠΈ λ‚΄μš©μ„ ν•¨κ»˜ λΆ„μ„ν•˜μ—¬ 전사 였λ₯˜λ₯Ό μˆ˜μ •ν•˜κ³ , λ°œμ–Έμž 식별 및 ν•΄λ‹Ή 정보λ₯Ό 의회 지식 λ² μ΄μŠ€μ™€ μ—°λ™ν•©λ‹ˆλ‹€. μ‹€ν—˜ κ²°κ³Ό, κΈ°μ‘΄ 방식 λŒ€λΉ„ 전사 ν’ˆμ§ˆκ³Ό λ°œμ–Έμž νƒœκΉ… 정확도가 크게 ν–₯μƒλ˜μ—ˆμŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
μŠ€μΊ”λœ λ¬Έμ„œ ν˜•νƒœλ‘œ μ‘΄μž¬ν•˜λŠ” 역사적 의회 μ—°μ„€λ¬Έκ³Ό 같은 ν¬μ†Œ μžμ›μ— λŒ€ν•œ μžλ™ 전사, 의미 뢄석, 개체 연결을 효과적으둜 μˆ˜ν–‰ν•  수 μžˆλŠ” μƒˆλ‘œμš΄ ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ‹œν•©λ‹ˆλ‹€.
β€’
VLM을 ν™œμš©ν•˜μ—¬ μ‹œκ°μ  정보와 ν…μŠ€νŠΈ 정보λ₯Ό ν†΅ν•©ν•¨μœΌλ‘œμ¨ κΈ°μ‘΄ OCR 기반 νŒŒμ΄ν”„λΌμΈμ˜ ν•œκ³„λ₯Ό κ·Ήλ³΅ν•˜κ³  정확도λ₯Ό 높일 수 μžˆμŒμ„ μž…μ¦ν•©λ‹ˆλ‹€.
β€’
λ°œμ–Έμž 식별 ν›„ 의회 지식 λ² μ΄μŠ€μ™€ μ—°λ™ν•˜λŠ” κ³Όμ •μ—μ„œ SPARQL 쿼리와 닀쀑 μ „λž΅ 퍼지 맀칭이 ν™œμš©λ˜μ–΄ μ •λ³΄μ˜ 신뒰도λ₯Ό λ†’μ˜€μŠ΅λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ λ°©λ²•λ‘ μ˜ νš¨κ³Όμ„±μ€ μ΄νƒˆλ¦¬μ•„ 의회 연섀문에 λŒ€ν•΄ κ²€μ¦λ˜μ—ˆμœΌλ‚˜, λ‹€λ₯Έ μ–Έμ–΄λ‚˜ λ‹€λ₯Έ μ’…λ₯˜μ˜ λ¬Έμ„œμ— λŒ€ν•œ μΌλ°˜ν™” κ°€λŠ₯성은 좔가적인 연ꡬ가 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘