Sign In

DRAGON: Robust Classification for Very Large Collections of Software Repositories

Created by
  • Haebom
Category
Empty

μ €μž

Stefano Balla (DISI), Stefano Zacchiroli (IP Paris, LTCI, ACES, INFRES), Thomas Degueule (LaBRI, UB), Jean-Remy Falleri (LaBRI, UB), Romain Robbes (LaBRI, UB)

πŸ’‘ κ°œμš”

λ³Έ 논문은 λŒ€κ·œλͺ¨ μ†Œν”„νŠΈμ›¨μ–΄ μ €μž₯μ†Œ μ»¬λ ‰μ…˜μ„ 효과적으둜 λΆ„λ₯˜ν•˜λŠ” DRAGONμ΄λΌλŠ” μƒˆλ‘œμš΄ 방법을 μ œμ•ˆν•©λ‹ˆλ‹€. DRAGON은 README 파일과 같은 메타데이터에 λŒ€ν•œ μ˜μ‘΄λ„λ₯Ό 쀄이고 파일 및 디렉토리 이름과 같은 κ²½λŸ‰ μ‹ ν˜Έλ₯Ό ν™œμš©ν•˜μ—¬, λˆ„λ½λ˜κ±°λ‚˜ 일관성이 μ—†λŠ” λ¬Έμ„œμ— λŒ€ν•œ κΈ°μ‘΄ μ ‘κ·Ό λ°©μ‹μ˜ ν•œκ³„λ₯Ό κ·Ήλ³΅ν•©λ‹ˆλ‹€. 특히, README 파일이 없을 λ•Œλ„ μ„±λŠ₯ μ €ν•˜κ°€ λ―Έλ―Έν•˜μ—¬ μ‹€μ œ ν™˜κ²½μ— 적용 κ°€λŠ₯ν•˜λ©°, F1@5 점수λ₯Ό 54.8%μ—μ„œ 60.8%둜 ν–₯μƒμ‹œμΌœ μ΅œμ‹  κΈ°μˆ μ„ λ›°μ–΄λ„˜λŠ” μ„±λŠ₯을 λ³΄μ—¬μ€λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
README νŒŒμΌμ— λŒ€ν•œ μ˜μ‘΄μ„± κ°μ†Œ: DRAGON은 README 파일이 λˆ„λ½λ˜κ±°λ‚˜ λΆˆμ™„μ „ν•œ λŒ€κ·œλͺ¨ μ†Œν”„νŠΈμ›¨μ–΄ μ €μž₯μ†Œ μ»¬λ ‰μ…˜μ„ λΆ„λ₯˜ν•˜λŠ” 데 νš¨κ³Όμ μ΄λ―€λ‘œ, ν˜„μ‹€ μ„Έκ³„μ˜ λ‹€μ–‘ν•œ ν™˜κ²½μ— 적용 κ°€λŠ₯ν•©λ‹ˆλ‹€.
β€’
높은 λΆ„λ₯˜ μ„±λŠ₯ 및 μ‹€μš©μ„±: κΈ°μ‘΄ 방법 λŒ€λΉ„ μš°μˆ˜ν•œ F1@5 μ„±λŠ₯을 λ‹¬μ„±ν–ˆμœΌλ©°, μ˜€λΆ„λ₯˜λœ κ²°κ³Όμ‘°μ°¨ μ˜λ―Έμƒ μœ μ‚¬ν•œ 주제λ₯Ό μ œμ‹œν•˜μ—¬ μ‚¬μš©μžμ—κ²Œ μœ μš©ν•œ 탐색 및 검색 κ°€μ΄λ“œλ₯Ό μ œκ³΅ν•©λ‹ˆλ‹€.
β€’
λŒ€κ·œλͺ¨ μ €μž₯μ†Œ λΆ„λ₯˜ 데이터셋 제곡: 825천 개의 μ €μž₯μ†Œμ™€ 주제 정보λ₯Ό ν¬ν•¨ν•˜λŠ” μ—­λŒ€ μ΅œλŒ€ 규λͺ¨μ˜ μ €μž₯μ†Œ λΆ„λ₯˜ 데이터셋을 κ³΅κ°œν•˜μ—¬, ν–₯ν›„ κ΄€λ ¨ 연ꡬ λ°œμ „μ— κΈ°μ—¬ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
ν–₯ν›„ 과제: μ˜€λΆ„λ₯˜κ°€ μ˜λ―Έμƒ μœ μ‚¬ν•œ 주제둜 λ‚˜νƒ€λ‚˜λŠ” κ²½ν–₯이 μžˆμ–΄, λΆ„λ₯˜ 정확도λ₯Ό λ”μš± 높이고 μ˜€λΆ„λ₯˜ 자체λ₯Ό μ€„μ΄λŠ” 좔가적인 연ꡬ가 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘