Sign In

EVA-0: Test-Time Model Evolution with Only Two Forward Passes per Sample

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Guohao Chen, Shuaicheng Niu, Geng Li, Yunbei Zhang, Shilin Shan, Chunyan Miao, Jianfei Yang

πŸ’‘ κ°œμš”

λ³Έ 논문은 λ ˆμ΄λΈ” μ—†λŠ” ν…ŒμŠ€νŠΈ μ‹œκ°„ κ²½ν—˜μ„ ν™œμš©ν•˜μ—¬ 배포된 λͺ¨λΈμ„ κ°œμ„ ν•˜λŠ” ν…ŒμŠ€νŠΈ μ‹œκ°„ λͺ¨λΈ μ§„ν™” 방법을 μ œμ•ˆν•©λ‹ˆλ‹€. κΈ°μ‘΄ 방법과 달리 μ—­μ „νŒŒ(BP) 없이 두 번의 순방ν–₯ μ „λ‹¬λ§ŒμœΌλ‘œ λͺ¨λΈ 적응을 μˆ˜ν–‰ν•˜λŠ” EVA-0 ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ‹œν•˜λ©°, 이λ₯Ό 톡해 λ©”λͺ¨λ¦¬ μ˜€λ²„ν—€λ“œλ₯Ό 쀄여 μ—£μ§€ λ””λ°”μ΄μŠ€ λ“± λ‹€μ–‘ν•œ ν™˜κ²½μ—μ„œμ˜ 배포λ₯Ό μš©μ΄ν•˜κ²Œ ν•©λ‹ˆλ‹€. EVA-0λŠ” 손싀 μŠ€μΌ€μΌ λΆˆλ³€μ„±, 액컀 기반 μ΅œμ ν™”, λŒ€μΉ­μ  μ–‘λ°©ν–₯ 섭동을 톡해 κΈ°μ‘΄ 제둜차 μ΅œμ ν™”μ˜ λ¬Έμ œμ μ„ κ·Ήλ³΅ν•˜κ³  높은 μ„±λŠ₯κ³Ό νš¨μœ¨μ„±μ„ λ‹¬μ„±ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
μ—­μ „νŒŒ 없이 효율적인 ν…ŒμŠ€νŠΈ μ‹œκ°„ 적응 κ°€λŠ₯μ„± μ œμ‹œ: BP 없이 단 두 번의 순방ν–₯ μ „λ‹¬λ§ŒμœΌλ‘œ λͺ¨λΈ μ„±λŠ₯을 κ°œμ„ ν•  수 μžˆμŒμ„ 보여주어, λ©”λͺ¨λ¦¬ μ œμ•½μ΄ μžˆκ±°λ‚˜ λΈ”λž™λ°•μŠ€ λͺ¨λΈμ—λ„ 적용 κ°€λŠ₯ν•œ μ‹€μš©μ μΈ 방법둠을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
κΈ°μ‘΄ 제둜차 μ΅œμ ν™” 문제점 ν•΄κ²°: 손싀 μŠ€μΌ€μΌ λΆˆλ³€μ„±, 액컀 기반 μ΅œμ ν™”, λŒ€μΉ­μ  μ–‘λ°©ν–₯ 섭동 기법을 톡해 κΈ°μ‘΄ 제둜차 μ΅œμ ν™”μ˜ 단점인 지름길 μ†”λ£¨μ…˜, κ°€μ€‘μΉ˜ λ“œλ¦¬ν”„νŠΈ, λΉ„νš¨μœ¨μ μΈ μ—…λ°μ΄νŠΈ λ°©ν–₯ μΆ”μ • 문제λ₯Ό 효과적으둜 ν•΄κ²°ν–ˆμŠ΅λ‹ˆλ‹€.
β€’
넓은 λ²”μœ„μ˜ 적용 κ°€λŠ₯μ„±: μ—£μ§€ λ””λ°”μ΄μŠ€, μ–‘μžν™” λͺ¨λΈ, 특수 가속기, λΈ”λž™λ°•μŠ€ λͺ¨λΈ λ“± λ‹€μ–‘ν•œ μ œμ•½ 쑰건이 μžˆλŠ” ν™˜κ²½μ—μ„œλ„ ν…ŒμŠ€νŠΈ μ‹œκ°„ λͺ¨λΈ μ§„ν™”κ°€ κ°€λŠ₯함을 μ‹œμ‚¬ν•©λ‹ˆλ‹€.
β€’
데이터셋 및 λͺ¨λΈ μ˜μ‘΄μ„±: μ œμ‹œλœ μ„±λŠ₯ ν–₯상이 νŠΉμ • 데이터셋(ImageNet-C)κ³Ό λͺ¨λΈ(ViT-Base)에 κ΅­ν•œλ  수 있으며, λ‹€λ₯Έ λ°μ΄ν„°μ…‹μ΄λ‚˜ λͺ¨λΈ μ•„ν‚€ν…μ²˜μ— λŒ€ν•œ μΌλ°˜ν™” μ„±λŠ₯ 검증이 ν•„μš”ν•©λ‹ˆλ‹€.
β€’
이둠적 λΆ„μ„μ˜ 심화: μ œμ•ˆλœ κΈ°λ²•λ“€μ˜ 이둠적인 μˆ˜λ ΄μ„±μ΄λ‚˜ μ•ˆμ •μ„±μ— λŒ€ν•œ 보닀 심측적인 뢄석이 ν–₯ν›„ 연ꡬ κ³Όμ œκ°€ 될 수 μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘