Sign In

Render, Don't Decode: Weight-Space World Models with Latent Structural Disentanglement

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Roussel Desmond Nzoyem, Mauro Comi

πŸ’‘ κ°œμš”

λ³Έ 논문은 λΉ„λ””μ˜€λ₯Ό μœ„ν•œ 기쑴의 ν”½μ…€ 인코딩 기반 μ›”λ“œ λͺ¨λΈμ˜ 계산 λΉ„νš¨μœ¨μ„±κ³Ό 뢈투λͺ…성을 ν•΄κ²°ν•˜κΈ° μœ„ν•΄, μ‹œμŠ€ν…œ μƒνƒœλ₯Ό μ’Œν‘œ 기반 μ•”μ‹œμ  μ‹ κ²½ ν‘œν˜„(INR)의 κ°€μ€‘μΉ˜μ™€ 편ν–₯으둜 λ‚˜νƒ€λ‚΄λŠ” μƒˆλ‘œμš΄ ν”„λ ˆμž„μ›Œν¬μΈ NOVAλ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. NOVAλŠ” 디코더λ₯Ό μ œκ±°ν•˜μ—¬ νš¨μœ¨μ„±μ„ 높이고, λΆ„ν•΄λŠ₯을 λ›°μ–΄λ„˜λŠ” λ Œλ”λ§ κΈ°λŠ₯을 μ œκ³΅ν•©λ‹ˆλ‹€. λ˜ν•œ, 좔가적인 손싀 ν•¨μˆ˜λ‚˜ μ λŒ€μ  ν•™μŠ΅ 없이도 λ°°κ²½, μ „κ²½, ν”„λ ˆμž„ κ°„ μ›€μ§μž„κ³Ό 같은 ꡬ쑰적 ꡬ성 μš”μ†Œλ₯Ό λΆ„λ¦¬ν•˜λŠ” λ†€λΌμš΄ λŠ₯λ ₯을 λ³΄μ—¬μ€λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
ꡬ쑰적 ν‘œν˜„μ˜ νš¨μœ¨μ„± 및 해석 κ°€λŠ₯μ„± ν–₯상: INR 기반의 κ°€μ€‘μΉ˜ 곡간 ν‘œν˜„μ„ 톡해 기쑴의 ν”½μ…€ 인코딩 방식보닀 훨씬 효율적이고 해석 κ°€λŠ₯ν•œ μ›”λ“œ λͺ¨λΈ ꡬ좕이 κ°€λŠ₯ν•΄μ‘ŒμŠ΅λ‹ˆλ‹€.
β€’
μ½˜ν…μΈ  및 동적 츑면의 독립적 μ œμ–΄: λͺ¨λΈμ΄ ꡬ쑰적 μš”μ†Œλ₯Ό μ„±κ³΅μ μœΌλ‘œ λΆ„λ¦¬ν•˜μ—¬, μ‚¬μš©μžλ“€μ€ μ½˜ν…μΈ (예: λ°°κ²½)λ‚˜ 동적 μš”μ†Œ(예: μ›€μ§μž„)λ₯Ό μ„œλ‘œ λ°©ν•΄ν•˜μ§€ μ•Šκ³  λ…λ¦½μ μœΌλ‘œ νŽΈμ§‘ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
μ‹€μš©μ  적용 κ°€λŠ₯μ„±: 단일 μ†ŒλΉ„μžμš© GPUμ—μ„œ μ•½ 4천만 개의 νŒŒλΌλ―Έν„°λ‘œλ„ 높은 μ„±λŠ₯을 λ‹¬μ„±ν•˜λ©°, ν–₯ν›„ λͺ°μž…ν˜• 및 λ§žμΆ€ν˜• 가상 κ²½ν—˜ ꡬ좕에 κΈ°μ—¬ν•  잠재λ ₯을 κ°€μ§€κ³  μžˆμŠ΅λ‹ˆλ‹€.
β€’
데이터셋 및 λ³΅μž‘μ„±: ν˜„μž¬ κ²€μ¦λœ 데이터셋듀이 μ œν•œμ μΌ 수 있으며, 맀우 λ³΅μž‘ν•˜κ±°λ‚˜ μ˜ˆμΈ‘ν•˜κΈ° μ–΄λ €μš΄ 동적 μž₯λ©΄μ—μ„œμ˜ μ„±λŠ₯ 및 μΌλ°˜ν™” λŠ₯λ ₯에 λŒ€ν•œ 좔가적인 연ꡬ가 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘