Sign In

TabDLM: Free-Form Tabular Data Generation via Joint Numerical-Language Diffusion

์ž‘์„ฑ์ž
  • Haebom
์นดํ…Œ๊ณ ๋ฆฌ
Empty

์ €์ž

Donghong Cai, Jiarui Feng, Yanbo Wang, Da Zheng, Yixin Chen, Muhan Zhang

๐Ÿ’ก ๊ฐœ์š”

๋ณธ ๋…ผ๋ฌธ์€ ์ˆ˜์น˜, ๋ฒ”์ฃผํ˜•, ๊ทธ๋ฆฌ๊ณ  ์ž์œ  ํ˜•์‹์˜ ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ๋ฅผ ํฌํ•จํ•˜๋Š” ๋ณต์žกํ•œ ํ…Œ์ด๋ธ” ๋ฐ์ดํ„ฐ ์ƒ์„ฑ์„ ์œ„ํ•œ ์ƒˆ๋กœ์šด ํ”„๋ ˆ์ž„์›Œํฌ์ธ TabDLM์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. TabDLM์€ ๋งˆ์Šคํฌ๋“œ ํ™•์‚ฐ ์–ธ์–ด ๋ชจ๋ธ(MDLM)์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•˜์—ฌ ํ…์ŠคํŠธ์™€ ๋ฒ”์ฃผํ˜• ๋ฐ์ดํ„ฐ๋ฅผ ํ™•์‚ฐ ๋ชจ๋ธ๋กœ, ์ˆ˜์น˜ ๋ฐ์ดํ„ฐ๋Š” ํŠนํ™”๋œ ์ˆซ์ž ํ† ํฐ ์ž„๋ฒ ๋”ฉ์„ ํ™œ์šฉํ•œ ์—ฐ์† ํ™•์‚ฐ ๊ณผ์ •์œผ๋กœ ๋ชจ๋ธ๋งํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ์ƒํ˜ธ ์ฃผ์˜ ๋ฉ”์ปค๋‹ˆ์ฆ˜์œผ๋กœ ๋‹ค์–‘ํ•œ ๋ฐ์ดํ„ฐ ํ˜•์‹ ๊ฐ„์˜ ์ƒํ˜ธ ์ž‘์šฉ์„ ํฌ์ฐฉํ•˜์—ฌ ํšจ๊ณผ์ ์ธ ํ…Œ์ด๋ธ” ๋ฐ์ดํ„ฐ ์ƒ์„ฑ์„ ๋‹ฌ์„ฑํ•ฉ๋‹ˆ๋‹ค.

๐Ÿ”‘ ์‹œ์‚ฌ์  ๋ฐ ํ•œ๊ณ„

โ€ข
์ž์œ  ํ˜•์‹ ํ…์ŠคํŠธ๋ฅผ ํฌํ•จํ•œ ์ด์งˆ์ ์ธ ํ…Œ์ด๋ธ” ๋ฐ์ดํ„ฐ์˜ ํšจ๊ณผ์ ์ธ ์ƒ์„ฑ์ด ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
โ€ข
์ˆ˜์น˜ ๋ฐ ์–ธ์–ด ๋ฐ์ดํ„ฐ๋ฅผ ํ†ตํ•ฉ์ ์œผ๋กœ ๋ชจ๋ธ๋งํ•˜์—ฌ ๊ธฐ์กด ๋ฐฉ๋ฒ•๋ก ์˜ ํ•œ๊ณ„๋ฅผ ๊ทน๋ณตํ•ฉ๋‹ˆ๋‹ค.
โ€ข
๋‹ค์–‘ํ•œ ๋ฒค์น˜๋งˆํฌ ๋ฐ์ดํ„ฐ์…‹์—์„œ ๊ธฐ์กด์˜ ํ™•์‚ฐ ๋ชจ๋ธ ๋ฐ LLM ๊ธฐ๋ฐ˜ ๋ฐฉ๋ฒ• ๋Œ€๋น„ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ์ž…์ฆํ–ˆ์Šต๋‹ˆ๋‹ค.
โ€ข
๋ณต์žกํ•œ ๋ฐ์ดํ„ฐ ํ˜•์‹ ๊ฐ„์˜ ์ƒํ˜ธ ์ž‘์šฉ์„ ๋”์šฑ ์ •๊ตํ•˜๊ฒŒ ๋ชจ๋ธ๋งํ•˜๊ธฐ ์œ„ํ•œ ์ถ”๊ฐ€์ ์ธ ์—ฐ๊ตฌ๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.
๐Ÿ‘