Sign In

Hi-SAM: A Hierarchical Structure-Aware Multi-modal Framework for Large-Scale Recommendation

Created by
  • Haebom
Category
Empty

์ €์ž

Pingjun Pan, Tingting Zhou, Peiyao Lu, Tingting Fei, Hongxiang Chen, Chuanjiang Luo

๐Ÿ’ก ๊ฐœ์š”

๋ณธ ๋…ผ๋ฌธ์€ ํ…์ŠคํŠธ, ์ด๋ฏธ์ง€ ๋“ฑ ํ’๋ถ€ํ•œ ์†์„ฑ์„ ๊ฐ€์ง„ ์•„์ดํ…œ ์ถ”์ฒœ์—์„œ ๊ธฐ์กด Semantic ID ๊ธฐ๋ฐ˜ ๋ฐฉ์‹์˜ ํ† ํฐํ™” ๋ฌธ์ œ์™€ ๊ณ„์ธต ๊ตฌ์กฐ๋ฅผ ๋ฌด์‹œํ•˜๋Š” ์•„ํ‚คํ…์ฒ˜ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด Hi-SAM ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. Hi-SAM์€ ๊ณต์œ  ์˜๋ฏธ์™€ ๊ฐœ๋ณ„ ๋ชจ๋‹ฌ๋ฆฌํ‹ฐ ์ •๋ณด๋ฅผ ๋ถ„๋ฆฌํ•˜๋Š” DST์™€ ์‚ฌ์šฉ์ž ์ƒํ˜ธ์ž‘์šฉ, ์•„์ดํ…œ, ํ† ํฐ์˜ ๊ณ„์ธต ๊ตฌ์กฐ๋ฅผ ๋ณต์›ํ•˜๋Š” HMAT๋ฅผ ํ†ตํ•ด ์ถ”์ฒœ ์„ฑ๋Šฅ์„ ํ–ฅ์ƒ์‹œํ‚ต๋‹ˆ๋‹ค. ๋Œ€๊ทœ๋ชจ ์‹ค์ œ ๋ฐ์ดํ„ฐ์…‹ ๋ฐ ์‹ค์„œ๋น„์Šค ์ ์šฉ ๊ฒฐ๊ณผ, ๊ธฐ์กด ์ตœ์ฒจ๋‹จ ๋ฐฉ๋ฒ• ๋Œ€๋น„ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ๊ณผ 6.55%์˜ ํ•ต์‹ฌ ์˜จ๋ผ์ธ ์ง€ํ‘œ ํ–ฅ์ƒ์„ ๋‹ฌ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค.

๐Ÿ”‘ ์‹œ์‚ฌ์  ๋ฐ ํ•œ๊ณ„

โ€ข
๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ •๋ณด์˜ ํšจ๊ณผ์ ์ธ ๋ถ„๋ฆฌ ๋ฐ ์••์ถ•: ๊ณต์œ  ์˜๋ฏธ์™€ ๋ชจ๋‹ฌ๋ฆฌํ‹ฐ๋ณ„ ํŠน์„ฑ์„ ๋ถ„๋ฆฌํ•˜์—ฌ ํ† ํฐํ™”์˜ ํšจ์œจ์„ฑ์„ ๋†’์ด๊ณ  ์ •๋ณด ์†์‹ค์„ ์ตœ์†Œํ™”ํ•ฉ๋‹ˆ๋‹ค.
โ€ข
๊ณ„์ธต์  ๊ตฌ์กฐ๋ฅผ ๊ณ ๋ คํ•œ ์ถ”์ฒœ ๋ชจ๋ธ๋ง: ์‚ฌ์šฉ์ž ํ–‰๋™, ์•„์ดํ…œ, ํ† ํฐ ๊ฐ„์˜ ๋‚ด์žฌ๋œ ๊ณ„์ธต ๊ตฌ์กฐ๋ฅผ ๋ณต์›ํ•˜์—ฌ ๋ณด๋‹ค ์ •ํ™•ํ•˜๊ณ  ๋งฅ๋ฝ์ ์ธ ์ถ”์ฒœ์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค.
โ€ข
์ฝœ๋“œ ์Šคํƒ€ํŠธ ์ƒํ™ฉ์—์„œ์˜ ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ: ์•„์ดํ…œ์˜ ํ’๋ถ€ํ•œ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ •๋ณด๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ํ™œ์šฉํ•˜์—ฌ ์ •๋ณด๊ฐ€ ๋ถ€์กฑํ•œ ์‹ ๊ทœ ์•„์ดํ…œ์— ๋Œ€ํ•œ ์ถ”์ฒœ ์„ฑ๋Šฅ์„ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œํ‚ต๋‹ˆ๋‹ค.
โ€ข
Anchor Token์˜ ํšจ์œจ์„ฑ ๊ฒ€์ฆ ๋ฐ ์ผ๋ฐ˜ํ™”: Anchor Token์„ ํ†ตํ•ด ๊ธด ์‹œํ€€์Šค ์ •๋ณด๋ฅผ ์••์ถ•ํ•˜๋Š” ๋ฐฉ๋ฒ•๋ก ์˜ ์‹คํšจ์„ฑ์„ ์ž…์ฆํ•˜์˜€์œผ๋‚˜, Anchor Token์˜ ์ตœ์  ๊ฐœ์ˆ˜๋‚˜ ์„ค๊ณ„ ๋ฐฉ์‹์— ๋Œ€ํ•œ ์ถ”๊ฐ€์ ์ธ ์—ฐ๊ตฌ๊ฐ€ ํ•„์š”ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๐Ÿ‘