每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

动态参数记忆:用于对话中长序列情绪识别的临时 LoRA 增强型 LLM

Created by
  • Haebom

作者

麦家龙、邢晓芬、李亚伟、陈卫东、李志鹏、邢景源、徐向民

大纲

针对高帧率导致的语音情感模型(SLLM)处理能力受限的问题,本文提出了一种动态参数记忆(DPM)机制。DPM 将句子级情感信息增量编码到临时的 LoRA 模块中,有效地“记忆”上下文信息,即使在有限的上下文窗口内也能实现无限长的音频处理。在 IEMOCAP 数据集上的实验结果表明,DPM 显著提升了 SLLM 在处理长音频序列时的情感识别性能,达到了最佳性能。

Takeaways,Limitations

Takeaways:
通过解决 SLLM 的上下文窗口有限问题,实现长期语音数据处理。
有效利用句子级情感信息,提高对话中的情感识别性能。
通过DPM机制,将基于SLLM的语音情感识别性能提升到最高水平。
Limitations:
DPM 的性能基于 IEMOCAP 数据集上的实验结果,需要进一步研究以确定其他数据集或不同语音特征上的泛化性能。
目前的重点是句子级的情感编码,可能需要研究在更细粒度的单位(例如音节、单词)上利用情感信息。
可能需要额外的分析和优化研究来解决 DPM 增加的计算成本。
👍