/
/
每日 Arxiv
每日 Arxiv
本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。
是什么推动了视觉生成模型的组合泛化?
时间序列在线共形预测中的相关性感知阈值
MINERVA:用于监督特征选择的互信息神经估计
使用分层记忆进行预训练:分离长尾知识和常识
超越手册和任务:LLM 代理的实例级上下文学习
InfoMosaic-Bench:评估工具增强代理中的多源信息搜索
对比损失和三重态损失:方差分析和优化行为
使用 GPT-4o 在牙科全景 X 光片中生成颌骨囊肿的诊断结果:构建具有结构化输出 (SLSO) 框架的两阶段自校正循环
基于 YOLO 目标检测模型的量产电子元件自动缺陷检测
NGGAN:基于窄带电力线通信实际测量数据集的噪声生成 GAN
PolySim:通过多模拟器动态随机化弥合人形控制的模拟与现实差距
格式惯性:法学硕士在医学预会诊中的失败机制
重新思考 RLHF 中的 KL 正则化:从价值估计到梯度优化
言语采样:如何缓解模式崩溃并释放法学硕士的多样性
MG2FlowNet:通过增强型 MCTS 和贪婪控制加速高奖励样本生成
LLM-MCoX:基于大型语言模型的多机器人协调探索与搜索
Auto-ARGUE:基于法学硕士的报告生成评估
Muon 在尾端联想记忆学习方面优于 Adam
利用可扩展的中期训练强化学习,学习将推理作为动作抽象
自主感知聚类:当本地决策取代全局处方时
HNote:使用十六进制编码扩展 YNote,用于音乐建模中的 LLM 微调
使用熵引导条件变分自动编码器进行不确定性感知生成过采样
人工权威:从机器思维到政治联盟。大语言模型中民主与专制偏见的实验分析
InfMasking:通过对比多模态相互作用释放协同信息
通过开源语言模型生成用于代码编辑的高质量数据集
Jina-reranker-v3:列表文档重新排序的最后但不晚的交互
SafeFlowMatcher:使用控制屏障函数进行流匹配的安全快速规划
揭示接地ID:外部线索如何影响多模态绑定
FrameMind:通过强化学习进行帧交错视频推理
通过因果分析和互信息分解解释基于深度学习的恒星质量估计
HFuzzer:通过基于短语的模糊测试来测试大型语言模型中的幻觉包
表格上的边界:针对结构化数据的有效黑盒决策攻击
提示感知分类器免费指导扩散模型
主动攻击:通过自适应环境对 LLM 进行红队攻击
稀疏子网络是否表现出认知一致的注意力?剪枝对显著图保真度、稀疏性和概念一致性的影响
当判断变成噪音:法学硕士评判基准的设计缺陷如何悄然损害效度
在多小区边缘网络中通过协调多点广播实现细粒度 AI 模型缓存和下载
组合结构的强化生成:复杂性理论的应用
水仙花假说:堕入幻觉
重新思考文本复杂性在语言模型预训练中的作用
视觉语言模型能像人类一样看待城市场景吗?城市感知基准
FedMentor:面向心理健康领域异构联邦法学硕士的领域感知差异隐私
MIA-EPT:通过表格数据的错误预测进行成员推理攻击
Fun-ASR技术报告
基于法学硕士的社会模拟中的人口对齐角色生成
TalkPlayData 2:用于多模式对话音乐推荐的代理合成数据管道
大型语言模型黑客攻击:量化使用 LLM 进行文本注释的隐藏风险
X-Teaming Evolutionary M2S:自动发现多回合到单回合越狱模板
Time2time:通过对隐藏状态进行因果干预来模拟时间序列基础模型中的罕见事件
基于专家路线的端到端自动驾驶知识驱动扩散策略
对大型语言模型进行后训练以获得多样化的高质量响应
注意力机制作为自适应滤波器
INGRID:使用大型语言模型的智能生成机器人设计
低资源菲律宾语言中零样本跨语言命名实体识别的元预训练
混合上下文生成长视频
使用大型语言模型为生态学提供灵活的元数据收集
人工智能伴侣的情感操纵
SSFO:检索增强生成的自监督忠实度优化
负山水:实时互动水墨画合成
关于零样本强化学习
OpenWHO:用于低资源语言健康翻译的文档级平行语料库
SurGE:科学调查生成的基准和评估框架
RLVR 中的深度-广度协同:通过自适应探索释放 LLM 推理优势
补一针,省九针:语言模型的主动自我完善
TSLA:自动驾驶汽车平台上语义分割的任务特定学习自适应
街道评论:基于人工智能的参与式街景包容性评估框架
突触修剪:深度学习正则化的生物学启示
时间是一种特征:利用扩散语言模型中的时间动态
LeWiDi-2025 上的 LPI-RIT:通过元数据和 DisCo 的损失重加权改进分布预测
SonicMaster:迈向可控的一体化音乐修复和母带处理
C3:口语对话模型的双语基准,探索复杂对话中的挑战
第一个幻觉标记与条件标记不同
利用大型语言模型进行太阳能光伏评估
SIA:通过视觉语言模型的意图感知增强安全性
思想纯度:思想链攻击的防御框架
MapIQ:评估用于地图问答的多模式大型语言模型
TolerantECG:不完美心电图的基础模型
使用具有特质反应中介的虚拟受访者进行心理测量项目验证
利用语言模型赋能医疗从业者:在两个实际临床应用中构建语音记录
谁是内鬼?基于 LLM 的多智能体系统中恶意代理的建模与检测
Optimas:利用全局一致的本地奖励优化复合人工智能系统
自我校正平台:发现并解决大型语言模型中的自我校正盲点
使用认知模型揭示语言模型中的价值权衡
通过库设计重构代码库
PhysioWave:用于生理信号表示的多尺度小波变换器
理解合成数据中的偏差以进行评估
超越分块:面向长文档问答的语篇感知分层检索
微行为:通过可操作的自我推理缓解基于法学硕士的 RAG 中的知识冲突
SSA-COMET:在评估资源匮乏的非洲语言的机器翻译方面,法学硕士 (LLM) 的表现是否优于学习指标?
MedAgentGym:用于生物医学数据科学中以代码为中心的推理的可扩展代理训练环境
SALAD:法学硕士辅助硬件设计中机器学习的系统评估
纯探索的情境学习
FreqPolicy:具有连续标记的频率自回归视觉运动策略
RFCAudit:用于网络协议功能错误检测的 LLM 代理
大型视觉语言模型中压缩投影器的安全威胁
重新思考暴露下的精确反学习:在大型语言模型中提取精确反学习下的遗忘数据
人类同理心作为编码器:特殊教育中的人工智能辅助抑郁症评估
CryoCCD:用于冷冻电镜合成的条件循环一致扩散与生物物理建模
正性约束下神经网络反馈系统的局部稳定性与吸引域分析
综合评价失去了什么?
Load more
PropRAG:通过命题路径上的定向搜索引导检索
Created by
Haebom
作者
王晶金、韩家伟
大纲
为了克服检索增强生成 (RAG) 的 Limitations 问题,我们引入了 PropRAG,这是一个新颖的 RAG 框架,它利用上下文丰富的命题,并通过高效的波束搜索发现多阶段推理路径。现有的 RAG 由于依赖于独立的知识检索,难以进行复杂的多阶段推理;而基于知识图谱的结构化 RAG 则存在三元组上下文崩溃的问题,导致知识表示的准确率较低。PropRAG 在 2Wiki、HotpotQA 和 MuSiQue 数据集上实现了最佳的零样本召回率@5 和 F1 得分。
Takeaways, Limitations
•
Takeaways:
◦
我们克服了现有 RAG 的局限性,并通过更准确的信息检索和高效的推理路径发现来改进非参数知识集成。
◦
我们通过基于上下文丰富的命题的知识表示来提高知识表示的准确性。
◦
即使没有 LLM,也可以使用高效的波束搜索进行多阶段推理。
◦
我们在 2Wiki、HotpotQA 和 MuSiQue 数据集上实现了 SOTA。
•
Limitations:
◦
Limitations,正如论文中所述,并未提出。
查看 PDF
Made with Slashpage