每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成，并以非盈利为基础运营。
论文版权归作者及相关机构所有，分享时请注明出处。

基于Transformer的量子强化学习解决带容量约束的车辆路径问题

安全关键型LLM助手中的Agent2Agent威胁：以人为中心的分类法

超越人工规划：大型组织的座位分配

BABE：生物学竞技场基准

OmniVideo-R1：利用查询意图和模态注意力强化视听推理

学习紧凑型布尔网络

TKG-Thinker：基于智能强化学习的时间知识图谱动态推理

STProtein：基于多组学数据预测空间蛋白质表达

NEX：用于无标签思维链选择和模型排序的神经元探索-利用评分

FiMI：印度金融生态系统的领域特定语言模型

RL-VLA$^3$：通过完全异步加速强化学习 VLA

RocqSmith：自动优化能否生成更好的证明代理？

LeakBoost：基于感知损失的成员推理攻击

通过细粒度知识验证减轻金融检索增强生成中的幻觉

锚定策略优化：通过支持约束修正缓解探索崩溃

非线性即秩：基于径向基函数的生成式低秩适配器

确定生产中能源效率最佳点的LLM推断

基于图的智能体记忆：分类、技术和应用

生成式本体：当结构化知识学会创造

反应式知识表示和异步推理

BhashaSetu：从高资源语言到极度低资源语言的跨语言知识转移

利用GPT对话代理模拟人类的总体选择行为和偏见

TangramSR：视觉语言模型能否在连续几何空间中进行推理？

基于语言模型的推理引导协同过滤实现可解释推荐

硬约束下的条件扩散引导：一种随机分析方法

人格分裂训练：通过不同的人格揭示潜在知识

用于构建数据集和基于模型的成釉细胞瘤诊断的统一多模态框架

SDFP：基于FIT剪枝模型的推测性解码，实现无需训练的即插即用LLM加速

Phi-Former：一种用于预测化合物-蛋白质相互作用的成对分层方法

ALIVE：通过对抗式学习和指导性语言评价唤醒LLM推理能力

精炼与提纯：基于零空间去噪的正交基优化用于条件表示学习

基于正则化策略的基础模型在波动市场中进行日前电力价格预测

M$^2$-Miner：面向移动 GUI 代理数据挖掘的多代理增强型 MCTS

THOR：基于超关系知识图谱的归纳链接预测

H-AdminSim：一款集成了 FHIR 协议的、用于模拟真实医院管理工作流程的多智能体模拟器

利用神经扩散-对流-反应方程推进舆论动态建模

基于LLM的评估方法对眼科患者咨询的医学大型语言模型聊天机器人进行临床验证

RaBiT：面向准确高效LLM的残差感知二值化训练

路径：评估人工智能网络代理中的调查和上下文发现

AgentXRay：通过工作流重构对代理系统进行白盒测试

ProAct：交互式环境中的智能体前瞻

PieArena：前沿语言代理达到MBA级别的谈判表现并揭示出新的行为差异

异构网络中的面向方面的MOOC推荐

立场：通用时间序列基础模型基于类别误差

基于大型语言模型的抗幻觉安全规划

超越余弦相似性

用于具身智能体现场评估的自动认知任务生成

可解释人工智能：用于解释脑肿瘤检测模型的组合式 XAI 框架

手术：通过注意力池减轻大型语言模型的有害微调

可追溯的跨源 RAG 中藏医学问答

HugRAG：面向 RAG 的分层因果知识图谱设计

CAST-CKT：面向交通流量预测的混沌感知时空跨城市知识迁移

SocialVeil：探测沟通障碍下语言代理的社交智能

通过抽签加权RLHF进行民主偏好对齐

理解LLM评估者行为：一种用于商户风险评估的结构化多评估者框架

GAMMS：基于图的对抗性多智能体建模模拟器

评估基于学习的主动式碎片清除任务规划的稳健性和适应性

VERA-MH：开源人工智能在心理健康领域安全性评估的信度和效度

利用强化学习、燃料补给和自适应避障优化多碎片交会任务规划

面向可靠的大型语言模型代理的可约化不确定性建模

在图论中已解决和未解决的问题上评估大型语言模型：对计算机教育的启示

MINT：用于目标驱动知识缺口推理和主动启发的最小信息神经符号树

DeepRead：利用文档结构感知推理增强智能搜索

人工智能作为一种奇异智能：反对线性智能模型

面向边缘人工智能系统的可扩展可解释性即服务 (XaaS)

面向高效多模态图基础模型：一种基于分而治之的方法

Tinker Tales：通过教育支架式的共同创作故事来支持儿童与人工智能的协作

基于张量分解的导频受限MIMO信道结构信息估计

神经网络中的利普希茨连续性原理

PluRel：合成数据揭示关系基础模型的扩展规律

理解和指导大型语言模型参数高效微调中的层放置

PromptSplit：揭示生成模型中提示层面的分歧

理性方差分析网络

当思维链不再重要时：大型语言模型中的因果旁路

DeXposure-FM：一种基于时间序列和图论的去中心化金融网络信用风险敞口和稳定性模型

Transformer 执行自适应部分池化

固定预算的难度并不比固定置信度下识别最佳臂的难度高，误差在对数因子以内。

人工智能ArXiv预印本研究生态系统中机构参与和合作的结构性转变

语义速率失真与后验设计：计算约束、多模态和策略推理

临床决策提取中的语言盲点

基于第一性原理的人工智能发现了分数量子霍尔液体的结晶现象

WIND：用于零样本大气建模的天气逆扩散

SpecMD：关于推测性专家预取的综合研究

Phaedra：面向物理科学的高保真离散标记化学习

面向零样本手写汉字识别的熵感知结构对齐

HY3D-Bench：3D资产生成

GeoIB：基于统计流形压缩的几何感知信息瓶颈

基于残余等距潜流的全原子GPCR-配体模拟

拜占庭机器学习：MultiKrum 和最优鲁棒性概念

基于视觉变换的动物图像零样本聚类：一项比较基准研究

分割后审核：基于语言参考的音视频分割的无参考掩码质量评估

亮点：用于音视频亮点检测的双通道音频编码器

用于增材制造中自动孔隙检测和严重性评估的可解释计算机视觉框架

PriorProbe：恢复个体层面的先验信息以实现人脸表情识别神经网络的个性化

DiGAN：用于早期阿尔茨海默病检测的扩散引导注意力网络

TruKAN：利用截断幂函数构建更高效的Kolmogorov-Arnold网络

GOPO：基于排名奖励的策略优化

化学信息学中用于 13C NMR 的可逆深度学习：结构和光谱

利用测试时尺度变换解码音频语言模型中的模糊情绪

Slashpage로 제작됨