Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

CoRT: Code-integrated Reasoning within Thinking

TransXSSM: A Hybrid Transformer State Space Model with Unified Rotary Position Embedding

Policy-Based Trajectory Clustering in Offline Reinforcement Learning

Understanding Human-AI Trust in Education

ConfPO: Exploiting Policy Model Confidence for Critical Token Selection in Preference Optimization

MasHost Builds It All: Autonomous Multi-Agent System Directed by Reinforcement Learning

CheMatAgent: Enhancing LLMs for Chemistry and Materials Science through Tree-Search Based Tool Learning

DeepVideo-R1: Video Reinforcement Fine-Tuning via Difficulty-aware Regressive GRPO

Robotic Policy Learning via Human-assisted Action Preference Optimization

LLM-D12: A Dual-Dimensional Scale of Instrumental and Relational Dependencies on Large Language Models

QuantMCP: Grounding Large Language Models in Verifiable Financial Reality

Future of Work with AI Agents: Auditing Automation and Augmentation Potential across the U.S. Workforce

Multi-Modal Multi-Task Federated Foundation Models for Next-Generation Extended Reality Systems: Towards Privacy-Preserving Distributed Intelligence in AR/VR/MR

Peer-Ranked Precision: Creating a Foundational Dataset for Fine-Tuning Vision Models from DataSeeds' Annotated Imagery

Q-Ponder: A Unified Training Pipeline for Reasoning-based Visual Quality Assessment

Sample Complexity and Representation Ability of Test-time Scaling Paradigms

Context Is Not Comprehension

High Performance Space Debris Tracking in Complex Skylight Backgrounds with a Large-Scale Dataset

SALAD: Systematic Assessment of Machine Unlearing on LLM-Aided Hardware Design

iQUEST: An Iterative Question-Guided Framework for Knowledge Base Question Answering

Incentivizing Reasoning for Advanced Instruction-Following of Large Language Models

SealQA: Raising the Bar for Reasoning in Search-Augmented Language Models

Subgraph Gaussian Embedding Contrast for Self-Supervised Graph Representation Learning

Quantum AIXI: Universal Intelligence via Quantum Information

VTool-R1: VLMs Learn to Think with Images via Reinforcement Learning on Multimodal Tool Use

Qronos: Correcting the Past by Shaping the Future... in Post-Training Quantization

QuXAI: Explainers for Hybrid Quantum Machine Learning Models

Convert Language Model into a Value-based Strategic Planner

PhysNav-DG: A Novel Adaptive Framework for Robust VLM-Sensor Fusion in Navigation Applications

Token-Efficient RL for LLM Reasoning

MAYA: Addressing Inconsistencies in Generative Password Guessing through a Unified Benchmark

Elucidating the Design Space of Multimodal Protein Language Models

A Minimalist Approach to LLM Reasoning: from Rejection Sampling to Reinforce

On the Geometry of Receiver Operating Characteristic and Precision-Recall Curves

Expert Race: A Flexible Routing Strategy for Scaling Diffusion Transformer with Mixture of Experts

Content ARCs: Decentralized Content Rights in the Age of Generative AI

PLAY2PROMPT: Zero-shot Tool Instruction Optimization for LLM Agents via Tool Play

Computation Mechanism Behind LLM Position Generalization

CompMarkGS: Robust Watermarking for Compressed 3D Gaussian Splatting

Large Language Models for Outpatient Referral: Problem Definition, Benchmarking and Challenges

Social Bias Benchmark for Generation: A Comparison of Generation and QA-Based Evaluations

An energy-efficient learning solution for the Agile Earth Observation Satellite Scheduling Problem

Generative Uncertainty in Diffusion Models

EgoNormia: Benchmarking Physical Social Norm Understanding

Obliviate: Efficient Unmemorization for Protecting Intellectual Property in Large Language Models

From Features to Graphs: Exploring Graph Structures and Pairwise Interactions via GNNs

Object-Centric Latent Action Learning

Quality over Quantity: Boosting Data Efficiency Through Ensembled Multimodal Data Curation

TransMLA: Multi-Head Latent Attention Is All You Need

Implicit Language Models are RNNs: Balancing Parallelization and Expressivity

Lightweight Dataset Pruning without Full Training via Example Difficulty and Prediction Uncertainty

Prompt-based Depth Pruning of Large Language Models

Great Models Think Alike and this Undermines AI Oversight

Upweighting Easy Samples in Fine-Tuning Mitigates Forgetting

Latent Action Learning Requires Supervision in the Presence of Distractors

SR-Reward: Taking The Path More Traveled

Heterogeneous Multi-Agent Reinforcement Learning for Distributed Channel Access in WLANs

SoK: Watermarking for AI-Generated Content

Engagement-Driven Content Generation with Large Language Models

PyGen: A Collaborative Human-AI Approach to Python Package Creation

DAWN: Designing Distributed Agents in a Worldwide Network

Efficient Length-Generalizable Attention via Causal Retrieval for Long-Context Language Modeling

Center-fixing of tropical cyclones using uncertainty-aware deep learning applied to high-temporal-resolution geostationary satellite imagery

LLM-Cure: LLM-based Competitor User Review Analysis for Feature Enhancement

Deploying Open-Source Large Language Models: A performance Analysis

Neural Networks Generalize on Low Complexity Data

M3-JEPA: Multimodal Alignment via Multi-gate MoE based on the Joint-Predictive Embedding Architecture

Paired Completion: Flexible Quantification of Issue-framing at Scale with LLMs

The Fellowship of the LLMs: Multi-Agent Workflows for Synthetic Preference Optimization Dataset Generation

TimeBridge: Better Diffusion Prior Design with Bridge Models for Time Series Generation

Multi-group Uncertainty Quantification for Long-form Text Generation

Hey, That's My Model! Introducing Chain & Hash, An LLM Fingerprinting Technique

Privacy-Aware Spectrum Pricing and Power Control Optimization for LEO Satellite Internet-of-Things

IndoToxic2024: A Demographically-Enriched Dataset of Hate Speech and Toxicity Types for Indonesian Language

Incentivizing Quality Text Generation via Statistical Contracts

Visually Descriptive Language Model for Vector Graphics Reasoning

Securing Large Language Models: Threats, Vulnerabilities and Responsible Practices

Mitigating Object Hallucination in Large Vision-Language Models via Image-Grounded Guidance

Near-Optimal Algorithms for Constrained k-Center Clustering with Instance-level Background Knowledge

IoTGeM: Generalizable Models for Behaviour-Based IoT Attack Detection

Improved Algorithm for Deep Active Learning under Imbalance via Optimal Separation

ConvD: Attention Enhanced Dynamic Convolutional Embeddings for Knowledge Graph Completion

Noise Balance and Stationary Distribution of Stochastic Gradient Descent

The Packing Chromatic Number of the Infinite Square Grid is 15

Reinforcing Multimodal Understanding and Generation with Dual Self-rewards

A Proposal to Extend the Common Model of Cognition with Metacognition

The Optimization Paradox in Clinical AI Multi-Agent Systems

CHANCERY: Evaluating Corporate Governance Reasoning Capabilities in Language Models

DeePoly: A High-Order Accuracy Scientific Machine Learning Framework for Function Approximation and Solving PDE

Beamforming and Resource Allocation for Delay Optimization in RIS-Assisted OFDM Systems

Evaluation of LLMs for mathematical problem solving

The Automated but Risky Game: Modeling Agent-to-Agent Negotiations and Transactions in Consumer Markets

A Heuristic Algorithm Based on Beam Search and Iterated Local Search for the Maritime Inventory Routing Problem

A Vision for Auto Research with LLM Agents

AssistanceZero: Scalably Solving Assistance Games

Don't Lag, RAG: Training-Free Adversarial Detection Using RAG

Wider or Deeper? Scaling LLM Inference-Time Compute with Adaptive Branching Tree Search

Training-Free Safe Denoisers for Safe Use of Diffusion Models

CollabLLM: From Passive Responders to Active Collaborators

Position: Theory of Mind Benchmarks are Broken for Large Language Models

Your Agent Can Defend Itself against Backdoor Attacks

Created by

Haebom

저자

Li Changjiang, Liang Jiacheng, Cao Bochuan, Chen Jinghui, Wang Ting

개요

대규모 언어 모델(LLM) 기반 에이전트는 훈련 및 미세 조정 중 백도어 공격으로 인해 심각한 보안 위험에 직면합니다. 이러한 손상된 에이전트는 입력 또는 환경에 특정 트리거가 제공될 때 악의적인 작업을 수행하도록 조작될 수 있습니다. 본 논문에서는 LLM 기반 에이전트에 대한 다양한 백도어 공격에 대한 새로운 방어 메커니즘인 ReAgent를 제시합니다. 백도어 공격은 사용자의 지시, 에이전트의 계획 및 실행 간의 불일치를 초래하는 경우가 많습니다. 이러한 통찰력을 바탕으로 ReAgent는 두 가지 수준의 접근 방식을 사용하여 잠재적인 백도어를 감지합니다. 실행 수준에서 ReAgent는 에이전트의 생각과 행동 간의 일관성을 확인하고, 계획 수준에서는 ReAgent는 에이전트가 자신의 생각 경로를 기반으로 지시를 재구성하는 기능을 활용하여 재구성된 지시와 사용자의 지시 간의 일관성을 확인합니다. 광범위한 평가는 다양한 작업에 걸쳐 다양한 백도어 공격에 대한 ReAgent의 효과를 보여줍니다. 예를 들어, ReAgent는 데이터베이스 작업에서 공격 성공률을 최대 90%까지 줄이며, 기존 방어보다 훨씬 우수한 성능을 보입니다. 이 연구는 손상된 에이전트 자체를 활용하여 백도어 위험을 완화할 수 있는 가능성을 보여줍니다.

시사점, 한계점

•

시사점:

◦

LLM 기반 에이전트의 백도어 공격 방어에 대한 새로운 접근 방식 제시

◦

에이전트의 자체 기능을 활용하여 백도어 공격을 탐지하는 효과적인 방법 제안

◦

기존 방어 메커니즘보다 월등히 높은 공격 성공률 감소 효과 확인 (최대 90%)

◦

손상된 에이전트를 활용한 백도어 위험 완화 가능성 제시

•

한계점:

◦

특정 유형의 백도어 공격에 대한 효과성만 평가되었을 가능성 (다양한 공격 유형에 대한 일반화 필요)

◦

ReAgent의 성능 저하 또는 오탐 발생 가능성 (실제 환경 적용 시 추가적인 검증 필요)

◦

복잡한 에이전트 행동에 대한 적용 가능성 및 효율성에 대한 추가 연구 필요

◦

ReAgent의 계산 비용 및 자원 소모에 대한 분석 부족

Made with Slashpage