Daily Arxiv

This page organizes papers related to artificial intelligence published around the world.
This page is summarized using Google Gemini and is operated on a non-profit basis.
The copyright of the paper belongs to the author and the relevant institution. When sharing, simply cite the source.

Quantum Reinforcement Learning with Transformers for the Capacitated Vehicle Routing Problem

Agent2Agent Threats in Safety-Critical LLM Assistants: A Human-Centric Taxonomy

Beyond Manual Planning: Seating Allocation for Large Organizations

BABE: Biology Arena BEnchmark

OmniVideo-R1: Reinforcing Audio-visual Reasoning with Query Intention and Modality Attention

Learning Compact Boolean Networks

TKG-Thinker: Towards Dynamic Reasoning over Temporal Knowledge Graphs via Agentic Reinforcement Learning

STProtein: predicting spatial protein expression from multi-omics data

NEX: Neuron Explore-Exploit Scoring for Label-Free Chain-of-Thought Selection and Model Ranking

FiMI: A Domain-Specific Language Model for Indian Finance Ecosystem

RL-VLA$^3$: Reinforcement Learning VLA Accelerating via Full Asynchronism

RocqSmith: Can Automatic Optimization Forge Better Proof Agents?

LeakBoost: Perceptual-Loss-Based Membership Inference Attack

Mitigating Hallucination in Financial Retrieval-Augmented Generation via Fine-Grained Knowledge Verification

Anchored Policy Optimization: Mitigating Exploration Collapse Via Support-Constrained Rectification

Nonlinearity as Rank: Generative Low-Rank Adapter with Radial Basis Functions

Determining Energy Efficiency Sweet Spots in Production LLM Inference

Graph-based Agent Memory: Taxonomy, Techniques, and Applications

Generative Ontology: When Structured Knowledge Learns to Create

Reactive Knowledge Representation and Asynchronous Reasoning

BhashaSetu: Cross-Lingual Knowledge Transfer from High-Resource to Extreme Low-Resource Languages

Emulating Aggregate Human Choice Behavior and Biases with GPT Conversational Agents

TangramSR: Can Vision-Language Models Reason in Continuous Geometric Space?

Reasoning-guided Collaborative Filtering with Language Models for Explainable Recommendation

Conditional Diffusion Guidance under Hard Constraint: A Stochastic Analysis Approach

Split Personality Training: Revealing Latent Knowledge Through Alternate Personalities

A Unified Multimodal Framework for Dataset Construction and Model-Based Diagnosis of Ameloblastoma

SDFP: Speculative Decoding with FIT-Pruned Models for Training-Free and Plug-and-Play LLM Acceleration

Phi-Former: A Pairwise Hierarchical Approach for Compound-Protein Interactions Prediction

ALIVE: Awakening LLM Reasoning via Adversarial Learning and Instructive Verbal Evaluation

Refine and Purify: Orthogonal Basis Optimization with Null-Space Denoising for Conditional Representation Learning

Day-Ahead Electricity Price Forecasting for Volatile Markets Using Foundation Models with Regularization Strategy

M$^2$-Miner: Multi-Agent Enhanced MCTS for Mobile GUI Agent Data Mining

THOR: Inductive Link Prediction over Hyper-Relational Knowledge Graphs

H-AdminSim: A Multi-Agent Simulator for Realistic Hospital Administrative Workflows with FHIR Integration

Advancing Opinion Dynamics Modeling with Neural Diffusion-Convection-Reaction Equation

Clinical Validation of Medical-based Large Language Model Chatbots on Ophthalmic Patient Queries with LLM-based Evaluation

RaBiT: Residual-Aware Binarization Training for Accurate and Efficient LLMs

PATHWAYS: Evaluating Investigation and Context Discovery in AI Web Agents

AgentXRay: White-Boxing Agentic Systems via Workflow Reconstruction

ProAct: Agentic Lookahead in Interactive Environments

PieArena: Frontier Language Agents Achieve MBA-Level Negotiation Performance and Reveal Novel Behavioral Differences

Aspect-Aware MOOC Recommendation in a Heterogeneous Network

Position: Universal Time Series Foundation Models Rest on a Category Error

Hallucination-Resistant Security Planning with a Large Language Model

Beyond Cosine Similarity

Automatic Cognitive Task Generation for In-Situ Evaluation of Embodied Agents

Explainable AI: A Combined XAI Framework for Explaining Brain Tumour Detection Models

Surgery: Mitigating Harmful Fine-Tuning for Large Language Models via Attention Sink

Traceable Cross-Source RAG for Chinese Tibetan Medicine Question Answering

First Proof

HugRAG: Hierarchical Causal Knowledge Graph Design for RAG

CAST-CKT: Chaos-Aware Spatio-Temporal and Cross-City Knowledge Transfer for Traffic Flow Prediction

SocialVeil: Probing Social Intelligence of Language Agents under Communication Barriers

Democratic Preference Alignment via Sortition-Weighted RLHF

Understanding LLM Evaluator Behavior: A Structured Multi-Evaluator Framework for Merchant Risk Assessment

GAMMS: Graph based Adversarial Multiagent Modeling Simulator

Evaluating Robustness and Adaptability in Learning-Based Mission Planning for Active Debris Removal

VERA-MH: Reliability and Validity of an Open-Source AI Safety Evaluation in Mental Health

Optimizing Mission Planning for Multi-Debris Rendezvous Using Reinforcement Learning with Refueling and Adaptive Collision Avoidance

Towards Reducible Uncertainty Modeling for Reliable Large Language Model Agents

Evaluating Large Language Models on Solved and Unsolved Problems in Graph Theory: Implications for Computing Education

MINT: Minimal Information Neuro-Symbolic Tree for Objective-Driven Knowledge-Gap Reasoning and Active Elicitation

DeepRead: Document Structure-Aware Reasoning to Enhance Agentic Search

Artificial Intelligence as Strange Intelligence: Against Linear Models of Intelligence

Scalable Explainability-as-a-Service (XaaS) for Edge AI Systems

Toward Effective Multimodal Graph Foundation Model: A Divide-and-Conquer Based Approach

Tinker Tales: Supporting Child-AI Collaboration through Co-Creative Storytelling with Educational Scaffolding

Structure-Informed Estimation for Pilot-Limited MIMO Channels via Tensor Decomposition

Principles of Lipschitz continuity in neural networks

PluRel: Synthetic Data unlocks Scaling Laws for Relational Foundation Models

Understanding and Guiding Layer Placement in Parameter-Efficient Fine-Tuning of Large Language Models

PromptSplit: Revealing Prompt-Level Disagreement in Generative Models

Rational ANOVA Networks

When Chains of Thought Don't Matter: Causal Bypass in Large Language Models

DeXposure-FM: A Time-series, Graph Foundation Model for Credit Exposures and Stability on Decentralized Financial Networks

Transformers perform adaptive partial pooling

Fixed Budget is No Harder Than Fixed Confidence in Best-Arm Identification up to Logarithmic Factors

Structural shifts in institutional participation and collaboration within the AI arXiv preprint research ecosystem

Semantic Rate Distortion and Posterior Design: Compute Constraints, Multimodality, and Strategic Inference

Linguistic Blind Spots in Clinical Decision Extraction

First-Principles AI finds crystallization of fractional quantum Hall liquids

WIND: Weather Inverse Diffusion for Zero-Shot Atmospheric Modeling

SpecMD: A Comprehensive Study On Speculative Expert Prefetching

Phaedra: Learning High-Fidelity Discrete Tokenization for the Physical Science

Entropy-Aware Structural Alignment for Zero-Shot Handwritten Chinese Character Recognition

HY3D-Bench: Generation of 3D Assets

GeoIB: Geometry-Aware Information Bottleneck via Statistical-Manifold Compression

All-Atom GPCR-Ligand Simulation via Residual Isometric Latent Flow

Byzantine Machine Learning: MultiKrum and an optimal notion of robustness

Vision Transformers for Zero-Shot Clustering of Animal Images: A Comparative Benchmarking Study

Audit After Segmentation: Reference-Free Mask Quality Assessment for Language-Referred Audio-Visual Segmentation

Sounding Highlights: Dual-Pathway Audio Encoders for Audio-Visual Video Highlight Detection

Explainable Computer Vision Framework for Automated Pore Detection and Criticality Assessment in Additive Manufacturing

PriorProbe: Recovering Individual-Level Priors for Personalizing Neural Networks in Facial Expression Recognition

DiGAN: Diffusion-Guided Attention Network for Early Alzheimer's Disease Detection

TruKAN: Towards More Efficient Kolmogorov-Arnold Networks Using Truncated Power Functions

GOPO: Policy Optimization using Ranked Rewards

Reversible Deep Learning for 13C NMR in Chemoinformatics: On Structures and Spectra

Decoding Ambiguous Emotions with Test-Time Scaling in Audio-Language Models

Re-ranking Using Large Language Models for Mitigating Exposure to Harmful Content on Social Media Platforms

Created by

Haebom

저자

Rajvardhan Oak, Muhammad Haroon, Claire Jo, Magdalena Wojcieszak, Anshuman Chhabra

개요

본 논문은 소셜 미디어 플랫폼에서 머신러닝 기반 추천 알고리즘으로 인한 유해 콘텐츠 노출 문제를 해결하기 위해, 대규모 언어 모델(LLM)을 활용한 새로운 재순위 지정 접근 방식을 제안합니다. 기존의 방대한 수동 주석 데이터에 의존하는 분류 방식의 한계를 극복하고자, 제로샷 및 퓨샷 학습 설정에서 LLM을 사용하여 콘텐츠 시퀀스를 동적으로 평가하고 재순위 지정함으로써 유해 콘텐츠 노출을 완화합니다. 유해 콘텐츠 노출 감소 효과를 평가하기 위한 두 가지 새로운 지표를 제시하며, 세 가지 데이터셋, 세 가지 모델, 세 가지 구성에 대한 실험을 통해 기존의 독점적 조정 방식보다 LLM 기반 접근 방식이 유해 콘텐츠 완화에 훨씬 효과적임을 보여줍니다.

시사점, 한계점

•

시사점:

◦

대규모 언어 모델을 활용하여 유해 콘텐츠 노출을 효과적으로 완화하는 새로운 방법 제시.

◦

기존 방식의 한계점인 확장성 및 새로운 유형의 유해 콘텐츠 적응 문제 해결.

◦

방대한 라벨링 데이터가 필요 없어 효율적인 유해 콘텐츠 조정 가능.

◦

유해 콘텐츠 노출 감소 효과 측정을 위한 새로운 지표 제안.

◦

기존 방식 대비 성능 향상을 실험적으로 입증.

•

한계점:

◦

제시된 새로운 지표의 일반적인 타당성 및 범용성에 대한 추가 연구 필요.

◦

LLM의 성능이 LLM 자체의 한계 및 편향에 영향을 받을 수 있음.

◦

실험 데이터셋의 일반화 가능성 및 다양성에 대한 추가 검토 필요.

◦

실제 소셜 미디어 플랫폼 환경에서의 적용 및 성능 평가 필요.

PDF 보기

Made with Slashpage