Các mô hình ngôn ngữ lớn không mô phỏng được tâm lý con người

ĐàO tạo - Chỉnh sửa màu hướng dẫn bằng văn bản miễn phí với Multimodal Diffusion Transformer

SPARC: Mô hình truy xuất đa sở thích thích ứng xác suất mềm thông qua sổ mã cho hệ thống đề xuất

Khi Deepfake trông thật: Phát hiện khuôn mặt do AI tạo ra với dữ liệu chưa được gắn nhãn do những thách thức về chú thích

TempOpt -- Học quan hệ cảnh báo không giám sát cho mạng viễn thông

Khảo sát về việc tạo văn bản song song: Từ giải mã song song đến mô hình ngôn ngữ khuếch tán

Chuyển đổi mô hình ngôn ngữ thị giác không phụ thuộc mô hình có thể chuyển nhượng để tổng quát hóa từ yếu sang mạnh hiệu quả

Yan: Thế hệ video tương tác cơ bản

MLLM-CBench: Một chuẩn mực toàn diện cho việc điều chỉnh hướng dẫn liên tục của LLM đa phương thức với phân tích suy luận chuỗi suy nghĩ

VGGSounder: Đánh giá âm thanh-hình ảnh cho các mô hình nền tảng

Khả năng của GPT-5 trong Lý luận Y khoa Đa phương thức

C-MAG: Đồ thị thuộc tính đa phương thức xếp tầng để dự đoán liên kết chuỗi cung ứng

Vượt qua mười lượt: Mở khóa tìm kiếm Agentic tầm xa với RL không đồng bộ quy mô lớn

MIND: Một khuôn khổ khử nhiễu thích ứng với tiếng ồn cho hình ảnh y tế tích hợp bộ biến đổi đa tỷ lệ

FlexCTC: Giải mã chùm tia CTC bằng GPU với khả năng theo ngữ cảnh nâng cao

Tính công bằng của nhận dạng giọng nói tự động: Nhìn qua lăng kính triết học

Tổng quát hóa các luật tỷ lệ cho các mô hình ngôn ngữ lớn dày đặc và thưa thớt

Memp: Khám phá bộ nhớ thủ tục của tác nhân

InfoCausalQA: Liệu mô hình có thể thực hiện suy luận nhân quả không rõ ràng dựa trên Infographic không?

ĐáNh giá chuẩn các mô hình nhúng phân tử được đào tạo trước cho việc học biểu diễn phân tử

Tối ưu hóa chỉ theo yêu cầu cho hệ thống đề xuất

Chemist Eye: Hệ thống hỗ trợ mô hình ngôn ngữ trực quan để giám sát an toàn và ra quyết định cho robot trong phòng thí nghiệm tự lái

GTPO và GRPO-S: Định hình phần thưởng theo mã thông báo và cấp độ chuỗi với Entropy chính sách

FairPOT: Cân bằng hiệu suất AUC và tính công bằng với vận chuyển tối ưu theo tỷ lệ

GTPO: Tối ưu hóa chính sách dựa trên quỹ đạo trong các mô hình ngôn ngữ lớn

Khối: Cân bằng tải trong dịch vụ LLM với bối cảnh, kiến thức và lập lịch dự đoán

ƯớC tính Rủi ro Biên giới Trường hợp Xấu nhất của LLM Trọng lượng Mở

LiteFat: Học đồ thị không gian-thời gian nhẹ để phát hiện tình trạng mệt mỏi của tài xế theo thời gian thực

DRWKV: Tập trung vào các cạnh của vật thể để cải thiện hình ảnh thiếu sáng

Một bộ tối ưu hóa rắn cải tiến đa chiến lược cho các vấn đề lập kế hoạch đường đi của UAV ba chiều và kỹ thuật

Bộ ước tính mật độ kích thước mảnh vỡ cho gãy xương do co ngót dựa trên mạng nơ-ron thần kinh được thông báo về mặt vật lý

GLM-4.1V-Suy nghĩ và GLM-4.5V: Hướng tới lý luận đa phương thức linh hoạt với học tăng cường có khả năng mở rộng

WebArXiv: Đánh giá các tác nhân đa phương thức trên các tác vụ arXiv bất biến theo thời gian

Audio-3DVG: Âm thanh hợp nhất -- Kết hợp đám mây điểm để tạo nền tảng hình ảnh 3D

Vượt ra ngoài tính năng tự động hoàn thành: Thiết kế CopilotLens hướng tới các tác nhân mã hóa AI minh bạch và có thể giải thích được

OC-SOP: Nâng cao khả năng dự đoán vị trí ngữ nghĩa 3D dựa trên tầm nhìn bằng nhận thức lấy đối tượng làm trung tâm

SWA-SOP: Nhận thức không gian về cửa sổ để dự đoán sự chiếm dụng ngữ nghĩa trong lái xe tự động

Tầm quan trọng của sự lười biếng: Mở rộng giới hạn của việc học tập liên tục

Ghi lại chuyển động của con người từ các cảm biến quán tính rời rạc và thưa thớt với các mô hình khuếch tán nhận biết quần áo

HVL: Phân đoạn bán giám sát tận dụng sự phối hợp giữa tầm nhìn và ngôn ngữ phân cấp với sự căn chỉnh truy vấn không gian văn bản động

Phân đoạn toàn cảnh LiDAR tập mở được hướng dẫn bởi học tập nhận biết sự không chắc chắn

ĐầU độc một lần, kiểm soát mọi nơi: Cửa hậu trực quan văn bản sạch trong các tác nhân di động dựa trên VLM

MGDFIS: Chiến lược tích hợp tính năng chi tiết toàn cầu đa quy mô để phát hiện đối tượng nhỏ

Chiến lược tăng tốc và tối ưu hóa mô hình học sâu cho hệ thống đề xuất thời gian thực

ChineseHarm-Bench: Điểm chuẩn phát hiện nội dung độc hại của Trung Quốc

Chuyển đổi dần dần từ toán tử tối ưu Bellman sang toán tử Bellman trong học tăng cường trực tuyến

Sarc7: Đánh giá việc phát hiện và tạo ra sự mỉa mai với bảy loại và các kỹ thuật dựa trên cảm xúc

Khám phá các quy luật mở rộng cho các mô hình nền tảng EHR

MapStory: Tạo nguyên mẫu hoạt ảnh bản đồ có thể chỉnh sửa với LLM Agents

Dạy các mô hình ngôn ngữ lớn để duy trì tính trung thực theo ngữ cảnh thông qua các nhiệm vụ tổng hợp và học tăng cường

Liệu các mô hình đa phương thức lớn có thể hiểu được bối cảnh nông nghiệp? So sánh với AgroMind

Dừng GNNs tuần hoàn và phép tính $\mu$ được phân loại

Khởi động khởi động học sâu để tối ưu hóa quỹ đạo trên Trạm vũ trụ quốc tế

EmoVoice: Mô hình chuyển văn bản thành giọng nói cảm xúc dựa trên LLM với tính năng nhắc văn bản tự do

FedRecon: Thiếu tái cấu trúc phương thức trong môi trường phân tán không đồng nhất

Từ AI-Slop đến AI-Polish? Điều chỉnh Mô hình Ngôn ngữ thông qua Phần thưởng Viết dựa trên Chỉnh sửa và Tính toán Thời gian Kiểm tra

GraspClutter6D: Bộ dữ liệu thực tế quy mô lớn cho nhận thức và nắm bắt mạnh mẽ trong các cảnh lộn xộn

Mosaic: Cắt tỉa chiếu tổng hợp cho LLM tiết kiệm tài nguyên

CO-Bench: Đánh giá chuẩn các tác nhân mô hình ngôn ngữ trong tìm kiếm thuật toán để tối ưu hóa kết hợp

FT-Transformer: Máy biến áp bền bỉ và đáng tin cậy với khả năng chịu lỗi toàn diện

Tính chuẩn mực ảo tưởng của quy định AI dựa trên quyền

Thay đổi quan điểm: Định hướng các vectơ để giảm thiểu định kiến mạnh mẽ trong LLM

Mô phỏng thế giới thực: Khảo sát thống nhất các mô hình tạo đa phương thức

RIZE: Học tập mô phỏng chính quy thông qua học tập tăng cường phân phối

Các vectơ lái được tối ưu hóa một lần điều chỉnh các hành vi liên quan đến an toàn trong LLM

EvoP: Suy luận LLM mạnh mẽ thông qua việc cắt tỉa tiến hóa

Dự đoán phù hợp của các bộ phân loại có nhiều lớp dựa trên nhãn nhiễu

So sánh tư duy toán học của LLM với các câu hỏi về biến ngẫu nhiên chưa biết

GenAI Confessions: Suy luận thành viên hộp đen cho các mô hình hình ảnh tạo sinh

Vượt ra ngoài ghi nhớ: Đánh giá khái quát ngữ nghĩa trong các mô hình ngôn ngữ lớn bằng cách sử dụng cấu trúc cụm từ

ĐáNh giá các mô hình lấy cảm hứng từ sinh học trong các cài đặt học tập khác nhau để nâng cao hiệu quả năng lượng trong dự đoán lưu lượng mạng

SLTNet: Phân đoạn ngữ nghĩa dựa trên sự kiện hiệu quả với mạng lưới biến áp nhẹ điều khiển bởi Spike

Tận dụng các phương thức âm thanh và văn bản trong sức khỏe tâm thần: Nghiên cứu về hiệu suất của LLM

ĐặC điểm học tập của mạng nơ-ron quaternion ngược

Phát hiện điểm chính của con người tự giám sát theo hướng dẫn sâu thông qua chưng cất đa phương thức

Bộ chuyển đổi quyết định tăng cường truy xuất: Bộ nhớ ngoài cho RL trong ngữ cảnh

Giảm lượng mưa cực đại bằng phương pháp khuếch tán Wasserstein

Sự diễn đạt bằng lời của bộ nhớ theo từng giai đoạn sử dụng các biểu diễn phân cấp của trải nghiệm robot suốt đời

Dự đoán lợi nhuận cho việc lựa chọn danh mục đầu tư trung bình-phương sai: Cách học tập tập trung vào quyết định định hình các mô hình dự báo

Phân loại khối u não ở trẻ em bằng phương pháp mô bệnh học kỹ thuật số và học sâu: đánh giá các phương pháp SOTA trên nhóm bệnh nhân đa trung tâm ở Thụy Điển

CTRQNets & LQNets: Mạng nơ-ron lượng tử liên tục, hồi quy và lỏng

Giải thích sự tương tác giữa chú thích và hình ảnh trong các mô hình CLIP với các thuộc tính bậc hai

SpectralEarth: Đào tạo các mô hình nền tảng siêu quang phổ ở quy mô lớn

Hướng tới nhận thức linh hoạt với trí nhớ thị giác

Tích hợp Biểu đồ Kiến thức Lâm sàng và Hệ thống Thần kinh Dựa trên Độ dốc để Nâng cao Chẩn đoán U hắc tố thông qua Danh sách Kiểm tra 7 Điểm

LUMA: Bộ dữ liệu chuẩn để học từ dữ liệu không chắc chắn và đa phương thức

Hướng tới tấn công suy luận thành viên hộp đen cho các mô hình khuếch tán

Robo-Instruct: Căn chỉnh lệnh tăng cường mô phỏng để tinh chỉnh mã LLM

Từ Hiệu suất Mô hình đến Yêu cầu: Cách Thay đổi Trọng tâm trong Khả năng Sao chép Học máy Có thể Giúp Thu hẹp Khoảng cách Trách nhiệm

Học cách trì hoãn trong các hệ thống tắc nghẽn: Sự tương tác giữa AI và con người

LEAVES: Quan điểm học tập cho dữ liệu hành vi sinh học theo chuỗi thời gian trong học tập tương phản

Học tăng cường đa tác nhân theo lý thuyết trò chơi

SMA: Ai đã nói thế? Kiểm toán rò rỉ thành viên trong hệ thống kiểm soát RAG bán đen

Aryabhata: Mô hình ngôn ngữ tập trung vào kỳ thi cho JEE Math

Suy nghĩ lại về việc xây dựng chuẩn mực LLM theo lĩnh vực cụ thể: Một cách tiếp cận toàn diện-gọn nhẹ

Các mô hình ngôn ngữ lớn không mô phỏng được tâm lý con người

Bảng xếp hạng độ bền vững LLM v1 --Báo cáo kỹ thuật

Một mục tiêu phụ tại một thời điểm: Tổng quát hóa không cần chỉnh sửa cho các yêu cầu logic thời gian tuyến tính tùy ý trong học tăng cường đa nhiệm vụ

Liệu lý luận chuỗi suy nghĩ của LLM có phải là ảo ảnh? Một lăng kính phân phối dữ liệu

Xem trước StepFun-Prover: Hãy cùng suy nghĩ và xác minh từng bước

MoSE: Sự kết hợp giữa các chuyên gia về kỹ năng học tập cho các máy tự động hóa có thân xác

Arxiv hàng ngày

Các mô hình ngôn ngữ lớn không mô phỏng được tâm lý con người

Tác giả

Phác thảo

Takeaways, Limitations