[공지사항]을 빙자한 안부와 근황

Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

SystolicAttention: Kết hợp FlashAttention trong một mảng Systolic duy nhất

ĐáNh giá tính mới tự động của bài báo học thuật: Một cách tiếp cận hợp tác tích hợp kiến thức của con người và mô hình ngôn ngữ lớn

"Liệu nó có luôn theo dõi? Liệu nó có luôn lắng nghe?" Khám phá những lo ngại về quyền riêng tư và bảo mật theo ngữ cảnh đối với robot xã hội trong nhà

Phân tích lý thuyết nhóm về tính đối xứng cơ bản của phép cộng cơ sở và khả năng học của chúng bằng mạng nơ-ron

GHPO: Hướng dẫn thích ứng cho việc học tăng cường LLM ổn định và hiệu quả

Phần mở rộng OL-MDISF: Học trực tuyến từ các tính năng phát trực tuyến hỗn hợp, trôi dạt và không đầy đủ

Khi nào và ở đâu Data Poisons tấn công đảo ngược văn bản?

Truth Sleuth và Trend Bender: Các tác nhân AI kiểm tra thực tế các video trên YouTube và tác động đến ý kiến

NLP Gặp Gỡ Thế Giới: Hướng Đến Cải Thiện Các Cuộc Trò Chuyện Với Công Chúng Về Nghiên Cứu Xử Lý Ngôn Ngữ Tự Nhiên

Tạo ra chính xác các trạng thái chuyển tiếp phản ứng hóa học bằng cách khớp dòng chảy có điều kiện

ĐáNh giá và so sánh các mô hình AI trong sinh học: Kết quả và khuyến nghị từ Hội thảo tế bào ảo CZI

Khung PBN-RL-XAI để khám phá chiến lược điều trị “chạy trốn” trong bệnh ung thư hắc tố

NeuTSFlow: Mô hình hóa các hàm liên tục đằng sau dự báo chuỗi thời gian

THOR: Thuật toán biến đổi cho việc truy xuất theo yêu cầu

Hướng tới RAG mang tính tác nhân với lý luận sâu sắc: Khảo sát các hệ thống lý luận RAG trong LLM

Kết nối Văn học và Vũ trụ thông qua Hệ thống Mô hình Ngôn ngữ Lớn Đa tác nhân

Mô hình hóa từ-bức xạ và tối ưu hóa mạng lưới nơ-ron nhân tạo của dòng chảy sinh học trong vùng động mạch bị hẹp

Sự cộng sinh: Suy luận đa bộ điều hợp và tinh chỉnh

Suy nghĩ lại về bảo vệ dữ liệu trong kỷ nguyên trí tuệ nhân tạo (sáng tạo)

SoK: Quyền riêng tư ngữ nghĩa trong các mô hình ngôn ngữ lớn

FedRef: Điều chỉnh Bayesian hiệu quả truyền thông với mô hình tham chiếu

Tỷ lệ dự đoán: Phần II, Farseer: Một luật tỷ lệ tinh chỉnh trong các mô hình ngôn ngữ lớn

Dự đoán vị trí Học tự giám sát cho hình ảnh vệ tinh đa phương thức Phân đoạn ngữ nghĩa

ScaleRTL: Mở rộng LLM với Dữ liệu suy luận và Tính toán thời gian kiểm tra để tạo mã RTL chính xác

HueManity: Thăm dò nhận thức thị giác chi tiết trong MLLM

AKReF: Một khuôn khổ biểu diễn kiến thức lập luận cho lập luận có cấu trúc

Các mô hình ngôn ngữ lớn thường biết khi nào chúng đang được đánh giá

ĐáNh giá rủi ro động cho các tác nhân an ninh mạng tấn công

AI đói đến mức nào? So sánh năng lượng, nước và lượng khí thải carbon của suy luận LLM

Trách nhiệm phân tán: Phân tích mức tiêu thụ năng lượng của các mô hình phân tán văn bản thành âm thanh tạo sinh

Flow-GRPO: Đào tạo mô hình khớp luồng thông qua RL trực tuyến

Về nhu cầu xây dựng nền tảng thống kê trong thử nghiệm dựa trên tình huống của xe tự hành

ĐIều gì đang chi phối? Đánh giá tính toàn vẹn và sự quy kết trong đào tạo và suy luận AI thông qua chuyển đổi khái niệm

TD-EVAL: Xem xét lại Đánh giá Đối thoại theo Nhiệm vụ bằng cách Kết hợp Độ chính xác Cấp độ Lượt với So sánh Cấp độ Đối thoại

MobileCity: Một khuôn khổ hiệu quả cho mô phỏng hành vi đô thị quy mô lớn

Bộ điều hợp ngữ nghĩa cho nhúng văn bản phổ quát: Chẩn đoán và giảm thiểu tình trạng mù phủ định để tăng cường tính phổ quát

Tận dụng LLM cho các câu chuyện người dùng trong hệ thống AI: Bộ dữ liệu UStAI

Các mô hình ngôn ngữ lớn không đáng tin cậy đối với thông tin tình báo về mối đe dọa mạng

Bộ dữ liệu AnnoPage: Bộ dữ liệu các thành phần phi văn bản trong tài liệu với phân loại chi tiết

ĐáNh giá toàn diện về tác động của dữ liệu phi IID trong học tập liên bang

Lời nhắc vị trí trực quan cho việc tiếp đất trực quan dựa trên MLLM

Nơ-ron: Mô phỏng vỏ não thị giác của con người giúp cải thiện độ trung thực và khả năng diễn giải trong quá trình tái tạo fMRI sang video

FADE: Tại sao những mô tả tệ lại xảy ra với những tính năng hay

FlipConcept: Cá nhân hóa đa khái niệm không cần điều chỉnh để tạo văn bản thành hình ảnh

LUMINA-Net: Nâng cấp ánh sáng yếu thông qua mạng lưới điều chỉnh độ sáng và nhiễu đa tầng để cải thiện hình ảnh

Hướng tới các thế hệ LLM có nền tảng địa văn hóa

Học cách lý luận ở ranh giới của khả năng học tập

Giải mã linh hoạt và hiệu quả theo ngữ pháp ràng buộc

PATCH: một phương pháp học sâu để đánh giá tính không đồng nhất của hoạt động nghệ thuật trong các bức tranh lịch sử

Tác động của AI hiện đại trong quản lý siêu dữ liệu

Học một mô hình truy xuất tiền đề hiệu quả để hình thức hóa toán học hiệu quả

ChipAlign: Căn chỉnh lệnh trong các mô hình ngôn ngữ lớn để thiết kế chip thông qua nội suy trắc địa

Nhiều vấn đề khách quan trong đó sự giao thoa được chứng minh là cần thiết

Patheria: Phát hiện và phân loại tế bào cho những năm 2020

ViTally Consistent: Mở rộng quy mô học tập biểu diễn sinh học cho kính hiển vi tế bào

TextDestroyer: Phương pháp khuếch tán không cần đào tạo và chú thích để hủy văn bản bất thường khỏi hình ảnh

ĐịNh lượng lỗi hiệu chuẩn trong mạng nơ-ron hiện đại thông qua lý thuyết dựa trên bằng chứng

Mô hình nền tảng y sinh đa góc nhìn để dự đoán mục tiêu phân tử và tính chất

Lập kế hoạch quỹ đạo mô phỏng được tăng cường cho việc lái xe tự động trong đô thị

Chắt lọc các biểu diễn bất biến với phép tăng cường kép

Xử lý ngữ liệu trừu tượng và lý luận bằng Vision Transformers: Tầm quan trọng của biểu diễn 2D, vị trí và đối tượng

Mô hình nhúng khái niệm có thể diễn giải tuyến tính cho phân tích văn bản

Hướng tới việc hiểu khả năng tổng quát hóa của dự đoán liên kết theo sự thay đổi phân phối

StreakNet-Arch: Kiến trúc dựa trên mạng chống phân tán cho hình ảnh radar LiDAR tàu sân bay dưới nước

Tăng cường niềm tin vào các tác nhân tự động: Kiến trúc cho khả năng giải trình và khả năng giải thích thông qua chuỗi khối và mô hình ngôn ngữ lớn

Về các tính chất thống kê của các mô hình đối nghịch tạo sinh cho chiều dữ liệu nội tại thấp

Lập trình các quy trình tập thể phân tán trong phép tính eXchange

Phân tích toàn diện về tính bền vững của Học tập liên bang trong suốt vòng đời sản phẩm AI

Giới thiệu Toán học về Học sâu: Phương pháp, Triển khai và Lý thuyết

Epic-Sounds: Một tập dữ liệu quy mô lớn về các hành động phát ra âm thanh

Từ Web ngữ nghĩa và MAS đến AI tác nhân: Một câu chuyện thống nhất về Web tác nhân

Về Ngữ nghĩa dần dần cho Lập luận dựa trên Giả định

Thách thức của việc giảng dạy lý luận cho các LLM không có RL hoặc chưng cất

Tổng hợp phân loại liên tục

Có thể dự đoán độ khó của lệnh nhắc trực tuyến để tăng tốc quá trình tinh chỉnh RL của các mô hình lý luận không?

MacOSWorld: Điểm chuẩn tương tác đa ngôn ngữ cho các tác nhân GUI

GeoChain: Chuỗi suy nghĩ đa phương thức cho lý luận địa lý

Mất trong quá trình truyền tải: Khi nào và tại sao các LLM không thể lý giải trên toàn cầu

Khảo sát về các lĩnh vực trong lý luận LLM: Quy mô suy luận, Học cách lý luận và Hệ thống tác nhân

Hệ thống 0/1/2/3: Lý thuyết bốn quá trình cho các hệ thống nhận thức tập thể hiện diện ở nhiều thang thời gian

Nguyên tắc thực tế cho kế toán chi phí và tính toán AI

Giao tiếp mới nổi tạo sinh: Mô hình ngôn ngữ lớn là mô hình thế giới tập thể

Các tác nhân chủ động cho việc tạo văn bản thành hình ảnh nhiều lượt trong điều kiện không chắc chắn

Học các mô hình STRIPS nâng cao chỉ từ Action Traces: Một giải pháp đơn giản, tổng quát và có thể mở rộng

Giải độc ảo giác: Giảm độ nhạy cảm (SenD) để đào tạo mô hình ngôn ngữ lớn

Cuộc sống, ừm, tìm ra cách: Khả năng thích nghi cao nhờ Tìm kiếm Hành vi

Quản trị trí tuệ nhân tạo tạo ra cho các công ty

RACER: Mô hình xe theo dõi bằng trí tuệ nhân tạo hợp lý được tăng cường bằng thực tế

Quản trị trí tuệ nhân tạo cho doanh nghiệp

Giải thích ý định của bác sĩ X quang từ chuyển động mắt ở ngực _____T74927____-chẩn đoán bằng tia X

S2WTM: Bộ mã hóa tự động Wasserstein cắt lát hình cầu cho mô hình hóa chủ đề

Tổng hợp cấu hình dựa trên LLM yêu cầu giải thích rõ ràng

ĐặC điểm hiệu suất của mô hình không gian trạng thái (SSM) và mô hình ngôn ngữ lai SSM-Transformer với độ dài ngữ cảnh dài

EgoVLA: Học các mô hình thị giác-ngôn ngữ-hành động từ các video con người vị kỷ

Liệu chúng ta có thể dự đoán sự liên kết trước khi các mô hình hoàn thành suy nghĩ?

Phân đoạn mô bệnh học mô học dựa trên đơn vị thông qua biểu diễn tính năng đa cấp

Thúc đẩy việc tạo ra dữ liệu tăng cường truy xuất cho doanh nghiệp có cấu trúc và dữ liệu nội bộ

Hỗn hợp các chuyên gia Raytraced

QuRe: Truy xuất liên quan đến truy vấn thông qua lấy mẫu tiêu cực cứng trong truy xuất hình ảnh tổng hợp

AutoVDC: Tự động làm sạch dữ liệu thị giác bằng mô hình ngôn ngữ thị giác

Liệu chúng ta có thể dự đoán sự liên kết trước khi các mô hình hoàn thành suy nghĩ?

Created by

Haebom

Tác giả

Yik Siu Chan, Zheng-Xin Yong, Stephen H. Bach

Phác thảo

Bài báo này đề cập đến vấn đề các mô hình ngôn ngữ suy luận trọng số mở tạo ra các quy trình suy nghĩ dài (CoT) trước khi tạo ra phản hồi cuối cùng, điều này gây ra thêm rủi ro căn chỉnh cùng với lợi ích về hiệu suất, và nội dung có hại xuất hiện trong cả CoT và đầu ra cuối cùng. Chúng tôi nghiên cứu liệu CoT có thể được sử dụng để dự đoán lỗi căn chỉnh trong phản hồi cuối cùng hay không. Chúng tôi đánh giá một số phương pháp giám sát (con người, mô hình ngôn ngữ quy mô lớn hiệu suất cao và bộ phân loại văn bản) bằng cách sử dụng văn bản CoT hoặc kích hoạt, và nhận thấy rằng các đầu dò tuyến tính đơn giản được đào tạo trên các kích hoạt CoT có hiệu suất vượt trội đáng kể so với các phương pháp dựa trên văn bản trong việc dự đoán tính an toàn của phản hồi cuối cùng. Mặc dù văn bản CoT thường không chính xác và có thể gây hiểu lầm cho cả con người và bộ phân loại, nhưng các biến tiềm ẩn của mô hình (tức là kích hoạt CoT) cung cấp tín hiệu dự đoán đáng tin cậy hơn. Các đầu dò đưa ra dự đoán chính xác trước khi quá trình suy luận hoàn tất và đạt được hiệu suất mạnh mẽ ngay cả khi được áp dụng cho các phân đoạn CoT ban đầu. Những kết quả này được khái quát hóa trên các kích thước mô hình, họ và chuẩn mực an toàn, cho thấy các đầu dò nhẹ có thể cho phép giám sát an toàn theo thời gian thực và can thiệp sớm trong quá trình tạo.

Takeaways, Limitations

•

Takeaways:

◦

Các đầu dò tuyến tính với kích hoạt CoT vượt trội hơn các phương pháp dựa trên văn bản trong việc dự đoán tính an toàn của phản ứng cuối cùng.

◦

Có thể đưa ra những dự đoán chính xác ngay cả trước khi quá trình suy luận hoàn tất, cho thấy khả năng can thiệp sớm.

◦

Khả năng khái quát hóa trên nhiều kích thước mô hình, họ mô hình và tiêu chuẩn an toàn.

◦

Trình bày khả năng giám sát an toàn theo thời gian thực và can thiệp sớm bằng cách sử dụng đầu dò nhẹ.

•

Limitations:

◦

Cần có thêm nghiên cứu về ứng dụng thực tế của phương pháp được trình bày trong nghiên cứu này.

◦

Cần xác minh hiệu suất tổng quát cho nhiều loại nội dung có hại khác nhau.

◦

Cần có thêm nhiều nghiên cứu để khám phá khả năng diễn giải các phương pháp sử dụng kích hoạt CoT.

Xem PDF

Made with Slashpage