Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Ngữ pháp truyền tải ý nghĩa: Khả năng chấp nhận Gradient định hình các biểu diễn hình học của các công trình trong LLM

Created by
  • Haebom

Tác giả

Supantho Rakshit, Adele Goldberg

Phác thảo

Nghiên cứu này, dựa trên phương pháp tiếp cận kiến ​​tạo dựa trên cách sử dụng (UCx), tìm hiểu xem các biểu diễn bên trong của các mô hình ngôn ngữ quy mô lớn (LLM) có phản ánh các cấu trúc phân cấp giàu tính năng hay không. Sử dụng mô hình Pythia-1.4B, chúng tôi phân tích các biểu diễn của cụm từ tân ngữ kép (DO) và tân ngữ giới từ (PO) trong tiếng Anh. Chúng tôi tận dụng một tập dữ liệu gồm 5.000 cặp câu trong đó sở thích được đánh giá của con người đối với DO hoặc PO thay đổi một cách có hệ thống. Phân tích hình học cho thấy khả năng tách biệt của hai biểu diễn cụm từ, được đo bằng khoảng cách năng lượng hoặc độ phân kỳ Jensen-Shannon, được điều chỉnh một cách có hệ thống bởi cường độ ưu tiên theo gradient. Nghĩa là, các ví dụ điển hình hơn của mỗi cụm từ chiếm các vùng riêng biệt hơn trong không gian kích hoạt, trong khi các câu có khả năng xuất hiện ngang nhau trong một cụm từ thì không. Những kết quả này cung cấp bằng chứng cho thấy LLM học các biểu diễn cụm từ phân cấp phong phú và hỗ trợ phương pháp đo lường hình học đối với các biểu diễn LLM.

Takeaways, Limitations

Takeaways:
Chúng tôi trình bày bằng chứng cho thấy LLM học được các biểu diễn cú pháp phân cấp kết hợp các tính năng được đề xuất bởi chủ nghĩa xây dựng dựa trên cách sử dụng (UCx).
Chúng tôi chứng minh tính hữu ích của việc áp dụng các phương pháp đo lường hình học vào việc phân tích các biểu diễn bên trong của LLM.
Cung cấp những hiểu biết mới về cú pháp LLM.
Limitations:
Cần nghiên cứu thêm để xác định xem quy mô và đặc điểm cấu trúc của LLM (Pythia-1.4B) được sử dụng trong phân tích có thể được tổng quát hóa cho các LLM khác hay không.
Tính chủ quan trong đánh giá sở thích của con người có thể ảnh hưởng đến kết quả.
Vì câu mục tiêu phân tích bị giới hạn trong câu DO và PO tiếng Anh nên cần có khả năng khái quát hóa sang các ngôn ngữ hoặc loại câu khác.
👍