Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

ALLoyM: Một mô hình ngôn ngữ lớn để dự đoán sơ đồ pha hợp kim

Created by
  • Haebom

Tác giả

Yuna Oikawa,Guillaume Deffrennes,Taichi Abe,Ryo Tamura,Koji Tsuda

Phác thảo

Bài báo này giới thiệu aLLoyM, một mô hình ngôn ngữ quy mô lớn (LLM) ứng dụng trong khoa học vật liệu. aLLoyM là một LLM được tinh chỉnh đặc biệt cho thành phần hợp kim, nhiệt độ và thông tin pha tương ứng. Nó được phát triển bằng cách quản lý các cặp câu hỏi và trả lời (Q&A) cho sơ đồ pha nhị phân và tam phân dựa trên Cơ sở dữ liệu sơ đồ pha tính toán nguồn mở (CPDDB) và Tính toán sơ đồ pha (CALPHAD). Chúng tôi đã tinh chỉnh Mistral, một LLM được đào tạo trước nguồn mở, theo hai định dạng Hỏi & Đáp: trắc nghiệm và trả lời ngắn. Kết quả đánh giá chuẩn cho thấy việc tinh chỉnh cải thiện đáng kể hiệu suất đối với các câu hỏi sơ đồ pha trắc nghiệm. Hơn nữa, mô hình trả lời ngắn của aLLoyM chứng minh khả năng tạo ra các sơ đồ pha mới chỉ dựa trên các thành phần cấu thành, làm nổi bật tiềm năng của nó trong việc đẩy nhanh quá trình khám phá các hệ thống vật liệu chưa được khám phá trước đây. Để khuyến khích nghiên cứu và áp dụng sâu hơn, chúng tôi đã phát hành phiên bản trả lời ngắn gọn của aLLoyM và bộ dữ liệu Hỏi & Đáp đánh giá chuẩn mực hoàn chỉnh trên Hugging Face.

Takeaways, Limitations

Takeaways:
Chúng tôi đã phát triển một mô hình có thể áp dụng hiệu quả để giải quyết các vấn đề trong khoa học vật liệu bằng cách sử dụng LLM nguồn mở.
ALLoyM hoạt động tốt với cả câu hỏi trắc nghiệm và câu hỏi trả lời ngắn, và mô hình trả lời ngắn nói riêng chứng minh khả năng tạo ra các sơ đồ pha mới.
Chúng tôi khuyến khích nghiên cứu và sử dụng thêm bằng cách công khai các mô hình và tập dữ liệu đã phát triển.
Nó có tiềm năng đẩy nhanh quá trình khám phá các hệ thống vật liệu mới.
Limitations:
Hiện tại, phương pháp này chỉ được đào tạo bằng cách sử dụng dữ liệu cho biểu đồ pha nhị phân và tam phân, do đó khả năng áp dụng của nó vào các hệ thống phức tạp hơn có thể bị hạn chế.
Cần phải đánh giá và xác nhận thêm về độ chính xác và hiệu suất tổng quát của mô hình.
Có sự phụ thuộc vào tính chính xác và đầy đủ của dữ liệu dựa trên CPDDB và CALPHAD.
👍