Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

AtmosMJ: Xem xét lại cơ chế Gating cho dự báo thời tiết AI vượt ra ngoài quy mô năm

Created by
  • Haebom

Tác giả

Minjong Cheon

Phác thảo

Bài báo này đề cập đến vấn đề ổn định của dự báo dài hạn sử dụng các mô hình thời tiết quy mô lớn (LWM). Trong khi các mô hình tiên tiến hiện có đạt được độ ổn định liên niên bằng cách chuyển đổi dữ liệu đầu vào thành các miền không gian phi chuẩn, chẳng hạn như sóng hài cầu hoặc lưới HEALPix, bài báo này chứng minh rằng hiệu suất tương tự có thể đạt được trên lưới vĩ độ-kinh độ chuẩn. Chúng tôi đề xuất AtmosMJ, một mạng nơ-ron tích chập sâu xử lý trực tiếp dữ liệu ERA5. Mạng này tạo ra các dự báo ổn định trong khoảng 500 ngày bằng cách ngăn ngừa tích lũy lỗi thông qua cơ chế Gated Residual Fusion (GRF) mới. AtmosMJ đạt được độ chính xác dự báo 10 ngày tương đương với các mô hình như Pangu-Weather và GraphCast, trong khi đào tạo với chi phí đào tạo thấp là 5,7 ngày trên GPU V100. Điều này chứng minh rằng thiết kế kiến ​​trúc hiệu quả, chứ không phải biểu diễn dữ liệu phi chuẩn, là chìa khóa cho dự báo thời tiết dài hạn.

Takeaways, Limitations

Takeaways:
ĐIều này cho thấy việc dự báo thời tiết ổn định trong thời gian dài là có thể ngay cả trên lưới vĩ độ-kinh độ tiêu chuẩn.
Nhấn mạnh rằng thiết kế kiến ​​trúc hiệu quả (cơ chế GRF) rất quan trọng để đảm bảo tính ổn định của các dự đoán dài hạn.
ĐạT được hiệu suất dự đoán cạnh tranh với chi phí đào tạo thấp hơn so với các mô hình hiện có.
Limitations:
Hiệu suất dự đoán dài hạn của AtmosMJ bị giới hạn ở 500 ngày. Cần nghiên cứu thêm để đạt được những dự đoán dài hạn hơn.
Cần phải xác nhận thêm hiệu suất tổng quát hóa trên các tập dữ liệu hoặc yếu tố dự báo khí tượng khác.
Cần phải phân tích sâu hơn về ý nghĩa vật lý của cơ chế GRF.
👍