Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

AtmosMJ: Xem xét lại cơ chế Gating cho dự báo thời tiết AI vượt ra ngoài quy mô năm

Created by
  • Haebom

Tác giả

Minjong Cheon

Phác thảo

Bài báo này đề cập đến vấn đề ổn định của dự báo dài hạn sử dụng các mô hình thời tiết quy mô lớn (LWM). Các mô hình hiện có, chẳng hạn như SFNO và DLWP-HPX, đạt được dự báo dài hạn ổn định bằng cách chuyển đổi dữ liệu đầu vào thành các miền không gian phi chuẩn, chẳng hạn như các hàm điều hòa cầu hoặc lưới HEALPix. Điều này được coi là thiết yếu cho tính nhất quán vật lý và tính ổn định dài hạn. Trong bài báo này, chúng tôi thách thức giả định này và nghiên cứu xem liệu có thể đạt được hiệu suất dự báo dài hạn tương tự trên lưới vĩ độ-kinh độ chuẩn hay không. Để đạt được điều này, chúng tôi đề xuất AtmosMJ, một mạng nơ-ron tích chập sâu xử lý trực tiếp dữ liệu ERA5. AtmosMJ sử dụng cơ chế Gated Residual Fusion (GRF) mới để ngăn ngừa tích lũy lỗi và đảm bảo tính ổn định trong các mô phỏng đệ quy dài hạn. Kết quả thực nghiệm chứng minh rằng AtmosMJ tạo ra các dự báo ổn định và hợp lý về mặt vật lý trong khoảng 500 ngày và có khả năng cạnh tranh với các mô hình như Pangu-Weather và GraphCast về độ chính xác dự báo 10 ngày. Điều đáng chú ý là những kết quả này đạt được trong thời gian đào tạo ngắn 5,7 ngày bằng GPU V100. Tóm lại, bài báo này cho rằng thiết kế kiến trúc hiệu quả, chứ không phải biểu diễn dữ liệu không chuẩn, là chìa khóa để đảm bảo tính ổn định và hiệu quả tính toán của dự báo thời tiết dài hạn.

Takeaways, Limitations

_____T38836____:
ĐIều này cho thấy việc dự báo thời tiết ổn định trong thời gian dài là có thể ngay cả trên lưới vĩ độ-kinh độ tiêu chuẩn.
Nhấn mạnh rằng thiết kế kiến trúc hiệu quả rất quan trọng đối với tính ổn định và hiệu quả tính toán của dự báo thời tiết dài hạn.
ĐạT được hiệu suất dự đoán cạnh tranh với chi phí đào tạo thấp so với các mô hình hiện có.
Cơ chế GRF của mô hình AtmosMJ đưa ra một phương pháp mới có thể góp phần cải thiện tính ổn định của các mô hình dự đoán dài hạn.
Limitations:
Hiệu suất dự đoán dài hạn của AtmosMJ bị giới hạn ở 500 ngày. Cần nghiên cứu thêm để đạt được những dự đoán dài hạn hơn.
Vì chỉ áp dụng cho dữ liệu ERA5 nên cần phải xác minh hiệu suất tổng quát trên các tập dữ liệu khác.
Cần có thêm nghiên cứu về cách diễn giải vật lý của mô hình.
Có thể còn thiếu sót trong việc phân tích so sánh hiệu suất dự báo cho nhiều hiện tượng thời tiết khác nhau.
👍