Vn-Z.vn Ngày 16 tháng 11 năm 2023, Tạp chí khoa học Science vừa xuất bản bài báo cho biết Google tiếp tục nâng cấp mô hình dự báo thời tiết DeepMind với khả năng dự đoán mạnh nhất từ trước tới nay . Chỉ trong thời gian ngắn chưa đầy 1 phút, mô hình này có khả năng dự đoán thời tiết trực tiếp trong 10 ngày tới.
Được đánh giá với mức độ chính xác lên tới 90%, mô hình AI này vượt qua các hệ thống tiên tiến nhất được xây dựng bởi con người từ trước đến nay, đây là thành tựu tiến bộ nhất trong lĩnh vực dự báo thời tiết AI!
Ảnh chụp màn hình từ Science
Trước đây Deepmind từng dự đoán chính xác lượng mưa trong vòng 1 -2 giờ . Dự báo thời tiết cận kề rất quan trọng đối với việc quản lý nguồn nước, nông nghiệp, hàng không, lập kế hoạch khẩn cấp và các hoạt động ngoài trời, đồng thời hỗ trợ nhu cầu kinh tế xã hội thực sự của nhiều ngành khi phụ thuộc vào thời tiết để ra quyết định.
Mới đây đội ngũ phát triển mô hình dự báo thời tiết của DeepMind tiếp tục nghiên cứu công nghệ dự báo mới có tên là GraphCast và đã được công bố lên hệ thống mã nguồn mở Github .
Công nghệ này sử dụng độ phân giải 0.25 độ kinh/vĩ độ (tương đương khoảng 28x28 km ở xích đạo), vượt qua độ phân giải cao nhất hiện tại là 1 độ.
Độ phân giải này chia bề mặt Trái Đất thành hơn một triệu lưới, mỗi lưới có thể tạo ra hàng trăm dữ liệu dự báo, tổng cộng lên đến hàng chục triệu điểm dữ liệu.
Khác với phương pháp dự báo truyền thống, GraphCast chủ yếu dựa vào các mẫu dữ liệu để dự đoán thay vì sử dụng các phương trình vật lý được tạo ra bởi con người.
So với công nghệ dự báo HRES do con người tạo ra, GraphCast vượt trội tới 90% trong số 1380 chỉ số thử nghiệm. Giới hạn dự đoán trong tầng khí quyển, GraphCast vượt trội hơn HRES ở 99,7% các chỉ số.
Trên hơn 1 triệu lưới được chia, mỗi lưới mà GraphCast chia ra có thể tạo ra 227 dữ liệu dự đoán. Nó bao gồm 6 biến số khí quyển (bao gồm độ ẩm cụ thể, tốc độ và hướng gió và nhiệt độ) ở mỗi độ cao ở 37 độ cao khác nhau. Trên bề mặt Trái đất, GraphCast cũng có thể dự đoán năm biến số bao gồm nhiệt độ, tốc độ và hướng gió cũng như áp suất mực nước biển trung bình.
Các loại biến đổi đầy đủ và độ cao cụ thể (thể hiện bằng áp suất không khí, đơn vị: hPa) được thể hiện trong bảng sau:
Số trong dấu ngoặc đơn trong các tiêu đề cột là số lượng mục nhập trong cột đó. Các biến số và cấp độ được làm đậm cho biết những biến số và cấp độ đã được bao gồm trong đánh giá bảng điểm. Tất cả các biến số khí quyển được đại diện ở mỗi mức áp suất.
Để so sánh hiệu suất của GraphCast và HRES, các nhà nghiên cứu đã chọn dữ liệu lịch sử từ năm 2018 (dữ liệu đào tạo GraphCast kết thúc vào năm 2017) từ dữ liệu phân tích lại ERA5 của Trung tâm Dự báo Thời tiết Trung bình Châu Âu (ECMWF).
Các nhà nghiên cứu đã yêu cầu HRES và GraphCast đưa ra "dự đoán" trong tình huống hiện tại, sau đó so sánh "dự đoán" của họ với ERA5.
Trong trường chiều cao 500hPa, các chỉ số RMSE (sai số bình phương trung bình gốc, giá trị càng thấp thì hiệu suất càng tốt) và chỉ báo ACC (hệ số tương quan dị thường) của GraphCast tốt hơn đáng kể so với HRES.
Trong số 1380 điểm dữ liệu ở 50-1000hPa được các nhà nghiên cứu lựa chọn, 90,3% GraphCast tốt hơn HRES và 89,9% có lợi thế đáng kể (trong nhóm d của hình bên dưới, màu xanh biểu thị rằng GraphCast tốt hơn HRES và màu càng đậm thì lợi thế càng rõ ràng).
Ảnh Science.org
Ngoài những dữ liệu này, GraphCast còn có những lợi thế rõ ràng trong việc dự đoán thời tiết khắc nghiệt.
Đối với đường đi của bão nhiệt đới, sai số trung bình của GraphCast thấp hơn HRES, đặc biệt bắt đầu từ 4,75 ngày đầu tiên, khi lợi thế bắt đầu trở nên rõ ràng (a,b bên dưới).
Khi đưa ra dự đoán về dòng hơi nước dựa trên Sông khí quyển, giá trị RMSE của GraphCast cũng thấp hơn đáng kể so với HRES (Hình c bên dưới).
Khi dự đoán các đợt nắng nóng, GraphCast cũng chính xác hơn HRES trước 12 giờ, 5 ngày và 10 ngày (Hình d bên dưới).
A) Hiệu suất theo dõi lốc xoáy cho GraphCast và HRES. Trục x biểu thị thời gian thực hiện (tính bằng ngày) và trục y biểu thị sai số đường đi trung bình (tính bằng km). Các thanh lỗi biểu thị khoảng tin cậy 95% đã được khởi động cho giá trị trung bình. (B) Sự khác biệt về lỗi ghép nối theo dõi lốc xoáy giữa GraphCast và HRES. Trục x biểu thị thời gian thực hiện (tính bằng ngày) và trục y biểu thị chênh lệch lỗi ghép đôi trung bình (tính bằng km). Các thanh lỗi biểu thị khoảng tin cậy 95% đã được khởi động cho chênh lệch trung bình (xem phần tài liệu bổ sung 8.1). (C) Kỹ năng dự đoán sông khí quyển (IVT) cho GraphCast và HRES. Trục x biểu thị thời gian thực hiện (tính bằng ngày) và trục y biểu thị RMSE. Thanh lỗi là khoảng tin cậy 95%. (D) Thu hồi chính xác dự đoán nhiệt độ cực cao cho GraphCast và HRES. Trục x biểu thị khả năng thu hồi và trục y biểu thị độ chính xác. Các đường cong biểu thị sự cân bằng thu hồi độ chính xác khác nhau khi quét qua mức tăng được áp dụng cho tín hiệu dự báo (xem phần tài liệu bổ sung 8.3). ( Nguồn Science.org )
Vào tháng 9 năm 2023, GraphCast đã dự đoán chính xác cơn Bão Lee ở Bắc Đại Tây Dương chín ngày trước khi cơn bão đổ bộ vào đất liền, so với sáu ngày trước khi sử dụng các phương pháp truyền thống.
Ảnh Zoom Earth
Cơn bão Lee được xác nhận là một trong những cơn bão hiếm hoi tăng cường độ nhanh kinh hoàng, chỉ trong 24 giờ mà tăng từ Cấp 1 lên Cấp 5 (theo thang đo của Mỹ). Không chỉ vậy, nó còn có sự thay đổi cường độ liên tục, rất kỳ lạ và khó đoán.
GraphCast không chỉ có độ chính xác cao mà còn có khả năng dự đoán rất nhanh. Dự báo 10 ngày sử dụng GraphCast trên máy Google TPU v4 chỉ mất chưa đầy một phút để hoàn thành.
Trong khi sử dụng các phương pháp truyền thống như HRES mất vài giờ ngay cả trên siêu máy tính.
GraphCast đạt được dự báo thời tiết hiệu quả và chính xác dù không sử dụng phương trình vật lý, công nghệ này dự đoán hoàn toàn dựa vào phân tích dữ liệu
Trong quy trình làm việc, hãy nhập dữ liệu thời tiết từ 6 giờ trước đến thời điểm hiện tại và GraphCast có thể dự đoán thời tiết trong 6 giờ tới.
Dữ liệu dự đoán có thể được sử dụng làm trạng thái "hiện tại" mới để tiếp tục các dự đoán lặp lại và có thể dự đoán điều kiện thời tiết tới 10 ngày sau.
Đối với dữ liệu đầu vào, GraphCast chỉ yêu cầu hai bộ dữ liệu: trạng thái thời tiết 6 giờ trước và trạng thái thời tiết hiện tại. Sau đó, mô hình sẽ dự đoán thời tiết trong tương lai 6 giờ. Sau đó, quá trình này có thể được triển khai theo từng khoảng thời gian 6 giờ để cung cấp dự báo hiện đại trước tối đa 10 ngày. ( Ảnh deepmind.google
Về cơ bản, GraphCast sử dụng cấu trúc máy học và kiến trúc mạng thần kinh đồ thị (GNN), bao gồm một lớp mã hóa và một lớp giải mã, cùng với 16 lớp trung gian, có tổng cộng 36,7 triệu tham số. Nó chỉ sử dụng dữ liệu khí tượng đã có để dự đoán, không phụ thuộc vào các phương trình vật lý do con người xây dựng.
GraphCast ánh xạ dữ liệu khí tượng trên lưới 0.25 độ vào mạng thần kinh, sau đó kết quả tính toán được truyền qua và phục hồi lại thành dữ liệu khí tượng thông qua lớp giải mã.
Trong quá trình huấn luyện, GraphCast sử dụng dữ liệu tái phân tích thời tiết gần 40 năm từ tập dữ liệu ERA5 (1979-2017), bao gồm hình ảnh vệ tinh, radar và kết quả đo lường từ các trạm khí tượng.
ERA5 được tạo ra từ phương pháp 4DVar và đồng hóa quan sát, tạo ra dữ liệu tái tạo tối ưu toàn cầu, bao gồm thời gian từ những năm 1940 đến hiện tại, với phạm vi toàn cầu. Nếu sử dụng dữ liệu mới gần đây hơn, kết quả dự đoán của GraphCast có thể tiếp tục cải thiện độ chính xác.
Mỗi đường màu biểu thị GraphCast được huấn luyện với dữ liệu kết thúc trước một năm khác nhau, từ năm 2018 (màu xanh) đến năm 2021 (màu tím). Trục y biểu thị điểm kỹ năng RMSE trên dữ liệu kiểm tra năm 2021, cho Z500, so với GraphCast được huấn luyện trước năm 2018, qua các khoảng thời gian dẫn (trục x). Đường đứt đứt đứt biểu thị 3.5 ngày, nơi dự báo HRES 06z/18z kết thúc. Đường đen biểu thị HRES, với các khoảng thời gian trước và sau 3.5 ngày lần lượt từ khởi đầu 06z/18z và 00z/12z. ( Ảnh Science.org)
Google DeepMind như là một phần bổ sung cho các kỹ thuật dự báo thời tiết hiện tại. Đội ngũ phát triển cho biết "Phương pháp của chúng tôi không được coi là một phương pháp thay thế cho các phương pháp dự báo thời tiết truyền thống, các phương pháp này đã được phát triển trong nhiều thập kỷ, được kiểm tra chặt chẽ trong nhiều ngữ cảnh thực tế và cung cấp nhiều tính năng mà chúng tôi vẫn chưa khám phá."
Trong tương lai, ECMWF dự định phát triển mô hình trí tuệ nhân tạo riêng và khám phá việc tích hợp nó vào hệ thống dự báo thời tiết số của mình. UK Met Office, hợp tác với Viện Alan Turing, cũng đang phát triển mạng neural dạng đồ thị cho việc dự báo thời tiết để tích hợp vào cơ sở hạ tầng siêu máy tính của họ trong tương lai.
Được đánh giá với mức độ chính xác lên tới 90%, mô hình AI này vượt qua các hệ thống tiên tiến nhất được xây dựng bởi con người từ trước đến nay, đây là thành tựu tiến bộ nhất trong lĩnh vực dự báo thời tiết AI!
Ảnh chụp màn hình từ Science
Trước đây Deepmind từng dự đoán chính xác lượng mưa trong vòng 1 -2 giờ . Dự báo thời tiết cận kề rất quan trọng đối với việc quản lý nguồn nước, nông nghiệp, hàng không, lập kế hoạch khẩn cấp và các hoạt động ngoài trời, đồng thời hỗ trợ nhu cầu kinh tế xã hội thực sự của nhiều ngành khi phụ thuộc vào thời tiết để ra quyết định.
Mới đây đội ngũ phát triển mô hình dự báo thời tiết của DeepMind tiếp tục nghiên cứu công nghệ dự báo mới có tên là GraphCast và đã được công bố lên hệ thống mã nguồn mở Github .
Công nghệ này sử dụng độ phân giải 0.25 độ kinh/vĩ độ (tương đương khoảng 28x28 km ở xích đạo), vượt qua độ phân giải cao nhất hiện tại là 1 độ.
Độ phân giải này chia bề mặt Trái Đất thành hơn một triệu lưới, mỗi lưới có thể tạo ra hàng trăm dữ liệu dự báo, tổng cộng lên đến hàng chục triệu điểm dữ liệu.
Khác với phương pháp dự báo truyền thống, GraphCast chủ yếu dựa vào các mẫu dữ liệu để dự đoán thay vì sử dụng các phương trình vật lý được tạo ra bởi con người.
So với công nghệ dự báo HRES do con người tạo ra, GraphCast vượt trội tới 90% trong số 1380 chỉ số thử nghiệm. Giới hạn dự đoán trong tầng khí quyển, GraphCast vượt trội hơn HRES ở 99,7% các chỉ số.
Trên hơn 1 triệu lưới được chia, mỗi lưới mà GraphCast chia ra có thể tạo ra 227 dữ liệu dự đoán. Nó bao gồm 6 biến số khí quyển (bao gồm độ ẩm cụ thể, tốc độ và hướng gió và nhiệt độ) ở mỗi độ cao ở 37 độ cao khác nhau. Trên bề mặt Trái đất, GraphCast cũng có thể dự đoán năm biến số bao gồm nhiệt độ, tốc độ và hướng gió cũng như áp suất mực nước biển trung bình.
Các loại biến đổi đầy đủ và độ cao cụ thể (thể hiện bằng áp suất không khí, đơn vị: hPa) được thể hiện trong bảng sau:
Số trong dấu ngoặc đơn trong các tiêu đề cột là số lượng mục nhập trong cột đó. Các biến số và cấp độ được làm đậm cho biết những biến số và cấp độ đã được bao gồm trong đánh giá bảng điểm. Tất cả các biến số khí quyển được đại diện ở mỗi mức áp suất.
Các nhà nghiên cứu đã yêu cầu HRES và GraphCast đưa ra "dự đoán" trong tình huống hiện tại, sau đó so sánh "dự đoán" của họ với ERA5.
Trong trường chiều cao 500hPa, các chỉ số RMSE (sai số bình phương trung bình gốc, giá trị càng thấp thì hiệu suất càng tốt) và chỉ báo ACC (hệ số tương quan dị thường) của GraphCast tốt hơn đáng kể so với HRES.
Trong số 1380 điểm dữ liệu ở 50-1000hPa được các nhà nghiên cứu lựa chọn, 90,3% GraphCast tốt hơn HRES và 89,9% có lợi thế đáng kể (trong nhóm d của hình bên dưới, màu xanh biểu thị rằng GraphCast tốt hơn HRES và màu càng đậm thì lợi thế càng rõ ràng).
Ảnh Science.org
Ngoài những dữ liệu này, GraphCast còn có những lợi thế rõ ràng trong việc dự đoán thời tiết khắc nghiệt.
Đối với đường đi của bão nhiệt đới, sai số trung bình của GraphCast thấp hơn HRES, đặc biệt bắt đầu từ 4,75 ngày đầu tiên, khi lợi thế bắt đầu trở nên rõ ràng (a,b bên dưới).
Khi đưa ra dự đoán về dòng hơi nước dựa trên Sông khí quyển, giá trị RMSE của GraphCast cũng thấp hơn đáng kể so với HRES (Hình c bên dưới).
Khi dự đoán các đợt nắng nóng, GraphCast cũng chính xác hơn HRES trước 12 giờ, 5 ngày và 10 ngày (Hình d bên dưới).
A) Hiệu suất theo dõi lốc xoáy cho GraphCast và HRES. Trục x biểu thị thời gian thực hiện (tính bằng ngày) và trục y biểu thị sai số đường đi trung bình (tính bằng km). Các thanh lỗi biểu thị khoảng tin cậy 95% đã được khởi động cho giá trị trung bình. (B) Sự khác biệt về lỗi ghép nối theo dõi lốc xoáy giữa GraphCast và HRES. Trục x biểu thị thời gian thực hiện (tính bằng ngày) và trục y biểu thị chênh lệch lỗi ghép đôi trung bình (tính bằng km). Các thanh lỗi biểu thị khoảng tin cậy 95% đã được khởi động cho chênh lệch trung bình (xem phần tài liệu bổ sung 8.1). (C) Kỹ năng dự đoán sông khí quyển (IVT) cho GraphCast và HRES. Trục x biểu thị thời gian thực hiện (tính bằng ngày) và trục y biểu thị RMSE. Thanh lỗi là khoảng tin cậy 95%. (D) Thu hồi chính xác dự đoán nhiệt độ cực cao cho GraphCast và HRES. Trục x biểu thị khả năng thu hồi và trục y biểu thị độ chính xác. Các đường cong biểu thị sự cân bằng thu hồi độ chính xác khác nhau khi quét qua mức tăng được áp dụng cho tín hiệu dự báo (xem phần tài liệu bổ sung 8.3). ( Nguồn Science.org )
Vào tháng 9 năm 2023, GraphCast đã dự đoán chính xác cơn Bão Lee ở Bắc Đại Tây Dương chín ngày trước khi cơn bão đổ bộ vào đất liền, so với sáu ngày trước khi sử dụng các phương pháp truyền thống.
Ảnh Zoom Earth
GraphCast không chỉ có độ chính xác cao mà còn có khả năng dự đoán rất nhanh. Dự báo 10 ngày sử dụng GraphCast trên máy Google TPU v4 chỉ mất chưa đầy một phút để hoàn thành.
Trong khi sử dụng các phương pháp truyền thống như HRES mất vài giờ ngay cả trên siêu máy tính.
GraphCast đạt được dự báo thời tiết hiệu quả và chính xác dù không sử dụng phương trình vật lý, công nghệ này dự đoán hoàn toàn dựa vào phân tích dữ liệu
Trong quy trình làm việc, hãy nhập dữ liệu thời tiết từ 6 giờ trước đến thời điểm hiện tại và GraphCast có thể dự đoán thời tiết trong 6 giờ tới.
Dữ liệu dự đoán có thể được sử dụng làm trạng thái "hiện tại" mới để tiếp tục các dự đoán lặp lại và có thể dự đoán điều kiện thời tiết tới 10 ngày sau.
Đối với dữ liệu đầu vào, GraphCast chỉ yêu cầu hai bộ dữ liệu: trạng thái thời tiết 6 giờ trước và trạng thái thời tiết hiện tại. Sau đó, mô hình sẽ dự đoán thời tiết trong tương lai 6 giờ. Sau đó, quá trình này có thể được triển khai theo từng khoảng thời gian 6 giờ để cung cấp dự báo hiện đại trước tối đa 10 ngày. ( Ảnh deepmind.google
Về cơ bản, GraphCast sử dụng cấu trúc máy học và kiến trúc mạng thần kinh đồ thị (GNN), bao gồm một lớp mã hóa và một lớp giải mã, cùng với 16 lớp trung gian, có tổng cộng 36,7 triệu tham số. Nó chỉ sử dụng dữ liệu khí tượng đã có để dự đoán, không phụ thuộc vào các phương trình vật lý do con người xây dựng.
GraphCast ánh xạ dữ liệu khí tượng trên lưới 0.25 độ vào mạng thần kinh, sau đó kết quả tính toán được truyền qua và phục hồi lại thành dữ liệu khí tượng thông qua lớp giải mã.
ERA5 được tạo ra từ phương pháp 4DVar và đồng hóa quan sát, tạo ra dữ liệu tái tạo tối ưu toàn cầu, bao gồm thời gian từ những năm 1940 đến hiện tại, với phạm vi toàn cầu. Nếu sử dụng dữ liệu mới gần đây hơn, kết quả dự đoán của GraphCast có thể tiếp tục cải thiện độ chính xác.
Mỗi đường màu biểu thị GraphCast được huấn luyện với dữ liệu kết thúc trước một năm khác nhau, từ năm 2018 (màu xanh) đến năm 2021 (màu tím). Trục y biểu thị điểm kỹ năng RMSE trên dữ liệu kiểm tra năm 2021, cho Z500, so với GraphCast được huấn luyện trước năm 2018, qua các khoảng thời gian dẫn (trục x). Đường đứt đứt đứt biểu thị 3.5 ngày, nơi dự báo HRES 06z/18z kết thúc. Đường đen biểu thị HRES, với các khoảng thời gian trước và sau 3.5 ngày lần lượt từ khởi đầu 06z/18z và 00z/12z. ( Ảnh Science.org)
Google DeepMind như là một phần bổ sung cho các kỹ thuật dự báo thời tiết hiện tại. Đội ngũ phát triển cho biết "Phương pháp của chúng tôi không được coi là một phương pháp thay thế cho các phương pháp dự báo thời tiết truyền thống, các phương pháp này đã được phát triển trong nhiều thập kỷ, được kiểm tra chặt chẽ trong nhiều ngữ cảnh thực tế và cung cấp nhiều tính năng mà chúng tôi vẫn chưa khám phá."
Trong tương lai, ECMWF dự định phát triển mô hình trí tuệ nhân tạo riêng và khám phá việc tích hợp nó vào hệ thống dự báo thời tiết số của mình. UK Met Office, hợp tác với Viện Alan Turing, cũng đang phát triển mạng neural dạng đồ thị cho việc dự báo thời tiết để tích hợp vào cơ sở hạ tầng siêu máy tính của họ trong tương lai.