banner
Heim / Blog / Genaues Medium
Blog

Genaues Medium

Apr 14, 2024Apr 14, 2024

Nature Band 619, Seiten 533–538 (2023)Diesen Artikel zitieren

106.000 Zugriffe

4 Zitate

1534 Altmetrisch

Details zu den Metriken

Wettervorhersagen sind wichtig für Wissenschaft und Gesellschaft. Das derzeit genaueste Vorhersagesystem ist die Methode der numerischen Wettervorhersage (NWP), die atmosphärische Zustände als diskretisierte Gitter darstellt und partielle Differentialgleichungen numerisch löst, die den Übergang zwischen diesen Zuständen beschreiben1. Allerdings ist dieses Verfahren rechenintensiv. In jüngster Zeit haben auf künstlicher Intelligenz basierende Methoden2 das Potenzial gezeigt, die Wettervorhersage um Größenordnungen zu beschleunigen, allerdings ist die Vorhersagegenauigkeit immer noch deutlich geringer als die von NWP-Methoden. Hier stellen wir eine auf künstlicher Intelligenz basierende Methode für genaue, mittelfristige globale Wettervorhersagen vor. Wir zeigen, dass dreidimensionale tiefe Netzwerke, die mit erdspezifischen Prioritäten ausgestattet sind, komplexe Muster in Wetterdaten effektiv verarbeiten können und dass eine hierarchische zeitliche Aggregationsstrategie Akkumulationsfehler bei mittelfristigen Vorhersagen reduziert. Basierend auf globalen Daten aus 39 Jahren erzielt unser Programm Pangu-Weather stärkere deterministische Vorhersageergebnisse auf Basis von Reanalysedaten in allen getesteten Variablen im Vergleich zum weltweit besten NWP-System, dem operationellen integrierten Vorhersagesystem des Europäischen Zentrums für mittelfristiges Wetter Prognosen (EZMW)3. Unsere Methode funktioniert auch gut mit Extremwettervorhersagen und Ensemblevorhersagen. Bei der Initialisierung mit Reanalysedaten ist die Genauigkeit der Verfolgung tropischer Wirbelstürme ebenfalls höher als die von ECMWF-HRES.

Wettervorhersagen sind eine wichtige Anwendung des wissenschaftlichen Rechnens, die darauf abzielt, zukünftige Wetteränderungen vorherzusagen, insbesondere im Hinblick auf extreme Wetterereignisse. Im letzten Jahrzehnt haben Hochleistungsrechnersysteme die Forschung auf dem Gebiet der Methoden der numerischen Wettervorhersage (NWP) erheblich beschleunigt1. Herkömmliche NWP-Methoden befassen sich hauptsächlich mit der Beschreibung der Übergänge zwischen diskretisierten Gittern atmosphärischer Zustände mithilfe partieller Differentialgleichungen (PDEs) und deren anschließender Lösung mit numerischen Simulationen4,5,6. Diese Methoden sind oft langsam; Eine einzige Simulation für eine Zehn-Tage-Prognose kann in einem Supercomputer mit Hunderten von Knoten stundenlange Berechnungen erfordern7. Darüber hinaus basieren herkömmliche NWP-Algorithmen größtenteils auf der Parametrisierung, die Näherungsfunktionen verwendet, um ungelöste Prozesse zu erfassen, bei denen Fehler durch Näherung eingeführt werden können8,9.

Die rasante Entwicklung des Deep Learning10 hat eine vielversprechende Richtung eingeleitet, die in der wissenschaftlichen Gemeinschaft als auf künstlicher Intelligenz (KI) basierende Methoden2,11,12,13,14,15,16 bezeichnet wird. Hier besteht die Methodik darin, ein tiefes neuronales Netzwerk zu trainieren, um die Beziehung zwischen der Eingabe (Neuanalyse der Wetterdaten zu einem bestimmten Zeitpunkt) und der Ausgabe (Neuanalyse der Wetterdaten zum Zielzeitpunkt) zu erfassen. Auf speziellen Rechengeräten wie Grafikprozessoren (GPUs) sind KI-basierte Methoden extrem schnell. Um ein aktuelles Beispiel zu nennen: FourCastNet2 benötigt nur 7 Sekunden, um eine 24-Stunden-Prognose für 100 Mitglieder zu berechnen, was um Größenordnungen schneller ist als herkömmliche NWP-Methoden. Allerdings ist die Genauigkeit von FourCastNet immer noch nicht zufriedenstellend; Sein mittlerer quadratischer Fehler (RMSE) einer 5-Tage-Z500-Vorhersage (500 hPa Geopotential) beträgt 484,5, was viel schlechter ist als der 333,7, der vom Operational Integrated Forecasting System (IFS) des Europäischen Zentrums für mittelfristige Wettervorhersagen gemeldet wird (EZMW)3. In einer kürzlich durchgeführten Umfrage17 waren sich Forscher einig, dass KI großes Potenzial birgt, gaben jedoch zu, dass „eine Reihe grundlegender Durchbrüche erforderlich“ sind, bevor KI-basierte Methoden NWP schlagen können.

Diese Durchbrüche scheinen früher zu geschehen als erwartet. Hier präsentieren wir Pangu-Weather (siehe Methoden für eine Erklärung des Namens „Pangu“), ein leistungsstarkes KI-basiertes Wettervorhersagesystem, das für alle getesteten Wettervariablen anhand von Reanalysedaten stärkere deterministische Vorhersageergebnisse liefert als das operative IFS. Unsere technischen Beiträge sind zweifach. Zunächst haben wir Höheninformationen in eine neue Dimension integriert, damit die Eingabe und Ausgabe unserer tiefen neuronalen Netze dreidimensional konzeptualisiert werden kann. Darüber hinaus haben wir eine dreidimensionale (3D) erdspezifische Transformatorarchitektur (3DEST) entworfen, um erdspezifische Priors in die tiefen Netzwerke einzuspeisen. Unsere Experimente zeigen, dass 3D-Modelle durch die Formulierung der Höhe in eine individuelle Dimension die Beziehung zwischen atmosphärischen Zuständen bei unterschiedlichen Druckniveaus erfassen können und somit im Vergleich zu zweidimensionalen Modellen wie FourCastNet2 erhebliche Genauigkeitsgewinne erzielen. Zweitens haben wir einen hierarchischen zeitlichen Aggregationsalgorithmus angewendet, der das Training einer Reihe von Modellen mit zunehmenden Prognosevorlaufzeiten beinhaltet. Daher wurde in der Testphase die Anzahl der für mittelfristige Wettervorhersagen erforderlichen Iterationen weitgehend reduziert und die kumulativen Prognosefehler wurden verringert. Experimente mit der fünften Generation von ECMWF-Reanalysedaten (ERA5)18 bestätigten, dass Pangu-Weather gut für deterministische Vorhersagen und Extremwettervorhersagen geeignet ist und gleichzeitig mehr als 10.000-mal schneller ist als das operative IFS.

Wir haben unser Wettervorhersagesystem durch Deep Learning etabliert. Die Methodik umfasst das Training tiefer neuronaler Netze, um neu analysierte Wetterdaten zu einem bestimmten Zeitpunkt als Eingabe zu verwenden und dann neu analysierte Wetterdaten zu einem zukünftigen Zeitpunkt als Ausgabe zu erzeugen. Wir haben sowohl für die Eingabe als auch für die Ausgabe einen einzigen Zeitpunkt verwendet. Die zeitliche Auflösung der ERA5-Daten beträgt 1 h; In der Trainingsteilmenge (1979–2017) gab es bis zu 341.880 Zeitpunkte, die Menge an Trainingsdaten in einer Epoche. Um das Risiko einer Überanpassung zu verringern, haben wir zu Beginn jeder Epoche die Reihenfolge der Stichproben anhand der Trainingsdaten zufällig geändert. Wir haben vier tiefe Netzwerke mit Vorlaufzeiten (der Zeitdifferenz zwischen Eingabe und Ausgabe) von 1 Stunde, 3 Stunden, 6 Stunden und 24 Stunden trainiert. Jedes der vier tiefen Netzwerke wurde für 100 Epochen trainiert und jede davon dauert auf einem Cluster von 192 NVIDIA Tesla-V100-GPUs etwa 16 Tage.

Die Architektur unseres tiefen Netzwerks ist in Abb. 1a dargestellt. Diese Architektur ist als 3D-Erdspezifischer Transformator (3DEST) bekannt. Wir haben alle enthaltenen Wettervariablen, einschließlich 13 Schichten der oberen Luftvariablen und der Oberflächenvariablen, in ein einziges tiefes Netzwerk eingespeist. Anschließend führten wir eine Patch-Einbettung durch, um die räumliche Auflösung zu reduzieren, und kombinierten die heruntergesampelten Daten zu einem 3D-Würfel. Die 3D-Daten werden über eine Encoder-Decoder-Architektur weitergegeben, die vom Swin-Transformator19 abgeleitet ist, einer Variante eines Vision-Transformators20 mit 16 Blöcken. Die Ausgabe wird in Oberluftvariablen und Oberflächenvariablen aufgeteilt und mit Patch-Recovery hochgesampelt, um die ursprüngliche Auflösung wiederherzustellen. Um erdspezifische Prioritäten in das tiefe Netzwerk einzufügen, haben wir einen erdspezifischen Positionsbias (einen Mechanismus zur Codierung der Position jeder Einheit; ausführlich unter Methoden) entworfen, um den ursprünglichen relativen Positionsbias von Swin zu ersetzen. Diese Modifikation erhöht die Anzahl der Bias-Parameter um den Faktor 527, wobei jedes 3D-Tiefennetzwerk etwa 64 Millionen Parameter enthält. Im Vergleich zur Basislinie hat 3DEST jedoch den gleichen Rechenaufwand und eine schnellere Konvergenzgeschwindigkeit.

a, 3DEST-Architektur. Basierend auf dem Standard-Encoder-Decoder-Design von Vision-Transformatoren haben wir den Mechanismus des verschobenen Fensters19 angepasst und eine erdspezifische Positionsabweichung angewendet. b, Hierarchische zeitliche Aggregation. Nachdem wir eine Vorlaufzeit festgelegt hatten, nutzten wir einen Greedy-Algorithmus, um Prognosen mit möglichst wenigen Schritten durchzuführen. Wir verwenden FM1, FM3, FM6 und FM24, um die Prognosemodelle mit Vorlaufzeiten von 1 h, 3 h, 6 h bzw. 24 h anzugeben. A0 ist der eingegebene Wetterzustand und \({\hat{{\bf{A}}}}_{t}\) bezeichnet den vorhergesagten Wetterzustand zum Zeitpunkt t (in Stunden).

Die Vorlaufzeit einer mittelfristigen Wettervorhersage beträgt 7 Tage oder länger. Dies veranlasste uns, die grundlegenden tiefen Netzwerke (Vorlaufzeiten 1 Stunde, 3 Stunden, 6 Stunden oder 24 Stunden) iterativ aufzurufen und dabei jedes prognostizierte Ergebnis als Eingabe für den nächsten Schritt zu verwenden. Um die kumulativen Prognosefehler zu reduzieren, haben wir die hierarchische zeitliche Aggregation eingeführt, einen gierigen Algorithmus, der immer das tiefe Netzwerk mit der größten erschwinglichen Vorlaufzeit anruft. Mathematisch gesehen reduziert sich dadurch die Anzahl der Iterationen erheblich. Wenn die Vorlaufzeit beispielsweise 56 Stunden betrug, würden wir das 24-Stunden-Prognosemodell zweimal, das 6-Stunden-Prognosemodell einmal und das 1-Stunden-Prognosemodell zweimal ausführen (Abb. 1b). Im Vergleich zu FourCastNet2, das ein festes 6-Stunden-Prognosemodell verwendet, ist unsere Methode schneller und genauer. Die Grenzen dieser Strategie werden im Abschnitt „Methoden“ erläutert.

Wir haben Pangu-Weather anhand der ERA5-Daten ausgewertet18, die als die bekannteste Schätzung für die meisten atmosphärischen Variablen gelten21,22. Um Pangu-Weather fair mit FourCastNet2 zu vergleichen, haben wir unsere 3D-Tiefennetzwerke anhand von Daten aus 39 Jahren (von 1979 bis 2017) trainiert, sie anhand von Daten aus dem Jahr 2019 validiert und sie anhand von Daten aus dem Jahr 2018 getestet. Wir haben 69 Faktoren untersucht, darunter 5 Variablen der oberen Luft bei 13 Druckniveaus (50 hPa, 100 hPa, 150 hPa, 200 hPa, 250 hPa, 300 hPa, 400 hPa, 500 hPa, 600 hPa, 700 hPa, 850 hPa, 925). hPa und 1.000 hPa) und 4 Oberflächenvariablen. Beim Test anhand von Reanalysedaten erzeugt Pangu-Weather für jede getestete Variable einen niedrigeren RMSE und einen höheren Anomaliekorrelationskoeffizienten (ACC) als das operative IFS und FourCastNet, die besten NWP- bzw. AI-basierten Methoden. Insbesondere bei einer Einzelvorhersage meldet Pangu-Weather einen RMSE von 296,7 für eine 5-Tage-Z500-Vorhersage, was niedriger ist als der für das operative IFS und FourCastNet, die 333,7 bzw. 462,5 meldeten. Darüber hinaus betragen die Inferenzkosten von Pangu-Weather 1,4 s auf einer einzelnen GPU, was mehr als 10.000-mal schneller ist als das betriebsbereite IFS und auf Augenhöhe mit FourCastNet. Pangu-Weather liefert nicht nur starke quantitative Ergebnisse (z. B. RMSE und ACC), sondern bewahrt auch ausreichende Details für die Untersuchung bestimmter extremer Wetterereignisse. Um diese Fähigkeit zu demonstrieren, haben wir die wichtige Anwendung der Verfolgung tropischer Wirbelstürme untersucht. Durch die Ermittlung des lokalen Minimums des mittleren Meeresspiegeldrucks (MSLP), einer der Oberflächenvariablen, erreichte unser Algorithmus eine hohe Genauigkeit bei der Verfolgung von 88 benannten tropischen Wirbelstürmen im Jahr 2018, darunter einige (z. B. Taifun Kong-rey und Taifun Yutu). bleiben eine Herausforderung für die weltweit besten Trackingsysteme wie ECMWF-HRES (wobei HRES für High-Resolution steht). Unsere Forschung wirft Licht auf KI-basierte mittelfristige Wettervorhersagesysteme und treibt den Fortschritt auf dem Weg zur Etablierung von KI als Ergänzung oder Ersatz für NWP voran, eine Errungenschaft, die bisher als weit in der Zukunft liegende Errungenschaft galt17.

Wir haben die deterministische Vorhersage für die ungestörten Anfangszustände von ERA5 durchgeführt. Anschließend haben wir Pangu-Weather mit den stärksten Methoden sowohl in NWP als auch in KI verglichen, nämlich dem operativen IFS von ECMWF (aus dem TIGGE-Archiv (THORPEX Interactive Grand Global Ensemble) heruntergeladene Daten3) und FourCastNet2. Die räumliche Auflösung von Pangu-Weather, 0,25° × 0,25°, wurde durch die Trainingsdaten bestimmt, die mit der Kontrollvorhersage von ECMWF ENS5 vergleichbar und mit FourCastNet identisch sind. Der Vorhersageabstand (die minimale Einheit der Vorhersagezeit) von Pangu-Weather beträgt 1 Stunde, 6-mal weniger als FourCastNet.

Die Gesamtprognoseergebnisse für 2018 sind in Abb. 2 dargestellt. Für jede getestete Variable, einschließlich Höhen- und Oberflächenvariablen, meldet Pangu-Weather genauere Ergebnisse als sowohl das operative IFS als auch FourCastNet (wenn die Variable gemeldet wird). In Bezug auf RMSE (je niedriger ist besser) meldet Pangu-Weather typischerweise 10 % niedrigere Werte als das operative IFS und 30 % niedrigere Werte als FourCastNet. Der Vorteil bleibt über alle Vorlaufzeiten bestehen (von 1 Stunde bis 168 Stunden, d. h. 7 Tage), und für einige Variablen wie Z500 wird der Vorteil mit zunehmender Vorlaufzeit noch bedeutender. Für quantitative Studien in der nördlichen Hemisphäre, der südlichen Hemisphäre und den Tropen siehe die erweiterten Datenabbildungen. 1–3. Die Prognoseergebnisse für 2020 und 2021 sowie den Vergleich mit den Ergebnissen für 2018 finden Sie in den erweiterten Daten Abb. 4.

Zehn Variablen wurden im Hinblick auf breitengradgewichteten RMSE (niedriger ist besser) und ACC (höher ist besser) verglichen, wobei die ersten fünf Variablen in FourCastNet gemeldet wurden und die letzten fünf nicht. Hier geben Z500, T500, Q500, U500 und V500 das Geopotential, die Temperatur, die spezifische Luftfeuchtigkeit sowie die u-Komponente und die v-Komponente der Windgeschwindigkeit bei 500 hPa an. Z850 und T850 geben das Geopotential bzw. die Temperatur bei 850 hPa an. T2M gibt die 2-m-Temperatur an, und U10 und V10 geben die u-Komponente bzw. die v-Komponente der 10-m-Windgeschwindigkeit an.

Quelldaten

Um unseren Vorteil zu demonstrieren, haben wir ein Konzept namens „Prognosezeitgewinn“ eingeführt, das der durchschnittlichen Differenz zwischen den Vorlaufzeiten von Pangu-Weather und einem Konkurrenten entspricht, wenn diese die gleiche Genauigkeit melden. Pangu-Weather zeigt typischerweise einen prognostizierten Zeitgewinn von 10–15 Stunden gegenüber dem betrieblichen IFS, und für einige Variablen wie die spezifische Luftfeuchtigkeit beträgt der Gewinn mehr als 24 Stunden. Dies impliziert die Schwierigkeit, die herkömmliche NWP-Methoden bei der Vorhersage spezifischer Variablen haben, doch KI-basierte Methoden profitieren davon, dass sie effektive Muster aus einer Fülle von Trainingsdaten lernen. Im Vergleich zu FourCastNet beträgt der prognostizierte Zeitgewinn von Pangu-Weather bis zu 40 Stunden, was den erheblichen Vorteil unseres technischen Designs zeigt, der insbesondere aus den 3D-Tiefennetzwerken und der fortschrittlichen zeitlichen Aggregationsstrategie resultiert. Die prognostizierten Zeitgewinne von Pangu-Weather in Bezug auf verschiedene Wettervariablen sind in der erweiterten Datentabelle 2 zusammengefasst.

Abbildung 3 zeigt eine Visualisierung der 3-Tages-Vorhersageergebnisse von Pangu-Weather. Wir untersuchten zwei Variablen der oberen Luft, Z500 und T850 (850 hPa Temperatur), und zwei Oberflächenvariablen, 2 m Temperatur und 10 m Windgeschwindigkeit, und verglichen die Ergebnisse mit dem betrieblichen IFS und der ERA5-Bodenwahrheit. Die Ergebnisse sowohl von Pangu-Weather als auch des operativen IFS kommen der Grundwahrheit hinreichend nahe, dennoch gibt es sichtbare Unterschiede zwischen ihnen. Pangu-Weather erzeugte glattere Konturlinien, was darauf hindeutet, dass das Modell dazu neigt, ähnliche Werte für benachbarte Regionen vorherzusagen. Es ist eine allgemeine Eigenschaft jedes Regressionsalgorithmus (einschließlich tiefer neuronaler Netze), bei Durchschnittswerten zu konvergieren. Im Gegensatz dazu ist die operative IFS-Vorhersage weniger glatt, da sie einen einzigen geschätzten Wert an jeder Gitterzelle berechnet, indem sie ein System von PDEs mit Anfangsbedingungen löst, während die chaotische Natur des Wetters und die zwangsläufig ungenaue Kenntnis der Anfangsbedingungen und Unterbedingungen Rastermaßstabsprozesse können zu statistischen Unsicherheiten in jeder Prognose führen.

Die 3-Tages-Vorhersage von zwei Höhenvariablen (Z500 und T850) und zwei Oberflächenvariablen (2 m Temperatur und 10 m Windgeschwindigkeit). Für jeden Fall werden Pangu-Weather (links), das operative IFS3 (Mitte) und die ERA5-Grundwahrheit18 (rechts) angezeigt. In allen Fällen ist der Eingabezeitpunkt 00:00 UTC am 1. September 2018.

Als nächstes nutzten wir Pangu-Weather, um tropische Wirbelstürme zu verfolgen. Ausgehend von einem anfänglichen Zeitpunkt haben wir die Vorlaufzeit auf ein Vielfaches von 6 Stunden festgelegt (Ref. 23) und Pangu-Weather initiiert, um zukünftige Wetterzustände vorherzusagen. Wir haben nach dem lokalen Minimum an MSLP gesucht, das bestimmte Bedingungen erfüllt, wie zum Beispiel das Zyklonauge. Der Tracking-Algorithmus wird im Zusatzmaterial zu diesem Dokument beschrieben. Wir haben das Projekt International Best Track Archive for Climate Stewardship (IBTrACS)24,25 verwendet, das die besten verfügbaren Schätzungen für tropische Wirbelstürme enthält.

Wir haben Pangu-Weather mit ECMWF-HRES verglichen, einer starken Methode zur Zyklonverfolgung, die auf hochauflösender (9 km × 9 km) operativer Wettervorhersage basiert. Wir haben im Jahr 2018 88 benannte tropische Wirbelstürme ausgewählt, die sowohl im IBTrACS als auch im ECMWF-HRES vorkommen. Wie in Abb. 4 dargestellt, lieferte Pangu-Weather statistisch gesehen genauere Tracking-Ergebnisse für diese Wirbelstürme als ECMWF-HRES. Die mittleren direkten Positionsfehler der Zyklonaugen über 3 und 5 Tage wurden für Pangu-Weather mit 120,29 km bzw. 195,65 km angegeben, was kleiner ist als 162,28 km bzw. 272,10 km für ECMWF-HRES. Die Aufschlüsselung der Trackingfehler nach Regionen und Intensitäten ist in Abb. 5 der erweiterten Daten dargestellt. Der Vorteil von Pangu-Weather wird mit zunehmender Vorlaufzeit immer bedeutender. In Abb. 4 zeigen wir auch die Tracking-Ergebnisse der beiden stärksten Wirbelstürme im Westpazifik, Kong-rey und Yutu. Eine detaillierte Analyse finden Sie im Zusatzmaterial.

a,b, Tracking-Ergebnisse für zwei starke tropische Wirbelstürme im Jahr 2018, nämlich Taifun Kong-rey (2018–25) und Yutu (2018–26). Der Anfangszeitpunkt wird unter jedem Panel angezeigt. Der Zeitabstand zwischen benachbarten Punkten beträgt 6 Stunden. Pangu-Weather prognostiziert den korrekten Weg von Yutu (das heißt, er geht zu den Philippinen) am 23. Oktober 2018 um 12:00 UTC, wohingegen ECMWF-HRES zwei Tage später zu derselben Schlussfolgerung gelangt und vorhersagt, dass Yutu einen machen wird große Wende nach Nordosten. c, Ein Vergleich zwischen Pangu-Weather und ECMWF-HRES hinsichtlich des mittleren direkten Positionsfehlers über 88 Zyklone im Jahr 2018. Jede Zahl in Klammern auf der x-Achse gibt die Anzahl der Proben an, die zur Berechnung des Durchschnitts verwendet wurden. „(788)“ bedeutet beispielsweise, dass es insgesamt 788 Anfangspunkte gibt, von denen aus der Taifun mindestens 24 Stunden andauert, und die 788 direkten Positionsfehler von Pangu-Weather und ECMWF-HRES wurden in die Endergebnisse gemittelt. Die Panels a und b wurden mit dem Matplotlib Basemap-Toolkit geplottet.

Quelldaten

Trotz der vielversprechenden Tracking-Ergebnisse weisen wir darauf hin, dass der direkte Vergleich zwischen Pangu-Weather und ECMWF-HRES etwas unfair ist, da ECMWF-HRES die IFS-Anfangszustandsdaten als Eingabe verwendete, während Pangu-Weather Reanalysedaten verwendete.

Als KI-basierte Methode ist Pangu-Weather mehr als 10.000-mal schneller als das operative IFS. Dies bietet die Möglichkeit, Vorhersagen für große Ensembles mit geringem Rechenaufwand durchzuführen. Wir haben FourCastNet2 untersucht, um eine vorläufige Ensemble-Methode zu untersuchen, die den anfänglichen Wetterzuständen Störungen hinzufügt. Anschließend generierten wir 99 zufällige Störungen (ausführlich unter Methoden) und fügten sie dem ungestörten Ausgangszustand hinzu. Somit haben wir eine 100-köpfige Ensemble-Vorhersage erhalten, indem wir einfach die Prognoseergebnisse gemittelt haben. Wie in Abb. 5 dargestellt, ist der Ensemble-Mittelwert für jede Variable bei kurzfristigen Wettervorhersagen (z. B. 1 Tag) etwas schlechter als bei der Einzelmitgliedsmethode, bei einer Vorlaufzeit von 5–7 Tagen jedoch deutlich besser . Dies steht im Einklang mit FourCastNet2, was darauf hinweist, dass Vorhersagen für Ensembles mit großen Mitgliedern besonders nützlich sind, wenn die Genauigkeit einzelner Modelle geringer ist, sie jedoch das Risiko bergen, unerwartetes Rauschen in kurzfristige Vorhersagen einzuführen. Die Ensemble-Vorhersage bietet mehr Vorteile für nicht glatte Variablen wie Q500 (500 hPa spezifische Luftfeuchtigkeit) und U10 (10 m u-Komponente der Windgeschwindigkeit). Darüber hinaus ist das Spread-Skill-Verhältnis von Pangu-Weather kleiner als 1, was darauf hindeutet, dass die aktuelle Ensemble-Methode etwas unterdispersiv ist. Im Vergleich zu NWP-Methoden reduziert Pangu-Weather die Kosten für Ensemble-Vorhersagen erheblich, sodass Meteorologen ihr Fachwissen zur Lärmkontrolle und zur Verbesserung der Genauigkeit von Ensemble-Vorhersagen einsetzen können.

Der RMSE der Ensemble-Mittelwertvorhersage (niedriger ist besser) für drei Höhenvariablen (Z500, Q500 und U500) und zwei Oberflächenvariablen (T2M und U10). Wir haben auch eine aktuelle Arbeit verfolgt35, um zwei Metriken zu zeichnen, den CRPS (niedriger ist besser) und das Spread-Skill-Verhältnis (ein ideales Ensemble-Modell erzeugt Spread-Skill-Verhältnisse von 1,0, dargestellt als gestrichelte Linien), die die Eigenschaften von weiter veranschaulichen unsere Ensemble-Prognoseergebnisse. Dabei geben Z500, Q500 und U500 jeweils das Geopotential, die Temperatur und die u-Komponente der Windgeschwindigkeit bei 500 hPa an. T2M gibt die 2-m-Temperatur an und U10 gibt die U-Komponente der 10-m-Windgeschwindigkeit an.

Quelldaten

In diesem Artikel stellen wir Pangu-Weather vor, ein KI-basiertes System, das tiefe Netzwerke für schnelle und genaue numerische Wettervorhersagen trainiert. Zu den wichtigsten technischen Beiträgen gehören der Entwurf der 3DEST-Architektur und die Anwendung der hierarchischen zeitlichen Aggregationsstrategie für mittelfristige Prognosen. Durch das Training der Modelle anhand globaler Wetterdaten aus 39 Jahren liefert Pangu-Weather bessere deterministische Vorhersageergebnisse auf der Grundlage von Reanalysedaten als das weltweit beste NWP-System, das operative IFS des ECMWF, und ist gleichzeitig viel schneller. Darüber hinaus eignet sich Pangu-Weather hervorragend zur Vorhersage extremer Wetterereignisse und zur Erstellung von Ensemble-Wettervorhersagen. Pangu-Weather zeigt das Potenzial der Verwendung großer vorab trainierter Modelle für verschiedene nachgelagerte Anwendungen und zeigt den gleichen Trend wie andere KI-Bereiche wie Computer Vision26,27, Verarbeitung natürlicher Sprache28,29, modalübergreifendes Verständnis30 und darüber hinaus.

Trotz der vielversprechenden Prognosegenauigkeit der Reanalysedaten weist unser Algorithmus einige Einschränkungen auf. Zunächst wurde Pangu-Weather in diesem Artikel anhand von Reanalysedaten trainiert und getestet, reale Vorhersagesysteme basieren jedoch auf Beobachtungsdaten. Es gibt Unterschiede zwischen diesen Datenquellen; Daher muss die anwendungsübergreifende Leistung von Pangu-Weather weiter untersucht werden. Zweitens wurden einige Wettervariablen, wie etwa der Niederschlag, in dieser Arbeit nicht untersucht. Das Weglassen dieser Faktoren kann dazu führen, dass dem aktuellen Modell einige Fähigkeiten fehlen, beispielsweise die Nutzung von Niederschlagsdaten für die genaue Vorhersage kleinerer extremer Wetterereignisse wie Tornado-Ausbrüche31,32. Drittens führen KI-basierte Methoden zu gleichmäßigeren Prognoseergebnissen und erhöhen so das Risiko, das Ausmaß extremer Wetterereignisse zu unterschätzen. Wir haben einen Sonderfall untersucht, die Zyklonverfolgung, aber es gibt noch viel zu tun. Viertens kann durch die Verwendung von Modellen mit unterschiedlichen Vorlaufzeiten eine zeitliche Inkonsistenz entstehen. Dies ist ein herausforderndes Thema, das eine weitere Untersuchung wert ist.

Mit Blick auf die Zukunft gibt es sowohl für KI-basierte Methoden als auch für NWP-Methoden Verbesserungspotenzial. Auf der KI-Seite können weitere Vorteile erzielt werden, indem mehr vertikale Ebenen und/oder atmosphärische Variablen einbezogen werden, die Zeitdimension integriert wird und vierdimensionale tiefe Netzwerke trainiert33,34, tiefere und/oder breitere Netzwerke verwendet werden oder einfach die Anzahl der Trainings erhöht wird Epochen. Alle diese Richtungen erfordern leistungsfähigere GPU-Cluster mit größerem Speicher und höheren FLOPS (Gleitkommaoperationen pro Sekunde), was der aktuelle Trend der KI-Community ist. Auf der NWP-Seite können Nachbearbeitungsmethoden entwickelt werden, um die vorhersehbaren Verzerrungen von NWP-Modellen zu mildern. Wir erwarten, dass KI-basierte und NWP-Methoden in Zukunft kombiniert werden, um eine noch stärkere Leistung zu erzielen.

Wir haben alle untersuchten globalen Wettervariablen zum Zeitpunkt t als At bezeichnet. Dies ist eine 3D-Matrix der Größe Nlat × Nlon × 69, wobei Nlat = 1.440 und Nlon = 721 die räumliche Auflösung entlang der Längen- bzw. Breitengradachse und 69 die Anzahl der untersuchten Variablen ist. Mit anderen Worten: Jedes horizontale Pixel nimmt 0,25° × 0,25° auf der Erdoberfläche ein. Das mathematische Problem besteht darin, dass der Algorithmus bei gegebenem Vorhersagezeitpunkt t0, angenommen dass At für alle t ≤ t0 verfügbar ist, die Aufgabe hat, \({{\bf{A}}}_{{t}_{0}+ vorherzusagen \Delta t}\), wobei Δt die Vorlaufzeit genannt wird. Aufgrund der Beschränkung des GPU-Speichers verwendete der Prognosealgorithmus in unserer Arbeit nur \({{\bf{A}}}_{{t}_{0}}\) als Eingabe und prognostizierte \({{\bf {A}}}_{{t}_{0}+\Delta t}\) als Ausgabe. Zu diesem Zweck haben wir ein tiefes neuronales Netzwerk trainiert, \(f({{\bf{A}}}_{{t}_{0}}\,;{\boldsymbol{\theta }})\), wobei θ bezeichnet die lernbaren Parameter.

Wenn die vorhergesagte Version von At verfügbar ist (t = t0 + Δt), bezeichnet als \({\hat{{\bf{A}}}}_{t}\), haben wir zwei definierte Metriken, RMSE und ACC, berechnet wie folgt:

Hier ist v eine beliebige Wettervariable, \({{\bf{A}}}_{i,j,t}^{v}\) ist ein Skalar, der den Wert von v zum Zeitpunkt t und an der horizontalen Koordinate (i, J). \(L\left(i\right)={N}_{{\rm{lat}}}\times \frac{{\rm{\cos }}{\phi }_{i}}{{\sum }_{{i\text{'}}=1}^{{N}_{{\rm{lat}}}}{\rm{\cos }}{\phi }_{{i\text{' }}}}\) ist das Gewicht am Breitengrad ϕi. A′ bezeichnet die Differenz zwischen A und der Klimatologie, also dem langfristigen Mittel der Wetterzustände, die anhand der Trainingsdaten über 39 Jahre geschätzt werden. Die RMSE- und ACC-Werte wurden über alle Zeiten und horizontalen Koordinaten gemittelt, um die Durchschnittswerte für die Variable v und die Vorlaufzeit Δt zu ermitteln. Die RMSE- und ACC-Metriken können auch für bestimmte Regionen ausgewertet werden, beispielsweise auf der Nordhalbkugel, der Südhalbkugel und den Tropen. Siehe Abb. 2 und die erweiterten Datenabbildungen. 1–3 für die Gesamt- und Aufschlüsselungsergebnisse im Jahr 2018.

Wir folgen einer aktuellen Arbeit35, um zwei Metriken für die Ensemble-Wettervorhersage zu berechnen, nämlich den Continuous Ranking Probability Score (CRPS) und das Spread-Skill-Verhältnis (SSR). Mathematisch ist CRPS definiert als

wobei F(·) die kumulative Verteilungsfunktion der prognostizierten Verteilung bezeichnet und \({\mathbb{I}}\)(·) eine Indikatorfunktion ist, die den Wert 1 annimmt, wenn die Aussage wahr ist, andernfalls 0. Wir folgen dem Originalpapier und verwenden das xskillscore-Python-Paket zur Berechnung des CRPS. SSR erhält man, indem man „Spread“ durch RMSE dividiert, wobei Spread ist

Hier gibt var(·) die Varianz in der Ensemble-Dimension an. Zur Berechnung des SSR werden die über alle Prognosen gemittelten Spread- und RMSE-Werte verwendet. Wenn ein Ensemble vollkommen zuverlässig ist, sollte es einen SSR von 1,0 melden.

Der ERA5-Datensatz18 enthält globale, stündliche Reanalysedaten für die letzten 60 Jahre. Die Beobachtungsdaten und die Vorhersage numerischer Modelle werden mithilfe numerischer Assimilationsmethoden zu Reanalysedaten zusammengeführt und bieten so einen qualitativ hochwertigen Maßstab für die globale Wettervorhersage. Wir haben die Reanalysedaten jeder einzelnen Stunde genutzt, damit der Algorithmus stündliche Wettervorhersagen durchführen kann. Wir haben die höchste verfügbare räumliche Auflösung in ERA5 beibehalten, 0,25° × 0,25° auf der Erdkugel, was zu einer Eingabeauflösung von 1.440 × 721 führte: Die Breitendimension hat einen zusätzlichen Eintrag, da sich die nördlichsten und südlichsten Positionen nicht überlappen.

Wir folgten WeatherBench13, um 13 von 37 Druckstufen auszuwählen (50 hPa, 100 hPa, 150 hPa, 200 hPa, 250 hPa, 300 hPa, 400 hPa, 500 hPa, 600 hPa, 700 hPa, 850 hPa, 925 hPa und 1.000 hPa ) und das Oberflächenniveau. Um einen fairen Vergleich mit der Online-Version der ECMWF-Kontrollvorhersage zu ermöglichen, haben wir uns entschieden, die im TIGGE-Datensatz3 veröffentlichten Faktoren vorherzusagen, nämlich fünf Variablen der oberen Luft (Geopotential, spezifische Luftfeuchtigkeit, Temperatur sowie die u- und v-Komponente von). Windgeschwindigkeit) und vier Oberflächenvariablen (2-m-Temperatur, die u-Komponente und v-Komponente der 10-m-Windgeschwindigkeit und MSLP). Eine vollständige Liste der untersuchten Variablen und die entsprechenden Abkürzungen finden Sie in der erweiterten Datentabelle 1. Darüber hinaus wurden der Eingabe von Oberflächenvariablen drei konstante Masken (die Topographiemaske, die Land-See-Maske und die Bodentypmaske) hinzugefügt.

Bei der Vorbereitung der Testdaten im Jahr 2018 haben wir die Testpunkte am 1. Januar 2018 aufgrund der Überschneidung mit Trainingsdaten ausgeschlossen. Darüber hinaus sind aufgrund eines Serverfehlers des ECMWF alle Testpunkte im Dezember 2018 für die oberen Luftvariablen nicht verfügbar. FourCastNet hat diese Daten auch aus der Testphase ausgeschlossen.

Es gibt zwei Quellen für Eingabe- und Ausgabedaten, nämlich Höhenvariablen und Oberflächenvariablen. Ersteres umfasst 13 Druckniveaus, von denen jedes 5 Variablen hat, und sie bilden zusammen ein Volumen von 13 × 1.440 × 721 × 5. Letzteres enthält ein Volumen von 1.440 × 721 × 4. Diese Parameter wurden zunächst aus dem ursprünglichen Raum in einen C-dimensionalen latenten Raum eingebettet. Zur Dimensionsreduzierung haben wir eine gängige Technik namens Patch-Einbettung verwendet. Für den oberen Luftteil beträgt die Patchgröße 2 × 4 × 4, sodass die eingebetteten Daten eine Form von 7 × 360 × 181 × C haben. Für die Oberflächenvariablen beträgt die Patchgröße 4 × 4, sodass die eingebetteten Daten eine Form haben Form von 360 × 181 × C, wobei C die Basiskanalbreite ist und in unserer Arbeit auf 192 festgelegt wurde. Diese beiden Datenvolumina wurden dann entlang der ersten Dimension verkettet, um ein 8 × 360 × 181 × C-Volumen zu ergeben. Das Volumen wurde dann über eine Standard-Encoder-Decoder-Architektur mit 8 Encoderschichten und 8 Decoderschichten verbreitet. Die Ausgabe des Decoders ist immer noch ein 8 × 360 × 181 × C-Volumen, das mit Patch-Wiederherstellung in den ursprünglichen Raum zurückprojiziert wurde und so die gewünschte Ausgabe erzeugte. Nachfolgend beschreiben wir die technischen Details der einzelnen Komponenten.

Wir folgten dem Standard-Vision-Transformer und verwendeten eine lineare Ebene mit GELU-Aktivierung (Gaussian Error Linear Unit) für die Patch-Einbettung. In unserer Implementierung hat ein Patch 2 × 4 × 4 Pixel für Variablen in der oberen Luft und 4 × 4 für Variablen an der Oberfläche. Die Schrittweite der Schiebefenster entspricht der Patchgröße, und die erforderliche Nullwertauffüllung wurde hinzugefügt, wenn die Datengröße nicht durch die Patchgröße teilbar ist. Die Anzahl der Parameter für die Patch-Einbettung beträgt (4 × 4 × 2 × 5) × C für Variablen in der oberen Luft und (4 × 4 × 4) × C für Oberflächenvariablen. Die Patch-Wiederherstellung führt den umgekehrten Vorgang aus und verfügt über die gleiche Anzahl von Parametern, diese Parameter werden jedoch nicht mit der Patch-Einbettung geteilt.

Die Datengröße bleibt unverändert bei 8 × 360 × 181 × C für die ersten 2 Encoderschichten, während für die nächsten 6 Schichten die horizontalen Abmessungen um den Faktor 2 reduziert und die Anzahl der Kanäle verdoppelt wurden, was zu einer Datengröße führte von 8 × 180 × 91 × 2C. Der Decoderteil ist symmetrisch zum Encoderteil, wobei die ersten 6 Decoderschichten eine Größe von 8 × 180 × 91 × 2C und die nächsten 2 Schichten eine Größe von 8 × 360 × 181 × C haben. Die Ausgänge des zweiten Encoders Die Decoderschicht und die siebte Decoderschicht wurden entlang der Kanaldimension verkettet. Wir verfolgen die Implementierung von Swin-Transformatoren19, um die benachbarten Schichten unterschiedlicher Auflösungen mit Downsampling- und Upsampling-Operationen zu verbinden. Für das Downsampling haben wir vier Token zu einem zusammengeführt (die Merkmalsdimensionalität erhöht sich von C auf 4C) und eine lineare Ebene durchgeführt, um die Dimensionalität auf 2C zu reduzieren. Für das Upsampling wurden die umgekehrten Vorgänge durchgeführt.

Jede Encoder- und Decoderschicht ist ein 3DEST-Block. Er ähnelt dem Standard-Vision-Transformerblock20, ist jedoch speziell für die Ausrichtung auf die Erdgeometrie konzipiert. Wir haben den Standard-Selbstaufmerksamkeitsmechanismus von Vision Transformern verwendet. Um die Rechenkosten weiter zu senken, haben wir den Fensteraufmerksamkeitsmechanismus19 geerbt, um die Feature-Maps in Fenster zu unterteilen, von denen jedes höchstens 2 × 12 × 6 Token enthält. Der Mechanismus des verschobenen Fensters19 wurde angewendet, sodass sich die Rasteraufteilung für jede Ebene um die Hälfte der Fenstergröße von der vorherigen unterscheidet. Da die Koordinaten in Längengradrichtung periodisch sind, werden die Halbfenster am linken und rechten Rand zu einem Vollfenster zusammengeführt. Der Zusammenführungsvorgang wurde nicht entlang der Breitengradrichtung durchgeführt, da er nicht periodisch ist. Für weitere Einzelheiten zu Vision Transformern verweisen wir den Leser auf die Originalarbeiten19,20.

Der Swin-Transformator19 verwendete einen relativen Positionsbias, um die translationinvariante Komponente der Aufmerksamkeiten darzustellen, wobei der Bias anhand der relativen Koordinate jedes Fensters berechnet wurde. Bei der globalen Wettervorhersage ist die Situation jedoch etwas anders: Jeder Token entspricht einer absoluten Position im Erdkoordinatensystem; Da es sich bei der Karte um eine Projektion der Erdkugel handelt, kann der Abstand zwischen benachbarten Token unterschiedlich sein. Noch wichtiger ist, dass einige Wetterzustände eng mit der absoluten Position verknüpft sind. Beispiele für Geopotential, Windgeschwindigkeit und Temperatur sind in der erweiterten Datenabbildung 6 dargestellt. Um diese Eigenschaften zu erfassen, haben wir einen erdspezifischen Positionsbias eingeführt, der funktioniert, indem jedem Token ein Positionsbias hinzugefügt wird, der auf seinem absoluten (statt relativen) Wert basiert. Koordinate.

Mathematisch gesehen sei die gesamte Feature-Map ein Volumen mit einer räumlichen Auflösung von Npl × Nlon × Nlat, wobei Npl, Nlon und Nlat die Größe entlang der Achsen der Druckniveaus, des Längengrads bzw. des Breitengrads angeben. Das Datenvolumen wurde in Mpl × Mlon × Mlat-Fenster aufgeteilt, und jedes Fenster hat eine Größe von Wpl × Wlon × Wlat. Die erdspezifische Positions-Bias-Matrix enthält Mpl × Mlat-Untermatrizen (Mlon erscheint hier nicht, da unterschiedliche Längengrade den gleichen Bias haben: Die Längengradindizes sind zyklisch und die Abstände entlang dieser Achse gleichmäßig verteilt), von denen jede \({W} _{{\rm{pl}}}^{2}\times {\left(2{W}_{{\rm{lon}}}-1\right)\times W}_{{\rm{lat }}}^{2}\) lernbare Parameter. Als die Aufmerksamkeit zwischen zwei Einheiten innerhalb desselben Fensters berechnet wurde, verwendeten wir die Indizes des Druckniveaus und des Breitengrads (mpl, mlat), um die entsprechende Bias-Submatrix zu lokalisieren. Dann haben wir die fensterinternen Koordinaten verwendet, \(\left({h}_{1}^{{\prime} },{\lambda }_{1}^{{\prime} },{\phi } _{1}^{{\prime} }\right)\) und \(\left({h}_{2}^{{\prime} },{\lambda }_{2}^{{\prime } },{\phi }_{2}^{{\prime} }\right)\), um den Bias-Wert bei \(\left({h}_{1}^{{\prime} } nachzuschlagen \,+\,{h}_{2}^{{\prime} }\times {W}_{{\rm{pl}}},{\lambda }_{1}^{{\prime} } -{\lambda }_{2}^{{\prime} }\,+\,{W}_{{\rm{lon}}}-1,{\phi }_{1}^{{\prime } }\,+\,{\phi }_{2}^{{\prime} }\,\times \,{W}_{{\rm{lat}}}\right)\) der (mpl , mlate Submatrix.

Wir besprechen kurz andere Designoptionen. Aufgrund des hohen Trainingsaufwands haben wir keine umfassenden Studien zu den Hyperparametern durchgeführt und glauben, dass es Konfigurationen oder Hyperparameter gibt, die zu einer höheren Genauigkeit führen. Erstens haben wir 8 (2 + 6) Encoder- und Decoderschichten verwendet, was deutlich weniger ist als beim Standard-Swin-Transformator19. Dadurch soll die Komplexität von Zeit und Speicher reduziert werden. Wenn man über einen leistungsstärkeren Cluster mit größerem GPU-Speicher verfügt, kann eine Erhöhung der Netzwerktiefe zu einer höheren Genauigkeit führen. Zweitens ist es möglich, die Anzahl der Parameter, die bei der erdspezifischen Positionsabweichung verwendet werden, durch gemeinsame Nutzung von Parametern oder andere Techniken zu reduzieren. Wir hielten dies jedoch nicht für ein zentrales Problem, da es unwahrscheinlich ist, dass das Wettervorhersagemodell auf Edge-Geräten mit begrenztem Speicher bereitgestellt wird. Drittens ist es möglich und vielversprechend, die Wetterzustände mehrerer Zeitindizes in das Modell einzuspeisen, wodurch alle Tensoren von drei Dimensionen auf vier Dimensionen geändert werden. Obwohl die KI-Community die Wirksamkeit vierdimensionaler tiefer Netzwerke gezeigt hat33,34, hinderte uns das begrenzte verfügbare Rechenbudget daran, diese Methode zu untersuchen.

Die vier einzelnen Modelle wurden mit dem Adam-Optimierer für 100 Epochen trainiert. Wir haben den mittleren absoluten Fehlerverlust verwendet. Die Normalisierung wurde für jedes zweidimensionale Eingabefeld (z. B. Z500) separat durchgeführt. Es funktionierte, indem der Mittelwert vom zweidimensionalen Feld subtrahiert und anschließend durch die Standardabweichung dividiert wurde. Der Mittelwert und die Standardabweichung jeder Variablen wurden anhand der Wetterdaten von 1979 bis 2017 berechnet. Die Gewichtung für jede Variable war umgekehrt proportional zum durchschnittlichen Verlustwert, der in einem frühen Durchlauf berechnet wurde, was die Äquivalenz der Beiträge dieser Variablen erleichtern sollte . Insbesondere betrugen die Gewichtungen für Variablen in der oberen Luft 3,00, 0,60, 1,50, 0,77 und 0,54 für Z, Q, T, U und V, und die Gewichte für Oberflächenvariablen betrugen 1,50, 0,77, 0,66 und 3,00 für MSLP, U10 , V10 bzw. T2M. Wir haben dem mittleren absoluten Fehlerverlust der Variablen in der oberen Luft eine Gewichtung von 1,0 und der der Oberflächenvariablen eine Gewichtung von 0,25 hinzugefügt und die beiden Verluste summiert. Wir haben eine Stapelgröße von 192 verwendet (d. h. 1 Trainingsbeispiel pro GPU). Die Lernrate begann mit 0,0005 und sank nach dem Kosinusplan schrittweise auf 0 ab. Alle Startzeitpunkte in der Trainingsteilmenge (1979–2017) wurden in jeder Epoche zufällig permutiert, um eine Überanpassung zu verringern. Um eine Überanpassung zu verringern, wurden ein Gewichtsabfall von 3 × 10−6 und ScheduledDropPath36 mit einem Drop-Verhältnis von 0,2 übernommen. Wir haben festgestellt, dass am Ende von 100 Epochen noch nicht alle Modelle die vollständige Konvergenz erreicht haben, sodass wir davon ausgehen, dass eine Erweiterung des Trainingsverfahrens die Prognosegenauigkeit verbessern kann. Wir haben die Genauigkeit einiger getesteter Variablen in Bezug auf unterschiedliche Vorlaufzeiten (1 Stunde, 3 Stunden, 6 Stunden und 24 Stunden) in Extended Data Abb. 7 dargestellt.

Die Inferenzgeschwindigkeit von Pangu-Weather ist vergleichbar mit der von FourCastNet2. Im Vergleich auf Systemebene benötigt FourCastNet 0,28 s für die Ableitung einer 24-Stunden-Vorhersage auf einer Tesla-A100-GPU (312 TeraFLOPS), während Pangu-Weather 1,4 s auf einer Tesla-V100-GPU (120 TeraFLOPS) benötigt. Unter Berücksichtigung der GPU-Leistung ist Pangu-Weather etwa 50 % langsamer als FourCastNet. Pangu-Weather ist mehr als 10.000-mal schneller als das betriebsbereite IFS, das in einem Supercomputer mit Hunderten von Knoten mehrere Stunden benötigt.

Wir folgten einer früheren Arbeit37, um die Werte der Quantile der obersten Ebene zu vergleichen, die anhand des Prognoseergebnisses und der Grundwahrheit berechnet wurden. Mathematisch setzen wir D = 50 Perzentile, bezeichnet als q1, q2, ..., qD. Wir folgten FourCastNet2, um q1 = 90 % und qD = 99,99 % festzulegen, und die Zwischenperzentilwerte wurden in der logarithmischen Skala linear zwischen q1 und qD verteilt. Anschließend wurden die entsprechenden Quantile, bezeichnet als Q1, Q2, ..., QD, einzeln für jedes Paar aus Wettervariablen und Vorlaufzeit berechnet. Beispielsweise wurden für alle 3-Tages-Vorhersagen der Variablen U10 pixelweise Werte aus allen Frames für Statistiken erfasst. Wir folgten FourCastNet2, um die extremen Perzentile in Bezug auf die Vorlaufzeit in Extended Data Abb. 7 darzustellen.

Schließlich wurde der relative Quantilfehler (RQE) berechnet, um die Gesamtdifferenz zwischen der Grundwahrheit und einem beliebigen Wettervorhersagealgorithmus zu messen:

wobei Qd und \({\hat{Q}}_{d}\) das d-te Quantil sind, das auf der Grundlage der ERA5-Grundwahrheit und des untersuchten Prognosealgorithmus berechnet wird. RQE kann die Gesamttendenz messen, wobei RQE < 0 und RQE > 0 bedeuten, dass der Prognosealgorithmus dazu neigt, die Intensität von Extremen zu unterschätzen bzw. zu überschätzen. Wir haben festgestellt, dass sowohl Pangu-Weather als auch das operative IFS dazu neigen, Extreme zu unterschätzen. Pangu-Weather erleidet mit zunehmender Vorlaufzeit eine stärkere Unterschätzung. Es ist zu beachten, dass RQE und die einzelnen Quantilwerte Einschränkungen haben: Sie bewerten nicht, ob Extremwerte am richtigen Ort und zur richtigen Zeit auftreten, sondern betrachten nur die Werteverteilung. Die Fähigkeit von Pangu-Weather, einzelne Extremereignisse zu erfassen, wurde durch Experimente zur Verfolgung tropischer Wirbelstürme weiter validiert.

Wir folgten einem klassischen Algorithmus38, der das lokale Minimum des MSLP lokalisiert, um das Auge tropischer Wirbelstürme zu verfolgen. Angesichts des Startzeitpunkts und der entsprechenden Anfangsposition eines Zyklonauges haben wir iterativ den 6-Stunden-Vorhersagealgorithmus aufgerufen und nach einem lokalen Minimum des MSLP gesucht, das die folgenden Bedingungen erfüllt:

Innerhalb eines Radius von 278 km gibt es auf der Nordhalbkugel ein Maximum einer relativen Vorticity von 850 hPa, die größer als 5 × 10−5 ist, und auf der Südhalbkugel ein Minimum, das kleiner als −5 × 10−5 ist.

In einem Umkreis von 278 km liegt die maximale Mächtigkeit des Zyklons zwischen 850 hPa und 200 hPa, wenn er außertropisch ist.

Die maximale 10-m-Windgeschwindigkeit ist größer als 8 m s−1 innerhalb eines Radius von 278 km, wenn der Zyklon an Land ist.

Sobald das Auge des Zyklons geortet wurde, fuhr der Tracking-Algorithmus fort, die nächste Position in einem Umkreis von 445 km zu finden. Der Tracking-Algorithmus wurde beendet, wenn kein lokales Minimum an MSLP gefunden wurde, das die oben genannten Bedingungen erfüllt. Zwei Tracking-Beispiele finden Sie in Abb. 8 für erweiterte Daten.

Wir haben Abb. 4c erweitert, indem wir die mittleren direkten Positionsfehler in Bezug auf unterschiedliche Becken oder unterschiedliche Intensitäten in Abb. 5 der erweiterten Daten aufgetragen haben. In jeder Teilmenge meldet Pangu-Weather geringere Fehler und der Vorteil wird mit zunehmender Vorlaufzeit signifikanter, was zur Ausrichtung führt mit den Schlussfolgerungen, die wir aus dem gesamten Datensatz gezogen haben. Wir betonen erneut, dass der Vergleich mit ECMWF-HRES etwas unfair ist, da ECMWF-HRES IFS-Anfangszustandsdaten verwendete, während Pangu-Weather Reanalysedaten verwendete.

Nachfolgend finden Sie eine detailliertere Analyse von vier tropischen Wirbelstürmen. Der Vorteil von Pangu-Weather liegt vor allem in der Verfolgung der Zyklonpfade im Frühstadium.

Taifun Kong-rey (2018-25) ist einer der stärksten tropischen Wirbelstürme weltweit im Jahr 2018. Wie in Abb. 4 dargestellt, prognostiziert das ECMWF-HRES, dass Kong-rey in China landen würde, was aber tatsächlich nicht der Fall war. Stattdessen liefert Pangu-Weather genaue Tracking-Ergebnisse, die nahezu mit der Grundwahrheit übereinstimmen. Außerdem zeigt die erweiterte Datenabbildung 8 die Tracking-Ergebnisse von Pangu-Weather und ECMWF-HRES zu verschiedenen Zeitpunkten: Das Vorhersageergebnis von Pangu-Weather ändert sich mit der Zeit kaum, und ECMWF-HRES kommt zu dem Schluss, dass Kong-rey dies nicht tun würde Landung in China mehr als 48 Stunden später als Pangu-Wetter.

Taifun Yutu (2018–26) ist ein extrem starker tropischer Wirbelsturm, der auf den Marianen und den Philippinen katastrophale Zerstörungen verursachte. Er ist mit Kong-rey der stärkste tropische Wirbelsturm weltweit im Jahr 2018. Wie in Abb. 4 dargestellt, liefert Pangu-Weather bereits 6 Tage vor der Landung das korrekte Prognoseergebnis (Yutu geht auf die Philippinen), wohingegen ECMWF-HRES sagt fälschlicherweise voraus, dass Yutu in der Anfangsphase eine große Wende nach Nordosten machen wird. ECMWF-HRES liefert die korrekten Tracking-Ergebnisse mehr als 48 Stunden später als Pangu-Weather.

Hurrikan Michael (2018–13) ist der stärkste Hurrikan der atlantischen Hurrikansaison 2018. Wie in Abb. 8 der erweiterten Daten dargestellt, prognostizieren sowohl Pangu-Weather als auch ECMWF-HRES die Landung in Florida mit einer Startzeit, die mehr als drei Tage vor der Landung liegt. Allerdings beträgt die Verzögerung der vorhergesagten Landezeit für Pangu-Weather nur 3 Stunden, während sie für ECMWF-HRES 18 Stunden beträgt. Darüber hinaus zeigt Pangu-Weather große Vorteile bei der Verfolgung von Michael nach seiner Landung, wohingegen die Verfolgung von ECMWF-HRES kürzer ist und sich offensichtlich nach Osten verschiebt.

Taifun Ma-on (2022-09) ist ein schwerer Tropensturm, der die Philippinen und China heimgesucht hat. Wie in Abb. 8 der erweiterten Daten dargestellt, liefert ECMWF-HRES ein falsches Vorhersageergebnis, dass Ma-on in Zhuhai, China, landen würde, wenn der Startzeitpunkt etwa drei Tage vor der Landung liegt, während das Vorhersageergebnis von Pangu-Weather zutrifft ist nah an der Wahrheit.

Die besseren Tracking-Ergebnisse von Pangu-Weather sind hauptsächlich auf die genaue deterministische Vorhersagegenauigkeit der Reanalysedaten zurückzuführen. In Extended Data Abb. 8 zeigen wir, wie Pangu-Weather Hurrikan Michael und Taifun Ma-on anhand des angegebenen Tracking-Algorithmus verfolgt. Von den vier Variablen wurden MSLP und 10-m-Windgeschwindigkeit direkt durch deterministische Vorhersage erzeugt, und Dicke und Wirbelstärke wurden aus dem Geopotential und der Windgeschwindigkeit abgeleitet. Dies weist darauf hin, dass Pangu-Weather Zwischenergebnisse liefern kann, die die Verfolgung von Zyklonen unterstützen, was Meteorologen beim Verständnis und der Nutzung der Verfolgungsergebnisse weiter unterstützt.

Jede für die Ensemble-Wettervorhersage generierte Störung enthält 3 Oktaven Perlin-Rauschen mit den Skalen 0,2, 0,1 und 0,05 und die Anzahl der zu erzeugenden Perioden entlang jeder Achse (Längen- oder Breitengrad) beträgt 12, 24 bzw. 48. Wir haben den in einem GitHub-Repository (https://github.com/pvigier/perlin-numpy) bereitgestellten Code verwendet und den Code zur Beschleunigung geändert. Wir haben dem Pseudocode einen Abschnitt hinzugefügt.

Es gibt hauptsächlich zwei Forschungsrichtungen für die Wettervorhersage. In diesem Artikel haben wir „konventionelle NWP“- oder einfach „NWP“-Methoden verwendet, um auf numerische Simulationsmethoden zu verweisen, und „KI-basierte“ Methoden verwendet, um datengesteuerte Prognosesysteme zu spezifizieren. Wir verstehen, dass KI-basierte Methoden verbal auch zu NWP gehören, wir haben uns jedoch an die Konvention17 gehalten, diese Terminologien zu verwenden.

NWP-Methoden unterteilen die atmosphärischen Zustände oft in diskretisierte Gitter, verwenden PDEs, um den Übergang zwischen ihnen zu beschreiben1,39,40 und lösen die PDEs mithilfe numerischer Simulationen. Der Abstand der Gitter ist für die Vorhersagegenauigkeit von entscheidender Bedeutung, wird jedoch durch das Rechenbudget eingeschränkt und daher ist die räumliche Auflösung von Wettervorhersagen häufig begrenzt. Die Parametrisierung41 ist eine effektive Methode zur Erfassung ungelöster Prozesse. NWP-Methoden sind weit verbreitet, haben jedoch Probleme mit dem superlinear steigenden Rechenaufwand1,42 und es ist oft schwierig, für sie eine effiziente Parallelisierung durchzuführen43. Der hohe Rechenaufwand von NWP schränkt auch die Anzahl der Ensemblemitglieder ein und schwächt somit die Vielfalt und Genauigkeit probabilistischer Wettervorhersagen.

KI-basierte Methoden bieten einen ergänzenden Weg zur Wettervorhersage. Die Spitzentechnologie der KI liegt im Deep Learning10, das davon ausgeht, dass die komplexe Beziehung zwischen Eingabe- und Ausgabedaten aus zahlreichen Trainingsdaten gelernt werden kann, ohne die tatsächlichen physikalischen Verfahren und/oder Formeln zu kennen. Im Rahmen der Wettervorhersage wurden KI-basierte Methoden zunächst auf die Probleme der Niederschlagsvorhersage auf Basis von Radardaten44,45,46,47 oder Satellitendaten48,49 angewendet und ersetzten dabei die traditionellen, stark von den Ausgangsbedingungen beeinflussten Methoden durch Deep-Learning-basierte Methoden. Die starke Ausdrucksfähigkeit tiefer neuronaler Netze führte zum Erfolg bei diesen Problemen, was die Forscher weiter dazu ermutigte, sich mit der mittelfristigen Wettervorhersage2,11,12,13,14,15,16 als schnellere Ergänzung oder Ersatz für NWP-Methoden zu befassen. Moderne Deep-Learning-Methoden basieren meist auf großen Modellen (also mit einer großen Anzahl lernbarer Parameter), um komplexe Muster aus den Trainingsdaten zu lernen.

Pangu ist ein Urwesen und eine Schöpfungsfigur in der chinesischen Mythologie, die Himmel und Erde trennte und zu geografischen Merkmalen wie Bergen und Flüssen wurde (siehe https://en.wikipedia.org/wiki/Pangu). Pangu ist auch eine Reihe vorab trainierter KI-Modelle, die von Huawei Cloud entwickelt wurden und Computer Vision, Verarbeitung natürlicher Sprache, multimodales Verständnis, wissenschaftliches Rechnen (einschließlich Wettervorhersage) usw. abdecken.

Zum Training und Testen von Pangu-Weather haben wir einen Teilsatz des ERA5-Datensatzes (ca. 60 TB) von https://cds.climate.copernicus.eu/ heruntergeladen, der offiziellen Website von Copernicus Climate Data (CDS). Zum Vergleich mit dem operativen IFS haben wir die Prognosedaten und die Ergebnisse der Verfolgung tropischer Wirbelstürme des EZMW von https://confluence.ecmwf.int/display/TIGGE, der offiziellen Website des TIGGE-Archivs, heruntergeladen. Wir haben die Ground-Truth-Routen tropischer Wirbelstürme vom Projekt International Best Track Archive for Climate Stewardship (IBTrACS) heruntergeladen, https://www.ncei.noaa.gov/products/international-best-track-archive. Alle diese Daten sind für Forschungszwecke öffentlich zugänglich. Quelldaten werden mit diesem Dokument bereitgestellt.

Die Codebasis von Pangu-Weather wurde auf PyTorch aufgebaut, einer Python-basierten Bibliothek für Deep Learning. Beim Aufbau und der Optimierung der Backbones nutzten wir die Codebasis von Swin Transformer, verfügbar unter https://github.com/microsoft/Swin-Transformer. Weitere Details, darunter Netzwerkarchitekturen, Module, Optimierungstricks und Hyperparameter, sind im Papier und im Pseudocode verfügbar. Die Berechnung der CRPS-Metrik basierte auf dem Python-Paket xskillscore, https://github.com/xarray-contrib/xskillscore/. Die Implementierung von Perlin Noise wurde von einem GitHub-Repository https://github.com/pvigier/perlin-numpy geerbt. Wir haben im Forschungsprojekt auch andere Python-Bibliotheken wie NumPy und Matplotlib verwendet. Wir haben die trainierten Modelle, den Inferenzcode und den Pseudocode der Details in einem GitHub-Repository der Öffentlichkeit zugänglich gemacht: https://github.com/198808xc/Pangu-Weather (https://doi.org/10.5281/zenodo.7678849). Die trainierten Modelle ermöglichen es den Forschern, die Fähigkeiten von Pangu-Weather entweder auf ERA5-Anfangsfeldern oder auf ECMWF-Anfangsfeldern zu untersuchen, wobei Letzteres praktischer ist, da es als API für Wettervorhersagen nahezu in Echtzeit verwendet werden kann.

Bauer, P., Thorpe, A. & Brunet, G. Die stille Revolution der numerischen Wettervorhersage. Natur 525, 47–55 (2015).

Artikel ADS CAS PubMed Google Scholar

Pathak, J. et al. FourCastNet: ein globales datengesteuertes hochauflösendes Wettermodell unter Verwendung adaptiver neuronaler Fourier-Operatoren. Vorabdruck unter https://arxiv.org/abs/2202.11214 (2022).

Bougeault, P. et al. Das interaktive große globale Ensemble von THORPEX. Stier. Bin. Meteorol. Soc. 91, 1059–1072 (2010).

Artikel ADS Google Scholar

Skamarock, WC et al. Eine Beschreibung der Advanced Research WRF Version 2 (National Center For Atmospheric Research Mesoscale and Microscale Meteorology Division, 2005).

Molteni, F., Buizza, R., Palmer, TN & Petroliagis, T. Das ECMWF-Ensemble-Vorhersagesystem: Methodik und Validierung. QJR Meteorol. Soc. 122, 73–119 (1996).

Artikel ADS Google Scholar

Ritchie, H. et al. Implementierung der Semi-Lagrange-Methode in einer hochauflösenden Version des ECMWF-Prognosemodells. Mo. Weather Rev. 123, 489–514 (1995).

2.0.CO;2" data-track-action="article reference" href="https://doi.org/10.1175%2F1520-0493%281995%29123%3C0489%3AIOTSLM%3E2.0.CO%3B2" aria-label="Article reference 6" data-doi="10.1175/1520-0493(1995)1232.0.CO;2">Artikel ADS Google Scholar

Bauer, P. et al. Das ECMWF-Skalierbarkeitsprogramm: Fortschritte und Pläne (Europäisches Zentrum für mittelfristige Wettervorhersagen, 2020).

Allen, MR, Kettleborough, JA & Stainforth, DA Modellfehler in der Wetter- und Klimavorhersage. Im ECMWF Predictability of Weather and Climate Seminar 279–304 (Europäisches Zentrum für mittelfristige Wettervorhersagen, 2022); http://www.ecmwf.int/publications/library/do/references/list/209.

Palmer, TN et al. Darstellung der Modellunsicherheit bei der Wetter- und Klimavorhersage. Annu. Rev. Planet Erde. Wissenschaft. 33, 163–193 (2005).

Artikel ADS MathSciNet CAS MATH Google Scholar

LeCun, Y., Bengio, Y. & Hinton, G. Deep Learning. Natur 521, 436–444 (2015).

Artikel ADS CAS PubMed Google Scholar

Weyn, JA, Durran, DR & Caruana, R. Können Maschinen lernen, das Wetter vorherzusagen? Verwendung von Deep Learning zur Vorhersage einer gerasterten geopotentiellen Höhe von 500 hPa aus historischen Wetterdaten. J. Adv. Modell. Erdsystem. 11, 2680–2693 (2019).

Artikel ADS Google Scholar

Scher, S. & Messori, G. Wetter- und Klimavorhersage mit neuronalen Netzen: Verwendung allgemeiner Zirkulationsmodelle (GCMs) mit unterschiedlicher Komplexität als Untersuchungsgrundlage. Geosci. Modellentwickler. 12, 2797–2809 (2019).

Artikel ADS Google Scholar

Rasp, S. et al. WeatherBench: ein Benchmark-Datensatz für datengesteuerte Wettervorhersagen. J. Adv. Modell. Erdsystem. 12, e2020MS002203 (2020).

Artikel ADS Google Scholar

Weyn, JA, Durran, DR, Caruana, R. & Cresswell-Clay, N. Subsaisonale Vorhersage mit einem großen Ensemble von Deep-Learning-Wettervorhersagemodellen. J. Adv. Modell. Erdsystem. 13, e2021MS002502 (2021).

Artikel ADS Google Scholar

Keisler, R. Vorhersage des globalen Wetters mit grafischen neuronalen Netzen. Vorabdruck unter https://arxiv.org/abs/2202.07575 (2022).

Hu, Y., Chen, L., Wang, Z. & Li, H. SwinVRNN: ein datengesteuertes Ensemble-Vorhersagemodell über erlernte Verteilungsstörung. J. Adv. Modell. Erdsystem. 15, e2022MS003211(2023).

Schultz, MG et al. Kann Deep Learning die numerische Wettervorhersage schlagen? Phil. Trans. R. Soc. A 379, 20200097 (2021).

Artikel ADS MathSciNet CAS PubMed PubMed Central Google Scholar

Hersbach, H. et al. Die globale ERA5-Reanalyse. QJR Meteorol. Soc. 146, 1999–2049 (2020).

Artikel ADS Google Scholar

Liu, Z. et al. Swin-Transformator: Hierarchischer Vision-Transformator mit verschobenen Fenstern. In Proc. Internationale Konferenz über Computer Vision 10012–10022 (IEEE, 2021).

Dosovitskiy, A. et al. Ein Bild sagt mehr als 16 x 16 Worte: Transformatoren für die Bilderkennung im Maßstab. Vorabdruck unter https://arxiv.org/abs/2010.11929 (2020).

Betts, AK, Chan, DZ & Desjardins, RL Oberflächennahe Vorurteile in ERA5 gegenüber den kanadischen Prärien. Vorderseite. Umgebung. Wissenschaft. 7, 129 (2019).

Artikel Google Scholar

Jiang, Q. et al. Auswertung des ERA5-Reanalyse-Niederschlagsdatensatzes über dem chinesischen Festland. J. Hydrol. 595, 125660 (2021).

Artikel Google Scholar

Magnusson, L. et al. Tropische Wirbelsturmaktivitäten am ECMWF (Europäisches Zentrum für mittelfristige Wettervorhersagen, 2021).

Knapp, KR, Kruk, MC, Levinson, DH, Diamond, HJ & Neumann, CJ Das international beste Track-Archiv für Klimaverantwortung (IBTrACS) vereinheitlicht tropische Wirbelsturmdaten. Stier. Bin. Meteorol. Soc. 91, 363–376 (2010).

Artikel ADS Google Scholar

Knapp, KR, Diamond, HJ, Kossin, JP, Kruk, MC & Schreck, CJ International Best Track Archive for Climate Stewardship (IBTrACS) Project, Version 4 (NOAA National Centers for Environmental Information, 2018).

He, K., Fan, H., Wu, Y., Xie, S. & Girshick, R. Momentum-Kontrast für unbeaufsichtigtes visuelles Repräsentationslernen. In Proc. IEEE/CVF-Konferenz zu Computer Vision und Mustererkennung 9729–9738 (IEEE, 2020).

Bao, H., Dong, L. & Wei, F. Beit: BERT-Vorschulung von Bildtransformatoren. Vorabdruck unter https://arxiv.org/abs/2106.08254 (2021).

Devlin, J., Chang, MW, Lee, K. & Toutanova, K. BERT: Vortraining tiefer bidirektionaler Transformatoren für das Sprachverständnis. In Proc. Konferenz Nordamerikanisches Kapitel der Association of Computational Linguistics Vol. 1, 4171–4186 (NAACL, 2019).

Brown, T. et al. Sprachmodelle sind Wenig-Schuss-Lernende. Adv. Neuronal. Inf. Verfahren. Syst. 33, 1877–1901 (2020).

Radford, A. et al. Erlernen übertragbarer visueller Modelle durch Supervision in natürlicher Sprache. In Proc. Internationale Konferenz zum maschinellen Lernen 8748–8763 (PMLR, 2021).

Chasteen, MB & Koch, SE Multiskalenaspekte des Tornado-Ausbruchs vom 26.–27. April 2011. Teil I: Chronologie des Ausbruchs und Umweltentwicklung. Mo. Weather Rev. 150, 309–335 (2022).

Artikel ADS Google Scholar

Chasteen, MB & Koch, SE Multiskalenaspekte des Tornado-Ausbruchs vom 26.–27. April 2011. Teil II: Umweltveränderungen und gehobene Rückkopplungen aufgrund latenter Prozesse. Mo. Weather Rev. 150, 337–368 (2022).

Artikel ADS Google Scholar

Choy, C., Gwak, JY & Savarese, S. 4D räumlich-zeitliche Konvnets: Minkowski-Faltungs-Neuronale Netze. In Proc. IEEE/CVF-Konferenz zu Computer Vision und Mustererkennung 3075–3084 (IEEE, 2019).

Zhang S., Guo, S., Huang, W., Scott MR & Wang, L. V4D: 4D-Faltungs-Neuronale Netze für das Lernen von Darstellungen auf Videoebene. Vorabdruck unter https://arxiv.org/abs/2002.07442 (2020).

Garg, S., Rasp, S. & Thuerey, N. WeatherBench-Wahrscheinlichkeit: ein Benchmark-Datensatz für probabilistische mittelfristige Wettervorhersagen zusammen mit Deep-Learning-Basismodellen. Vorabdruck unter https://arxiv.org/abs/2205.00865 (2022).

Zoph, B., Vasudevan, V., Shlens, J. & Le, QV Lernen übertragbarer Architekturen für skalierbare Bilderkennung. In Proc. IEEE/CVF-Konferenz zu Computer Vision und Mustererkennung 8697–8710 (IEEE, 2017).

Fildier, B., Collins, WD & Muller, C. Verzerrungen der Regenverteilung bei Erwärmung, mit und ohne Selbstaggregation. J. Adv. Modell. Erdsystem. 13, e2020MS002256 (2021).

Artikel ADS PubMed PubMed Central Google Scholar

White, P. Newsletter Nr. 102 – Winter 2004/05 (Europäisches Zentrum für mittelfristige Wettervorhersagen, 2005); https://www.ecmwf.int/node/14623 (2005).

Kalnay, E. Atmosphärenmodellierung, Datenassimilation und Vorhersagbarkeit (Cambridge Univ. Press, 2003).

Lynch, P. Die Ursprünge der Computer-Wettervorhersage und Klimamodellierung. J. Comput. Physik. 227, 3431–3444 (2009).

Artikel ADS MathSciNet MATH Google Scholar

Stensrud, DJ Parametrisierungsschemata: Schlüssel zum Verständnis numerischer Wettervorhersagemodelle (Cambridge Univ. Press 2009).

Bauer, P. et al. Das ECMWF-Skalierbarkeitsprogramm: Fortschritte und Pläne (Europäisches Zentrum für mittelfristige Wettervorhersagen, 2020).

Nakaegawa, T. Hochleistungsrechnen in der Meteorologie im Kontext einer Ära grafischer Verarbeitungseinheiten. Computer 11, 114 (2022).

Artikel Google Scholar

Shi, X. et al. Faltungs-LSTM-Netzwerk: ein maschineller Lernansatz für Niederschlags-Nowcasting. Adv. Neuronal. Inf. Verfahren. Syst. 28, 802–810 (2015).

Google Scholar

Shi, X. et al. Deep Learning für Niederschlags-Nowcasting: ein Benchmark und ein neues Modell. Adv. Neuronal. Inf. Verfahren. Syst. 30, 5617–5627 (2017).

Google Scholar

Agrawal, S. et al. Maschinelles Lernen für Niederschlags-Nowcasting aus Radarbildern. Vorabdruck unter https://arxiv.org/abs/1912.12132 (2019).

Ravuri, S. et al. Gekonnte Niederschlagsvorhersage mithilfe tiefgehender generativer Radarmodelle. Natur 597, 672–677 (2021).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Lebedev, V. et al. Niederschlags-Nowcasting mit Satellitenbildern. In Proc. ACM SIGKDD Internationale Konferenz zu Knowledge Discovery und Data Mining 2680–2688 (ACM, 2019).

Sønderby, CK et al. Metnet: ein neuronales Wettermodell zur Niederschlagsvorhersage. Vorabdruck unter https://arxiv.org/abs/2003.12140 (2020).

Referenzen herunterladen

Wir danken dem ECMWF für die Bereitstellung des ERA5-Datensatzes und des TIGGE-Archivs; NOAA National Centers for Environmental Information für den IBTrACS-Datensatz; und andere Mitglieder des Pangu-Teams für Diskussionen und Unterstützung mit den GPUs. Unser Dank geht auch an das Integration Verification-Team von Huawei Cloud EI, das uns eine Plattform für hochleistungsfähiges Parallelrechnen bietet.

Huawei Cloud, Shenzhen, China

Kaifeng Bi, Lingxi Xie, Hengheng Zhang, Xin Chen, Xiaotao Gu und Qi Tian

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

KB hat das Projekt entworfen und die 3D-Tiefennetzwerke für Pangu-Weather trainiert. LX hat das technische Design verbessert. HZ, XC und XG richteten die Testumgebung ein und bereiteten die Daten vor. QT leitete und überwachte das Forschungsprojekt. KB und LX haben den Artikel geschrieben.

Korrespondenz mit Qi Tian.

KB, LX, HZ, XC, XG und QT sind Mitarbeiter von Huawei Cloud. Für den in diesem Artikel beschriebenen generativen Algorithmus wurde ein vorläufiges Patent (noch keine ID erteilt) angemeldet, in dem die Autoren KB, LX und QT als Erfinder aufgeführt sind.

Nature dankt Matthew Chantry, Imme Ebert-Uphoff und Martin Schultz für ihren Beitrag zum Peer-Review dieser Arbeit. Peer-Reviewer-Berichte sind verfügbar.

Anmerkung des Herausgebers Springer Nature bleibt hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten neutral.

Wir haben Pangu-Weather nur mit dem betriebsbereiten IFS3 verglichen, da FourCastNet2 die Pannenergebnisse nicht gemeldet hat. Wir folgten dem ECMWF und definierten die „nördliche Hemisphäre“ als die Region zwischen dem Breitengrad 20° (ausschließlich) und 90° (einschließlich). Hier gibt Z500/T500/Q500/U500/V500 das Geopotential, die Temperatur, die spezifische Luftfeuchtigkeit sowie die U- und V-Komponente der Windgeschwindigkeit bei 500 hPa an. Z850/T850 gibt das Geopotential und die Temperatur bei 850 hPa an. T2M gibt die 2-m-Temperatur an und U10/V10 gibt die u-Komponente und v-Komponente der 10-m-Windgeschwindigkeit an.

Quelldaten

Wir haben Pangu-Weather nur mit dem betriebsbereiten IFS3 verglichen, da FourCastNet2 die Pannenergebnisse nicht gemeldet hat. Wir folgten dem ECMWF und definierten die „nördliche Hemisphäre“ als die Region zwischen dem Breitengrad –20° (ausschließlich) und –90° (einschließlich). Hier gibt Z500/T500/Q500/U500/V500 das Geopotential, die Temperatur, die spezifische Luftfeuchtigkeit sowie die U- und V-Komponente der Windgeschwindigkeit bei 500 hPa an. Z850/T850 gibt das Geopotential und die Temperatur bei 850 hPa an. T2M gibt die 2-m-Temperatur an und U10/V10 gibt die u-Komponente und v-Komponente der 10-m-Windgeschwindigkeit an.

Quelldaten

Wir haben Pangu-Weather nur mit dem betriebsbereiten IFS3 verglichen, da FourCastNet2 die Pannenergebnisse nicht gemeldet hat. Wir folgten dem ECMWF und definierten die „Tropen“ als die Region zwischen dem Breitengrad +20° (einschließlich) und –20° (einschließlich). Hier gibt Z500/T500/Q500/U500/V500 das Geopotential, die Temperatur, die spezifische Luftfeuchtigkeit sowie die U- und V-Komponente der Windgeschwindigkeit bei 500 hPa an. Z850/T850 gibt das Geopotential und die Temperatur bei 850 hPa an. T2M gibt die 2-m-Temperatur an und U10/V10 gibt die u-Komponente und v-Komponente der 10-m-Windgeschwindigkeit an.

Quelldaten

Die RMSE- und ACC-Werte und -Trends liegen in den drei Jahren nahe beieinander, was auf die stabile Prognosefähigkeit von Pangu-Weather über verschiedene Jahre hindeutet. Hier gibt Z500/T500/Q500/U500/V500 das Geopotential, die Temperatur, die spezifische Luftfeuchtigkeit sowie die U- und V-Komponente der Windgeschwindigkeit bei 500 hPa an. Z850/T850 gibt das Geopotential und die Temperatur bei 850 hPa an. T2M gibt die 2-m-Temperatur an und U10/V10 gibt die u-Komponente und v-Komponente der 10-m-Windgeschwindigkeit an.

Quelldaten

a) Die Aufteilung in sechs Ozeane. b) Die Aufteilung in drei Intensitätsintervalle. Die Gesamtstatistik ist in Abb. 4c dargestellt.

Quelldaten

a) Die horizontale Karte entspricht einer ungleichmäßigen räumlichen Verteilung auf der Erdkugel. b) Die geopotentielle Höhe hängt eng mit der Breite zusammen. c) Die mittlere Windgeschwindigkeit und Temperatur stehen in engem Zusammenhang mit der Höhe (formuliert als Druckniveau). Die Unterabbildungen b) und c) wurden mithilfe von Statistiken zu den ERA5-Daten dargestellt.

a) Testfehler einzelner Modelle. Es zeigt die Testfehler (in RMSE) in Bezug auf die Prognosezeit unter Verwendung einzelner Modelle (d. h. Vorlaufzeiten betragen jeweils 1 Stunde, 3 Stunden, 6 Stunden und 24 Stunden). Beachten Sie die Anhäufung von Prognosefehlern mit zunehmender Prognosezeit. b) Visualisierung des Quantiltrends in Bezug auf die Durchlaufzeit. Es zeigt den Trend aller in Abb. 2 angezeigten Variablen und die Vergleiche mit dem operativen IFS3 und ERA518. Pangu-Weather meldet häufig niedrigere Quantilwerte, da KI-basierte Methoden in der Regel zu reibungslosen Vorhersagen führen. Hier gibt Z500/T500/Q500/U500/V500 das Geopotential, die Temperatur, die spezifische Luftfeuchtigkeit sowie die U- und V-Komponente der Windgeschwindigkeit bei 500 hPa an. Z850/T850 gibt das Geopotential und die Temperatur bei 850 hPa an. T2M gibt die 2-m-Temperatur an und U10/V10 gibt die u-Komponente und v-Komponente der 10-m-Windgeschwindigkeit an.

Quelldaten

a) Die Tracking-Ergebnisse der Zyklonaugen für Hurrikan Michael (2018–13) und Taifun Ma-on (2022–09) von Pangu-Weather und ECMWF-HRES, mit einem Vergleich mit der Grundwahrheit (von IBTrACS24,25). b) Eine Veranschaulichung des Tracking-Prozesses, wobei wir Pangu-Weather als Beispiel verwendet haben. Der Algorithmus lokalisiert das Zyklonauge, indem er vier Variablen (aus Vorhersageergebnissen) überprüft, nämlich den mittleren Meeresspiegeldruck, die 10-m-Windgeschwindigkeit, die Dicke zwischen 850 hPa und 200 hPa und die Wirbelstärke von 850 hPa. Die angezeigten Zahlen entsprechen den Prognoseergebnissen dieser Variablen bei einer Vorlaufzeit von 72 Stunden, und die verfolgten Zyklonaugen sind durch den Schwanz von Pfeilen gekennzeichnet. c) Die prozeduralen Verfolgungsergebnisse des Taifuns Kong-rey (2018–25). Die Ergebnisse von Pangu-Weather wurden mit denen von ECMWF-HRES und der Ground-Truth (von IBTrACS24,25) verglichen. Wir zeigen sechs Zeitpunkte, wobei der erste der 29. September 2018, 12:00 UTC, ist und die Zeitlücke zwischen benachbarten Teilfiguren 12 Stunden beträgt. Der historische (beobachtete) Weg der Zyklonaugen ist gestrichelt dargestellt. Beachten Sie den erheblichen Unterschied zwischen den Tracking-Ergebnissen von Pangu-Weather und ECMWF-HRES (Pangu-Weather ist genauer) in den mittleren vier Unterzahlen. Die Teilfiguren mit Karten wurden mit dem Matplotlib Basemap-Toolkit geplottet.

Quelldaten

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative-Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Bi, K., Xie, L., Zhang, H. et al. Genaue mittelfristige globale Wettervorhersage mit 3D-Neuronalen Netzen. Natur 619, 533–538 (2023). https://doi.org/10.1038/s41586-023-06185-3

Zitat herunterladen

Eingegangen: 5. Januar 2023

Angenommen: 09. Mai 2023

Veröffentlicht: 05. Juli 2023

Ausgabedatum: 20. Juli 2023

DOI: https://doi.org/10.1038/s41586-023-06185-3

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Wissenschaftliche Berichte (2023)

Nature Reviews Erde & Umwelt (2023)

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.