Prognosemethode

Hallo,

seit meinem letzten Beitrag sind nun einige Wochen vergangen. Ich hatte angekündigt, eine neue Prognosemethode vorzustellen und gab damals auch bereits einige Hinweise.

Die Sache hat sich allerdings als sehr zäh erwiesen, war sehr zeitaufwändig, ob sich der Aufwand überhaupt lohnt, weiß ich selbst noch nicht.

Zu meinem Ansatz: Ich möchte das grobe Zirkulationsmuster der Nordhemisphäre prognostizieren (also im Wesentlichen Bodendruckanomalien). Zu diesem Zweck unterteile ich die Nordhemisphäre in 72 Zonen, jede Zone umfasst 15 Breitengrade und 30 Längengrade, Zone 1 ist also 75 – 90°N 180 – 150°W, Zone 2 umfasst 75 – 90°N 150 – 120°W…………..Zone 72 ist dann 0 – 15°N 150 – 180°E.

Zunächst begann ich daher eine (für meine Verhältnisse) umfangreiche Datenbank aufzubauen, zum besseren Verständnis eine Graphik:

Datengraphik Projekt10

 

Datenspalte 1 beinhaltet die Jahreszahl, also Zeitraum 1950 – 2016, ergibt 67 Datenreihen. In den folgenden 864 Datenspalten sind die monatlichen Flächenmittel des Bodendrucks dieser 72 Zonen zu finden, Datenspalte Nr. 866 bis 1729 beinhaltet die Geopotentialwerte auf der 500hPa – Ebene, die Spalten Nr. 1730 bis 2593 zeigen die Geopotentialwerte auf der 50hPa – Ebene (Stratosphäre). Es folgen weitere relevante Daten der NH (Spalten 2594 bis 2797), als da wären: Pacific Warm Pool, North Tropical Atlantik Index, Caribbean Index, Nino 1.2, 3.4, 4, die PDO, AMO, TNA, TSA, außerdem die SSTs des Indischen Ozeans (10°S – 25°N 40 – 100Ê), die SSTs der Gewässer um Neufundland (35 – 50°N 60 – 40°W), bei Labrador (55 – 65°N 70 – 40°W), des Polarmeesrs (67.5 – 80°N 10 – 100°E). Im Anschluss daran sind noch die QBO – Werte zu finden.

Die Spalten 2798 bis 3661 beinhalten die monatlichen Flächenmittel der Bodentemperaturen dieser 72 Zonen.Es folgen die NAO – sowie AO – Werte (Spalten 3662 bis 3685), danach die solar flux Werte, die Hurricane Aktivität (3686 bis 3709). Den Abschluss bilden die Werte der outgoing longwave radiation (Spalten 3710 bis 4573).

Diese Daten, also 4573 Spalten zu jeweils 67 Reihen, insgesamt über 300.000 Einzeldaten bilden die Basis für die Prognosen.

Monatlich werden die Daten aktualisiert und zwar auf besondere Weise: Ich gehe davon aus, dass die Januarwerte von Luftdruck etc. der einzelnen Zonen ein Ergebnis der „Verhältnisse“ in den Vormonaten sind (die sich in den Daten der Vormonate ausdrücken), also der Januarwert des Jahres 1951 ein Ergebnis der „Gesamtverhältnisse“ des Jahres 1950 ist, der Januarwert von 1952 ein Ergebnis von 1951. Deshalb schreibe ich nun bei der Aktualisierung den Januarwert von 1951 in die Reihe des Jahres 1950, den von 1952 in die Reihe von 1951 usw. Der Januarwert von 2017 gehört also in die Reihe des Jahres 2016. Diesen Wert trage ich jedoch nicht !!!!!!!!!! ein, denn dieser Wert soll vom Rechenprogramm bestimmt werden, denn es kennt ja jetzt die Beziehungen „aller“ (= vieler) Facetten der Vormonate zum Bodendruck etc. des Monats Januar.

Außerdem stelle ich um, die Reihen werden zu Spalten und die Spalten zu Reihen, ich habe also nun 67 Datenspalten (die Jahre 1950 – 2016) mit jeweils 4573 Reihen. Außerdem erscheinen die Jahreszahlen (in der Aktualisierung!!!!!!!!!!) nicht mehr, 2017 ist sozusagen 2016b so wie 1951 nicht mehr 1951 ist, sondern 1950b, 1952 wird zu 1951b ……….. das Jahr 2018 wird zu 2016c usw (werden). Auf diese Weise entsteht für jede Spalte (jedes Jahr) eine Kette von fortlaufenden Daten und Beziehungen, die vom Rechenprogramm in eine Prognose gegossen werden (kann).

Das Programm generiert Modelle zur Berechnung der Variablen bzw. die mathematischen Formeln, in diesem Fall für die Bodendruckwerte der 72 Zonen des Januar 2017, als Beispiel die 3 besten Modelle von einigen tausend (ranking list):

Generated by GMDH Shell 3.8.6

Y1 = 2.31244 + x46*0.113925 + x25*0.178436 + x63*0.0847515 + x58*0.210335 + x15*(-0.132565) + x4*0.238682 + x17*(-0.0962977) + x21*0.206676 + x42*(-0.124315) + x43*0.184347 + x22*(-0.261997) + x3*0.136506 + x44*(-0.0996634) + x34*0.0937552 + x65*0.209691 + x18*(-0.170531) + x55*0.165174 + x19*(-0.116306) + x62*(-0.145521) + x32*0.113287 + x59*0.125321 + x30*(-0.108335) + x28*0.0848361 + x14*(-0.063797) + x13*0.0791369 + x31*0.112444 + „x2, cubert“*(-3.56472) + „x36, cubert“*3.06238 + x20*(-0.0656656) + x61*0.0670449 + x10*0.0848162 + x11*(-0.101132) + „x15, cubert“*2.69275 + „x29, cubert“*(-3.60152) + „x1, cubert“*(-4.68157) + „x17, cubert“*2.29086 + „x64, cubert“*(-3.6868) + „x22, cubert“*1.55475 + „x13, cubert“*2.80124 + „x59, cubert“*2.62104 + „x44, cubert“*2.16085 + „x24, cubert“*(-3.32839) + „x47, cubert“*2.17445 + „x32, cubert“*(-2.31613) + „x46, cubert“*1.34388
Y2 = 2.28739 + x46*0.11381 + x25*0.178189 + x63*0.0846351 + x58*0.210248 + x15*(-0.132407) + x4*0.238664 + x17*(-0.0956016) + x21*0.206329 + x42*(-0.124284) + x43*0.184016 + x22*(-0.262385) + x3*0.137494 + x44*(-0.10016) + x34*0.092971 + x65*0.209196 + x18*(-0.170188) + x55*0.164931 + x19*(-0.115611) + x62*(-0.14457) + x32*0.113547 + x59*0.125 + x30*(-0.106613) + x28*0.0847039 + x14*(-0.063445) + x13*0.0787463 + x31*0.11282 + „x2, cubert“*(-2.99247) + „x36, cubert“*3.85269 + x20*(-0.0664108) + x61*0.0674388 + x10*0.0833057 + x11*(-0.101329) + „x15, cubert“*3.12025 + „x29, cubert“*(-3.70223) + „x1, cubert“*(-4.7193) + „x17, cubert“*2.23148 + „x64, cubert“*(-3.25959) + „x22, cubert“*2.24485 + „x13, cubert“*2.78523 + „x59, cubert“*2.43485 + „x44, cubert“*1.92129 + „x24, cubert“*(-3.31109) + „x47, cubert“*2.32335 + „x32, cubert“*(-2.23151) + „x46, cubert“*1.56647 + „x6, cubert“*(-2.74099)
Y3 = 2.28762 + x46*0.113745 + x25*0.177945 + x63*0.0848985 + x58*0.210598 + x15*(-0.133314) + x4*0.238321 + x17*(-0.0970819) + x21*0.209588 + x42*(-0.124054) + x43*0.184718 + x22*(-0.262209) + x3*0.136383 + x44*(-0.0994574) + x34*0.0932914 + x65*0.209951 + x18*(-0.170614) + x55*0.165371 + x19*(-0.116146) + x62*(-0.145427) + x32*0.112905 + x59*0.125398 + x30*(-0.108441) + x28*0.0848598 + x14*(-0.0640681) + x13*0.0784208 + x31*0.112197 + „x2, cubert“*(-2.98102) + „x36, cubert“*3.02422 + x20*(-0.0655977) + x61*0.0669396 + x10*0.0850096 + x11*(-0.101104) + „x15, cubert“*2.99559 + „x29, cubert“*(-3.30337) + „x1, cubert“*(-4.63485) + „x17, cubert“*2.46795 + „x64, cubert“*(-3.60214) + „x22, cubert“*1.58464 + „x13, cubert“*2.9819 + „x59, cubert“*2.30127 + „x44, cubert“*1.97607 + „x24, cubert“*(-3.09144) + „x47, cubert“*2.74736 + „x32, cubert“*(-2.08836) + „x46, cubert“*1.12813 + „x21, cubert“*(-1.97838)
Model Criterion value
Y1 0
Y2 0
Y3 0

In der Zeilenreihe 4574 beginnt nun die Aktualisierung, also die Bodendruckwerte des Januar 1951 in Form von 1950b, 1952 in Form von 1951b, 1953 in Form von 1952b……………die Daten des Januar 2017 in Form von 2016b sollen vom Programm errechnet werden, werden also nicht eingegeben. Das beste Modell, das sich als solches auf bekanntem Terrain vor den gesuchten Daten im überwachten Modus herauskristallisiert hat (die Anzahl bestimmt das Programm selbst anhand der Datenmenge) lieferte nachstehende Ergebnisse: Reihe 4574 zeigt den Bodendruck der Zone 1, also 75-90°N 180-150°W, 4575 den Bodendruck der Zone 2 von 75 -90°N 150 – 120°W………………4645 den Bodendruck der Zone 72 von 0 – 15°N 150 – 180Ê.

Die linke Spalte gibt (wie erklärt) die Zeilenreihe an, die mittlere Spalte den tatsächlich eingetretenen Bodendruckwert (in hPa), von mir jetzt zum Vergleich genannt und die rechte Spalte den vom Programm errechneten Wert.

 

 

4574 1005,690 1011,460123
4575  1007,545 1011,317913
4576  1008,604 1009,961721
4577  1007,592 1009,027379
4578  1009,463 1010,714168
4579  1005,523 1006,218671
4580  999,716 1000,746932
4581  997,678 999,0637206
4582  998,530 1001,24505
4583  1000,841 1005,867005
4584  1002,985 1008,6828
4585  1004,729 1010,498499
4586  1010,563 1014,946404
4587  1012,448 1018,209812
4588  1012,627 1015,167742
4589  1007,212 1006,097548
4590  1006,547 1006,253745
4591  1005,876 997,6596737
4592  1004,578 993,6982369
4593  1004,879 996,3983804
4594  1010,264 1006,053822
4595  1017,677 1017,516084
4596  1018,375 1019,546901
4597  1014,046 1016,978624
4598  1007,414 1004,081278
4599  1011,419 1015,251279
4600  1016,258 1022,366072
4601  1010,887 1015,125114
4602  1007,286 1008,739476
4603  1016,620 1010,063148
4604  1020,516 1013,048557
4605  1019,125 1016,356972
4606  1024,276 1026,360429
4607  1031,340 1033,642642
4608  1019,334 1019,563494
4609  1008,990 1004,4301
4610  1011,763 1006,922777
4611  1015,369 1019,168832
4612  1018,836 1022,612509
4613  1016,462 1019,51047
4614  1016,483 1021,612479
4615  1021,768 1024,350733
4616  1020,103 1020,258071
4617  1021,852 1022,18717
4618  1025,199 1027,004119
4619  1028,355 1031,456016
4620  1019,133 1018,308402
4621  1007,906 1005,513315
4622  1016,462 1015,168194
4623  1018,071 1019,121418
4624  1016,374 1018,324438
4625  1017,595 1019,048942
4626  1018,037 1020,899874
4627  1018,308 1020,952074
4628  1017,420 1019,752437
4629  1016,457 1017,6261
4630  1016,577 1016,810538
4631  1017,165 1018,880693
4632  1016,434 1016,696067
4633  1013,822 1013,649566
4634  1010,818 1011,391555
4635  1011,960 1012,905631
4636  1012,318 1013,754806
4637  1012,248 1013,221738
4638  1012,758 1013,505376
4639  1012,194 1013,28554
4640  1010,675 1012,238047
4641  1012,755 1013,033263
4642  1012,334 1012,399413
4643  1010,606 1011,817908
4644  1009,245 1010,368715
4645  1009,400 1010,098185

 

Der Korrelationskoeffizient beträgt 0.8962, der Determinationskoeffizient R² beträgt 0.8032.

Der mittlere absolute Fehler beläuft sich auf 2,7, RMSE lautet 3,6.

Was ich erwarte:

Ich erwarte keine punktgenauen Prognosen, Hinweise auf „unterdurchschnittlich“ bzw. „überdurchschnittlich“ würden mir ausreichen. Wünschenswert wäre es, wenn die Prognosen auf Geopotential und Temperatur ausgedehnt werden könnten, das ist jedoch auch eine Zeitfrage. Auf jeden Fall geht es mir um objektive Fakten, um nachvollziehbare und überprüfbare Prognosen, die Subjektivität, Bauchgefühle, Kaffeesatzleserei und sonstigen metaphysischen Schwachsinn ausschließen.

Gruß

KHB