Hallo,
seit meinem letzten Beitrag sind nun einige Wochen vergangen. Ich hatte angekündigt, eine neue Prognosemethode vorzustellen und gab damals auch bereits einige Hinweise.
Die Sache hat sich allerdings als sehr zäh erwiesen, war sehr zeitaufwändig, ob sich der Aufwand überhaupt lohnt, weiß ich selbst noch nicht.
Zu meinem Ansatz: Ich möchte das grobe Zirkulationsmuster der Nordhemisphäre prognostizieren (also im Wesentlichen Bodendruckanomalien). Zu diesem Zweck unterteile ich die Nordhemisphäre in 72 Zonen, jede Zone umfasst 15 Breitengrade und 30 Längengrade, Zone 1 ist also 75 – 90°N 180 – 150°W, Zone 2 umfasst 75 – 90°N 150 – 120°W…………..Zone 72 ist dann 0 – 15°N 150 – 180°E.
Zunächst begann ich daher eine (für meine Verhältnisse) umfangreiche Datenbank aufzubauen, zum besseren Verständnis eine Graphik:
Datenspalte 1 beinhaltet die Jahreszahl, also Zeitraum 1950 – 2016, ergibt 67 Datenreihen. In den folgenden 864 Datenspalten sind die monatlichen Flächenmittel des Bodendrucks dieser 72 Zonen zu finden, Datenspalte Nr. 866 bis 1729 beinhaltet die Geopotentialwerte auf der 500hPa – Ebene, die Spalten Nr. 1730 bis 2593 zeigen die Geopotentialwerte auf der 50hPa – Ebene (Stratosphäre). Es folgen weitere relevante Daten der NH (Spalten 2594 bis 2797), als da wären: Pacific Warm Pool, North Tropical Atlantik Index, Caribbean Index, Nino 1.2, 3.4, 4, die PDO, AMO, TNA, TSA, außerdem die SSTs des Indischen Ozeans (10°S – 25°N 40 – 100Ê), die SSTs der Gewässer um Neufundland (35 – 50°N 60 – 40°W), bei Labrador (55 – 65°N 70 – 40°W), des Polarmeesrs (67.5 – 80°N 10 – 100°E). Im Anschluss daran sind noch die QBO – Werte zu finden.
Die Spalten 2798 bis 3661 beinhalten die monatlichen Flächenmittel der Bodentemperaturen dieser 72 Zonen.Es folgen die NAO – sowie AO – Werte (Spalten 3662 bis 3685), danach die solar flux Werte, die Hurricane Aktivität (3686 bis 3709). Den Abschluss bilden die Werte der outgoing longwave radiation (Spalten 3710 bis 4573).
Diese Daten, also 4573 Spalten zu jeweils 67 Reihen, insgesamt über 300.000 Einzeldaten bilden die Basis für die Prognosen.
Monatlich werden die Daten aktualisiert und zwar auf besondere Weise: Ich gehe davon aus, dass die Januarwerte von Luftdruck etc. der einzelnen Zonen ein Ergebnis der „Verhältnisse“ in den Vormonaten sind (die sich in den Daten der Vormonate ausdrücken), also der Januarwert des Jahres 1951 ein Ergebnis der „Gesamtverhältnisse“ des Jahres 1950 ist, der Januarwert von 1952 ein Ergebnis von 1951. Deshalb schreibe ich nun bei der Aktualisierung den Januarwert von 1951 in die Reihe des Jahres 1950, den von 1952 in die Reihe von 1951 usw. Der Januarwert von 2017 gehört also in die Reihe des Jahres 2016. Diesen Wert trage ich jedoch nicht !!!!!!!!!! ein, denn dieser Wert soll vom Rechenprogramm bestimmt werden, denn es kennt ja jetzt die Beziehungen „aller“ (= vieler) Facetten der Vormonate zum Bodendruck etc. des Monats Januar.
Außerdem stelle ich um, die Reihen werden zu Spalten und die Spalten zu Reihen, ich habe also nun 67 Datenspalten (die Jahre 1950 – 2016) mit jeweils 4573 Reihen. Außerdem erscheinen die Jahreszahlen (in der Aktualisierung!!!!!!!!!!) nicht mehr, 2017 ist sozusagen 2016b so wie 1951 nicht mehr 1951 ist, sondern 1950b, 1952 wird zu 1951b ……….. das Jahr 2018 wird zu 2016c usw (werden). Auf diese Weise entsteht für jede Spalte (jedes Jahr) eine Kette von fortlaufenden Daten und Beziehungen, die vom Rechenprogramm in eine Prognose gegossen werden (kann).
Das Programm generiert Modelle zur Berechnung der Variablen bzw. die mathematischen Formeln, in diesem Fall für die Bodendruckwerte der 72 Zonen des Januar 2017, als Beispiel die 3 besten Modelle von einigen tausend (ranking list):
Generated by GMDH Shell 3.8.6
Y1 = 2.31244 + x46*0.113925 + x25*0.178436 + x63*0.0847515 + x58*0.210335 + x15*(-0.132565) + x4*0.238682 + x17*(-0.0962977) + x21*0.206676 + x42*(-0.124315) + x43*0.184347 + x22*(-0.261997) + x3*0.136506 + x44*(-0.0996634) + x34*0.0937552 + x65*0.209691 + x18*(-0.170531) + x55*0.165174 + x19*(-0.116306) + x62*(-0.145521) + x32*0.113287 + x59*0.125321 + x30*(-0.108335) + x28*0.0848361 + x14*(-0.063797) + x13*0.0791369 + x31*0.112444 + „x2, cubert“*(-3.56472) + „x36, cubert“*3.06238 + x20*(-0.0656656) + x61*0.0670449 + x10*0.0848162 + x11*(-0.101132) + „x15, cubert“*2.69275 + „x29, cubert“*(-3.60152) + „x1, cubert“*(-4.68157) + „x17, cubert“*2.29086 + „x64, cubert“*(-3.6868) + „x22, cubert“*1.55475 + „x13, cubert“*2.80124 + „x59, cubert“*2.62104 + „x44, cubert“*2.16085 + „x24, cubert“*(-3.32839) + „x47, cubert“*2.17445 + „x32, cubert“*(-2.31613) + „x46, cubert“*1.34388
Y2 = 2.28739 + x46*0.11381 + x25*0.178189 + x63*0.0846351 + x58*0.210248 + x15*(-0.132407) + x4*0.238664 + x17*(-0.0956016) + x21*0.206329 + x42*(-0.124284) + x43*0.184016 + x22*(-0.262385) + x3*0.137494 + x44*(-0.10016) + x34*0.092971 + x65*0.209196 + x18*(-0.170188) + x55*0.164931 + x19*(-0.115611) + x62*(-0.14457) + x32*0.113547 + x59*0.125 + x30*(-0.106613) + x28*0.0847039 + x14*(-0.063445) + x13*0.0787463 + x31*0.11282 + „x2, cubert“*(-2.99247) + „x36, cubert“*3.85269 + x20*(-0.0664108) + x61*0.0674388 + x10*0.0833057 + x11*(-0.101329) + „x15, cubert“*3.12025 + „x29, cubert“*(-3.70223) + „x1, cubert“*(-4.7193) + „x17, cubert“*2.23148 + „x64, cubert“*(-3.25959) + „x22, cubert“*2.24485 + „x13, cubert“*2.78523 + „x59, cubert“*2.43485 + „x44, cubert“*1.92129 + „x24, cubert“*(-3.31109) + „x47, cubert“*2.32335 + „x32, cubert“*(-2.23151) + „x46, cubert“*1.56647 + „x6, cubert“*(-2.74099)
Y3 = 2.28762 + x46*0.113745 + x25*0.177945 + x63*0.0848985 + x58*0.210598 + x15*(-0.133314) + x4*0.238321 + x17*(-0.0970819) + x21*0.209588 + x42*(-0.124054) + x43*0.184718 + x22*(-0.262209) + x3*0.136383 + x44*(-0.0994574) + x34*0.0932914 + x65*0.209951 + x18*(-0.170614) + x55*0.165371 + x19*(-0.116146) + x62*(-0.145427) + x32*0.112905 + x59*0.125398 + x30*(-0.108441) + x28*0.0848598 + x14*(-0.0640681) + x13*0.0784208 + x31*0.112197 + „x2, cubert“*(-2.98102) + „x36, cubert“*3.02422 + x20*(-0.0655977) + x61*0.0669396 + x10*0.0850096 + x11*(-0.101104) + „x15, cubert“*2.99559 + „x29, cubert“*(-3.30337) + „x1, cubert“*(-4.63485) + „x17, cubert“*2.46795 + „x64, cubert“*(-3.60214) + „x22, cubert“*1.58464 + „x13, cubert“*2.9819 + „x59, cubert“*2.30127 + „x44, cubert“*1.97607 + „x24, cubert“*(-3.09144) + „x47, cubert“*2.74736 + „x32, cubert“*(-2.08836) + „x46, cubert“*1.12813 + „x21, cubert“*(-1.97838)
Model Criterion value
Y1 0
Y2 0
Y3 0
In der Zeilenreihe 4574 beginnt nun die Aktualisierung, also die Bodendruckwerte des Januar 1951 in Form von 1950b, 1952 in Form von 1951b, 1953 in Form von 1952b……………die Daten des Januar 2017 in Form von 2016b sollen vom Programm errechnet werden, werden also nicht eingegeben. Das beste Modell, das sich als solches auf bekanntem Terrain vor den gesuchten Daten im überwachten Modus herauskristallisiert hat (die Anzahl bestimmt das Programm selbst anhand der Datenmenge) lieferte nachstehende Ergebnisse: Reihe 4574 zeigt den Bodendruck der Zone 1, also 75-90°N 180-150°W, 4575 den Bodendruck der Zone 2 von 75 -90°N 150 – 120°W………………4645 den Bodendruck der Zone 72 von 0 – 15°N 150 – 180Ê.
Die linke Spalte gibt (wie erklärt) die Zeilenreihe an, die mittlere Spalte den tatsächlich eingetretenen Bodendruckwert (in hPa), von mir jetzt zum Vergleich genannt und die rechte Spalte den vom Programm errechneten Wert.
4574 | 1005,690 | 1011,460123 |
4575 | 1007,545 | 1011,317913 |
4576 | 1008,604 | 1009,961721 |
4577 | 1007,592 | 1009,027379 |
4578 | 1009,463 | 1010,714168 |
4579 | 1005,523 | 1006,218671 |
4580 | 999,716 | 1000,746932 |
4581 | 997,678 | 999,0637206 |
4582 | 998,530 | 1001,24505 |
4583 | 1000,841 | 1005,867005 |
4584 | 1002,985 | 1008,6828 |
4585 | 1004,729 | 1010,498499 |
4586 | 1010,563 | 1014,946404 |
4587 | 1012,448 | 1018,209812 |
4588 | 1012,627 | 1015,167742 |
4589 | 1007,212 | 1006,097548 |
4590 | 1006,547 | 1006,253745 |
4591 | 1005,876 | 997,6596737 |
4592 | 1004,578 | 993,6982369 |
4593 | 1004,879 | 996,3983804 |
4594 | 1010,264 | 1006,053822 |
4595 | 1017,677 | 1017,516084 |
4596 | 1018,375 | 1019,546901 |
4597 | 1014,046 | 1016,978624 |
4598 | 1007,414 | 1004,081278 |
4599 | 1011,419 | 1015,251279 |
4600 | 1016,258 | 1022,366072 |
4601 | 1010,887 | 1015,125114 |
4602 | 1007,286 | 1008,739476 |
4603 | 1016,620 | 1010,063148 |
4604 | 1020,516 | 1013,048557 |
4605 | 1019,125 | 1016,356972 |
4606 | 1024,276 | 1026,360429 |
4607 | 1031,340 | 1033,642642 |
4608 | 1019,334 | 1019,563494 |
4609 | 1008,990 | 1004,4301 |
4610 | 1011,763 | 1006,922777 |
4611 | 1015,369 | 1019,168832 |
4612 | 1018,836 | 1022,612509 |
4613 | 1016,462 | 1019,51047 |
4614 | 1016,483 | 1021,612479 |
4615 | 1021,768 | 1024,350733 |
4616 | 1020,103 | 1020,258071 |
4617 | 1021,852 | 1022,18717 |
4618 | 1025,199 | 1027,004119 |
4619 | 1028,355 | 1031,456016 |
4620 | 1019,133 | 1018,308402 |
4621 | 1007,906 | 1005,513315 |
4622 | 1016,462 | 1015,168194 |
4623 | 1018,071 | 1019,121418 |
4624 | 1016,374 | 1018,324438 |
4625 | 1017,595 | 1019,048942 |
4626 | 1018,037 | 1020,899874 |
4627 | 1018,308 | 1020,952074 |
4628 | 1017,420 | 1019,752437 |
4629 | 1016,457 | 1017,6261 |
4630 | 1016,577 | 1016,810538 |
4631 | 1017,165 | 1018,880693 |
4632 | 1016,434 | 1016,696067 |
4633 | 1013,822 | 1013,649566 |
4634 | 1010,818 | 1011,391555 |
4635 | 1011,960 | 1012,905631 |
4636 | 1012,318 | 1013,754806 |
4637 | 1012,248 | 1013,221738 |
4638 | 1012,758 | 1013,505376 |
4639 | 1012,194 | 1013,28554 |
4640 | 1010,675 | 1012,238047 |
4641 | 1012,755 | 1013,033263 |
4642 | 1012,334 | 1012,399413 |
4643 | 1010,606 | 1011,817908 |
4644 | 1009,245 | 1010,368715 |
4645 | 1009,400 | 1010,098185 |
Der Korrelationskoeffizient beträgt 0.8962, der Determinationskoeffizient R² beträgt 0.8032.
Der mittlere absolute Fehler beläuft sich auf 2,7, RMSE lautet 3,6.
Was ich erwarte:
Ich erwarte keine punktgenauen Prognosen, Hinweise auf „unterdurchschnittlich“ bzw. „überdurchschnittlich“ würden mir ausreichen. Wünschenswert wäre es, wenn die Prognosen auf Geopotential und Temperatur ausgedehnt werden könnten, das ist jedoch auch eine Zeitfrage. Auf jeden Fall geht es mir um objektive Fakten, um nachvollziehbare und überprüfbare Prognosen, die Subjektivität, Bauchgefühle, Kaffeesatzleserei und sonstigen metaphysischen Schwachsinn ausschließen.
Gruß
KHB