10. Anhang 81
Anlage 4: Für das statistische Downscaling zur Erstellung eines Ensembles hochaufgelöster Klimaprojekti-
onen grundsätzlich zur Verfügung stehende Verfahren.
Für das statistische Downscaling lassen sich insgesamt drei Klassen von Verfahren unterscheiden (Trzaska
und Schnarr 2014):
? Lineare Methoden,
? Wetterlagen-Klassifizierungen und
? Wettergeneratoren.
Hier wird ein Verfahren der Wetterlagen-Klassifizierungen favorisiert. An dieser Stelle sei auch auf die
COST-733 Action verwiesen (Tveito und Huth 2016), wo eine Fülle von verschiedenen Wetterlagenklassi-
fikationen systematisch katalogisiert und evaluiert wurde. Wetterlagen-Klassifizierungen beinhalten in der
Regel ein Cluster-Verfahren. Bei einer Cluster-Analyse ist es das Ziel, große Datenmengen in verschiedene
Gruppen (bzw. Klassen oder Cluster) aufzuteilen und dadurch eine Datenreduktion zu erreichen. Die grup-
pierten Elemente werden durch bestimmte Eigenschaften charakterisiert. In diesem Fall hier z. B. durch
meteorologische Eigenschaften wie Zirkulationsmuster oder Temperaturverteilungen. Die Daten können
als Vektoren in einem N-dimensionalen Raum aufgefasst werden (Panitz 2006). Dabei gilt das Prinzip, dass
innerhalb einer Gruppe größtmögliche Homogenität und außerhalb einer Gruppe größtmögliche Hetero-
genität herrschen soll. Ein Maß dafür kann z. B. eine Distanz im Raum sein.
Beim Clustering unterscheidet man grundlegend drei verschiedene Methoden:
? Hierarchische Clusterverfahren,
? partitionierende Clusterverfahren und
? self-organizing maps (SOM).
Hierarchische Clustermethoden gehen zu Beginn ihres Algorithmus davon aus, dass jeder einzelne Da-
tenvektor eine eigene Klasse bildet. Im nächsten Schritt werden die zwei ähnlichsten Vektoren zu einer
Klasse zusammengefügt. In einem iterativen Verfahren werden schließlich die Klassen gefunden, die einem
Optimum (von definierten Maßzahlen und Kriterien) entsprechen, das am Anfang des Verfahrens festgelegt
werden muss. Dabei werden die einzelnen Datenvektoren in einer Gruppe festgehalten, sobald sie dorthin
verteilt worden sind. Ein Vertreter dieser Methode ist die sogenannte Ward-Methode (Ward 1963).
Bei partitionierenden Verfahren wird die Anzahl der Klassen zu Beginn festgelegt. Die Anfangsverteilung
der Klassen wird zufällig gewählt. In einem iterativen Austauschprozess werden die einzelnen Vektoren
zwischen den Klassen umgeordnet, bis eine gegebene Zielfunktion optimiert ist. Das sogenannte k-means
Verfahren nutzt dabei die Streuungsquadratsumme innerhalb der Gruppe (Lloyd 1982).
Das SOM-Verfahren ist ein unüberwachtes neuronales Netz, ähnelt aber in der Vorgehensweise den an-
deren Verfahren (Kohonen 1995). Im N-dimensionalen Raum der Datenvektoren werden (in der Anzahl
vorher festgelegte) Mustervektoren (= Knoten oder Klassen) platziert und in einem iterativen Verfahren
unter Ähnlichkeitsgesichtspunkten optimiert. Innerhalb eines Iterationsschrittes wird für jeden Datenvektor
der nächstgelegene Knoten gesucht und korrigiert. Zusätzlich werden die innerhalb einer definierten Nach-
barschaftsfunktion liegenden Nachbarknoten ebenfalls korrigiert. Der Radius der Nachbarschaftsfunktion
nimmt im Laufe der Iteration monoton ab, sodass mit der Zeit immer weniger Nachbarknoten mitkorrigiert
werden.
Als Ergebnis aller drei Verfahren werden die Anzahl der Fälle pro Klasse (Häufigkeit in Tagen pro Zeitraum)
und der repräsentative Tag ausgegeben. Am repräsentativen Tag ist die Wetterlage dem Clustermittel am
ähnlichsten. Für die betrachtete Variable können dann für jedes Cluster der Tagesgang am repräsentativen
Tag für jeden Gitterpunkt des hochaufgelösten dynamischen Klimaprojektionslaufs bestimmt werden. Zu
jedem Cluster wird auch angegeben, an wie vielen und welchen Tagen des Zeitraums die jeweilige Wetterlage