196
600
300 3
300 2 50
100
100 3.
Diese Angaben entsprechen einem Verhältnis der Anzahlen der beiden Selektionsverfahren
von 50:50. Für die Vorhersage des Staus zu Niedrigwasserzeitpunkten sollten diese Angaben
so verändert werden, daß sie dem Verhältnis 25:75 (MD:ZGR) entsprechen. Außerdem sollten
Gesamtzahl und Gruppengröße an die zur Verfügung stehende Hardware entsprechend
angepaßt werden. Für das neue Lernen wird empfohlen, nicht eine Workstation des Wasser
standsvorhersagedienstes zu verwenden, sondern den aktuellen Computer, auf dem auch die
hydrodynamischen Modelle laufen. Die dritte Steuerdatei ist die bereits erwähnte Datenbank
("db"), z.B. "sel.db". Dieser Begriff ist übertrieben. Es handelt sich dabei nur um eine Liste
von vier bis fünf Einträgen pro Zeile, aus denen sich das Selektionsprogramm die nötigen
Angaben zum Einlesen der Daten heraussucht. Die Pfade in dieser Datei müssen noch
entsprechend angepaßt werden.
Zur Selektion der Daten kann dies Programm auf folgende Weisen aufgerufen werden. Die
erste Zeile entspricht der Selektion von Trainingsvektoren für die Vorhersage von stündlichen
Werten, die zweite Zeile für die Vorhersage des Staus zu Hochwasserzeitpunkten und die
dritte Zeile entsprechend zu Niedrigwasserzeitpunkten:
sei
-a -m -s 1.1.85
-e 1.1.96
-r 1.1.96
-x 1.
1.97
>
sel.out.std
sei
-h
-a -s 1.1.85
-e 1.1.96
-r 1.1.96
-x 1.1.97
>
sei. out. hw
sei
-j -h
-a -s 1.1.85
-e 1.1.96
-r 1.1.96
-x l.:
1.97
>
sel.out.nw
Die Optionen "-s" und "-e" bezeichnen den Zeitraum der Trainingsvektoren, die Optionen "-r"
und "-x" den Zeitraum der Validationsvektoren. Die Datumsangaben bei den Optionen "-s"
und "-r" sind inklusiv, die bei den Optionen "-e" und "-x" sind exklusiv. Da die Datums
angaben intern auf Tage umgerechnet werden, beziehen sich "inklusiv" und "exklusiv" auf
Tage. Die Option "-a" weist das Programm an, alle Vektoren aus dem Validationszeitraum
zu selektieren, die möglich sind, und überschreibt die Angaben in "sel.meth". Somit würde
dieser Aufruf das Jahr 1996 zum Standardvergleichsjahr erklären. Die Option "-m" weist das
Programm an, bei der Selektion die gleichbehandelnde Metrik zu verwenden. Die Option "-h"
steht für den Stau zu Hochwasserzeitpunkten. Die Option "-j" steht zusammen mit der Option
"-h" für den Stau zu Niedrigwasserzeitpunkten.
In die Standardausgabe (dargestellt durch das UNIX-Symbol ">") werden zuerst die Werte
verschiedener Parameter geschrieben, die für die Steuerung der neuronalen Netze erforderlich
sind. Danach werden die Trainingsvektoren geschrieben, die ohne weitere Umformung sofort
angelernt werden können. Entsprechendes gilt für die Validationsvektoren, die nach den
Trainingsvektoren geschrieben werden. Das Selektionsprogramm wurde so modifiziert, daß
es auch Daten ausgeben kann, die in den Gesamtansatz [2.1] eingegeben werden können.
Diese Daten werden weder vorbereitet noch selektiert. Da die Ausgabe für "ges.c" am Anfang
von "sehe" geschieht, sollte daher "sei", wenn die Datei "sel.ges" geschrieben worden ist, mit
Ctrl-C abgebrochen werden. In Abhängigkeit davon, welche Summanden des Polynoms [2.1]
benutzt werden sollen, muß die Kontrolldatei entsprechend geändert werden ("sel.ctl").
Die Dateien, die die Standardausgabe des Selektionsprogramms abgefangen haben
("sel.out.std", "sel.out.hw" und "sel.out.nw"), können als Eingabedateien für das Programm