68
Teil C - Anhang zur Untersuchung der Schutzgüter
Statistische Modelle unterliegen einer steten Weiter- und Neuentwicklung, die dazu führen
kann, dass neue oder weiterentwickelte Methoden ähnlich effizient und adäquat sind, die ge
gebenen Fragestellungen zu beantworten, wie die hier Beschriebenen. Insofern ist diese Me
thode als Basis zu verstehen, die gegebenenfalls erweitert werden kann, um rezente Entwick
lungen zu berücksichtigen.
Für die Durchführung der Modellierungen, ist eine umfangreiche Datensichtung (,data explo-
ration 1 , beschrieben in Zuur et al. 2010) und Modellvalidierung (Wood et al. 2006, Zuur et al.
2009, 2010, 2012a,b) durchzuführen, um zu überprüfen, ob die Modellannahmen über die
Grundverteilung der Daten und Zusammenhänge durch die residuale Varianzverteilung ge
stützt werden. In der Modellvalidierung werden die Punkte Ausreißer, Flomogenität der Vari
anz, Normalverteilung der Residuen, starker Anteil von Nullwerten (Zero-Inflation), korrelierte
predictor Variablen, Interaktionen und die Vermutung der Unabhängigkeit der Daten überprüft
(Zuur et al. 2010). Die Modellvalidierung führt zu geeigneten Modellen, die die Daten korrekt
beschreiben. Eine Vorabfestlegung auf GAMM oder GLMM ist nicht sinnvoll. Gemischte
Modelle, sind hingegen zwingend notwendig, da die Fragestellung an sich einfach ist: Wie
reagieren Schweinswale (response) auf die Rammung von Fundamenten (predictor). Dieser
Prozess wird jedoch durch saisonale und geografische Verteilung der Schweinswale und
Messgeräteunterschiede beeinflusst, die idealerweise im Modell durch Zufallseffekte (random
effects) zu berücksichtigen sind. Innerhalb der Modellvalidierung müssen auch räumliche und
zeitliche Autokorrelationseffekte berücksichtigt werden. Zeitliche Autokorrelation kann
beispielsweise in „mgcv“ durch die Einführung einer Autokorrelationsstruktur berücksichtigt
werden; eine räumliche Autokorrelation sollte durch Variogramme überprüft werden (Zuur
et al. 2010).
Um eine möglichst hohe zeitliche Auflösung der Schweinswalaktivität in Relation zu den
Rammereignissen (Stunden mit Rammereignissen = Stunde „0“) zu erhalten, werden zur Aus
wertung die schweinswalpositiven Minuten pro Stunde (DPM hr 1 ), oder alternativ die schweins
walpositiven 10 Minuten pro Stunde (DP10M hr 1 ) als response herangezogen. Die Auswirkun
gen der Rammungen lassen sich durch den Einfluss von predictor Variablen, sowohl räumlich
(z. B. Entfernung zur Rammstelle), als auch zeitlich (z. B. Stunde relativ zum Rammereignis)
beschreiben. Das Zusammenwirken räumlicher und zeitlicher Effekte ist komplex und lässt
sich z. B. durch das Einfügen eines Interaktionsterms (predictor Raum x predictor Zeit oder
als Tensorprodukt) charakterisieren. Darüber hinaus können zeitliche Parameter (Tageszeit,
Monat, Jahr), und je nach Datenlage weitere, z. B. Parameter, die das Rammereignis näher
charakterisieren (z. B. Dauer, durchschnittlich eingesetzte Energie kJ hr 1 , gemessene Schal
limmission am Ort der C-POD-Messung) in das Modell einfließen. Die aus den Modellierungen
gewonnenen p-Werte sind nicht mit traditioneller Statistik gleichzusetzen, weshalb p-Werte,
die nahe des alpha-levels von 5 % liegen, kritisch hinterfragt werden müssen. Die Evaluation
erfolgt über in der Regel über eine ANOVA oder einen log-likelihood Test.
Bei Vorliegen der Kalibrierungsdaten in einer auswertbaren Form sollten diese bevorzugt in
das Modell eingebunden werden (s. auch Wahl et al. 2013). Die Einbindung der POD-ID als
random factor kann unter bestimmten Voraussetzungen (schneller Wechsel der Messgeräte
und homogene Nutzung eines möglichst kleinen Gerätepools über die Vorhabensstationen) zu
einer Verbesserung der Modellergebnisse führen. Sie ist aber keine gerätespezifische Eigen
schaft und kann deshalb starken Einflüssen der saisonalen und geografischen Verteilung von
Schweinswalen unterliegen: Sie stellt dementsprechend eine Sammelfaktor dar. Die Fehler
verteilung ist von der Datensichtung und Modellvalidierung abhängig. Als potentiell geeignete
Verteilungen kommen Poisson, Binominial und negative Binominial Verteilungen, deren Deri
vate zur Kompensierung von Overdispersion (Quasi-), sowie nullbeeinflusste Verteilungen
(Zero Inflated oder Altered Binomial (ZIB, ZAB), Zero Inflated oder Altered Poisson (ZIP, ZAP)
und Zero Inflated oder Altered Negative Binomial (ZINB, ZANB)) in Frage.