-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathdiscussion.tex
23 lines (20 loc) · 3.37 KB
/
discussion.tex
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
\section{Diskussion}
Automatisierte Verfahren zur Bestimmung von Regressionsgleichungen werden eingesetzt, um Modelle zu optimieren oder explorativ neue Modelle zu generieren, wenn viele potentielle Prädikatoren involviert sind.
Im Falle der Optimierung gilt es insbesondere, ein zu stark an die Trainingsdaten angepasstes Modell zu vereinfachen.
Einfachere Modelle sind in der Regel stabiler, was wiederum die Generalisierbarkeit erhöht.
Ziel ist es hierbei, Prädiktoren mit geringer Vorhersagekraft zu eliminieren. Mittels exhaustiver Verfahren können sämtliche Kombinationen von den im Modell enthaltenen Prädiktoren geschätzt werden.
Aus diesem Set meist einfacherer Modelle kann mittels Kreuzvalidierung die durchschnittliche Fehlvorhersage berechnet werden. Im Idealfall wird ein einfacheres Modell gefunden, das die Daten generell besser vorhersagt als das komplexe Modell.
Der Vorteil exhaustiver Verfahren gegenüber den standardmässig eingesetzten schrittweisen Verfahren ist, dass das optimale Modell gefunden wird, insbesondere in Kombination mit der Kreuzvalidierung.
Der erhöhte Rechenaufwand sollte heutzutage nicht mehr ins Gewicht fallen, insbesondere da in der Psychologie meist nur eine Handvoll Prädiktoren ein Modell beschreiben.
Die explorative Anwendung ist verbreiteter und dient dem Schätzen von Modellen ohne klare theoretische Begründung.
Eine Auslese potentieller Prädikatoren sollte möglichst unkorreliert sein, um der Multikolinearität vorzubeugen. Bei genügend grossem Stichprobenumfang und einer mässigen Anzahl an potentiellen Prädiktoren führt auch hier das exhaustive Verfahren gefolgt von einer Kreuzvalidierung zur optimalen und stabilsten Vorhersage. In der psychologischen Forschung ist der Stichprobenumfang oft knapp bemessen. Kann aufgrund des Stichprobenumfangs eine Kreuzvalidierung nicht verlässlich geschätzt werden, kommen schrittweise Verfahren zum Einsatz. Dabei werden Prädikatoren schrittweise hinzugefügt oder eliminiert, bis ein zuvor bestimmtes Kriterium nicht mehr erfüllt werden kann. Das Kriterium besagt weshalb, und wann ein Modell als akzeptabel zu betrachten ist.
Es soll ein Kriterium herbei gezogen werden, welches die Anzahl der Prädiktoren im Modell berücksichtigt um Overfitting entgegen zu wirken.
Akaikes Informationskriterium bietet sich hier als Kriterium der schrittweisen Regression an.
\citeA[p. 57]{harrell2001regression} erwähnte eine ganz generelle Schwierigkeit: ``It allows us to not think about the problem.''.
Moderne leicht zu bedienende Statistikprogramme gepaart mit der Möglichkeit schier grenzenloser Rechenkapazität verführen dazu, nach Effekten zu fischen und \gls{glos:datamining} zu betreiben.
Der Einsatz automatisierter Verfahren zur Bestimmung von Regressionsgleichungen ist umstritten.
Während die einen Autoren dies als ein probates Mittel ansehen, lehnen andere insbesondere die schrittweise Regression ab.
Schrittweise Verfahren halten sich auch heute noch hartnäckig, obschon es keinen Grund gibt, nicht vollumfänglich alle Modelle durchzurechnen.
Die Rechenkapazität sowie die nötige Software ist vorhanden.
Forschende sollten sich vom Gedanken lösen, das Resultat gleich unmittelbar zu bekommen und dem Computer eine Kaffeepause lang die Möglichkeit geben, das optimale Resultat zu finden.
Zu guter Letzt kann man auch hier die Faustregel anwenden, dass das simpelste Verfahren das beste Resultat ergibt.