-
Notifications
You must be signed in to change notification settings - Fork 0
/
Zeitplan-MA-Update.txt
108 lines (79 loc) · 3.52 KB
/
Zeitplan-MA-Update.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
Masterarbeit gibt 25 ECTS, 1 ECTS entspricht 30 Std Arbeitszeit
Datum 25.05.12, Abgabe 12.07.
6 Wochen Zeit, 42 Tage.
22 Tage sind hier verplant für coden und grob schreiben
20 Tage wären übrig für schreiben und fertigstellen
EDA (Precip und SST):
Ziel/ Fragestellung (2 Tage):
1. Überblick über die Rohdaten verschaffen (auch um Clustering zu motivieren oder neue
Fragen aufzuwerfen:
TODO:
Info Datensatz: Relevanz der Variable/ was wird gemessen/ wie wird gemessen/ welcher Zeitraum
Unsicherheiten der Daten
Outlier detection schon hier, oder erst in Modelling/STL part
Definiere local/ global scaling in glyph plots
Glyph plots für SST
DONE:
regionale Unterschiede in mean und var
zeitl Unterschiede in mean und var (für jeden Monat)
verschiedene Trends untersuchen
eventuell stl()
Visualisierung der Daten/Untersuchen räumlicher und zeitlicher Unterschiede:
Alle Zeitreihen Überblick/Mittelwerte/SD der Zeitreihen räumlich geplotted, Mean
und SD für die jeweiligen Monate
Backlog:
Perioden mit hohem/niedrigem Niederschlag finden(v.a Dürren)
betrachten aktuell nur Nierderschlag ohne Dürreindex
Clustering Precip DONE:
Ziel/ Fragestellung:
1. Kann man das Amazonasbecken hinsichtlich Niederschlagsverläufen
in eine Handvoll in sich homogener, untereinander heterogener Teilbereiche zerlegen
2. Sind die resultierenden Cluster stabil ggü der gewählten Methoden?
DONE:
Motivation
Mathematische Grundlage
Hauptfaktorenanalyse vs ohne Hauptfaktorenanalyse
kmeans clustering
pam clustering
Backlog:
hierarchical clustering?
take into account temporal dependencies?
take into account spatial dependencies?
STL Algorithmus (2 Tage)
Regressionsmodelle (18 Tage):
Ziel/ Fragestellung:
1. Können wir den Niederschlag im Amazonasbecken anhand von SST mit einem (regularisierten)
linearen Modell vorhersagen?
2. Wie lassen sich CV-Methoden für Zeitreihen für unseren Case anwenden?
3. Das lineare Modell gibt uns für jeden gridpoint im Meer einen Koeffizientenwert, wie sind
diese Koeffizientenwerte räumlich aufgeteilt (z.B hohe positive Werte im Atlantik, etc)
4. Wie unterscheiden sich diese Aufteilungen in verschiedenen Modellen/CV-methoden/Folds
5. Sind die Ergebnisse über verschiedene Folds hinweg einer CV stabil?
Mathematische Formulierung, Precip = f(SST) (3 Tage)
Verschiedene Timelags (miteinbauen in Funktionen)
weitere Variablen (welcher Monat, rolling mean etc) einbauen?
LASSO (3 Tage + Experimente)
mathematische Formulierung schreiben (3 Tage)
Experimente laufen lassen
Entscheiden über Parameter (Zeitlags considered etc)
Fused LASSO (5 Tage + Experimente)
mathematische Formulierung (5 Tage)
Experimente laufen lassen
Cross Validation (3 Tage schreiben + Experimente)
CV für Zeitreihen, klassische CV für Zeitreihen mit Stationarität?
verschiedene CV Methoden ausprobieren und vergleichen:
classic CV?
Blocked CV
overlapped CV (evtl)
Experimente laufen lassen/ Vergleichen der Modelle (7 Tage):
Für jedes Modell mittels CV beste Regularisierung finden
und anschließend auf Testset evaluieren und vergleichen.
Wenn wir 3 Timelags ausprobieren (0, 3, 6) Monate, und 2 CV Methoden,
dann sind wir bei 6 Modellen die miteinander verglichen werden müssen.
DONE:
LASSO imlementierung
FUSED LASSO implementierung
CV, Blocked CV implmentierung
Backlog:
Precipitation in Dürreindex umrechnen? Wenn ja, Dürreindex beschreiben, eventuell EDA anpassen