-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathZeitplan-MA.txt
126 lines (70 loc) · 3.68 KB
/
Zeitplan-MA.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
Masterarbeit gibt 25 ECTS, 1 ECTS entspricht 30 Std Arbeitszeit
ab 19.01. bis 12.07 25 Wochen Zeit.
25 ECTS in 25 Wochen -> 1 ECTS pro Woche -> 30 Std Arbeitszeit pro Woche. pro Tag 6 Stunden
Einplanen: Urlaub, konservativ planen, etc.
Im letzten Monat nur noch schreiben -> bis 12.06 code fertig.
Datum: 24.05.12
19.01 bis 16.02. (4 Wochen, 28 Tage, 20 AT, 18 Tage geplant, 2 Tage puffer)
"Organisatorisch": Grundgerüst Rmarkdown Thesis (2 Tage), Repo sauber (2 Tage). DONE
Intro am Ende schreiben aber Ideen sammeln und Einführung in das Problem fertig "schreiben"
Related Work/ Ciemer Zusammenfassung (siehe Exposé) (2 Tage)
EDA (Precip und SST) (5 Tage): DONE
Ziel/ Fragestellung:
1. Überblick über die Rohdaten verschaffen (auch um Clustering zu motivieren oder neue
Fragen aufzuwerfen:
regionale Unterschiede in mean und var
zeitl Unterschiede in mean und var (für jeden Monat)
verschiedene Trends untersuchen
eventuell stl()
Perioden mit hohem/niedrigem Niederschlag finden(v.a Dürren)
Info Datensatz: Relevanz der Variable/ was wird gemessen/ wie wird gemessen/ welcher Zeitraum
Unsicherheiten der Daten
Visualisierung der Daten/Untersuchen räumlicher und zeitlicher Unterschiede:
Alle Zeitreihen Überblick/Mittelwerte/SD der Zeitreihen räumlich geplotted, Mean
und SD für die jeweiligen Monate
Clustering Precip (7 Tage):
Ziel/ Fragestellung:
1. Kann man das Amazonasbecken hinsichtlich Niederschlagsverläufen
in eine Handvoll in sich homogener, untereinander heterogener Teilbereiche zerlegen
2. Sind die resultierenden Cluster stabil ggü der gewählten Methoden?
Motivation
Mathematische Grundlage
Normalisieren vs nicht Normalisieren
Hauptfaktorenanalyse vs ohne Hauptfaktorenanalyse
kmeans clustering
pam clustering
hierarchical clustering?
take into account temporal dependencies?
take into account spatial dependencies?
18.02. bis 22.04 (9 Wochen, 63 Tage, 45 AT, 37 Tage geplant, 8 Tage Puffer)
Regressionsmodelle (27 Tage + 3 Tage Puffer = 30 Arbeitstage):
Ziel/ Fragestellung:
1. Können wir den Niederschlag im Amazonasbecken anhand von SST mit einem (regularisierten)
linearen Modell vorhersagen?
2. Wie lassen sich CV-Methoden für Zeitreihen für unseren Case anwenden?
3. Das lineare Modell gibt uns für jeden gridpoint im Meer einen Koeffizientenwert, wie sind
diese Koeffizientenwerte räumlich aufgeteilt (z.B hohe positive Werte im Atlantik, etc)
4. Wie unterscheiden sich diese Aufteilungen in verschiedenen Modellen/CV-methoden/Folds
5. Sind die Ergebnisse über verschiedene Folds hinweg einer CV stabil?
Mathematische Formulierung, Precip = f(SST) (3 Tage)
Precipitation in Dürreindex umrechnen? Wenn ja, Dürreindex beschreiben, eventuell EDA anpassen
Verschiedene Timelags (miteinbauen in Funktionen)
weitere Variablen (welcher Monat, rolling mean etc) einbauen?
LASSO (7 Tage)
mathematische Formulierung (2 Tage)
implementieren/ coden (5 Tage)
Fused LASSO (12 Tage)
mathematische Formulierung (3 Tage)
implementieren/ coden (9 Tage)
Cross Validation (11 Tage)
CV für Zeitreihen, klassische CV für Zeitreihen mit Stationarität?
verschiedene CV Methoden ausprobieren und vergleichen:
classic CV?
Blocked CV
overlapped CV (evtl)
Vergleichen der Modelle (7 Tage):
Für jedes Modell mittels CV beste Regularisierung finden
und anschließend auf Testset evaluieren und vergleichen.
Wenn wir 3 Timelags ausprobieren (0, 3, 6) Monate, und 2 CV Methoden,
dann sind wir bei 6 Modellen die miteinander verglichen werden müssen.
22.04 bis 12.06 noch nicht geplant (wird aber bestimmt gebraucht)