-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathLoesung_Hausaufgabe_2024-12-17.qmd
75 lines (52 loc) · 2.54 KB
/
Loesung_Hausaufgabe_2024-12-17.qmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
---
title: "Hausaufgabe vom 17.12.2024"
format: html
embed-resources: true
editor: visual
---
### **Aufgabe 1**
Berechnen Sie für die Probanden den BMI. Unterscheidet sich der Mittelwert des BMI zwischen den Männern und den Frauen? Ist der Unterschied statistisch signifikant?
```{r}
library(tidyverse)
read_csv("data_on_git/nhanes.csv") %>% #Die Daten aufrufen
filter(age >= 20, age <= 29) %>%
filter(!is.na (weight), !is.na(height)) %>%
mutate(bmi = weight/(height/100)^2) -> tbl
t.test(bmi ~ gender, tbl)
#Die Mittelwerte der jeweiligen Geschlechter werden automatisch von der 't.test()'-Funktion ausgegeben
```
### **Aufgabe 2**
Unterscheidet sich der BMI zwischen den Ethnien? Führen Sie eine Two-way-ANOVA durch für BMI gegen die Faktoren Geschlecht und Ethnie.
```{r}
anova(lm(bmi~ethnicity, tbl))
```
### **Aufgabe 3**
Ermitteln Sie die Anzahl übergewichtiger Frauen und übergewichtiger Männer unter den Probanden. Ein Proband zählt als übergewichtig, wenn der BMI 25 überschreitet. Bestimmen Sie den (prozentualen) Anteil der Übergewichtigen an allen Frauen bzw. Männern. Führen Sie einen statistischen test durch, um zu sehen, ob der Anteil signifikant ist.
```{r}
tbl %>%
mutate( overweight = bmi > 25) %>%
group_by( gender ) %>%
summarise( n_overweight = sum(overweight), n = n()) %>%
mutate( percent_overweight = n_overweight / (n*100))
#Fisher-Test durchführen, dafür erstellen wir ein Vier-Felder-Tafel
tbl %>%
mutate( overweight = bmi > 25) %>%
group_by( gender ) %>%
summarise( n_overweight = sum(overweight), not_overweight = n() - sum(!overweight))%>%
column_to_rownames("gender") %>% #Die Spalte "Gender" als Zeilennamen umgewandelt
fisher.test()
#Aus vorherigen Code haben wir die benötigten Werte ausgerechnet, nun erstellen wir einen Vier-Felder-Tafel
rbind(c(245,153), c(223,148)) %>% fisher.test
```
### **Aufgabe 4**
In Aufgabe 1 haben wir den Mittelwert des BMI zwischen den Geschlechtern verglichen, in Aufgabe 3 hingegen den Anteil der Probanden, deren BMI einen vorgegeben Wert überschreitet. Vergleichen Sie die beiden Vorgehensweisen hinsichtlich ihrer Eignung, die Frage zu beantworten, welches Geschlecht mehr von der Adipositas-Epidemie betroffen ist. (Schreiben Sie dazu ein paar Sätze.)
```{r}
```
### **Aufgabe 5**
Visualisieren Sie die Daten, die Sie in Aufgabe 2 untersucht haben, in geeigneter Weise.
```{r}
tbl %>%
ggplot() + geom_histogram( aes (x = bmi, y = after_stat(density)), bins = 14) +
facet_grid(rows = vars (gender), cols = vars(ethnicity)) +
geom_vline(xintercept = 25)
```