forked from Matimath/ProgramowanieWizualizacja2017
-
Notifications
You must be signed in to change notification settings - Fork 0
/
Lab02.Rmd
118 lines (88 loc) · 2.41 KB
/
Lab02.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
---
title: "Laboratorium 2"
author: "Tutaj wpisz swoje dane"
date: "13/10/2017"
output: html_document
---
```{r setup, include=FALSE}
knitr::opts_chunk$set(echo = TRUE)
```
## Do zrobienia
```{r eval=FALSE}
install.packages("PogromcyDanych")
library(PogromcyDanych)
```
Poniższe operacje wykonaj na bazie zbioru danych auta2012 z pakietu PogromcyDanych.
```{r}
auta <- auta2012
```
* Która Marka występuje najczęściej w zbiorze danych auta2012?
```{r}
auta %>%
group_by(Marka) %>%
summarise(Ilosc=n())
```
* Spośród aut marki Toyota, który model występuje najczęściej.
```{r}
auta %>%
filter(Marka == "Toyota") %>%
group_by(Model) %>%
summarise(ilosc = n()) %>%
arrange(desc(ilosc)) %>%
head(1)
#as.data.frame() -> tt
#cat("Ta marka to:", as.character(tt[1,1]))
```
* Sprawdź ile jest aut z silnikiem diesla wyprodukowanych w 2007 roku?
```{r}
auta %>%
filter(Rodzaj.paliwa == "olej napedowy (diesel)", Rok.produkcji == 2007) %>%
nrow()
```
* Jakiego koloru auta mają najmniejszy medianowy przebieg?
```{r}
auta %>%
group_by(Kolor) %>%
summarise(Przebieg.mediana=median(Przebieg.w.km, na.rm=TRUE)) %>%
arrange(Przebieg.mediana) %>%
head(1) #%>%
#select(-Przebieg.mediana)
```
* Gdy ograniczyć się tylko do aut wyprodukowanych w 2007, która Marka występuje najczęściej w zbiorze danych auta2012?
```{r}
auta %>%
filter(Rok.produkcji == 2007) %>%
group_by(Marka) %>%
summarise(ilosc=n()) %>%
arrange(desc(ilosc)) %>%
head(1)
```
* Spośród aut marki Toyota, który model najbardziej stracił na cenie pomiędzy rokiem produkcji 2007 a 2008.
```{r}
#install.packages("tidyr")
#library("tidyr")
auta %>%
filter(Marka == "Toyota", Rok.produkcji %in% c(2007,2008)) %>%
group_by(Model, Rok.produkcji) %>%
select(Cena.w.PLN,Model,Rok.produkcji) %>%
summarise(srednia.cena=mean(Cena.w.PLN)) %>%
spread(Rok.produkcji,srednia.cena) %>%
summarise(roznica=`2007`-`2008`) %>%
arrange(desc(roznica)) %>%
head(1)
```
* Spośród aut z silnikiem diesla wyprodukowanych w 2007 roku która marka jest najdroższa?
```{r}
auta %>%
filter(Rodzaj.paliwa == "olej napedowy (diesel)", Rok.produkcji == 2007) %>%
group_by(Marka) %>%
summarise(srednia.cena=mean(Cena.w.PLN)) %>%
arrange(desc(srednia.cena)) %>%
head(1)
```
* Ile jest aut z klimatyzacją?
```{r}
auta %>%
filter(grepl(pattern="klimatyzacja",.$Wyposazenie.dodatkowe)) %>%
summarise(ilosc=n())
```