-
Notifications
You must be signed in to change notification settings - Fork 1
/
Copy pathFacebookMetrics.Rmd
62 lines (41 loc) · 2.69 KB
/
FacebookMetrics.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
---
title: "FacebookMetrics"
author: "Oséias Beu"
date: "27/06/2020"
output: html_document
---
```{r setup, include=FALSE}
knitr::opts_chunk$set(echo = TRUE)
```
## R Markdown
Local de download e entendimento da base: <https://archive.ics.uci.edu/ml/datasets/Facebook+metrics>.
## Exercício proposto:
Monte um script que leia o arquivo, execute a correlação de todas as variáveis numéricas e contrua uma regressão da quantidade de likes "Page total likes" usando as outras variáveis.
Plota o sumário e verifique quais variáveis são significativamente relacionadas (****)
### Leitura do arquivo:
```{r reading file}
library(corrplot)
facebook_data <- read.csv("https://raw.githubusercontent.com/OseiasBeu/Data-Science/master/DataSets/Facebook_metrics/dataset_Facebook.csv", sep=";")
str(facebook_data)
facebook_data_new <- facebook_data[,-2]
```
Note que a única variável não numérica é a type.
### Correlacioando as variáveis:
```{r correlacao1 }
correlacao_facebook <- cor(facebook_data_new)
str(correlacao_facebook)
```
```{r correlacao2 }
corrplot(correlacao_facebook,tl.cex = 0.3, cl.cex = 0.3)
```
```{r montando regressão}
fit <- lm( facebook_data_new$Page.total.likes ~
facebook_data_new$Category + facebook_data_new$Post.Month + facebook_data_new$Post.Weekday + facebook_data_new$Post.Hour + facebook_data_new$Paid + facebook_data_new$Lifetime.Post.Total.Reach + facebook_data_new$Lifetime.Post.Total.Impressions + facebook_data_new$Lifetime.Engaged.Users + facebook_data_new$Lifetime.Post.Consumers + facebook_data_new$Lifetime.Post.Consumptions + facebook_data_new$Lifetime.Post.Impressions.by.people.who.have.liked.your.Page + facebook_data_new$Lifetime.Post.reach.by.people.who.like.your.Page + facebook_data_new$Lifetime.People.who.have.liked.your.Page.and.engaged.with.your.post + facebook_data_new$comment + facebook_data_new$like + facebook_data_new$share + facebook_data_new$Total.Interactions
,data = facebook_data_new)
summary(fit)
```
As variáveis mais significativamente relacionadas são:
* Post Month:
O que faz bastante sentido, pois o maior número de curtidas em alguma postágem sempre acontece no primeiro mês de postagem, nos meses seguintes as pessoas curtem cada vez menos pois a postagem vai ficando mais para baixo de outros posts e então começa a desaparecer.
* People who have liked your Page and engaged with your post:
Também faz muito sentido essa vatiável ser significativamente relacionada com a quantidade de likes, pois certamente terei o maior número de likes de pessoas que estão deretamente conectadas a mim e a meus posts pelo fato de termos os mesmos gostos; por esse mesmo motivo que escolhem curtir minha página ou algo do tipo.