Skip to content

Latest commit

 

History

History
185 lines (132 loc) · 5.46 KB

README.md

File metadata and controls

185 lines (132 loc) · 5.46 KB

logo reprograma

Tema da Aula

Turma Online On35 | Semana 12 | 2024 | Professora Daviny Letícia

Instruções

Antes de começar, vamos organizar nosso setup.

  • Fork esse repositório
  • Clone o fork na sua máquina (Para isso basta abrir o seu terminal e digitar git clone url-do-seu-repositorio-forkado)
  • Entre na pasta do seu repositório (Para isso basta abrir o seu terminal e digitar cd nome-do-seu-repositorio-forkado)
  • [Add outras intrucoes caso necessario]

Resumo

O que veremos na aula de hoje?

Apostila: Análise de Dados com Pandas e NumPy

1. Pensamento Analítico

O que é Pensamento Analítico?

Pensamento analítico é a habilidade de decompor problemas complexos em partes menores e manejáveis. Na análise de dados, isso significa identificar as perguntas certas que precisamos responder e entender como os dados podem ajudar a resolver essas questões.

Exemplo Prático:

Imagine que você trabalha no setor de vendas de uma empresa e quer entender quais produtos são mais populares em diferentes regiões. O primeiro passo é identificar as variáveis (produto, região, quantidade vendida) e como elas se relacionam.


2. Visualização de Dados

Introdução

A visualização de dados é uma ferramenta poderosa para comunicar informações de maneira clara e impactante. Utilizaremos bibliotecas como Matplotlib e Seaborn para criar visualizações.

Exemplo Prático:

Vamos criar um DataFrame com dados fictícios de vendas:

import pandas as pd

# Criando o DataFrame
dados_vendas = {
    'Produto': ['Produto A', 'Produto B', 'Produto C', 'Produto A', 'Produto B'],
    'Região': ['Norte', 'Sul', 'Norte', 'Sul', 'Norte'],
    'Quantidade': [150, 200, 300, 120, 100],
    'Receita': [4500, 6000, 9000, 3600, 3000]
}

df_vendas = pd.DataFrame(dados_vendas)
print(df_vendas)

Saída esperada:

Produto Região Quantidade Receita
Produto A Norte 150 4500
Produto B Sul 200 6000
Produto C Norte 300 9000
Produto A Sul 120 3600
Produto B Norte 100 3000

Agora, vamos visualizar esses dados:

import matplotlib.pyplot as plt
import seaborn as sns

# Gráfico de dispersão para Quantidade vs Receita
sns.scatterplot(x='Quantidade', y='Receita', data=df_vendas)
plt.title('Quantidade vs Receita por Produto')
plt.show()

3. Pandas: Consultas e Filtros

Introdução

Com o Pandas, podemos realizar consultas e filtros para extrair informações específicas dos nossos dados.

Exemplo Prático:

Vamos filtrar o DataFrame df_vendas para mostrar apenas as vendas do "Produto A":

filtro_produto_a = df_vendas[df_vendas['Produto'] == 'Produto A']
print(filtro_produto_a)

Saída esperada:

Produto Região Quantidade Receita
Produto A Norte 150 4500
Produto A Sul 120 3600

4. Pandas: Agrupamento / Agregação

Introdução

O agrupamento e a agregação nos permitem resumir e calcular estatísticas sobre os nossos dados.

Exemplo Prático:

Vamos agrupar os dados por Produto e calcular a média de Quantidade e Receita:

agrupado = df_vendas.groupby('Produto').mean()
print(agrupado)

Saída esperada:

Produto Quantidade Receita
Produto A 135.0 4050.0
Produto B 150.0 4500.0
Produto C 300.0 9000.0

5. Pandas: Gerando Gráficos

Introdução

Além das funções de visualização do Matplotlib e Seaborn, o Pandas também permite criar gráficos diretamente dos DataFrames.

Exemplo Prático:

Vamos criar um gráfico de barras para a média de Receita por Produto:

agrupado['Receita'].plot(kind='bar')
plt.title('Média de Receita por Produto')
plt.ylabel('Receita Média')
plt.show()

6. Pandas: Juntando forças com o pacote NumPy

Introdução

NumPy é uma biblioteca poderosa para operações numéricas. Podemos combinar o uso de Pandas com NumPy para realizar cálculos mais avançados.

Exemplo Prático:

Vamos calcular a raiz quadrada da Receita utilizando o NumPy:

import numpy as np

df_vendas['Raiz_Receita'] = np.sqrt(df_vendas['Receita'])
print(df_vendas)

Saída esperada:

Produto Região Quantidade Receita Raiz_Receita
Produto A Norte 150 4500 67.08
Produto B Sul 200 6000 77.46
Produto C Norte 300 9000 94.87
Produto A Sul 120 3600 60.00
Produto B Norte 100 3000 54.77

Exercícios

Material da aula

Links Úteis

Desenvolvido com 💜