Este repositório é dedicado ao treinamento "Data Science na Prática". Siga os passos abaixo para configurar o ambiente de desenvolvimento local e instalar as dependências utilizadas durante as aulas.
-
Google Colab - Plataforma baseada em nuvem que permite a execução de notebooks Jupyter sem a necessidade de configuração. Crie sua conta no Google Colab
-
VSCode - Editor de código utilizado durante o treinamento. Disponível para Windows, macOS e Linux. Instalação oficial do VSCode
-
Pyenv - Ferramenta para gerenciar múltiplas versões do Python. A versão recomendada do Python para este projeto é a
3.11.3
. Instruções oficiais de instalação do Pyenv -
Poetry - Ferramenta de gerenciamento de dependências em Python. Instruções oficiais de instalação do Poetry
-
Git - Ferramenta de controle de versão distribuído. Instruções oficiais de instalação do Git
-
GitHub - Plataforma de hospedagem de código. É essencial ter uma conta para interagir com os repositórios. Como criar uma conta no GitHub
Aqui está um resumo dos passos que você precisa seguir:
-
Clonar o Repositório Github para a sua máquina local e acessar a pasta
data-science-na-pratica
:git clone https://github.com/carlosfab/data-science-na-pratica.git cd data-science-na-pratica
-
Configurar o Poetry para criar ambientes virtuais dentro do diretório do projeto.
poetry config virtualenvs.in-project true
-
Configurar a versão
3.11.3
do Python com Pyenv:pyenv install 3.11.3 pyenv local 3.11.3
-
Instalar as dependências do projeto:
poetry install
-
Ativar o ambiente virtual.
poetry shell
-
Testando sua instalação
Após seguir os passos de instalação e configuração, execute os testes para garantir que tudo está funcionando como esperado:
task test
Módulo | Descrição | Link |
---|---|---|
1 - Introdução ao Data Sciece | Apresentação do conteúdo do curso, conceitos fundamentais da Ciência de Dados e Data-driven Decisions. | Módulo 1 |
2 - Análise e Exploração de Dados | Aprenda a importar dados, fazer a limpeza e extrair informações relevantes usando a biblioteca pandas . |
Módulo 2 |
3 - Visualização de Dados | Aprenda a criar visualizações informativas e impactantes com matplotlib . |
Módulo 3 |
4 - Data Storytelling | Conte histórias com dados, e aumente o impacto do seu trabalho. | Módulo 4 |
5 - Introdução ao Machine Learning | Aprenda Machine Learning do zero. | Módulo 5 |
6 - Machine Learning Avançado | Aplicações e técnicas avançadas de Machine Learning. | Módulo 6 |
7 - Auto Machine Learning | Ganhe tempo e performance com Auto Machine Learning. | Módulo 7 |
8 - Criando um Projeto do Zero | Construa um projeto real completo, da ideia à solução. | Módulo 8 |
9 - Deploy de Aplicações de Machine Learning | Coloque seu modelo em Produção. | Módulo 9 |
10 - Deep Learning | Aprenda a utilizar ténicas de Deep Learning. | Módulo 10 |
Carlos Melo é Engenheiro de Visão Computacional com formação em Ciências Aeronáuticas pela Academia da Força Aérea e Mestrado em Engenharia Aeroespacial pelo Instituto Tecnológico de Aeronáutica (ITA).
[Rafael Duarte](https://github.com/rafaelnduarte) é Cientista de Dados, Colaborador e especialista em Marketing Analytics no Sigmoidal. Formado em Ciência de Dados, com MBA e Master's em Big Data e Business Intelligence.