Update: Esse projeto foi um dos 10 escolhidos para ganhar uma bolsa de 100% para o Bootcamp Data Science Aplicada da Alura! Muito feliz com a oportunidade!
Olá! Neste projeto realizei uma Análise Exploratória de Dados sobre duas bases de dados disponibilizadas pela Alura para a Imersão de Dados 3. Esses datasets contém informações sobre a área de descoberta de novas drogas. Em uma das base de dados temos os experimentos realizados e na outra encontramos os resultados desses experimentos. Foram extraídos diversos insights e conclusões desses dados, nos possibilitando obter um modelo de Machine Learning para responder à seguinte pergunta:
Dados os dados (🎲 os 🎲) dos experimentos, será que conseguimos descobrir se no tratamento foi utilizada uma ou duas doses da droga?
Veremos que sim! ✅
Foi utilizado o Google Colab para a realização do projeto na linguagem Python, com os dados sendo carregados utilizando um link direto para o GitHub onde eles se encontram.
Nos vemos então com as seguintes seções no nosso projeto:
1 Introdução: O que é a Imersão de Dados 3 da Alura? O que é a descoberta de drogas? Como foi feito esse projeto?
2 Análise Exploratória dos Dados: Quais bibliotecas foram utilizadas? De onde vieram os dados? Quais as variáveis desse problema e como elas estão estruturadas?
3 Machine Learning: Qual o problema em questão? Qual modelo foi utilizado e por quê? Ele funcionou bem?
4 Conclusões: O que aprendemos sobre esses dados após a análise?
Todo o trabalho foi feito individualmente e todo o material é inédito, com inspiração e estudos fornecidos pelas 5 aulas que tivemos durante a semana da Imersão de Dados 3.
🖱️ Links úteis encontram-se ao final do notebook presente neste repositório.
Agradecimentos à Alura por ter proporcionado essa semana de aprendizado sobre Ciência de Dados e aos excelentes instrutores Thiago G. Santos, Vanessa Leiko e Guilherme Silveira, que nos acompanharam durante essa dias.
A imagem do banner pode ser encontrada aqui.