Projeto 1 de Ciência dos Dados. Classificador Naive-Bayes para tweets.
- Letícia Coêlho Barbosa
- Matheus Silva Melo de Oliveira
Que o universo Star Wars é um febre todos nós sabemos, o que falar então a respeito da série ,do mesmo universo, recém lancada do Disney Plus "The Mandalorian"?
Com o intuito de descobrir o quanto a série está agradando ou não os internautas de plantão e possíveis consumidores da série, analisaremos os comentários realizados a seu respeito na rede social Twitter.
O critério utilizado para considerar a relevância de um tweet foi caso o mesmo remetesse algum laço de intensidade em relação à série, positivo ou não, como elogiando algum capítulo, sentindo saudade da série ou criticando algum aspecto relevante à obra. Tweets que falavam apenas de aspectos tangentes à esse certame, como elogios ou comentários a atores da obra, listagens no qual à série se enquadra e vagas menções sobre a série foram consideradas como irrelevantes nessa classificação.
Para o funcionamento adequado será necessária a instalação das seguintes bibliotecas, caso não as possua:
- seaborn
- sklearn
- nltk
- emoji
- pysinonimos
-Naive Bayes and Text Classification
-A practical explanation of a Naive Bayes Classifier
- Projeto Concluído