Implementação feita durante o trabalho de conclusão do curso de Bacharelado em Sistemas de Informação, entitulado: Processo de Mineração Textual para Reconhecimento de Mensagens com Tendência a Discurso de Ódio no Twitter. O objetivo do trabalho foi propor, implementar e avaliar um processo capaz de extrair dados do Twitter e identificar as mensagens que tendem a discurso de ódio utilizando as etapas da Mineração de Texto.
A implementação compreende:
- Desenvolvimento de um extrator e pré-processador para os dados do Twitter;
- Desenvolvimento de um módulo para classificação de tweets;
- Códigos auxiliares.
Ao executar os scripts do projeto, tenha atenção para a estrutura de pastas onde pretende salvar ou carregar os arquivos.
Mais informações podem ser encontradas na monografia.
- [A Natural Language Toolkit - NTLK v3.2.2][http://www.nltk.org/]
- [Biblioteca Twitter (Python Twitter Tools) v1.17.1][https://pypi.python.org/pypi/twitter]
- [Scikit-learn ou sklearn v0.17.1 ][http://scikit-learn.org/stable/]