Este projeto realiza o web scraping de dados dos jogos da MLS. O objetivo é extrair informações como data, horário, estádio, times e resultado de partidas para posterior análise.
O script de web scraping foi desenvolvido em Python utilizando bibliotecas como BeautifulSoup
e requests
. A ideia principal é acessar páginas da web com informações sobre os jogos e coletar os dados automaticamente.
Os dados extraídos podem ser usados para diversas finalidades, como:
- Análises estatísticas dos times;
- Previsões de resultados;
- Geração de insights sobre a performance dos clubes ao longo da temporada.
- Linguagem: Python
- Bibliotecas:
requests
: Para realizar requisições HTTP e obter o conteúdo das páginas.BeautifulSoup
: Para fazer o parsing do HTML e facilitar a extração dos dados.pandas
: Para organizar e manipular os dados coletados.
-
Clone o repositório:
git clone https://github.com/eduardopfbp/MLS-PlayerStats
-
Crie um ambiente virtual e instale as dependências:
python -m venv venv source venv/bin/activate # Linux ou MacOS venv\Scripts\activate # Windows pip install -r requirements.txt
-
Certifique-se de que as dependências estão instaladas.
-
Execute o script principal para coletar os dados:
python main.py
-
Os dados extraídos serão salvos em um arquivo
.csv
para análises futuras.
MLS-PlayerStats/
│
├── database.csv # Database principal (.csv)
├── database_temp.csv # Database temporário (.csv)
├── links.csv # Database com link dos jogos (.csv)
├── analise.ipynb # Jupyter Notebooks para análises exploratórias
├── main.py # Script principal de web scraping
├── extrator_link.ipynb # Extrator do link
├── transformaador.ipynb # Concatenação dos novos dados
├── ml.ipynb # Machine Learning (em construção)
├── requirements.txt # Arquivo de dependências do Python
└── README.md # Documentação do projeto