Este projeto realiza a clusterização de sellers do Mercado Livre com base em dados da API, identificando grupos com perfis semelhantes.
- Identificar grupos de sellers com perfis semelhantes usando dados da API do Mercado Livre.
- Coleta dados de categorias, subcategorias e itens usando a API do Mercado Livre.
- As funções
buscar_itens_categoria
ebuscar_itens_categorias
realizam a coleta de dados com tratamento de erros e paralelização.
- Limpeza de dados: tratamento de valores nulos, remoção de colunas irrelevantes e tratamento de outliers.
- Transformação de variáveis: criação de novas colunas (desconto, marca própria, loja oficial, etc.) e transformação de variáveis categóricas em numéricas.
- Agregação de dados por seller e categoria, cálculo de preço médio ponderado e desconto ponderado.
- Utilização do algoritmo K-Means para clusterização dos sellers.
- Seleção do número ideal de clusters usando o método do cotovelo (elbow method).
- Análise das características de cada cluster (preço médio, desconto, frete grátis, fulfillment, etc.).
- Interpretação dos perfis dos sellers em cada cluster.
-
Instale as dependências:
pip install requests pandas scikit-learn matplotlib
-
Execute o notebook Jupyter:
jupyter notebook projeto_meli.ipynb
Contribuições são bem-vindas! Sinta-se à vontade para abrir issues e pull requests.
Este projeto está licenciado sob a Licença MIT.