Este proyecto se enfoca en el análisis de restaurantes en Madrid utilizando datos obtenidos a través de web scraping en TripAdvisor. La estructura del repositorio se divide en varias partes, cada una abordando un aspecto diferente del proceso de análisis de datos.
proyecto1_scrappeo_tripadvisor.ipynb: Código para realizar web scraping de datos de restaurantes en TripAdvisor.
precio_medio_dietas.ipynb: Tratamiento y limpieza de los datos, enfocado en el precio medio de las dietas de los restaurantes.
proyecto1_lectura_datos_graficas.ipynb: Contiene todas las visualizaciones de datos, gráficas importantes y mapas que muestran la distribución de los restaurantes en Madrid.
Ejemplos de Visualización de Datos Las visualizaciones se realizaron utilizando Seaborn, Matplotlib y Folium. Algunos ejemplos de visualizaciones incluyen:
Franquicias en Madrid (imagen) Restaurantes por municipio (imagen) Cloropeth de cantidad de restaurantes por municipio de Madrid (imagen) Gráficas para los municipios de Madrid (imagen)
A través del web scraping de reseñas de TripAdvisor, se extrajeron datos clave para realizar un análisis detallado de los restaurantes en Madrid. Algunas conclusiones interesantes incluyen:
Análisis de Calificaciones: Comparación de calificaciones promedio entre diferentes restaurantes. Análisis de Comentarios: Extracción de palabras clave y temas de los comentarios para entender preferencias y preocupaciones de los clientes. Popularidad y Frecuencia: Evaluación de la popularidad de los restaurantes basada en frecuencia de menciones y reseñas. Comparación de Categorías: Análisis de la distribución de calificaciones y comentarios en diferentes aspectos como comida, servicio y ambiente. Ubicación y Opiniones Geoespaciales: Análisis de la satisfacción del cliente en diferentes ubicaciones geográficas.
Las contribuciones son bienvenidas y valoradas. Si tienes sugerencias, mejoras o encuentras problemas, no dudes en abrir un issue o enviar un pull request.