Pour ce projet il faudra estimer les ventes totales d’un jeu vidéo à l’aide d’informations descriptives comme: ● Le pays d’origine ● Le studio l’ayant développé ● L’éditeur l’ayant publié ● La description du jeu ● La plateforme sur laquelle le jeu est sortie ● Le genre
La difficulté du projet est que les données fournies ne contiennent que les ventes totales du jeu, le studio, le pays et l’éditeur. Le reste des données devra être scrappé sur des sites tels que Metacritic ou jeuxvideo.com. De plus, une étude d’analyse de sentiments pourra être effectuée afin de quantifier l’engouement généré par un jeu avant la sortie afin d’en prédire les ventes.
Attention, il y a énormément de scraping à faire, et il ne faudra pas avoir peur d’écrire des codes très techniques, de fouiller dans des documentations et d’apprendre à utiliser des librairies qui ne font pas partie de la formation.
Ressources à consulter :
- Données :
- Le dataset fourni est consultable au lien suivant: https://www.kaggle.com/gregorut/videogamesales
- Les autres descripteurs devront être récupérées via du web scraping à l’aide de la libraire BeautifulSoup (par exemple).
Conditions de validation du projet :
- un rapport d’exploration, de data visualisation et de pre-processing des données ;
- un rapport de modélisation ;
- un rapport final et le code associé.