Ayman Thomas [email protected]
Matteo De Moor [email protected]
Robbe Van Herpe [email protected]
link https://dep-g30.atlassian.net/jira/software/c/projects/SEP2324G30/boards/2/
zie later
Hier maken we gebruik van webscraping om data te verzamelen zodat we met deze data te werk kunnen gaan.
Voor stap 1 maakt men gebruik van 3 scripts: fetch_stand
, fetch_matches
en fetch_goals
.
Deze Python-script haalt gegevens op van de website Transfermarkt om informatie over voetbalwedstrijden in de Belgische Jupiler Pro League van 1960 tot de huidige datum te extraheren. Het slaat de geëxtraheerde gegevens op in een CSV-bestand met de naam matches.csv
.
- BeautifulSoup4
- requests
- csv
- datetime
Je kunt de vereiste bibliotheken installeren met pip: pip install beautifulsoup4 requests csv datetime
- Kloon of download de repository naar je lokale machine.
- Open een terminal of opdrachtprompt.
- Navigeer naar de map met het script.
- Voer het script uit met Python: python fetch_matches.py
Het script begint gegevens over wedstrijden op te halen van de website transfermarkt en slaat deze op in matches.csv
. Elke rij in het CSV-bestand vertegenwoordigt een voetbalwedstrijd en bevat de volgende kolommen:
Match_ID
: unieke ID per wedstrijdSeizoen
: beginjaar en eindjaar seizoenSpeeldag
: de speeldagDatum
: datum van de wedstrijdTijdstip
: uur van de wedstrijdThuisploeg
: naam van de thuisploegResultaat_Thuisploeg
: score van de thuisploegResultaat_Uitploeg
: score van de uitploegUitploeg
: naam van de uitploeg
Deze Python-script haalt gegevens op van de website Transfermarkt om informatie over de stand in de Belgische Jupiler Pro League van 1960 tot de huidige datum te extraheren. Het slaat de geëxtraheerde gegevens op in een CSV-bestand met de naam stand.csv
.
- BeautifulSoup4
- requests
- csv
- datetime
Je kunt de vereiste bibliotheken installeren met pip: pip install beautifulsoup4 requests csv datetime
- Kloon of download de repository naar je lokale machine.
- Open een terminal of opdrachtprompt.
- Navigeer naar de map met het script.
- Voer het script uit met Python: python fetch_stand.py
Het script begint gegevens over de stand op te halen van de website transfermarkt en slaat deze op in stand.csv
. Elke rij in het CSV-bestand vertegenwoordigt een voetbalwedstrijd en bevat de volgende kolommen:
Seizoen
: beginjaar en eindjaar seizoenSpeeldag
: de speeldagStand
: plaats in standClub
: naam van de clubAantalGespeeld
: aantal matchen gespeeldAantalGewonnen
: aantal matchen gewonnenAantalGelijk
: aantal matchen gelijk gespeeldAantalVerloren
: aantal matchen verlorenDoelpunten
: aantal doelpuntenDoelpuntensaldo
: het doelpunten saldoPunten
: aantal punten
Dit Python-script is ontwikkeld om informatie over doelpunten in Transfermarkt van de Belgische Jupiler Pro League van 2007 tot de huidige datum te extraheren van de website Transfermarkt.com
. Het opgeslagen bestand, goals.csv
, bevat details van elk doelpunt per wedstrijd.
- BeautifulSoup4
- datetime
- requests
- csv
- re
Je kunt de vereiste bibliotheken installeren met pip: pip install beautifulsoup4 requests datetime
- Kloon of download de repository naar je lokale machine.
- Open een terminal of opdrachtprompt.
- Navigeer naar de map met het script.
- Voer het script uit met Python: python fetch_goals.py
Het script verzamelt gegevens over doelpunten van de website Transfermarkt.com
en slaat deze op in goals.csv
. Elke rij in het CSV-bestand vertegenwoordigt een doelpunt in een voetbalwedstrijd en bevat de volgende kolommen:
Match_ID
: unieke ID per wedstrijdSeizoen
: beginjaar en eindjaar seizoenSpeeldag
: de speeldagDatum
: datum van de wedstrijdTijdstip
: uur van de wedstrijdThuisploeg
: naam van de thuisploegUitploeg
: naam van de uitploegNaamScorendePloeg
: naam van de ploeg die scoortGoalTijdstip
: tijdstip goalGoalScorer
: naam van goal scorerStandThuisploeg
: stand van thuisploegStandUitploeg
: stand van uitploeg