Group Project for Data to Dollar Course @ HSG
Enthält das working paper für die Auswahl des Language Models.
Enthält nicht mehr gebrauchte Daten. Zur Vollständigkeit belassen wir sie.
Enthält unsere Daten und die Zwischenschritte zur Erlangung der Daten.
final_all_data_cleaned_with_categories_with_quartiles.xlsx ist der finale Datensatz.
Die Pythonskripts, welche aus den Datensätzen mithilfe des Language Models die jeweiligen Keywords extrahiert.
Diese Skripte gehören zum Scraping. Sie extrahieren aus den html Dateien die Links zu den einzelnen Events.
Die Plots, welche in Pyhton erstellt wurden + das jupyter notebook.
Die eigentlichen Scraper für die jeweilige website.