Skip to content

tessajo/PodcastNLP

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

81 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

PodcastNLP

Podcast Analyse Tool zur NLP Untersuchung von deutschsprachigen Corona Podcasts.

TODOS

  • Entwicklungsumgebung schaffen
  • Datenerfassung
    • automatisierter Download von MP3 und Transkript
    • BUG : NDR nur 39 pdfs
  • Datenaufbereitung
    • Ordnung
    • Unicode / ASCII Problem
    • Annotation (?)
  • Auswertung
    • Wordcount per Person
    • Sentimentanalyse
      • TextBlob-de Standard
      • eigenes Wörterbuch
    • Wortartvergleich
  • Visualisierung

0 Setup

Es wird Python >= 3.9 benötigt. Mit pip install -r requirements.txt werden die nötigen Module installiert.

1. Datensammlung

Mit python dataTools.py können bei bestehender Internetverbindung die Podcast-Transkripte von MDR und NDR heruntergeladen werden.

2. Datenauswertung

3. Fazit

About

Corona Podcast Analyse Tool.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 98.8%
  • Python 1.2%