-
Notifications
You must be signed in to change notification settings - Fork 22
API Quellen der einzelnen Add ons
Die verschiedenen Scraper (z.B. libdaserste) meiner Add-ons bedienen sich an verschiedensten Quellen. Oft stehen bei den Sendeanstalten mehrere APIs zur Auswahl. Für ein Add-on wird in der Regel die Quelle genommen, die möglichst alle Informationen liefert. Dies umfasst:
- vollständige Videolisten
- Metadaten (Plot, Laufzeit, ...)
- bestmögliche Videoauflösung
- saubere Datensätze
- möglichst viele Videos pro Seitenaufruf
- kurze Ladezeiten
Die Scraper bedienen sich teilweise bei mehreren Schnittstellen.
Fast jede Quelle gibt es als klassische HTML Webseite. Teilweise sind auch Android Apps einfach nur verpackte Webseiten. Ca. 50% aller HbbTV Webseiten liefern ihre Daten so aus. Oftmals gibt es hier weniger Metadaten wie Plot oder auch Thumbnails. Diese Schnittstelle ist durch Veränderung der Seitenstruktur äußerst fehleranfällig.
Fast alle Android Apps nutzen ein JSON Interface. Dies lässt sich wunderbar in Kodi einbauen, ist sehr robust und bringt oft auch Metadaten mit, die von den Apps selbst nicht angezeigt werden.
Einige Seiten liefern ihre Inhalte auch per RSS aus. Dies kann teilweise für Add-ons genutzt werden.
XML verschwindet immer mehr. Diese Interfaces sind in der Regel sehr informationshaltig und robust, sodass sie auch jetzt noch zum Einsatz kommen.
Sender | HTML | JSON | RSS | XML | Von Scraper genutzt |
---|---|---|---|---|---|
3sat | w | - | w | v | XML |
ARD | w,h | a | w | v | JSON, RSS, XML |
BR | w,h | a | - | - | JSON |
Das Erste | w | a,h | - | - | JSON (App) |
Funk.net | w | a | - | - | JSON |
HR | w | - | w | - | RSS |
KiKa | w | h | - | w | JSON, XML |
MDR | w,h | - | - | v | XML |
NDR | w | h | - | - | HTML |
Phoenix | w | a | w | w | JSON, RSS, XML |
SR | w | h | - | - | JSON |
SWR | w,a,m | - | - | - | HTML (App) |
WDR | w | - | v | - | RSS |
ZDF | w,h | a,v | - | - | JSON (versteckt) |
Legende:
w: auf Webseite genutzt
v: versteckt
h: Hbbtv
a: App
m: Mobile
Es kann durchaus vorkommen, dass Webseite und Add-on unterschiedliche Daten anzeigen, falls sich etwas in der Senderdatenbank direkt ändert. Die verschiedenen Quellen sollten sich aber innerhalb kurzer Zeit synchronisieren.
Teilweise stimmen die Datensätze von z.B. HbbTV und Webseite nicht überein. Dies betrifft in der Regel nur unwesentliche Videos, wie z.B. Clips aus einer Sendung, die auch als komplette Fassung vorliegt. Nach Möglichkeit werden derartige Videos ignoriert.
Im Vergleich zu den offiziellen Ausgaben der Quellen (App, Webseite, HbbTV) können die Add-ons durchaus mehr anzeigen. Vorallem mit dem 3sat Add-on können durch ein verstecktes XML Interface Sendungen nach "Meistgesehen" oder "Datum" sortiert werden. Add-ons wie WDR- oder Funk Mediathek zeigen auch den Plot an. Das ZDF Add-on wäre ohne ein verstecktes JSON Interface in dieser Form nicht möglich gewesen.
Die Einträge in den Mediatheken unterscheiden sich teilweise sehr stark in ihrer Qualität. Oft fehlen Plot und ordentliche Vorschaubilder. Manchmal wird der Sendungsname seperat aufgeführt, oft ist er aber auch direkt im Titel enthalten. Diese Inkonsistenz (teilweise in einer Sendereihe) macht eine einheitliche Präsentation schwierig.
Gerade die ARD Mediathek ist ein gutes Beispiel. Sendungsinhalte werden aus über zehn verschiedenen Mediatheken importiert. Dieser Prozess ist fehlerhaft und mit einer Zeitverzögerung verknüpft. Dies äußert sich z.B. bei dem Veröffentlichungsdatum: http://www.ardmediathek.de/tv/Neueste-Videos/mehr?documentId=41269152.
Im Gegensatz zu den einzelnen Mediatheken ist der Datensatz absolut unvollständig.
Die Unithek nutzt daher die ARD Mediathek nur als Quelle für "Meistgesehene Videos" und für die Sender ONE, tagesschau24, RB und RBB.
Die Videoqualität ist teilweise niedriger als in den urspünglichen Mediatheken. Dies äußert sich unter anderem bei Videos von Das Erste, NDR und DW.