German COVID-19 Forecast Hub - Zusammenstellung von Vorhersagen für COVID-19 Todesfälle in Deutschland
Description in English available here.
Website:: https://kitmetricslab.github.io/forecasthub/
Studienprotokoll:: https://osf.io/cy937/registrations
Referenz: Bracher J, Wolffram D, Deuschel, J, Görgen, K, Ketterer, J, Gneiting, T, Schienle, M (2020): The German and Polish COVID-19 Forecast Hub. https://github.com/KITmetricslab/covid19-forecast-hub-de.
Web tool zur Visualisierung von Vorhersage-Dateien vor der Einreichung: https://jobrac.shinyapps.io/app_check_submission/
Kontakt: [email protected]
Dieses Repository dient dazu, Vorhersagen für kumulative und inzidente COVID-19-Todeszahlen in einem standardisierten Format zusammenzutragen. Es wird von Mitgliedern des Lehrstuhl für Ökonometrie und Statistik am Karslruher Institut für Technologie und der Computational Statistics Gruppe am Heidelberger Institut für Theoretische Studien betrieben, siehe Auflistung unten.
Eine interaktive Visualisierung der verschiedenen Vorhersagen und weitere Informationen (auf English) sind auf unserer Webseite verfügbar.
Wir führe eine präregistrierte Evaluationsstudie durch, in der wir die Vorhersagequalität verschiedener Modelle in den Monaten Oktober 2020 bis März 2021 untersuchen, siehe hier für das Studienprotokoll.
Dieses Projekt ist vom US COVID-19 Forecast Hub inspiriert, der vom Reich Lab / UMass-Amherst Influenza Forecasting Center of Excellence betrieben wird. Wir stehen in engem Austausch mit dem Reich Lab und übernehmen weitgehend die dort festgelegten Strukturen und Datenformate, siehe auch diesen Wiki-Eintrag (auf englisch). Ausserdem verwenden wir vom ReichLab zur Verfügung gestellte Software (siehe unten).
Falls Sie an Vorhersagen für COVID-19-Todesfälle in Deutschland arbeiten und gerne zu diesem Repository beitragen möchten treten Sie bitte mit uns in Kontakt
Unser Hauptfokus liegt auf 1 bis 30 Tages und 1 bis 4 Wochen-Vorhersagen für inzidente und kumulative Todeszahlen. Wir akzeptieren auch Vorhersagen bis zu 130 Tage oder 20 Wochen voraus. Dieser Wiki-Eintrag (auf englisch) beinhaltet eine genauere Beschreibung der Vorhersageziele. Es gibt keine Verpflichtung, Vorhersagen für alle genannten Ziele abzugeben und es bleibt den einzelnen Gruppen überlassen, einzuschätzen, für welche Ziele ihr Modell sinnvolle Vorhersagen generieren kann.
Die Definition unserer Vorhersageziele folgt den hier für den US COVID-19 forecast hub beschriebenen Prinzipien.
Derzeit betrachten wir die ECDC Daten als die zugrundeliegende und vorherzusagende ``Wahrheit'' (ground truth). Für Todeszahlen in den Bundesländern und polnischen Woiwodschaften verwenden wir Daten des Robert Koch Instituts bzw. des polnischen Gedundheitsministeriums, siehe Abschnitt Wahrheitsdaten.
Wir akzeptieren ausserdem 1 bis 30 Tages und 1 bis 4 Wochen-Vorhersagen für inzidente und kumulative Fallzahlen, siehe auch Beschreibung hier.
Wir erwägen, demnächst auch Vorhersagen für den Bedarf an intensivmedizinischer Versorgung aufgrund von COVID19-Erkrankungen abzudecken. Daten aus dem DIVI Register könnten als Gundlage für die Definition von Vorhersagezielen dienen.
Die Definition unserer Vorhersageziele folgt den hier für den US COVID-19 forecast hub beschriebenen Prinzipien.
Die Hauptinhalte des Repositories sind gegenwärtig die Folgenden:
data-raw
: Vorhersagedateien in ihrer ursprünglichen Form, d.h. so, wie sie von den verschiedenen Teams zur Verfügung gestellt wurden.data-processed
: Vorhersagen im Standardformat.data-truth
: ECDC- und JHU-Daten zu COVID19 Todesfällen in einem standardisierten Format
Die Einreichung von Vorhersagen erfolgt via Pull Requests. In unserem Wiki stellen wir eine ausführliche Anleitung zur Einreichung zur Verfügung. Vorhersagen sollten in wöchentlichen Abständen aktualisiert werden, wenn möglich jeden Montag. Als Frist haben wir Dienstag 15:00 gewählt. Neue Vorhersagen können auch an anderen Wochentagen abgegeben werden (nicht mehr als eine pro Tag), diese werden jedoch nicht in Visualisierungen oder Ensembles verwendet (Ausnahme: Falls an einem Montag keine Vorhersage abgegeben wurde verwenden wir Vorhersagen, die am vorangegangenen Sonntag, Samstag oder Freitag abgegeben wurden).
Wir sind bemüht, teilnehmenden Gruppen technische Unterstützung bei der Einreichung anzubieten. Treten Sie hierzu gerne mit uns in Kontakt.
Wir speichern Punktvorhersagen und Vorhersagequantile in einem Langformat mit Informationen zu Datum und Ort, siehe hier. Dieses Format ist weithgehend identisch zu dem im US Hub verendeten Format (siehe hier and hier).
Die in diesem Repository zusammengetragenen Vorhersagen sind von verschiedenen unabhängigen Teams erstellt worden, in den meisten Fällen zusammen mit einer Lizenz zur Weiterverwendung. Diese Lizenzen sind in den entsprechenden Unterordnern von data-processed
enthalten. Teile der Processing- und Analyse-Codes sind angepasste Versionen von Codes aus dem [US COVID-19 Forecast Hub](COVID-19 Forecast Hub) (dort unter MIT Lizenz). Alle hier bereitgestellten Codes stehen ebenfalls unter der MIT license. Falls Sie Daten aus diesem Repository weiterverwenden möchten treten Sie bitte mit uns in Kontakt.
Daten zu den beobachteten Todeszahlen beziehen wir aus den folgenden Quellen:
- European Centre for Disease Prevention and Control (Dies ist unsere bevorzugte Quelle und wird bei der Evaluierung zugrundegelegt.)
- Johns Hopkins University
- European Centre for Disease Prevention and Control Dies ist unsere bevorzugte Quelle und wird bei der Evaluierung zugrundegelegt. Polnisches Gesundheitsministerium. Wir beziehen diese Daten aus einem öffentlichen Google Sheet, das von Michal Rogalski betrieben wird. Dies ist unsere bevorzugte Quelle für Daten auf der Bundesland-Ebene. Die Daten sind kompatibel mit den ECDC-Daten auf der Bundesebene. Um die Daten mit den Daten ECDC-Daten auf der nationalen Ebene kompatibel zu machen werden sie um einen Tag verschoben, seiehe hier.
- Robert Koch Institut. Die Generierung dieser Datensätze erfordert einige Pre-Processing-Schritte, siehe hier. Dies ist unsere bevorzugte Quelle für Daten auf der Bundesland-Ebene. Die Daten sind kompatibel mit den ECDC-Daten auf der Bundesebene.
- Johns Hopkins University. Diese Daten werden von einer Reihe von Teams zur Generierung von Vorhersagen genutzt. Derzeit (August 2020) ist die Übereinstimmung mit den ECDC-DAten gut, in der Vergangenheit gab es allerdings stärkere Diskrepanzen.
- DIVI Intensivregister Diese Daten werden derzeit nicht genutzt, wir planen jedoch, künftig auch Vorhersagen basierend auf diesen Daten zusammenzutragen.
Derzeit tragen wir Vorhersagen der folgenden Teams zusammen. Bitte beachten Sie, dass nicht alle Teams ihre Vorhersagen aufgrund der selben Datengrundlage zu Todeszahlen erstellen. (benutzte Datengrundlage und Lizenz in Klammern).
- epiforecasts.io / London School of Hygiene and Tropical Medicine (ECDC; no license specified)
- Frankfurt Institute for Advanced Studies & Forschungszentrum Jülich (ECDC; no license specified)
- ICM / University of Warsaw (ECDC; to be specified)
- IHME (JHU; CC-AT-NC4.0)
- Imperial College (ECDC; Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License)
- Johannes Gutenberg University Mainz / University of Hamburg (ECDC; MIT)
- KIT (ECDC; MIT) Die sind zwei einfache Referenzmodelle.
- [KITCOVIDhub] Das
mean_ensemble
undmedian_ensemble
sind zwei verschiedene Aggregationen der verfügbaren Vorhersagen, siehe hier. Das Median-Ensemble ist unser präspezifiziertes Haupt-Ensemble. - LANL (JHU; custom)
- MIM / University of Warsaw (ECDC; to be specified)
- MIT Covid Analytics (JHU; Apache 2.0)
- MOCOS Group (ECDC; to be specified)
- ITTW (Universities of Ilmenau, Trier, Wroclaw, Warsaw) (ECDC; no license specified)
- University of Geneva / Swiss Data Science Center (ECDC; none given)
- University of Leipzig IMISE/GenStat (ECDC; MIT)
- UCLA Statistical Machine Learning Lab (JHU; cc-by-4.0)
- University of Southern California Data Science Lab(JHU; MIT) (MIT)
- YYG (JHU; MIT)
Eines der Ziele des Forecast Hubs ist es, verschiedene Vorhersagen in einer Ensemble-Vorhersage zusammenzuführen, siehe hier für eine kurze Beschreibung des derzeit verwendeten Ansatzes ohne Gewichtung. Aufwändigere datengetriebene Verfahren setzen voraus, dass verschiedene Vorhersagen, sowohl Ensemble-Vorhersagen als auch Vorhersagen einzelner Teams evaluiert und verglichen werden. Wir möchten jedoch betonen, dass es sich hierbei nicht um einen Wettbewerb, sondern um ein kollaboratives Projekt handelt. Die Methoden zur Vorhersageevaluation die Anwendung finden werden sind hier beschrieben.
Die folgenden Personen haben zu diesem Projekt beigetragen, entweder durch praktische Arbeit am Repository oder konzeptionelle Arbeit im Hintergrund (in alphabetischer Reihenfolge):
- Johannes Bracher
- Jannik Deuschel
- Tilmann Gneiting
- Konstantin Görgen
- Jakob Ketterer
- Melanie Schienle
- Daniel Wolffram
- US COVID-19 Forecast Hub, betrieben vom Reich Lab (Preprint hier verfügbar).
- Code repository der SARS-CoV2 modelling initiative
Mitglieder unserer Gruppe haben zu den folgenden Veröffentlichungen oder Preprints im Zusammenhang mit der Vorhersage der COVID-19 Pandemie beigetragen:
- J. Bracher, E.L. Ray, T. Gneiting, N.G. Reich: Evaluating epidemic forecasts in an interval format.
- L.C. Brooks, E.L. Ray, J. Bien, J. Bracher, A. Rumack, R.J. Tibshirani, N.G. Reich: (Comparing ensemble approaches for short-term probabilistic COVID-19 forecasts in the U.S.)[https://forecasters.org/blog/2020/10/28/comparing-ensemble-approaches-for-short-term-probabilistic-covid-19-forecasts-in-the-u-s/]
- E.L. Ray, N. Wattanachit, J. Niemi et al: Ensemble Forecasts of Coronavirus Disease 2019 (COVID-19) in the U.S..
Das Forecast Hub-Projekt ist Teil des von der Helmholtz-Gemeinschaft geförderten SIMCARD Information& Data Science Pilot Project. Ausserdem gilt unser Dank der Alexander von Humboldt Stiftung deren Unterstützung für Nicholas G. Reich maßgeblich dazu beigetragen hat, die Zusammenarbeit mit dem Reich Lab und dem und dem US COVID-19 Forecast Hub in die Wege zu leiten.
Für die Inhalte dieser Seite sind einzig die Autoren verantwortlich. Diese Seite spiegelt nicht notwendigerweise die Standpunkte des KIT, HITS, der Humboldt Stiftung oder der Helmholtz-Gemeinschaft wider.