Die täglich aktuellen COVID19 Fälle des RKI sind nun als Frictionless Data Package über IPFS erhältlich. Der Link dazu wird täglich auf unserem Twitter-Account veröffentlicht.
Das RKI stellt lobenswerterweise die gesamten deutschen Falldaten zu Covid19 Infektionen als Open Data (DL-DE->BY-2.0) bereit. Die Datenbank wird jeden Tag einmal exportiert und als CSV unter folgenden Link zur Verfügung gestellt:
https://npgeo-corona-npgeo-de.hub.arcgis.com/datasets/dd4580c810204019a7b8eb3e0b329dd6_0
Inzwischen ist der Datensatz über 100 MB groß und Nutzer klagen des öfteren über Probleme, ihn herunterzuladen. Außerdem ist die Beschreibung der Daten nur direkt auf der Webseite einzusehen. Wir haben uns daher entschlossen, als Service für die Community, diese Daten in ein einfach zu nutzendes Frictionless Data Package zu packen und per IFPS zu veröffentlichen. Den IPFS-Hash zu jedem Paket finden sie jeden Tag nach der Veröffentlichung auf unserem Twitter Account:
https://twitter.com/MoringaSciPub
Die Daten, wie sie vom RKI kommen, sind einfaches CSV, und alle Informationen zu den Daten sind nur auf der zugehörigen Webseite einsehbar. Werden nur die Daten weitergegeben, kann man nicht mehr viel damit anfangen, weil diese Informationen fehlen. Frictionless Data löst dieses Problem, indem es alle nötige Metainformationen mit den Daten verpackt. Wir haben dazu alle wichtigen Informationen von der RKI Webseite kopiert und entsprechend dem Standard mit in das Datenpaket gepackt.
IPFS ist ein verteiltes Dateisystem. Jede Datei wird dabei in kleinere, verlinkte Blöcke verteilt und im Netz angeboten. Fordert ein Benutzer eine Datei in IPFS an, so holt sich das System alle Blöcke der Datei und speichert sie lokal. Das Interessante an IPFS ist nun, dass dieser Benutzer jetzt selbst für eine bestimmte Zeit diese Datei im Netz anbietet, es also schon zwei Kopien gibt. Ein Dritter, der die Datei über IPFS anfordert, bekommt sie jetzt aus zwei Quellen doppelt so schnell übertragen. Und schon sind es drei Kopien. Je mehr Benutzer also eine Datei in IPFS anfordern und erhalten, desto schneller bekommen neue Nutzer diese Datei dann selbst übertragen. IPFS ist also ein ideales System, um solche öffentlichen Daten zur Verfügung zu stellen. Deswegen nutzen wir bei Moringa Science Publishing auch IPFS um die von uns publizierten Artikel und Daten zusätzlich zur Webseite zur Verfügung zu stellen: Moringa Publikationsverzeichnis
Moringa Science Publishing möchte damit einen sinnvollen Beitrag liefern, die Daten zu COVID19 in Deutschland FAIR zu machen.