Foto: ORKG

Corona: Alles im Blick mit dem ORKG

Zu COVID-19 erscheinen täglich etliche neue wissenschaftliche Artikel. Viele Verlage haben beschlossen, die COVID-19-Forschung zu unterstützen, und veröffentlichen Artikel mit Bezug zum Krisenthema als Open Access. Der Zugang zu wissenschaftlichen Artikeln ist für die Forschung von entscheidender Bedeutung. Die Organisation der darin veröffentlichten Informationen ist zwar unerlässlich, aber extrem zeitaufwendig. Und Zeit ist unter diesen Umständen ein Aktivposten, der wertvoller ist denn je.

Prof. Dr. Sören Auer und sein Team im Joint Lab von L3S und TIB wollen mit dem  Open Research Knowledge Graph (ORKG) das Organisieren wissenschaftlicher Erkenntnisse effizienter machen. Der ORKG stellt das in der wissenschaftlichen Literatur veröffentlichte Wissen strukturiert dar, sodass es maschinell verwertbarer ist und letztlich leichter zur Verfügung steht.

R0-Wissen effizient organisieren

Dr. Markus Stocker und Allard Oelen gehören zum ORKG-Forscherteam. Sie zeigen, wie der ORKG das Wissen um die COVID-19-Basisreproduktionszahl, auch R0 genannt, organisieren kann. Die Zahl bezieht sich auf die erwartete Anzahl von Menschen, die eine infizierte Person anstecken wird. Zusammen mit der Sterblichkeitsrate gibt R0 Aufschluss darüber, wie gefährlich eine Infektionskrankheit ist. Diese Zahlen können sich aufgrund der Bevölkerungsdichte oder kultureller Unterschiede von Ort zu Ort unterscheiden. Zu den R0-Zahlen einiger bekannter Krankheiten gehören 12 - 18 für Masern, 2 - 5 für SARS und 2 - 3 für Erkältungskrankheiten.

Es sind bereits einige Artikel über R0-Schätzungen zu COVID-19 veröffentlicht worden. Da sie über die wachsende Literatur verstreut sind, wird es immer aufwendiger, Informationen über R0, ihren Wert, die Konfidenzintervalle, den Studienort und den Zeitrahmen zu organisieren. Traditionell organisieren Reviews die Literatur zu einem bestimmten Problem. Aber sie weisen mindestens zwei Mängel auf: Erstens ist ihr Inhalt ebenso wie die ursprünglichen Forschungsartikel unstrukturiert und daher kaum maschinell verwertbar. Zweitens spiegeln sie den Stand des Wissens zu einem bestimmten Zeitpunkt wider.

Hier setzt der ORKG an. Der Wissensgraph unterstützt die strukturierte Beschreibung der wissenschaftlichen Arbeit. Für die R0-Forschung sind die folgenden Informationen besonders relevant: die R0-Schätzung, ein Konfidenzintervall von 95 Prozent, der Zeitrahmen und der Ort der Studie und (optional) die zur Bestimmung des R0 verwendeten Methoden. In Artikeln werden diese Informationen als natürlicher Text veröffentlicht, was die (menschliche oder maschinelle) Extraktion genau dieser Informationen ziemlich schwierig macht. Mit dem ORKG können dieselben Informationen in strukturierter Form veröffentlicht werden.

Der ORKG übersetzt Informationen aus natürlichem Text in entsprechende maschinell verwertbare Repräsentationen.

Maschinelle Wissensverwertung

Erst durch die strukturierte Darstellung wissenschaftlicher Erkenntnisse können Literaturübersichten oder -vergleiche im ORKG automatisch erstellt werden. Das ist spannend, aber nur eine von mehreren Möglichkeiten. Die zweite ist, dass sich ORKG-Übersichten im Gegensatz zu Übersichtsartikeln weiterentwickeln können. Wenn neue Literatur zur R0-Forschung veröffentlicht wird, ist es einfach, eine solche Übersicht zu erweitern, die somit weiterhin den aktuellen Wissensstand in vergleichbarer Weise widerspiegelt.

Die eigentliche Stärke solcher ORKG-Übersichten zeigt sich jedoch, wenn man sie als Datenquellen verwendet. Tatsächlich ist es dank der maschinellen Verwertbarkeit sowohl der Daten als auch des Datenaustauschprotokolls (REST API) möglich, den ORKG und die Übersichten in die Datenanalyse einzubinden.

Automatisch erstellte Literaturübersicht für den Anwendungsfall der COVID-19- Basisreproduktionsnummer. Quelle

Vorgestellte Projekte
Kontakt
Dr. Markus Stocker

Markus Stocker ist wissenschaftlicher Mitarbeiter im Joint Lab von L3S und TIB. An der TIB leitet er die Nachwuchsforschungsgruppe Wissensinfrastrukturen. Seine Forschungsinteressen liegen an der Schnittstelle zwischen Forschungsinfrastrukturen und Forschungsgemeinschaften und der Art und Weise, wie solche Infrastrukturen wissenschaftliches Wissen über menschliche und natürliche Welten erwerben, erhalten und teilen.

Allard Oelen

Allard Oelen ist wissenschaftlicher Mitarbeiter im Joint Lab von L3S und TIB. Er forscht zu Technologien des Semantic Web und wie sie in realen Anwendungen eingesetzt werden können. Darüber hinaus interessieren ihn Mensch-Computer-Interaktion und insbesondere Design und Entwicklung von Benutzeroberflächen.