NatLit
Entwicklung, Erprobung und Evaluierung von einer natürlichsprachigen Anfrageschnittstelle zur Literaturrecherche in den Metadaten der DNB
Die Deutsche Nationalbibliothek (DNB) sammelt und verzeichnet seit 1913 umfassend alle deutschen und deutschsprachigen Publikationen und stellt deren Metadaten kostenlos über ihren Katalog bereit. Mit über 33 Millionen Einträgen sowie erweiterten Inhalten und neuen, KI-gestützten Suchschnittstellen dient sie als zentrale und zunehmend nutzerfreundliche Quelle für wissenschaftliche Literaturrecherche.
Ziel des Projekts NatLit ist es, die in den Metadaten der DNB erschlossenen Publikationen über die Interaktion mit LLMs besser und für Forschungsfragen zielgenauer zu finden. Dabei werden Nutzende ohne eigenes bibliothekarisches Wissen und ohne Kenntnis der Abfragesprache dabei unterstützt, komplexe, genaue und umfassende Suchanfragen durchzuführen. Die interaktive Literaturrecherche wird in einem natürlichsprachigen Chat in zwei Phasen erfolgen. In Phase 1 („Literaturrecherche“) formuliert ein*e Nutzer*in eine Suchanfrage an Publikationen im DNB-Bestand. Nun werden in einem Retrieval-Augmented-Generation-Ansatz relevante Entitäten in der Anfrage extrahiert und unter anderem über eine Teilgraph-Suche relevante Metadaten im DNB-Katalog identifiziert und einem LLM – neben bibliothekarischem Hintergrundwissen – zur Beantwortung der Frage zur Verfügung gestellt. In Phase 2 („Medienzusammenfassung“) können Nutzende Fragen über die gefundenen Publikationen stellen, die anschließend von einem LLM beantwortet werden. Die Qualität der Ergebnisse dieser Literaturrecherche mit LLMs soll vergleichbar oder besser als mit herkömmlichen Methoden sein, gemessen an den Kriterien Technische Funktionalität, Such- und Antwortqualität, sowie Nutzungserfahrun. NatLit als Pilotprojekt für den Einsatz großer Sprachmodelle mit dem umfangreichen Datenbestand einer Nationalbibliothek soll so eine einfachere und effizientere Literaturrecherche erproben.
DFG-Förderprogramm: Wissenschaftliche Literaturversorgungs- und Informationssysteme (LIS): e-Research-Technologien
- Deutsche Nationalbibliothek