Direkt zum Inhalt

Das Ziel des Projektes ALEXANDRIA (ERC Nr. 339233) ist die Entwicklung von Modellen, Werkzeugen und Technologien, die die relevanten Teile des Web archivieren und Web Archive indexieren, um eine aussagekräftige Suche und Erkundung von Inhalten zu ermöglichen. Im Rahmen des ALEXANDRIA Projektes werden semantische und zeit-orientierte Indexmethoden signifikant weiterentwickelt und mit Wissensrepräsentationen im Web kombiniert, um effiziente Indexierungs-, Such-, und Erkundungsmethoden für Informationen über Ereignisse und Entitäten aus der Vergangenheit zu ermöglichen. Die ALEXANDRIA Testumgebung stellt einen wichtigen Rahmen für die Erforschung, Erkundung und Evaluierung von Konzepten, Methoden und Algorithmen auf Web Archiven dar.

Motivation

Durch die wachsende Bedeutung des World Wide Web werden auch erhebliche Teile unseres kulturellen Erbes im Web eingestellt und konsumiert. Deshalb müssen Einrichtungen, die in der Bewahrung des Kulturerbes engagiert sind ergänzt werden durch Möglichkeiten zur Bewahrung von digitalen Kulturgütern und den Zugriff auf diese durch die Öffentlichkeit ermöglichen. Das Ziel des Projektes ALEXANDRIA ist die Entwicklung von Modellen, Werkzeugen und Technologien, die die relevanten Teile des Web archivieren und Web Archive indexieren, um eine aussagekräftige Suche und Erkundung von Inhalten zu ermöglichen. Während heutige Zugriffsmethoden auf Web Inhalte eine gute Basis darstellen, erfordert der optimale Zugriff auf Web Archive neue Modelle und Algorithmen für die Suche, Erkundung  und Analyse der Inhalte, die weit über die Anforderungen an klassischen Webzugriff hinausgehen. Besondere Herausforderzungen sind hierbei die zeitliche Dimension von Web Archiven, die Nutzung von bereits verfügbaren semantischen Informationen als auch die Integration von Informationen aus sozialen Medien und Netzwerken.

 

Ziel und Ansatz

Im Rahmen des ALEXANDRIA Projektes werden semantische und zeit-orientierte Indexmethoden signifikant weiterentwickelt und mit Wissensrepräsentationen im Web kombiniert, um effiziente Indexierungs-, Such-, und Erkundungsmethoden für Informationen über Ereignisse und Entitäten aus der Vergangenheit zu ermöglichen. Im Rahmen der Arbeiten wird ein spezieller Fokus auf die Evolution dieses Wissens und der zu indexierenden Webinhalte gelegt wobei auch die Diversität und die Unvollständigkeit des Wissens berücksichtigt werden. Zur Unterstützung von langfristigen Analysen und kollaborativen Abfragen auf Web Archiven werden crowdbasierte  mit maschinenbasierte Webanalysemethoden kombiniert. Die Nutzung von implizitem Feedback von Benutzern ist essentiell zur Verbesserung der Indexierung, da sie bessere Einsichten während der Verarbeitung dienen und zur besseren Fokussierung der Inhaltsammlung genutzt werden können.

 

Potentielle Anwendungen

Die ALEXANDRIA Testumgebung stellt einen wichtigen Rahmen für die Erforschung, Erkundung und Evaluierung von Konzepten, Methoden und Algorithmen, wie sie im Projekt entwickelt werden, dar. Sie stellt relevante Kollektionen und Algorithmen zur Verfügung, die weitergehende Forschung und die praktischen Anwendungen der Projektergebnisse für existierende Web Archive, wie beispielsweise dem Internet ArchiveInternet Memory Foundation oder den Web Archiven der Europäischen Nationalbibliotheken, demonstrieren.

 

Verwandte Projekte am L3S

  • Timetool - Large-Scale Temporal Search in MapReduce
  • iCrawl - The Integrated Focused Crawling ToolBox
  • WikiTimes - Bringing Order to Events in Wikipedia
  • WikipEvent - Challenges and Opportunities for Temporal Information Retrieval and Evolution in Wikipedia
  • Hadoop@L3S

 

Das Alexandria Project wird unterstützt durch das European Research Council (ERC Advanced Grant Nr. 339233).

Begin
End