Direkt zum Inhalt

ARCOMEM

Das ARCOMEM Projekt (FP7-IST-270239) adressiert im Zeitalter von sozialen Medien einige neue Herausforderungen an Archive, Museen und Bibliotheken. Soziale Medien dringen mehr und mehr in alle Bereiche des Menschen ein. Das Ziel des ARCOMEM ist es ein „kollektives Gedächtnis“ zu schaffen, das eng mit seinen Benutzern verbunden. Dazu werden das Web 2.0 und Weisheit der Masse genutzt um Web Archivierung in einen selektiveren und bedeutungsorientierteren Prozess zu wandeln. 

Beschreibung

Arcomem - Nutzung der Weisheit der Masse für die intelligente Bewahrung von Web Inhalten Motivation Mit dem rapiden Anstieg der Menge an Inhalten im Web ist der bisherige „wir sammeln alles“ Ansatz für die Bewahrung von Inhalten, bzgl. der notwendigen Resourcen und Qualität der Archive, nicht mehr praktikabel. Die Vision des ARCOMEM Projektes ist die Nutzung der „Weiheit der Masse“ für die Auswahl, Bewertung und Bewahrung von Web Inhalten. Die Inhalte der resultierenden Archive sollen die Sichtweise von Benutzergruppen auf Inhalte und deren Meinungen wiederspiegeln. Ziel und Ansatz Ziel des ARCOMEM-Projektes ist die Umwandlung von statischen Webarchiven in eine Art  „kollektives Gedächtnis“, das eng mit seinen Benutzern verbunden ist. Erreicht werden soll dies, indem nicht nur Inhalte von SocialWeb Plattformen  gesammelt, sondern die Plattformen auch nach Hinweise für weitere relevante Inhalte analysiert werden sollen. Die Idee dahinter ist, dass Benutzer von Sozialen Medien in ihren Beiträgen auch Verweise auf anderen Diskussionen oder externe Quellen angegeben, die der Benutzer als interessant empfunden hat. Je mehr Empfehlungen für eine Seite ausgesprochen werden desto relevanter ist diese aus der Sicht der Öffentlichkeit. Der ARCOMEM-Webcrawler behandelt diese Seiten mit höherer Priorität als andere. Zusätzlich wird die Bedeutung einer Seite zum Sammelzeitpunkt dokumentiert. Zur Entscheidung, ob eine Seite relevant für das Archiv ist, trägt aber nicht alleine ihre Empfehlung im Social Web bei. Der Archivar kann zusätzlich eine Liste von gewünschten Inhalten (z.B. Personen, Orte, Ereignisse wie „Olympische Spiele“) und/oder Themen (z.B. Finanzkrise) vorgeben. Während des Crawls wird jede Seite bezüglich ihrer Relevanz anhand dieser Spezifikation überprüft. Wird eine Seite als nicht relevant eingestuft, so ist die Annahme, dass die enthaltenen Verweise ebenfalls auf nicht relevante Seite zeigen. Weiterführende Crawlaktivitäten in dieser Richtung werden deshalb an dieser Stelle eingestellt. Um die spätere Nutzung der gesammelten Inhalte zu verbessern, werden diese automatisch einer Inhaltsanalyse unterzogen. Hierbei werden, unabhängig von der Crawlspezifikation, die vorkommenden Entitäten, Ereignisse und Themen sowie die Grundstimmung der Seite extrahiert und analysiert und zusammen mit der Seite gespeichert. Der Archivar oder die späteren Nutzer können dann über verschiedene Facetten gezielt auf Inhalte im Archiv zugreifen. Rolle des L3S Die Rolle des L3S im Projekt ist die Entwicklung von Methoden zur Konsolidierung von extrahierten Entitäten und Ereignissen zur Anreicherung der Archive und zur Steuerung des Crawlers. Desweiteren arbeitet das L3S an neuen Ansätzen für die Erkennung der Dynamik in Sprachen um beispielsweise neue Synonyme für Entitäten zu erkennen. Das L3S ist auch involviert in die Social Web Analyse und der Crawler Entwicklung mit dem Fokus auf die Priorisierung von URLs für die Crawler Steuerung. Potentielle Anwendungen Zur Demonstration und Validierung der Projektergebnisse, wird der ARCOMEM Crawler in zwei Anwendungsszenarien verwendet. Das erste Szenario zielt auf die Social Web getrieben Archivierung von Medien Web Seiten wie sie von Rundfunk und Fernsehanstalten benötigt werden. Im zweiten Szenario werden die ARCOMEM Technologie zur Erstellung von politischen Web Archiven durch zwei Europäische Parlamente eingesetzt.   Weitere Informationen über das Projekt finden Sie auf der ARCOMEM Homepage oder folgen Sie uns auf Twitter.

Research area
Intelligent Access to Information
Begin
End