Direkt zum Inhalt

Wie man die Stimmung in einer sich verändernden Umgebung mit begrenztem Benutzer-Feedback lernt.

 

Motivation
"Was andere Menschen denken" war schon immer eine wichtige Information für unseren Entscheidungsprozess. Aber das Internet und das Web ermöglichen es uns jetzt, Antworten auf diese Frage über den Kreis unserer persönlichen Bekannten hinaus zu finden. Traditionelle Sentiment-Mining-Techniken konzentrieren sich auf statische Daten. In dem Maße, in dem sich die Meinungen aus den sozialen Strömungen anhäufen, können sich jedoch Veränderungen ergeben, wie z.B. Veränderungen in der allgemeinen Stimmung gegenüber einem Thema oder gegenüber bestimmten Facetten dieses Themas sowie Veränderungen in den Wörtern, mit denen Gefühle ausgedrückt werden. Auch Themen ändern sich im Laufe der Zeit. In OSCAR entwickeln wir Methoden des Opinion Stream Mining, die mit Veränderungen umgehen und die gelernten Modelle kontinuierlich anpassen.

Herausforderungen & Highlights
Der erste Teil von OSCAR befasst sich mit der Nutzung von Stream-Mining-Methoden zur Behandlung von Vokabular-/Merkmalsänderungen. Eine Änderung im Feature-Raum bedeutet, dass das auf den alten Wörtern aufbauende Modell aktualisiert werden muss. Wir werden Informationen über den Gebrauch und die Stimmung jedes Wortes sammeln, um das langfristige Wechselspiel zwischen Wortpolarität und Dokumentpolarität hervorzuheben. Zweitens werden wir daran arbeiten, den Bedarf an beschrifteten Dokumenten zu verringern. Zu diesem Zweck werden wir aktive Lernmethoden entwickeln, die Polaritätsmodelle auf einem sich entwickelnden Merkmalsraum lernen und anpassen. Drittens werden wir daran arbeiten, mit verschiedenen Arten von Veränderungen gleichzeitig umzugehen. Zu diesem Zweck werden wir Ensembles einsetzen. Wir werden einige Ensemblemitglieder der Identifizierung von Thementrends zuordnen, andere der Veränderung des Vokabulars und wieder andere zeitlichen Veränderungen, einschließlich periodischer Veränderungen. (UNSICHER HIER. Ensemble?)

Mögliche Anwendungen & Zukunftsfragen
Das Ergebnis von OSCAR wird ein vollständiger Rahmen sein, der aktive Ensemble-Lernmethoden umfasst, die sich mit verschiedenen Formen des Wandels befassen und mit begrenzter Expertenbeteiligung lernen. Ein solcher Rahmen kann über die Stimmungsanalyse hinaus auch für andere Aufgaben der Stromklassifizierung verwendet werden.


 

Related publications

  • D. Melidis, M. Spiliopoulou, E. Ntoutsi, "Learning under Feature Drifts in Textual Streams", CIKM, 2018 (accepted).
  • C. Blake, E. Ntoutsi, "Reinforcement Learning Based Decision Tree Induction over Data Streams with Concept Drifts", IEEE ICBK, 2018 (accepted).
  • V. Unnikrishnan, C. Beyer, U. Niemann, P. Matuszyk, R. Pryss, W. Schlee, E. Ntoutsi and M. Spiliopoulou, "Entity-Level Stream Classification: Exploiting Entity Similarity to Label the Next Observation Referring to an Entity", IEEE DSAA, 2018.
  • D. Melidis, A. Veizaga Campero, V. Iosifidis, E. Ntoutsi, M. Spiliopoulou, "Enriching Lexicons with Ephemeral Words for Sentiment Analysis in Social Streams", WIMS, Novi Sad, Serbia, 2018 (accepted).
  • C. Beyer, U. Niemann, V. Unnikrishnan, E. Ntoutsi, M. Spiliopoulou, "Predicting Document Polarities on a Stream without Reading their Contents", SAC Data Streams track, Pau, France, 2018 (accepted).
  • V. Iosifidis, E. Ntoutsi, "Large scale sentiment annotation with limited labels", KDD, Halifax, Canada, 2017. [local copy]
  • V. Iosifidis, E. Ntoutsi, "Sentiment Classification over Opinionated Data Streams through Informed Model Adaptation", TPDL, Thessaloniki, Greece, 2017. [local copy]