Hauptinhalt
Topinformationen
Zuverlässige Stimmungsanalyse von Tweets
Leitung: Prof. Dr. Oliver Vornberger |
Mitarbeiter: Nils Haldenwang, M.Sc. |
Laufzeit: 08/2014 - 04/2017 |
Stichworte: Stimmungsanalyse, Soziale Netzwerke, Klassifikation, Twitter |
Im Zeitalter der Smartphones und der permanenten Anbindung an das Internet geben viele Menschen rund um die Uhr öffentlich ihre Meinung zu Produkten, zur Politik oder zum aktuellen Weltgeschehen in sozialen Netzwerken preis. Die Plattform Twitter gibt an, dass ihre Nutzer täglich mehr als 500 Millionen Kurznachrichten - sogenannte Tweets - veröffentlichen. Durch automatisierte Auswertung dieser riesigen Datenmengen bezüglich der Stimmung zu den angesprochenen Themen lassen sich nützliche Erkenntnisse gewinnen. Mögliche Anwendungen sind Marktforschung, Finanzmarktprognosen, Wahlprognosen und sogar Gewalt- und Verbrechensprävention. Wie gut sich die Daten tatsächlich für die Anwendungen nutzen lassen, hängt natürlich stark mit der Zuverlässigkeit und Güte der Analyseverfahren zusammen.
Die meisten aktuellen Verfahren zur Klassifikation der Stimmung unterscheiden zwischen den Klassen “positiv”, “negativ” und “neutral”. Die Klasse neutral bezeichnet dabei meist Tweets, die keinerlei Stimmung enthalten. Problematisch daran ist, dass Tweets, die mehrere Stimmungen enthalten nicht in die neutrale Klasse eingeordnet werden, sondern ihnen wird das Label positiv oder negativ zugewiesen. Erstrebenswerter wäre hier ein Algorithmus, dem es erlaubt ist als Ergebnis “ich weiß es nicht” zu liefern. Dieser Algorithmus würde darauf trainiert werden zwischen positiv und negativ zu entscheiden und bei mehreren widersprüchlichen Stimmungen oder neutralen Tweets wäre das Ergebnis der Entscheidung “ich weiß es nicht”. Dieses Verhalten lässt sich realisieren, indem neben dem Ergebnis der Klassifikation ein weiterer Wert - die Konfidenz - geliefert wird. Unterschreitet die Konfidenz einen festgelegten Schwellwert, dann kann man sich je nach Anwendung entscheiden dem Algorithmus in diesem Fall nicht mehr zu vertrauen und den Tweet nicht weiter zu berücksichtigen.
Ziel des Projektes ist der Entwurf von Algorithmen, die möglichst gute Entscheidungen bezüglich der Stimmung eines Tweets treffen können, gleichzeitig aber Informationen darüber liefern, wie sicher sie sich bei der Entscheidung sind.