Text Mining – eine moderne Methode der Marktforschung

Text Mining – eine moderne Methode der Marktforschung
10.02.2020
Qualitative Techniken, wie Tiefeninterviews und Fokusgruppen, aber auch quantitative Ansätze, wie Online- oder Telefonbefragungen gehören zum Standard-Repertoire eines Marktforschers. Dabei wird eine Vielzahl an Informationen generiert, die häufig nur in halb- oder gar unstrukturierter Form vorliegen. Wie können diese Daten möglichst effizient erfasst, analysiert und genutzt werden?
Im Rahmen einer Online-Studie hat Facit Digital 1.000 deutsche Sportfans hinsichtlich der Relevanz eines „Smart Stadiums“ befragt. Um die Zielgruppe und ihre Bedürfnisse möglichst gut kennenzulernen, sollten die Befragten unter anderem beschreiben, welche Informationen, Hilfestellungen, Unterhaltungsprogramme oder Services sie sich wünschen, um einen Stadionbesuch attraktiver zu gestalten.
Sie können sich bestimmt vorstellen, wie ausführlich die Antwort eines enthusiastischen und anspruchsvollen Fußball-Fans ausfallen kann.
Erster Eindruck anhand einer Schlagwortwolke
Um ein erstes Gefühl bezüglich der Kommentare zu entwickeln, bietet sich eine Schlagwortwolke an.
Die aus der Befragung stammenden Rohdaten werden zunächst bereinigt, sprich es werden Zahlen, Satzzeichen und Leerzeichen entfernt, sowie Großbuchstaben in Kleinbuchstaben verwandelt. Stoppwörter, also Wörter, die keinen Mehrwert für den Informationsgehalt der Aussage besitzen, werden ebenfalls aus der Analyse ausgeschlossen. Mithilfe der sogenannten Tokenisierung werden die Texte dann in Einheiten zerlegt. Token können wie im obigen Bild Wörter, aber auch Ausdrücke oder ganze Sätze sein.
Dies geschieht mithilfe von R, einer freien Programmiersprache für statistische Berechnungen und Grafiken. R bietet zudem eine Möglichkeit, die erstellte Schlagwortwolke individuell anzupassen, sprich die Anordnung, Farbe und Größe der Wörter mit einer entsprechenden Syntax zu alternieren. So stellt obige Schlagwortwolke maximal 200 Wörter dar und gibt nur solche aus, die häufiger als fünf Mal genannt wurden.
Die Grundstimmung der Teilnehmer mit der Sentimentanalyse kennenlernen
Die Sentimentanalyse als Untergebiet des Text Mining bezeichnet die automatische Auswertung von Texten mit dem Ziel, eine geäußerte Haltung als positiv oder negativ zu erkennen. Diese Methode eignet sich gut, um einen ersten Eindruck des Stimmungsbildes bezüglich Design- oder Formularentwürfen zu erhalten.


Im Rahmen einer weiteren internen Studie von Facit Digital wurde Teilnehmern obiges Bild (links) präsentiert. In offenen Nennungen sollten diese kommentieren, was Ihnen gefällt, nicht gefällt oder was gegebenenfalls zu Verständnisproblemen führt. Mit Hilfe eines Visual Feedback Tools (rechtes Bild) konnte festgestellt werden, welche Bereiche positiv und welche negativ bewertet wurden.
Die Programmiersprache R bietet auch hier Funktionen an, die nach einer Bereinigung der Rohdaten, eine genaue Analyse der Stimmung ermöglichen.
Der mittlere Sentimentscore zeigt z.B. mit einem Wert von „- 0.05“ (gerundet) ein leicht negatives Grundgefühl der Teilnehmer. Es gilt dann zu entscheiden, ob ein tieferer Blick in die Daten notwendig ist, um die spezifischen Stärken und Schwächen lokalisieren und fundierte Handlungsempfehlungen ableiten zu können.