- DAZ.online
- DAZ / AZ
- DAZ 26/2023
- Hört gut zu, wenn den ...
Management
Hört gut zu, wenn den Kunden etwas stört!
Analyse der Online-Kundenbewertungen von Apotheken in Baden-Württemberg
Was aber bewegt die Kunden der Vor-Ort-Apotheken zu solchen Sterne-Bewertungen und Rezensionen? Welche Themen sind für sie wichtig? Was führt dazu, dass sie eine Apotheke gut und eine andere schlecht bewerten? Gibt es Unterschiede in der Beurteilung unterschiedlicher Apothekentypen? Werden Filialapotheken besser oder schlechter als Haupt- oder Einzelapotheken bewertet? Und existiert ein Zusammenhang zwischen der Zahl der Apotheken innerhalb eines Filialverbundes und ihren Bewertungen? Diese Fragen sollen anhand der Google-Bewertungen aller Baden-Württemberger Apotheken beantwortet werden. Neben den Sterne-Bewertungen interessiert uns vor allem der Inhalt der über 30.000 Rezensionen. Für die Analyse dieser Rezensionen, für das sogenannte Text Mining, wurden Methoden aus dem Werkzeugkasten der Data Science verwendet.
In zwei Beiträgen der vergangenen Jahre (Schmid T. Gute, aber eher wenige Bewertungen: Wie Deutschlands Apotheken bei Google rezensiert werden. DAZ 2022, Nr. 34, S. 50, und Schmid T. Google-Rezensionen – Landapotheken haben die Nase vorn: Mehr Sterne am ländlichen Himmel. AWA 2023, Nr. 1, S. 14) wurden bereits die Sterne-Bewertungen von Apotheken auf Bundesebene betrachtet. Die Erkenntnisse dort bestätigen auch die Auswertung des Datensatzes der Baden-Württemberger Apotheken: Google-Bewertungen sind für fast jede Apotheke vorhanden, pro Apotheke gibt es relativ wenige Sterne-Bewertungen, darunter sehr häufig 5-Sterne-Bewertungen, mengenmäßig gefolgt von 1-Stern-Bewertungen. Zum Zeitpunkt unserer Erhebung, Ende Dezember 2022, waren 2318 Baden-Württemberger Apotheken mit einem Google-Unternehmensprofil im Internet vertreten. Der Abgleich mit einer Apothekenliste der Apothekerkammer Baden-Württemberg ergab, dass es keine Apotheke ohne ein solches Unternehmensprofil gibt – selbst mittlerweile geschlossene Apotheken sind häufig noch vertreten. Diese werden im Folgenden nicht weiter berücksichtigt. Von den 2318 Apotheken wurden nur acht Apotheken nicht bewertet. Im Durchschnitt kommt jede Apotheke auf knapp 21 Bewertungen. 2302 Apotheken weisen neben den Sterne-Bewertungen auch Rezensionen auf. Insgesamt sind es 32.431 Rezensionen (reine Emoji-„Texte“ nicht mitgerechnet), sodass auf eine dieser 2302 Apotheken im Durchschnitt gut 14 Rezensionen entfallen. Auf ein Viertel der Rezensionen wird von den Apotheken geantwortet.
Die Zahl der Kundenrezensionen wächst stetig
14 Rezensionen je Apotheke im Durchschnitt mag nicht besonders viel erscheinen, aber Tabelle 1 zeigt, wie – mit einer Ausnahme – die Zahl der Rezensionen Jahr für Jahr wächst.
Interessant ist vor allem der Anstieg ab 2020 – sowohl bei den Rezensionen als auch bei den Sterne-Bewertungen.
Bemerkenswert ist auch: Weniger als die Hälfte (41,8%) der 32.431 Rezensionen erhalten eine oder mehrere Likes. Auf diese Rezensionen werden insgesamt 29.193 Likes verteilt, was im Durchschnitt gut zwei Likes je Rezension entspricht. Die obersten zehn Plätze der Likes-je-Rezension-Rangliste belegt eine Lörracher Apotheke, bei der zehn ihrer 4-Sterne- und 5-Sterne-Rezensionen insgesamt 880 Likes erhalten, im Maximalfall für eine Rezension („Sehr freundliches und angenehm hilfsbereites Personal“) sogar 181 Likes. Hier stellt sich die Frage, wie es zu diesen Ausreißern nach oben bei den Rezensionen einer einzelnen Apotheke kommt. Eine Antwort könnte sein, dass diese Apotheke ihre Kunden aktiv auf die Möglichkeit der Rezensionsabgabe und -beurteilung hinweist.
Jahr | 2010 | 2011 | 2012 | 2013 | 2014 | 2015 | 2016 | 2017 | 2018 | 2019 | 2020 | 2021 | 2022 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Sterne-Bewertungen | 3 | 20 | 44 | 78 | 111 | 318 | 1511 | 5357 | 5145 | 5630 | 6674 | 11.654 | 11.703 |
… davon mit Rezension | 3 | 7 | 29 | 45 | 78 | 178 | 885 | 3133 | 3076 | 3887 | 4568 | 8122 | 8420 |
Negative Rezensionen sind häufig sehr umfangreich
Analysiert man die prozentuale Verteilung der Sterne-Bewertungen mit und ohne Rezension für die von uns anhand der Zahl der Sterne gebildeten Bewertungskategorien, ergibt sich folgendes Bild für die Apotheken in Baden-Württemberg (s. Tab. 2).
Bewertung(Anzahl der Sterne) | Bewertungskategorie | Bewertungen ohne Rezension | Bewertungen mit Rezensionen |
---|---|---|---|
5 | positiv | 74,0% | 73,1% |
4 | 13,2% | 6,8% | |
3 | neutral | 4,5% | 2,5% |
2 | negativ | 1,3% | 2,4% |
1 | 7,0% | 15,2% | |
N | – | 15.817 | 32.431 |
Die Zahl an positiven Bewertungen (mit und ohne Rezension) ist sehr hoch. Der Anteil der negativen Bewertungen fällt doppelt so hoch aus bei den Bewertungen mit Rezension im Vergleich zu den Bewertungen ohne Rezension. Anscheinend teilen sich die Kunden eher mit, wenn sie unzufrieden sind. Hier liegt eine Chance für die Vor-Ort-Apotheken, etwas über die Kritikpunkte der Kunden zu erfahren!
Dies zeigt auch Tabelle 3, die die Wortanzahl im arithmetischen Mittel sowie deren Median für die einzelnen Bewertungskategorien gegenüberstellt. Interessant ist auch, dass der Anteil der negativen Rezensionen seit Jahren kontinuierlich steigt: So lag er 2017 noch bei 8,7%, im Jahr 2022 bei 21,8%.
Rating-Kategorie | AnzahlRezensionen | Wortanzahlarithmetisches Mittel | WortanzahlMedian |
---|---|---|---|
positiv | 25.912 | 21,6 | 14,0 |
neutral | 797 | 34,6 | 19,0 |
negativ | 5722 | 52,8 | 35,0 |
Summe | 32.431 | – | – |
Freundlichkeit oder Unfreundlichkeit des Teams sind häufig entscheidend
Für die weitere Analyse im Rahmen des Text Mining wurden die Rezensionen einem Preprocessing unterzogen. Insbesondere wurden die Texte so gefiltert, dass lediglich Substantive, Verben, Adjektive sowie Negationen in den Rezensionen behalten wurden. Auch wurden die Wörter auf ihren Wortstamm und auf Kleinschreibung reduziert. Nach diesem Preprocessing blieben von den 32.431 noch 32.209 Rezensionen übrig.
Grundsätzlich ist das Text Mining eine recht anspruchsvolle Disziplin im Bereich Data Science, da man es mit Textdokumenten, also mit „unstrukturierten Daten“, zu tun hat. Im Gegensatz zu „strukturierten Daten“, beispielsweise mit Zahlen gefüllte Zeilen und Spalten einer Tabelle, können diese vom Computer nicht ohne Weiteres verarbeitet bzw. analysiert werden. Zum Text Mining gehört daher in der Regel die Transformation der unstrukturierten Daten in strukturierte Daten, so dass die ursprünglich für das menschliche Verständnis formatierten Daten, z. B. ein Zeitungsartikel, in ein Format umgewandelt werden, das Computer verarbeiten können. Diese Umwandlung von Text in Zahlen, das heißt in Matrizen oder Vektoren, findet beispielsweise auch statt, wenn die Software ChatGPT eine unserer Fragen verarbeitet und beantwortet. Hier setzen wir solche Techniken ein, die automatisiert häufig genannte Themen innerhalb der Gesamtheit unserer Rezensionen identifizieren und benennen.
Zunächst lassen sich aber bereits Erkenntnisse durch die reine Auszählung von Worthäufigkeiten in Rezensionen der beiden Bewertungskategorien „positiv“ und „negativ“ gewinnen. Zum einen kann man analysieren, welche aussagekräftigen Wörter nach dem Preprocessing besonders häufig in positiven Rezensionen vorkommen und welche besonders häufig in negativen Rezensionen auftauchen (s. Tab. 4).
Top-Wörter in positiven Rezensionen | Top-Wörter in negativen Rezensionen | ||
---|---|---|---|
freundlich | 48,1% | unfreund | 29,7% |
berat | 36,4% | medikament | 18,5% |
kompetent | 26,8% | kund | 14,5% |
personal | 19,8% | personal | 12,4% |
nett | 19,7% | berat | 11,6% |
servic | 12,5% | rezept | 9,4% |
hilfsbereit | 10,1% | dam | 7,5% |
mitarbeit | 9,6% | mitarbeit | 6,4% |
team | 7,5% | servic | 5,4% |
schnell | 7,2% | bestell | 5,2% |
Dazu ein Lesebeispiel: In 48,1% der positiven Rezensionen taucht das Wort „freundlich“ auf, während in 29,7% der negativen Rezensionen das Wort „unfreundlich“ vorkommt. Tabelle 4 gibt einen ersten Hinweis darauf, wie wichtig eine kompetente Beratung durch freundliche Mitarbeiter der Apotheke für eine gute Beurteilung ist.
Man kann die Analyse aber auch umgekehrt durchführen: Anstatt zu fragen, welche Wörter in Rezensionen einer bestimmten Bewertungskategorie besonders häufig auftreten, kann untersucht werden, welche Bewertungskategorie eine Rezension aufweist, wenn sie bestimmte Wörter enthält. Tabelle 5 zeigt diese Information für die in Tabelle 4 identifizierten besonders häufig vorkommenden Wörter.
Auch hierzu ein Lesebeispiel: Wenn die Rezension das Wort „Team“ enthält, fällt sie zu 97,5% positiv aus, enthält sie das Wort „unfreundlich“, liegt die Wahrscheinlichkeit für eine negative Rezension bei 94,7%.
positive Rezensionen bei bestimmten Wörtern | negative Rezensionen bei bestimmten Wörtern | ||
---|---|---|---|
team | 97,5% | unfreund | 94,7% |
kompetent | 97,4% | rezept | 54,7% |
hilfsbereit | 96,3% | dam | 54,3% |
nett | 94,7% | kund | 38,5% |
freundlich | 94,3% | bestell | 31,6% |
schnell | 93,0% | medikament | 30,9% |
berat | 92,5% | mitarbeit | 12,6% |
servic | 89,9% | personal | 12,0% |
personal | 86,0% | servic | 8,6% |
mitarbeit | 85,4% | berat | 6,5% |
Die Zahlen in dieser Abbildung bestätigen die Erkenntnisse aus Tabelle 4: Zwar spielen Fragen der Medikamentenbeschaffung (rezept, medikament, bestell) auch eine wichtige Rolle, an allererster Stelle stehen aber Sachverhalte, die das Apothekenpersonal selbst in der Hand hat, nämlich das Auftreten als hilfsbereites und freundliches Team, das den Kunden mit seiner Beratung und seinem Service überzeugen soll.
Eine weitere Möglichkeit, Informationen über die Bedeutung einzelner Wörter für die Bewertung zu erhalten, besteht darin, ein Machine-Learning-Modell mit einem großen Teil der Rezensionen und der jeweiligen Information zur Bewertungskategorie so zu trainieren, dass es in der Lage ist, anhand des Inhalts einer ihm unbekannten Rezension die Rating-Kategorie für diese Rezension vorherzusagen. Wenn dies mit einer ausreichenden Prognosegüte möglich ist, kann innerhalb des Machine-Learning-Modells analysiert werden, welche Wörter das Modell besonders häufig verwendet hat, um eine Prognose bezüglich der Bewertungskategorie anstellen zu können. Mit dem Random-Forest-Algorithmus haben wir ein solches Modell erstellt, das eine gute Prognosegüte aufweist (Sensitivität: 97,7%, Spezifität: 75,7%). Im Ergebnis wird deutlich, dass das Modell besonders häufig die Wörter „freundlich“ und „unfreundlich“ zur Unterscheidung zwischen positiven und negativen Rezensionen verwendet, was wiederum die Bedeutung des Auftretens des Apothekenteams gegenüber den Kunden bestätigt.
Das Team kann sehr häufig die Bewertung beeinflussen
Die bisherigen Ergebnisse vermitteln einen Eindruck, welche Faktoren einen hohen Einfluss auf die Bewertung durch die Apothekenkunden haben. Im Folgenden soll über die Analyse einzelner Wörter hinausgegangen und die wichtigsten Themen über alle Rezensionen identifiziert werden. Für dieses sogenannte Topic Modeling stehen im Rahmen des Text Mining verschiedene Verfahren zur Verfügung. In der vorliegenden Untersuchung wurde mit der Latent Dirichlet Allocation (LDA) ein bewährtes Standardverfahren eingesetzt, bei dem die Themen der Texte dadurch sichtbar gemacht werden, indem häufig vorkommende und gemeinsam auftretende Worte innerhalb der Texte identifiziert werden.
Für die LDA-Analyse wurden alle Rezensionen, die weniger als zehn Wörter enthalten, ausgeschlossen, da der Algorithmus ansonsten Schwierigkeiten mit der Themenzuordnung hat. Um im Anschluss den Einfluss der identifizierten Themen auf die Polarität der Rezensionen zu untersuchen, wurden ebenfalls Rezensionen mit neutralem Rating ausgeschlossen. Auf diese Weise hat sich die Zahl der Rezensionen auf 10.915 reduziert.
Tabelle 6 zeigt die Themenbereiche, die mithilfe der LDA-Analyse identifiziert wurden. Dabei ist zu beachten, dass der Algorithmus nur die thematisch zusammenhängenden Wörter identifiziert und ausweist, den konkreten Themennamen haben wir daraufhin vergeben (Tab. 6).
Thema der Rezension | Name | Auswirkung auf die Bewertungskategorie |
---|---|---|
1 | positive Beratung und Service | stark positiv |
2 | Personal negativ | sehr stark negativ |
3 | Apotheken-„Team“ (auch individuelle Nennungen) | positiv |
4 | Rezepteinlösung und -bestellung | negativ |
5 | Preisaspekte | stark negativ |
6 | Corona-Test | negativ |
Die Themen sind absteigend nach der Rezensionshäufigkeit geordnet, das heißt „positive Beratung und Service“ wird den meisten Rezensionen als Thema zugeordnet. Ebenfalls sind in Tabelle 6 die Auswirkungen der einzelnen Themen auf die Bewertungskategorie angegeben. Diese wurden mithilfe einer logistischen Regression ermittelt, wobei die Bewertungskategorie, positiv oder negativ, die (binäre) abhängige Variable darstellt, während die durch den LDA-Algorithmus ausgegebenen Zuordnungswahrscheinlichkeiten der einzelnen Rezensionen zu jedem der sechs Themen als unabhängige Variablen verwendet wurden.
Auch hier wird wieder deutlich, dass es die Apotheke zum größten Teil selbst in der Hand hat, ob sie insgesamt positiv oder negativ beurteilt wird. Denn am häufigsten werden den Rezensionen Themen zugeordnet, die die Beratung und den Service sowie das Personal im Allgemeinen bzw. explizit das „Team“ oder konkret einzelne Mitarbeiter der Apotheke betreffen. Diese Aspekte wirken sich teilweise auch sehr stark auf die Bewertung aus. Schwierigkeiten bei der Rezepteinlösung und Bestellung sowie Preisaspekte haben zwar auch eine Auswirkung auf die Beurteilung der Apotheke, spielen aber eher eine nachgeordnete Rolle. Dies gilt umso mehr für Aspekte rund um die Corona-Tests.
Filialapotheken nicht schlechter bewertet als Einzelapotheken …
Und was ist nun mit dem Apothekentyp? Lassen sich Unterschiede in den Bewertungen zwischen Einzel-, Haupt- und Filialapotheken erkennen? Um es vorwegzunehmen: Es gibt zwar Unterschiede in der durchschnittlichen Bewertung von Einzelapotheken im Vergleich zu Haupt- oder Filialapotheken. Allerdings zeigt Tabelle 7, dass die Standardabweichungen der durchschnittlichen Bewertung innerhalb der drei Apothekentypen im Vergleich zu den Mittelwertunterschieden der Bewertungen zwischen den Apothekentypen recht groß ausfallen, so dass nicht von klaren Unterschieden in den Bewertungen gesprochen werden kann. Da wir in unserer Untersuchung mit einer Vollerhebung arbeiten, wird hier und im Folgenden auf statistische Stichproben-Tests verzichtet bzw. diese werden nicht benötigt. Für die Analyse haben wir uns auf Bewertungen mit Rezensionen aus dem Jahr 2022 beschränkt, da unsere Informationen zum Typ der jeweiligen Apotheke aus diesem Jahr stammen.
Apothekentyp | durchschnittliche Bewertung | Standardabweichung | Zahl Apotheken |
---|---|---|---|
Einzelapotheke | 4,14 | 1,12 | 1099 |
Filialapotheke | 4,06 | 1,17 | 538 |
Hauptapotheke | 4,05 | 1,08 | 390 |
… aber die Größe des Filialverbundes spielt eine Rolle
Die durchschnittliche Bewertung kann neben dem Apothekentyp auch mit der Zahl der Apotheken ins Verhältnis gesetzt werden. Die Eins steht für eine Einzelapotheke. Tabelle 8 zeigt die entsprechenden Werte.
Hier wird ein Unterschied in der durchschnittlichen Bewertung von Einzelapotheken und Apotheken in einem Filialverbund mit vier Apotheken deutlich. Eine mögliche Begründung für diesen Befund könnte darin liegen, dass es dem Inhaber mit zunehmender Größe des Filialverbundes schwerfällt, die Qualität der Kundenbetreuung in allen seinen Filialen hochzuhalten.
Anzahl Apotheken im Filialverbund | durchschnittliche Bewertung | Standardabweichung | Bewertungen mit Rezensionen |
---|---|---|---|
1 | 4,14 | 1,12 | 1099 |
2 | 4,09 | 1,14 | 485 |
3 | 4,10 | 1,05 | 249 |
4 | 3,90 | 1,20 | 194 |
Ergebnisse in der Zusammenfassung
Der weitaus überwiegende Teil der Bewertungen mit und ohne Rezension fällt für die Apotheken positiv aus. Allerdings wird auch deutlich, dass die Apothekenkunden im Zeitverlauf kritischer geworden sind und dies auch in den Rezensionen kundtun. Aber genau hier liegt auch die Chance für die Apotheken:
- Zum einen enthalten die Rezensionen, je umfangreicher sie ausfallen, umso eher Hinweise, was genau sauer aufgestoßen ist und eventuell verbessert werden kann.
- Zum anderen lautet ein zentrales Ergebnis der Untersuchung, dass es auch in Zeiten von Corona und Lieferengpässen immer noch das Apothekenteam ist, das es mit seiner Beratung und seinem Auftreten zum großen Teil selbst in der Hand hat, ob eine Bewertung positiv oder negativ ausfällt.
Für die Filialapotheken gilt, dass sie nicht per se schlechter bewertet werden als beispielsweise die Einzelapotheken. Die Ausnahme sind Filialverbünde mit vier Apotheken: Diese schneiden im Durchschnitt schlechter ab als andere Apothekentypen. Dies könnte Fragen nach der Führungsqualität aufwerfen. |
0 Kommentare
Das Kommentieren ist aktuell nicht möglich.