Peter Kabel über Sprach-KI: „Conversational Interfaces legen zu“

HAW-Professor Peter Kabel erläutert im Interview, warum Deep-Learning-gespeiste, sprachbasierte Eingabesysteme jetzt u.a. im Voice Commerce so wichtig werden. Und warum und wie Unternehmen rechtzeitig in diese „Conversational Interfaces“ einsteigen sollten.Conversational Interfaces: Mit jedem Dialog lernt die Maschine

Was sind Conversational Interfaces und was macht sie so wichtig?

Prof. Peter Kabel: Menschen sprechen mit Maschinen und müssen sich perspektivisch keine Gedanken mehr machen, wie sie antworten – weil die Maschine sie immer besser versteht. Egal ob sie noch tippen oder sprechen: Ein natürlich-sprachliches „Wie backe ich einen Apfelkuchen?“ (früher: „Apfelkuchen AND backen“) reicht völlig aus. Diese Fortschritte beim Erkennen menschlicher Nutzeranliegen stehen nun nicht mehr nur Suchmaschinen zur Verfügung.

Siri, Google Assistant, Alexa, Bixby, Cortana und Co. Lassen sich mitunter zur Aussage verleiten „Ich kann dich nicht verstehen …“. Wie ausgereift sind Conversational Interfaces aktuell tatsächlich?

Kabel: Natural Language Processing (NLP) – also die Fähigkeit, das Nutzeranliegen (den „Intent“) richtig zu erkennen und adäquat auf eine Frage zu antworten, steht noch ganz am Anfang. Wer Fragen („Queries“) richtig antizipieren kann und sein Angebot darauf zuschneidet, ist erfolgreicher – ein Vorgang, wie man ihn auch aus der Suchmaschinen-Optimierung von Web-Angeboten kennt. Wer beispielsweise mit schwer verständlichen Produktnamen arbeitet, verliert. Denn insbesondere Voice-basierte Systeme brauchen eindeutige und verständliche Bezeichnungen.


 

Prof. Peter Kabel: „Werbungtreibende werden wegen der Gatekeeper Apple, Google und Amazon Schwierigkeiten haben, eine eigene User Journey auf die Beine zu stellen“

Prof. Peter Kabel: „Werbungtreibende werden wegen der Gatekeeper Apple, Google und Amazon Schwierigkeiten haben, eine eigene User Journey auf die Beine zu stellen“   (Foto: Anton Ahrens)


Gerade semi-intelligente, klassische Bots stehen im Ruf, kein Gedächtnis zu haben. Was bedeutet das für komplexe Anfragen und Service-Anliegen?

Kabel: Ein Probem aktueller NLP-Lösungen besteht tatsächlich darin, innerhalb einer Chat-Session den „State“ erhalten: Es gilt, das Gedächtnis der Maschine, also mehrere Teilaspekte des Dialogs, in die fortlaufende Konversation einzubeziehen und nicht einfach wieder zu vergessen. Ein Dialog, bei dem es beispielsweise um Reiseziel, Reisezeit und Reiseart geht, darf nicht bei jedem neuen Nutzerbeitrag von vorn beginnen. Zugegeben: Das hört sich einfach an, ist es aber nicht. Für die Maschine ist es schwierig zu erkennen, wann der Dialogbeitrag eines Nutzers endet und wann sie mit der Analysearbeit beginnen soll.

Wie verbessert maschinelles Lernen bzw. „Machine Learning“ den Status quo?

Kabel: Je enger ich eine Wissensdomäne definiere und je mehr wiederkehrende Anfragen stattfinden, desto schneller werden sich Lernerfolge einstellen. Etwa rund um das Thema, eine Zugfahrkarte zu buchen: Das indische Start-up Niki.ai an dem ich beteiligt bin, weist aufgrund seiner verhältnismäßig engen Domäne im Ticket-Bereich bereits jetzt eine Lösungsquote von mehr als 79 Prozent auf.

Wie erfolgreich sind hingegen Generalisten wie Siri oder Cortana?

Kabel: Universelle Bots haben es aufgrund geringer Wiederholungsraten und größerer Interpretationsspielräume vergleichsweise schwer, schnelle Fortschritte zu erzielen. Sie sind beim Erkennen längst nicht derart ausgereift und beschränken sich meist auf Web-Suchen oder Suchen im eigenen Datenbestand. Aktuell können sie keine oder nur wenige tatsächlich transaktiven Dienste anbieten. 

Laut dem KI-Experten Dr. Tristan Behrens gehen Chatbot-Interessenten „häufig davon aus, dass sie einen philosophierenden Nietzsche erhalten“. Von welchen Vorurteilen müssen sich Unternehmer verabschieden?

Kabel: Ich bin skeptisch hinsichtlich des Begriffs „Intelligenz“. Maschinelle Intelligenz entsteht, wenn sie Sprachmuster erkennt, relevante Daten zusammenzuzieht und intelligent aufbereitet. Beispiel: Mit Wissen aus der Kundendatenbank, Wetterdaten und vielem mehr bietet mir die KI einen Sommerschuh meiner Lieblingsmarke in der richtigen Größe an.

Sobald dies reibungslos funktioniert …

Kabel: … nennen wir dies nicht mehr „Künstliche Intelligenz“. Verschiebungen von Begriffsdefinitionen gibt es ja häufig: Ein heute gebräuchlicher Waschvollautomat wurde vor 20 Jahren noch als intelligent angepriesen. Das Gleiche geschieht bei der Personalisierung und beim Targeting im Internet.

 


Lesen Sie dazu auch

Künstliche Intelligenz im Kundenservice: Wie Voice Services die One-to-one-Kundenbeziehung optimieren


 

So lange wir das noch tun: Wie sollten Conversational-Interface-willige Unternehmen in diese Thematik starten?

Kabel: Ich rate Einsteigern, mit einem Service-Bot zu beginnen und diesen mit dem Ticketing-System im Kundenservice zu koppeln. Die meisten Aftersales-Fragen drehen sich um überschaubare Themen wie Retouren-Management oder Lieferstatus. Zudem bestehen bereits herkömmliche dialogische Strukturen, um mit Kunden in Kontakt zu kommen. So gelingt es, maschinell schnell zu lernen.

Apropos KI-Training: Was geschieht im Hinblick auf die Daten?

Kabel: Mit dem Initial-Input aus den Contact-Center-Daten sind Systeme bereits nach wenigen Monaten so gut trainiert, dass sich erste Erfolge einstellen und Unternehmen Call-Center-Agenten nur noch für Querchecks, komplexere Anfragen oder Eskalationen einsetzen müssen.

Worauf kommt es beim Einstieg in Conversational Interfaces taktisch an?

Kabel: Im Kundenservice macht sich deren Erfolg nicht nur daran fest, dass sie den Service von jetzt auf gleich vollautomatisieren – und damit für Kunden erheblich verbessern. Viel wichtiger ist es für Organisationen, sich mit dem technischen Workflow auseinanderzusetzen – in einer Alpha-Phase intern, in einer Beta-Phase mit den ersten Kunden. Sobald im Kundenservice ausreichend Erfahrungen vorliegen, können Firmen sich an Produktempfehlungs-Bots und Beratungsmaschinen heranwagen.

Welche unternehmerischen Voraussetzungen sind erforderlich, um sich Kompetenzen zur Programmierung eines Service-Bots oder einer Beratungsmaschine zu erwerben?

Kabel: Testen Sie und bauen Sie Prototypen, um frühzeitig auf diesem Gebiet zu lernen. Das fängt beim Mindset auf Entscheiderebene an, um Conversational Interfaces gerade im Management in ihrer Komplexität zu begreifen. Gut vorbereitet, angeleitet sowie mit Open-Source-Anwendungen und Datenbanken über die jeweilige Wissensdomäne ausgestattet, gelingt es auch C-Level-Entscheidern, in wenigen Stunden selbst einen Witzerzähl- oder Kochrezepte-Bot zu programmieren. Vor allem bauen die Manager damit Vorurteile gegenüber der Technologie ab und lernen, wie wichtig es ist, Sprache in ihre Bestandteile zu zerlegen.

Damit eigene Bots künftig nicht kapitulieren: Was braucht es, um ein „Ich kann dich nicht verstehen …“ zumindest richtig zu interpretieren?

Kabel: Nirgendwo sonst ist iteratives, agiles Arbeiten wichtiger und richtiger als beim Aufbau und der Optimierung von Bots. Es gibt kein festes Layout wie bei einer Website. Jeder Dialog variiert. Mit jedem einzelnen Dialog lernt die Maschine: Sie rankt mögliche Lösungen nach deren Wahrscheinlichkeit in den vorangegangenen Fällen. Die Entscheidung, ob die Lösungen richtig gewichtet sind und menschliche Nutzer zufrieden machen, trifft und beeinflusst jetzt meist den Betreiber. Er entscheidet auch, ab welchem Schwellenwert die Eskalation zum leibhaftigen Service-Agenten angemessen ist. Je besser der Betreiber seine Kunden kennt, um so besser kann er die Maschine darauf vorbereiten, möglichst selten mit einem „Ich kann dich nicht verstehen“ zu antworten.

Wie verändern Conversational Interfaces die User Journey?

Kabel: Der Machine-to-Machine-Dialog wird massiv zunehmen. Persönliche Bots verhandeln künftig mit Ticket-Maschinen und Service-Bots und erfüllen „nur“ noch unsere Vorgaben.

Was bedeutet das für die Angebote, die Maschinen handeln, sowie für die dazugehörigen Marken?

Kabel: Die Dynamik, mit der die Wirtschaft Skills und kleine Anwendungen produziert, nimmt schneller zu als es bei Smartphone-Apps der Fall ist. Das bedeutet, dass werbungtreibende Unternehmen nicht mehr an den dazugehörigen Gatekeepern Apple, Google und Amazon vorbeikommen und somit Schwierigkeiten haben werden, eine eigene User Journey auf die Beine zu stellen.

 Welche Auswirkungen haben die dominierenden Marktplätze und App Stores auf das Voice-Marketing?

Kabel: Wahrscheinlich wird sich ein hochkomplexes System entwickeln, das fallweise über Text- und Spracheingabe gesteuert wird. Gleichzeitig bezieht es die unterschiedlichen Bildschirme im Nutzerumfeld – Smart-Watch, Kühlschrank, Smart-Phone, TV etc. – flexibel ein. Es ist unerheblich, ob dies in den bewussten Walled Gardens, also etwa in der Amazon- oder der Google-Welt, stattfindet oder in verknüpften Ökosystemen. Firmen müssen sich darum bemühen, auf Marktplätzen bzw. in App Stores relevant zu sein und zu bleiben.

Wie schaffen es Marken, auf diesen Plattformen prominent vertreten zu sein?

Kabel: Für Nutzer gestaltet es sich schwierig, neue Skills und Bots zu entdecken. Schwache Marken wie No-Name-Taschentücher oder unbekannte Angebote werden es besonders schwer haben. Unternehmen müssen daher Media-Aufwände zur Bekanntmachung ihres Angebots kalkulieren. Gleichzeitig wird es darum gehen, die eigenen Service-Angebote und Inhalte über gut gepflegte Schnittstellen und kompatible Web-Services zu gliedern und die Schnittstellen aktiv per sogenanntem B2B-API-Marketing bei den Plattformbetreibern zu platzieren.

Welcher Faktor ist bei hohem Wettbewerbsdruck am erfolgskritischsten für Unternehmen, die Voice-Services nutzen wollen?

Kabel: Es geht um den Klassiker: Silos aufzubrechen und Systeme über Schnittstellen so zu koppeln, dass die Systeme in Echtzeit kompatibel sind. Diese sollten nicht den nächsten SAP-Run benötigen, um richtig zu beauskunften. Interessenten warten nicht, bis die Logistik- und Lagerdaten aktualisiert sind. Systeme und Daten-Reservoirs müssen so aufgestellt sein, dass sich überall Schnittstellen implementieren lassen. Denn datengetriebene Service-Angebote kommen nur über Schnittstellen zum Kunden.

Ehemals starke Marken, die sich der Disruption in der Vergangenheit und damit dem Voice-Trend verweigert haben, sind gescheitert. Warum?

Kabel: Weil die Einstiegshürden mit zunehmender Marktreife zu hoch waren. Und weil neue Player etwa mit einem frühen und konsequenten „Mobile First“ und damit verbundenen steilen Lernkurven wesentlich erfolgreicher waren. Sie haben die alten Player verdrängt.

Was bedeutet diese Disruption für den Trend der Conversational Interfaces?

Kabel: Hier drohen dieselben Gefahren und zeitgleich winken dieselben Chancen. Wer früh dabei ist, profitiert von einer steilen Lernkurve. Denn: Conversational Interfaces werden immens an Bedeutung gewinnen.


Über Peter Kabel

Peter Kabel lehrt an der Hamburger Hochschule für Angewandte Wissenschaften (HAW) Interaction- und Servicedesign. Er ist Gründungspartner von  Asian E-Commerce Alliance AECAL in Hamburg und damit u.a. am indischen Start-up Niki.ai beteiligt. Das Urgestein der Digitalwirtschaft hat schon alle Höhen und Tiefen der Internetbranche hautnah miterlebt.


Mehr Wissen, Methoden, Trends und Insights

Digital Services mit dem Fokus auf Customer Experience kommen auch bei den virtuellen Weiterbildungsprodukten von AVADO Learning zum Tragen unter anderem bei Drive Digital, dem virtuellen Kurs, der Denk- und Arbeitsweisen verändert. Machen Sie sich selbst ein Bild:

Mehr zu AVADO Learning  und Drive Digital gibt es hier. 

Geschrieben von

Kristina Schreiber

Kristina Schreiber war bis April 2018 Senior Corporate Editor bei AVADO Learning. Sie schreibt seit fast zwei Dekaden über Digitalisierung und Marketing, vormals u.a. für absatzwirtschaft, acquisa, Adzine, Internet World Business und ONEtoONE. Kristina brennt für Data-, Analytics- und Tech-Themen ebenso wie für disruptive Geschäftsmodelle und kulturellen Wandel.