Conversational Interfaces intelligenter gestalten
Unter „intelligenten“ Benutzungsoberflächen oder Schnittstellen kann man sich eine Menge vorstellen. Um eines von vorneherein klarzustellen: Das Intelligenzniveau der meisten Chatbots da draussen reicht meiner Meinung noch nicht aus, als dass ich sie als „intelligent“ bezeichnen würde. Aber fangen wir mal von vorne an. Was sind Conversational Interfaces und warum sind sie intelligent (oder sollten es sein)?
Was sind Conversational Interfaces?
Definition
Conversational Interfaces sind Systeme, die natürliche Sprache verarbeiten und (meistens) sinnvolle Antworten finden oder Aktionen ausführen. Sie sind sozusagen „intelligent“, weil sie fähig sind, aus ihren Interaktionen mit Menschen zu lernen. Theoretisch gesehen. Man spricht hier auch von Natural-Language-Processing-Systemen (NLP-Systemen).
Conversational Interfaces können auch sprechen
Conversational Interfaces gibt es nicht nur für den Austausch mit Menschen in Textform, wie bei Chatbots, sondern auch für gesprochene Sprache, wie bei Siri (von Apple) oder Alexa (von Amazon). Schnittstellen, die die menschliche Stimme verstehen, antworten auf demselben Weg und simulieren menschliche Sprache. Einige Synonyme für solche Systeme sind Chatbot, virtueller Agent oder Conversational Bot.
Auf dem Markt gibt es mehrere Plattformen, die solche spezialisierten Conversational Interfaces für unterschiedliche Zwecke anbieten, zum Beispiel Dialogflow von Google, Lex von Amazon, Azure Cognitive Services von Microsoft oder Watson von IBM. Diese Plattformen basieren auf leistungsstarken NLP-Systemen.
In diesem Artikel werfen wir einen Blick auf die Grundlagen für die Gestaltung, oder besser, für die Konzeption von Conversational Interfaces, die ein wenig „intelligenter“ sind (aber wirklich nur ein bisschen).
Apropos Intelligenz
Hier stellt sich eine weitere Frage: Wann ist ein Chatbot intelligent? Oder was macht einen Chatbot intelligent? Als wir zum ersten Mal mit einem NLP-System herumexperimentierten, kamen wir schnell zu der enttäuschenden, aber klaren Erkenntnis, dass das Ding nichts konnte, wofür man es nicht explizit konfiguriert hatte. Anders gesagt: Ein NLP-System muss intensiv konfiguriert und justiert werden, bevor es sinnvolle Antworten geben kann. Deswegen ist es so schwierig, einen Chatbot „intelligenter“ wirken zu lassen.
Ein NLP-System muss intensiv konfiguriert und justiert werden, bevor es sinnvolle Antworten geben kann. Deswegen ist es so schwierig, einen Chatbot „intelligenter“ wirken zu lassen.
Graciela Schütz
Senior UX Architect, Unic
Conversational Interfaces konzipieren
Wie ich oben schon erwähnte, ist ein Conversational Interface ein System, das zu (hoffentlich) sinnvoller Interaktion mit einem Menschen in natürlicher Sprache imstande ist. Damit es das kann, muss das NLP-System konfiguriert werden. Diese Konfiguration erfordert eine Datenbank mit Sätzen und deren Abfolgen.
Emotionen – Persönlichkeit bewusst gestalten
Wir Menschen sind fühlende Wesen, und das heisst, dass eine Interaktion mit einem solchen System Emotionen auslöst. Schliesslich simuliert ein Conversational Interface natürliche, gesprochene Sprache, die echt wirkt. Unsere Emotionen können dabei positiv, negativ oder irgendwo dazwischen sein. Deswegen ist es so wichtig, die Persönlichkeit eines solchen Conversational Interface mit Bedacht zu gestalten. Wir wollen ganz sicher sein, dass Kund:innen oder Anwender:innen die Begegnung als positiv empfinden. Es soll sich ein bisschen so anfühlen, als würde man mit einem Menschen hinter dem Bildschirm sprechen.
Eine Persona schaffen
Um ein Conversational Interface zu konzipieren oder dessen Persönlichkeit zu gestalten, ist es sehr wichtig, eine Persona zu schaffen. Eine Persona ist die Vorstellung einer fiktiven Persönlichkeit, die uns dabei hilft, unserem Conversational Interface ein Gesicht und Charaktereigenschaften zu verleihen. Es ist leichter, sich die Unterhaltung mit dem Conversational Interface vorzustellen, wenn wir es vor unserem inneren Auge sehen können.
Klare Vorstellung von Zielen und Fähigkeiten
Ich bin mir sicher, dass eine klare Vorstellung der gewünschten Ziele und Fähigkeiten eines Conversational Interface entscheidend dafür ist, dass es intelligenter wird. Der Chatbot sollte eine klare Aufgabe haben und auch klar beantworten können, ob er helfen kann oder nicht. Diese Abgrenzung ist entscheidend, wenn das Conversational Interface eine Anfrage bekommt, für die es einfach nicht trainiert ist. Dann kann es angemessen auf die Situation reagieren.
Wobei soll der Chatbot helfen?
Ein weiterer entscheidender Punkt ist die Frage, wobei der Chatbot denn eigentlich helfen soll. Es gibt so viele Chatbots im Netz, die Nutzer:innen bei Dingen helfen sollen, die kaum Mehrwert generieren. Wenn man einen Chatbot um Informationen bittet und dieser dann nur den Link zu einer Seite ausspuckt, die man auch selbst bei Google hätte finden können, ist er weder wertvoll noch intelligent. Wo kann dann ein Chatbot wertvoll sein? In ihrem Vortrag bei der Front Conference 2021 in Zürich erwähnte Emily Sappington, dass der Wert künstlicher Intelligenz (KI) vor allem in Automatisierung und Effizienz liegt. Sie sagte: „Mit KI sollten wir uns wie Superhelden fühlen (!!!)“
Wie können wir das sicherstellen?
Zusammenfassend gab Emily Sappington uns die folgenden Ratschläge:
Sei ehrlich, was du tun kannst und was du nicht tun kannst
Steuere die Erwartungen entsprechend
Denke in Szenarien
Versuche, nützlich und hilfreich zu sein
Hab Spass
Darauf komme ich später noch zurück. Zunächst schauen wir uns an, aus welchen Elementen ein Conversational Interface besteht.
Mit KI sollten wir uns wie Superhelden fühlen (!!!)
Emily Sappington
Director of Product, Twilio
Die Informationsarchitektur eines Conversational Interface verstehen
Wenn wir entschieden haben, was ein Conversational Interface tun soll und wie seine Persönlichkeit aufgebaut sein soll, müssen wir uns die Informationsarchitektur genauer anschauen. NLP-Systeme als Software-Systeme identifizieren Wörter in den eingegebenen Sätzen. Diese Wörter werden dann in die verschiedenen Elemente einer Konversation unterteilt. Für ein NLP-System sind das „Utterances“, „Intents“ und „Entities“.
„Utterances“
„Utterances“ sind einfach die Äusserungen der Menschen oder des Bots selbst. Utterances sind Teile gesprochener Sprache, wie wir sie aus jedem normalen Dialog kennen. Ein Beispiel: „Es ist sonnig draussen“, oder „Ich habe Hunger“, oder „Ich finde meine Versichertennummer nicht“.
„Intents“
Dann gibt es „Intents“. In einem normalen Gespräch zwischen natürlichen Personen erkennen Menschen schnell, um was für ein Gespräch es sich handelt. Sie können unterscheiden, ob es sich nur um Small Talk handelt, jemand eine Bitte hat oder es um ein bestimmtes Thema geht. Ein Conversational Interface muss identifizieren, was Nutzer:innen oder Kund:innen wollen oder auszudrücken versuchen. Diese Intention, also ob eine Frage beantwortet oder eine Aufgabe erledigt werden soll, das bezeichnet man als Intent.Bei der Äusserung „Wie stehen die Börsenkurse heute?“ handelt es sich nur um eine Informationsabfrage darüber, wie die Aktien heute stehen. Aber bei der Äusserung „Die Börsenkurse steigen heute“ geht es mehr um eine Bestätigung dessen, dass die Börsenkurse heute steigen. Wenn ein NLP-System den Intent identifiziert, wird dieser mit möglichen Aktionen abgeglichen und eine Aktion ausgelöst. So reagiert das System entsprechend und zeigt zum Beispiel die heutigen Kursgewinne an der Börse an. Oder antwortet „Swiss Market Index 3 Punkte über dem gestrigen Stand, Dow Jones 2 Punkte besser als gestern. Stimmt, die Börsenkurse steigen.“
„Entities“
„Entities“ sind Informationen, die ausschlaggebend dafür sind, was der Bot im Backend sucht. Wer, was, wann und wo sind hier die entscheidenden Fragen. Bei der Äusserung „Wie stehen die Börsenkurse heute?“ sind „Börsenkurse“ und „heute“ die Entities. Danach würde das System dann suchen.
Ein Chatbot muss das Gespräch weiterführen, wenn er Antworten hat. Wenn nicht, muss er sich entschuldigen und dann still sein.
Graciela Schütz
Senior UX Architect, Unic
Konversation ist alles
Der letzte Akt ist die Konversation. Ein Chatbot muss das Gespräch weiterführen, wenn er Antworten hat. Wenn nicht, muss er sich entschuldigen und dann still sein.
Um auf Emily Sappington zurückzukommen, würde ich folgenden praktischen Rat geben:
Beschränken Sie die Fähigkeiten des Chatbots auf die Fälle, in denen er wirklich helfen kann (und nicht nur die Suchmaschine ersetzt), und kommunizieren Sie klar, was der Chatbot kann.
Machen Sie sich nicht die Mühe, Konversationsabläufe zu erstellen, wenn Sie die Konversation nicht in Gang halten können. Zum Beispiel fragt der Nutzer etwas Unerwartetes und der Bot hat keine Antwort darauf. Ich würde vorschlagen, den Gesprächsfluss zu analysieren, um festzustellen, an welchem Punkt der Nutzer den Eindruck hatte, dass der Chatbot ihm helfen könnte.
Konzentrieren Sie sich auf Fälle, in denen Automatisierung und Effizienz die Hauptziele sind.
Und bloß nicht den Spass vergessen! Wer mit dem Chatbot gesprochen hat, darf gern mit einem Lächeln wieder gehen.
Fazit
NLP-Systeme sind sehr hilfreich und leistungsstark. Die Intelligenz eines Chatbot sollte man allerdings nicht als selbstverständlich hinnehmen. Diese Intelligenz muss konzipiert, konfiguriert und trainiert werden. Die Abgrenzungen eines Chatbots sind entscheidend für den Erfolg und für den Wert, den der Chatbot liefern kann.
Quellen
Google Cloud Training, “Contact Center AI: Conversational Design Fundamentals”
Raluca Budiu, nngroup.com. "The User Experience of Chatbots"
Josh Lovejoy, “When are we going to start designing AI with purpose?”
Kontakt für Ihre digitale Lösung mit Unic
Termin buchenSie möchten Ihre digitalen Aufgaben mit uns besprechen? Gerne tauschen wir uns mit Ihnen aus.
Wir sind da für Sie!
Termin buchenSie möchten Ihr nächstes Projekt mit uns besprechen? Gerne tauschen wir uns mit Ihnen aus.