Inhalte für den Chatbot optimieren

Wenn Sie den Chatbot einsetzen, bildet dieser die Antworten auf Ihre Fragen mit Hilfe der Inhalte, die diesem als Kontext überliefert werden. Die Qualität der Antwort, aber auch die inhaltliche Vollständigkeit, hängen somit direkt mit der Qualität der übergebenen Inhalte, und somit dem sogenannten Kontext, ab.

Dies gilt umso mehr, wenn der Chatbot keine Internet-Suche für die Erfassung des relevanten Kontexts durchführen soll und somit nur die Inhalte Ihrer Webseite zur Verfügung stehen.

In diesem Artikel wird beschrieben, wie Sie die Inhalte Ihrer Webseite so optimieren können, dass diese gefunden und die passenden Inhalte zur gestellten Frage dem Chatbot als Kontext übergeben werden können. Mit diesen Optimierungen verringern Sie die Wahrscheinlichkeit, dass der Chatbot auf eine Frage unvollständig antwortet oder gar fantasiert.

Funktionsweise des Chatbots verstehen

Um Ihre Inhalte für die Verwendung im Chatbot zu optimieren, ist es zunächst wichtig zu wissen, was prinzipiell zwischen einer gestellten Frage und einer generierten Antwort passiert. Dies gilt insbesondere dann, wenn Sie den Chatbot ohne Internet-Suche und ausschließlich mit den Inhalten Ihrer Webseite betreiben wollen.

wb_incandescent

Zur besseren Verständlichkeit wird im Folgenden die Funktionsweise des Chatbots vereinfacht erklärt.

Ob Sie den Chatbot mit einem Ollama Model, GPT oder Mistral einsetzen: das verwendete Model ist ein sogenanntes Large Language Model (LLM). Dieses Model verfügt über die Möglichkeit natürliche Sprache zu verstehen und in natürlicher Sprache zu antworten. Zusätzlich wurde das Model auch mit einem allgemeinen Wissen zu unterschiedlichen Themen trainiert. Die Komplexität der Spracherkennung und Spracherzeugung, sowie der Umfang der trainierten Wissensdatenbank, hängt dabei stark vom verwendeten LLM ab.

Das bedeutet: das LLM kennt die Inhalte Ihrer Webseite möglicherweise nicht und muss für die Beantwortung einer Frage, die sich auf die Inhalte Ihrer Webseite bezieht, um den entsprechenden Kontext aus Ihren Inhalten ergänzt werden. Dabei wird aus technischen Gründen nicht der gesamte Inhalt Ihrer Webseite als Kontext für die Beantwortung jeder Frage übergeben, sondern nur Abschnitte davon, die zur gestellten Frage passen.

Diese Abschnitte werden über ein sogenanntes Natural Language Processing (NLP) ermittelt. Das bedeutet, dass eine Suche durchgeführt wird, die passende Abschnitte in all Ihren Inhalten zur gestellten Frage finden soll. Dabei werden die gestellte Frage und alle Inhalte Ihrer Webseite in Vektoren umgewandelt und mathematisch verglichen. Die Ähnlichkeit zwischen den Vektoren der gestellten Frage und den Vektoren Ihrer Inhalte bestimmt dabei, ob bestimmte Abschnitte für die Verwendung als Kontext verwendet werden können.

Die NLP Suche findet somit nicht die Abschnitte in Ihren Inhalten, die sinngemäß am ehesten zur gestellten Frage passen könnten, sondern nur die Abschnitte, die im mathematischen Vergleich einen ähnlich Satzbau haben oder ähnliche Wörter beinhalten.

check

Damit die NLP Suche optimale Ergebnisse liefern kann, sind Inhalte mit ausführlichen Beschreibungen und sinnvoll gewählten Wörtern und Bezeichnungen notwendig.

Beispiele für optimale Inhalte

Um das Verständnis zu stärken, wie Sie Ihre Inhalte für die Verwendung im Chatbot optimieren können, helfen einige Beispiele, die immer folgenden Regeln folgen:

  • Beschreiben Sie eine Sache immer ausführlich: Davon auszugehen, dass etwas für einen Besucher Ihrer Webseite implizit verständlich ist und somit nicht extra beschrieben werden muss, führt dazu, dass die zugehörigen Wörter und Bezeichnungen nicht in Ihren Inhalten stehen und somit auch nicht von der NLP Suche gefunden werden können.
  • Strukturieren Sie Ihre Inhalte: Nutzen Sie Tabellen mit beschreibenden Kopfspalten, um die Bedeutung der einzelnen Spalten zu erklären. Für Tabellen, aber auch Listen gilt, dass diese mit einem einleitenden Satz, der erklärt, was in der folgenden Tabelle oder Liste aufgezeigt wird, eine höhere Wahrscheinlichkeit haben, von der NLP Suche gefunden zu werden.
  • Beschreiben Sie Ihre Bilder: Stellen Sie für Ihre Bilder eine ausführliche Beschreibung ein, die das Gezeigte erklärt. Auch Text, der um ein Bild platziert wird, sollte das Gezeigte auf dem Bild erklären. Die NLP Suche kann zusammenhängende Bilder und Texte finden und der Chatbot diese dann auch gemeinsam in der generierten Antwort ausgeben.
  • Beschreiben Sie Abkürzungen: Falls Sie Abkürzungen in Ihren Inhalten verwenden, wie z.B. NLP, schreiben Sie diese auch zusätzlich mindestens einmal ausführlich aus, z.B. Natural Language Processing (NLP). So kann die NLP Suche Abschnitte zu Fragen finden, die nur die Abkürzung oder nur die ausgeschriebene Form enthalten.
  • Verwenden Sie beschreibende Titel und Kurzbeschreibungen: Der Name einer Seite sollte möglichst kurz sein, da dieser für die URL Generierung und für die Anzeige in der Navigation genutzt wird. Der Titel einer Seite sollte hingegen ausführlicher beschrieben sein. Alternativ kann auch die Kurzbeschreibung einer Seite für diesen Zweck verwendet werden. Die NLP Suche stuft Seiten, bei der öfters ähnliche Vektoren zu den Vektoren der Fragen gefunden wurden, höher ein, so dass betroffene Seiten eher als Quellen, und somit Kontext, für die Generierung der Antworten verwenden werden können.
  • Inhalte für Ihre Zielgruppen: Wenn Sie verstehen, wer Ihre Nutzer sind und welche Fragen sie häufig stellen, hilft Ihnen das dabei auf Ihrer Webseite relevante Inhalte zu erstellen und zu optimieren. Der Chatbot bietet Funktionen zur Auswertung des Nutzerverhaltens und der Nutzererfahrung.

Auch das beschreiben, was bereits angenommen werden kann

In diesem Beispiel soll die Funktionsweise eines Newsletters für die Webseiten Besucher erklärt werden. An diesem Newsletter kann man sich anmelden und abmelden:

Melden Sie sich an unseren Newsletter an, um Neuigkeiten zu unseren Produkten zu erhalten. Sie können sich jederzeit vom Newsletter abmelden.

Für den Anwender ist eventuell bereits ersichtlich, dass für die Anmeldung eine E-Mail Adresse über die Eingabe in einem Formular erforderlich ist. Bei der Abmeldung kann der Anwender davon ausgehen, dass seine personenbezogenen Daten gelöscht werden oder er zumindest beim Zeitpunkt der Abmeldung darüber in Kenntnis gesetzt wird.

Stellt man nun dem Chatbot die Frage, "Wie kann ich mich am Newsletter anmelden?", wird dieser über die NLP Suche zwar den Abschnitt finden, dass eine Anmeldung möglich ist, aber darin nicht die Informationen dazu, welche Daten die Anmeldung erfordert.

Auch die Frage an den Chatbot, "Wie kann ich mich vom Newsletter abmelden und was passiert mit meinen Daten?", würde lediglich zu einer Antwort führen, die zwar die Möglichkeit einer Abmeldung am Newsletter bestätigt, aber keine weiteren Auskünfte dazu liefert, was mit den personenbezogenen Daten passiert.

Um die Qualität der Antworten auf die gestellten Fragen zu optimieren, lohnt es sich den Abschnitt entsprechend zu ergänzen:

Melden Sie sich mit Ihrer E-Mail Adresse an unseren Newsletter an, um Neuigkeiten zu unseren Produkten zu erhalten. Sie können sich jederzeit vom Newsletter abmelden. Ihre personenbezogenen Daten werden dann natürlich gelöscht.

wb_incandescent

Sollte man kurze und knappe Texte auf der Webseite bevorzugen, bietet sich als Alternative auch eine Seite an, die häufig gestellte Fragen ausführlich beantwortet (FAQ). Die NLP Suche kann dann diese FAQ Seiten als weitere Quellen für den Kontext heranziehen.

Unstrukturierte Daten beschreiben

In diesem Beispiel soll für interne Mitarbeiter eine Liste geführt werden, die die Namen der Mitarbeiter enthält, deren E-Mail Adressen, eine PIN Nummer für die Eingangstür und die direkte Telefondurchwahl. Eine typische Darstellung solcher unstrukturierten Daten könnte wie folgt aussehen:

Max Mustermann max.mustermann@domain.de 1234 001

Erika Mustermann erika.mustermann@domain.de 5678 002

Diese Darstellung verzichtet auf Beschreibungen dazu, welche Werte welche Bedeutung haben. Stattdessen wird darauf gesetzt, dass der menschliche Anwender die Zusammenhänge erkennen kann. Damit aber die NLP Suche bei einer Frage wie, "Welchen PIN für die Eingangstür hat Max Mustermann?" fündig werden kann, aber auch das LLM die Zusammenhänge dieser Werte deuten kann, empfiehlt sich entweder eine Darstellung in einer Tabelle oder einer Liste. In beiden Fällen wird aber ein einleitender Satz oder eine Überschrift empfohlen.

Beispiel als Tabelle

Im Folgenden werden für alle Mitarbeiter zusätzliche Informationen wie E-Mail Adresse, PIN für die Eingangstür und die Telefondurchwahl aufgelistet.

Nachname Vorname E-Mail Adresse PIN Eingangstür Telefondurchwahl
Mustermann Max max.mustermann@domain.de 1234 001
Mustermann Erika erika.mustermann@domain.de 5678 002

Beispiel als Liste

Im Folgenden werden für alle Mitarbeiter zusätzliche Informationen wie E-Mail Adresse, PIN für die Eingangstür und die Telefondurchwahl aufgelistet.

  • Mustermann, Max:
    • E-Mail Adresse: max.mustermann@domain.de
    • PIN Eingangstür: 1234
    • Telefondurchwahl: 001
  • Mustermann, Erika:
    • E-Mail Adresse: erika.mustermann@domain.de
    • PIN Eingangstür: 4567
    • Telefondurchwahl: 002

Chatbot Auswertungen nutzen

Der Chatbot speichert die Verläufe der getätigten Unterhaltungen. Eine Analyse dieser Unterhaltungen kann dabei helfen Mängel in den Chatbot Antworten festzustellen und entsprechend die Inhalte Ihrer Webseite zu ergänzen oder gar anzulegen. Es wird auch empfohlen Bewertungen für die Chatbot Antworten zuzulassen, was bei der Analyse für gute und schlechte Chatbot Antworten helfen kann.

Über die häufig gestellten Fragen können Sie einordnen, ob Sie die passenden Inhalte dazu ausreichend beschrieben haben oder nachbessern müssen.

Nutzen Sie auch den Selbsttest und stellen möglichst viele Fragen und Antworten ein, die regelmäßig mit dem Chatbot und den verfügbaren Inhalten geprüft werden. So können Sie Abweichungen an der Qualität des Chatbots schnell erkennen.