Zum Hauptinhalt springen

Wissensdatenbank

Die Wissensdatenbank von Bubble Chat ermöglicht das Pflegen eines Informationskorpus. Diese Wissensdatenbank dient dem Chatbot als Informationsquelle um Anfragen exakt zu beantworten. Die Wissensdatenbank kann dank Tags übersichtlich strukturiert werden.

Unterstütze Arten von Quellen

Webseiten

Öffentliche Webseiten können inklusive verlinkter PDF Dokumente indexiert werden.

Whitelisting / Blacklisting verlinkter Seiten

Es ist möglich, alle Unterseiten einer Webseite indexieren zu lassen. Nicht relevante Seiten können über ihre URL ausgeschlossen werden. Dabei kann zwischen einzelnen Seiten oder ganzen Bereichen (wie www.apptiva.ch/blog) unterschieden werden.

Whitelisting / Blacklisting verlinkter Dokumente

Ebenso kann konfiguriert werden, welche verlinkten PDF Dokumente anhand ihrer URL indexiert oder ausgeschlossen werden sollen.

Ältere Inhalte ausschliessen

Es kann bestimmt werden, dass beim Crawlen alle Seiten ausgeschlossen werden, deren Veröffentlichungsdatum älter ist als die angegebene Zeitspanne. Das Datum wird aus time-Elementen (datetime) oder gängigen Meta-Tags (z. B. article:published_time, itemprop=datePublished, og:published_time) ausgelesen. Wenn kein Datum gefunden wird, wird die Seite nicht gefiltert.

Diese Funktion ist besonders bei Blogposts oder News-Seiten nützlich, damit der Chatbot keine veralteten Daten zur Beantwortung von Fragen verwendet.

CSS-Selektoren

Für Webseiten können CSS-Selektoren erfasst werden, um nur einen Teil der Webseiten zu indexieren. Ebeso kann gewartet werden, bis gewisse Elemente geladen wurden, z.B. bei Javascript Webseiten.

Authentifizierung

Für nicht öffentliche Seiten kann ein Login konfiguriert werden, um Bubble Chat Zugang zu diesen zu gewähren.

Automatische Reindexierung

Webseiten können optional automatisch täglich, wöchentlich oder monatlich neu indexiert werden.

Dokumente

PDF und Word Dokumente können als Wissensdatenbank hochgeladen werden. Bilder werden bei der Indexierung ignoriert.

CSV

Für CSV Dokumente müssen die Spaltentrennzeichen und Begrenzungszeichen konfiguriert werden. Optional können auch die ID-Felder und Titelfelder konfiguriert werden.

Es wird pro Zeile ein Wissensdatenbank-Eintrag erstellt.

APIs

Durch das Bubble Chat Rest API und verschiedene Integrationen können Wissensdatenbanken automatisiert verwaltet werden.

FAQs

Bei FAQs können eine Liste möglicher Benutzeranfragen sowie die dazu passende Antwort erfasst werden.

Falls der Chatbot über Absichten verfügt, können diese in FAQs umgewandelt werden.

Textausschnitte

Es können simple Texte erfasst werden, um die Wissensdatenbank zu ergänzen.

Allgemeine Einstellungen für Quellen

Quellenangaben

Standardmässig wird jede Quelle aus der Wissensdatenbank im Quellenverzeichnis angegeben, wenn diese zum generieren der Antwort verwendet wurde. Im Content-Management-System kann dies jedoch pro Quelle deaktiviert werden. (z.B. bei Quellen die man nicht öffentlich erwähnen möchte)

Bedingungen

Für jede Quelle können Bedingungen definiert werden. Wenn keine Bedingung gesetzt ist, gilt die Quelle immer und überall.

  • Sprache: Quelle nur für eine bestimmte Sprache verwenden
  • Zeitraum: Quelle nur in einem definierten Zeitraum verwenden (Gültig ab / Gültig bis)
  • Kontext: Quelle nur verwenden, wenn sich die Benutzer-Session in einem bestimmten Kontext befindet (z. B. Microsite). Sind mehrere Kontexte angegeben, reicht es, wenn einer davon zutrifft.
  • Umgebung: Quelle nur in einer bestimmten Umgebung verwenden (Produktion oder Test)

Indexierung

Jede Quelle verfügt über eine Indizierungsübersicht. Diese zeigt erfolgreiche und fehlerhafte Indexierungen sowie ausgeschlossene Seiten an. Die Webseiten können regelmässig (täglich, wöchentlich oder monatlich) neu indexiert werden.

Häufig gestellte Fragen

Wie wird die Wissensdatenbank aktualisiert?

Webseiten und APIs werden automatisch regelmässig indexiert und bleiben so immer auf dem neuesten Stand. Manuell hochgeladene Dokumente wie PDFs, Word-Dateien oder andere Dateien müssen bei Änderungen manuell aktualisiert werden.

Welche Arten von Informationen sind in der Wissensdatenbank enthalten?

Die Wissensdatenbank kann verschiedenste Informationsquellen enthalten: Webseiten, PDF-Dokumente, Word-Dateien, FAQs und weitere Dokumente. Diese werden strukturiert gespeichert und indexiert, damit der Chatbot schnell und präzise darauf zugreifen kann.

Wie kann ich auf die Informationen in der Wissensdatenbank zugreifen?

Sie greifen auf die Wissensdatenbank zu, indem Sie dem Chatbot Ihre Frage stellen. Bubble Chat wertet Ihre Anfrage mithilfe von RAG (Retrieval-Augmented Generation) und Hybrid Search aus, durchsucht die verknüpften Wissensdatenbanken und generiert mit GPT-Technologie eine passende, verständliche Antwort.

Welche Vorteile bietet die Nutzung einer Wissensdatenbank?

Eine Wissensdatenbank ermöglicht schnelle und präzise Antworten rund um die Uhr. Sie verbessert die Effizienz, entlastet Ihr Support-Team und bietet Usern sofortigen Zugang zu allen relevanten Informationen. Durch automatische Aktualisierungen und zeitliche sowie kontextabhängige Steuerung bleiben die Informationen immer aktuell und zielgruppengerecht.

Muss ich die Wissensdatenbank manuell pflegen oder funktioniert das automatisch?

Beides ist möglich. Sie können Inhalte manuell hinzufügen, bearbeiten oder entfernen. Gleichzeitig können Sie aber auch automatische Prozesse einrichten – etwa tägliche Aktualisierungen von Webseiten oder Integration per API – sodass die Wissensdatenbank sich weitgehend selbst aktualisiert.

Verwendet Bubble Chat einen Crawler um die Webseite zu indexieren?

Ja, Bubble Chat nutzt einen Crawler, um die Inhalte der Webseite zu erfassen und zu indexieren. Dabei kann flexibel festgelegt werden, welche Bereiche der Webseite einbezogen und welche vom Indexierungsprozess ausgeschlossen werden sollen. So wird eine massgeschneiderte und effiziente Datenextraktion gewährleistet, die den spezifischen Anforderungen jedes Unternehmens gerecht wird.