Maschinelles Lernen vs. Large Language Model:

Ein direkter Vergleich von KI-gesteuerten Software-Lösungen für den Kundenservice

In der modernen digitalen Kommunikation kommen zunehmend KI-basierte Systeme zum Einsatz, um Serviceanfragen effizient und automatisiert zu beantworten. Sematell bietet zwei prominente Vertreter dieser Entwicklung. Beide Plattformen setzen auf künstliche Intelligenz, unterscheiden sich jedoch grundlegend in Bezug auf die verwendeten Lerndaten, deren Herkunft und die Art und Weise, wie die KI am Ende agiert. In diesem Artikel nehmen wir die beiden Systeme genau unter die Lupe und beleuchten ihre Unterschiede aus technischer und praktischer Sicht.

Das Fundament jeder KI: Warum gute Daten über Erfolg oder Misserfolg entscheiden.

Was sind Lerndaten und warum sind sie wichtig?

Lerndaten bilden das Fundament jedes KI-Systems. Sie bestehen aus Beispielen, die genutzt werden, um der künstlichen Intelligenz beizubringen, wie sie Aufgaben lösen kann, etwa das Beantworten von E-Mails oder Kundenanfragen. Die Qualität und Vielfalt dieser Daten bestimmen maßgeblich, wie zuverlässig, präzise und flexibel die KI agieren kann.

Zwei Wege zum intelligenten System – und was sie unterscheidet.

KI-Training: Machine Learning mit Kundendaten oder mit vortrainiertem LLM

Unsere Software-Lösungen haben unterschiedliche Anforderungen. Die eine Lösung erwartet als Lerndaten Datensätze, die im Wesentlichen den Inhalt einer Email ausmachen, d.h. ohne die Grußformel, wie „Sehr geehrte Damen und Herren“ oder „Hallo“ und ohne Abschiedsformel, z.B. „Mit freundlichen Grüßen…“. Was zwischen den beiden genannten Bereichen steht, das erwartet die Software als Textdatei in einem Verzeichnis, auf das sie zugreifen kann. Selbstverständlich werden die Daten vor dem Einlesen im System anonymisiert.

Für die Software ist es wichtig, dass die Lerndaten „echte“ Kundendaten sind und nicht von einem Mitarbeiter niedergeschrieben wurden, damit Unterschiede in der Tonalität, Ausdrucksweise und Stimmung erfasst werden. Das hat zur Folge, dass sie „nur“ die Informationen hat, die ihm vom Contact Center zur Verfügung gestellt wurden.

Effizienter Start: Warum unsere KI mit weniger Lerndaten auskommt.

Übrigens: Im Vergleich zu anderen Anbietern von Kundenservice-Lösungen benötigt unser System nur rund 30-50 Lerndaten pro Kategorie anstelle mehrere hundert oder sogar tausende Lerndaten, um startklar zu sein.

Unsere neue Software-Lösung ReplyX hat die Lerndaten schon in Form einer großen Datenbank im Gepäck, wenn es bei den Kunden ankommt. Das LLM (Large Language Model, übersetzt „Großes Sprachmodell“) hat das Internet durchsucht und daraus gelernt, wie die Sprache funktioniert, wie ein Antwortschreiben gestaltet ist, etc.
Spezifische Informationen können als Retrieval Argumented Generation (RAG) oder im Prompt direkt oder als Quellenangabe im Prompt, z.B. in Form einer URL, mitgegeben werden.

Vom Datensatz bis zur Antwort – wie KI wirklich lernt.

Wie funktioniert der Lernprozess bei maschinellem Lernen und Large Language Models?

Die KI in ReplyOne basiert überwiegend auf klassischem, überwachten Machine-Learning- und regelbasierten Ansätzen. Der Trainingsprozess läuft wie folgt ab:

  • Erstellen der Lerndaten sortiert nach Kategorie
  • Einlesen der Lerndaten separat für jede Kategorie
  • Gegebenenfalls Nachjustierung auf Grund von menschlichem Feedback und Korrekturen


Die KI kennt nur die Daten und Szenarios, mit denen sie trainiert wurde. Das so oft erwähnte „fantasieren“ der KI findet nicht statt, da die KI nicht generativ ist, sondern „nur“ nach statistischen Verfahren kategorisiert und vorgegebene Bausteine auswählt.

ReplyX nutzt fortgeschrittene Deep-Learning-Architekturen, speziell ein großes Sprachmodell, das kontextsensitiv und adaptiv arbeitet. Der Lernprozess ist ein ungesteuertes Sammeln und Analysieren von Textdaten, typischerweise aus dem Internet.

Durch diese technologisch fortschrittliche Arbeitsweise kann sie auch mit unvorhergesehenen oder besonders kreativen Anfragen umgehen. Spezielle Informationen können über RAG oder den Prompt zugeführt werden.

Zwei Systeme, ein Ziel: Sicherer und transparenter Umgang mit Lerndaten.

Qualitätssicherung und Datenschutz in beiden Kundenservice-Systemen

Beide Systeme legen Wert auf Datenschutz und -sicherheit, allerdings mit unterschiedlichen Schwerpunkten:

  • ReplyOne: Da die Lerndaten meist aus dem eigenen Unternehmen stammen, ist die Einhaltung datenschutzrechtlicher Vorgaben (wie DSGVO) besonders hoch. Vor dem Training werden personenbezogene Informationen systematisch entfernt. Unternehmen behalten stets die Hoheit über ihre Daten.

  • ReplyX: Durch die breite Streuung der Datenquellen müssen zusätzliche technische und organisatorische Maßnahmen ergriffen werden, um Datenschutz und vor allem die Datenintegrität zu gewährleisten. Zentral ist die konsequente Anonymisierung und Pseudonymisierung aller Lerndaten.

Nachvollziehbar oder flexibel? Die Stärken und Grenzen beider Ansätze im Kundenservice.

Vergleich: Stärken und Schwächen beider Kundenservice-Lösungen

Software mit maschinellem Lernen:

  • Stärken: Nachvollziehbarkeit der Antworten. Sehr gut geeignet für die automatische Beantwortung (Dunkelverarbeitung) von Anfragen. Kein Fantasieren der KI.
  • Schwächen: Begrenzte Flexibilität bei ungewöhnlichen oder neuen Anfragetypen. Manueller Aufwand für das Management der Lerndaten.

 

Software mit Large Language Model:

  • Stärken: Sehr hohe Flexibilität. Fähigkeit, aus unterschiedlichsten Quellen und Formaten zu lernen. Die KI kann quasi Fragen zu den unterschiedlichsten Themen beantworten.
  • Schwächen: Geringe bis keine Nachvollziehbarkeit einzelner Entscheidungen aufgrund komplexer Modelle. Leicht variierende Antworten auf die gleiche Frage/Aufgabe. Nachkontrolle durch Menschen erforderlich. Für die automatische Beantwortung (Dunkelverarbeitung) von Anfragen nur begrenzt geeignet. Die KI kann fantasieren.

FAZIT:

Will ich zu 100% nachvollziehbare Ergebnisse und auf immer die gleiche Frage immer die gleiche Antwort haben, dann geht kaum ein Weg an einer KI, die mittels Machine Learning trainiert wurde, vorbei.

Kann ich damit leben, dass die Antworten auf gleiche Anfragen thematisch richtig, aber im Wortlaut leicht differierend sind, dann ist eine KI, die ein LLM benutzt, die bessere Wahl.