Rufen Sie uns einfach an, und wir beraten Sie gerne zu unserem Seminar- und Studienangebot.

Unsere Ansprechpartner:

Michael Rabbat, Dipl.-Kfm.
MBA Chief Operating Officer

Claudia Hardmeier
Kunden-Center
Studienbetreuung

Institute und Kompetenzzentren

Bindeglied zu einer Vielzahl an
Unternehmen und Organisationen

Erfahren Sie mehr ...

Forschung

Was Management-Forschung wirklich
leisten kann

Erfahren Sie mehr ...

Alumni

Wissenstransfer und
Erfahrungsaustausch

Erfahren Sie mehr ...

Referenzen

Feedback und
Teilnehmerstimmen

Erfahren Sie mehr ...

News

SGBS aktuell:
Wissen und
Anwendung

Erfahren Sie mehr ...

Klimaneutrale Seminare

Auf dem Weg zu
klimaneutralen Seminaren.

Erfahren Sie mehr ...

Juan Diego Flórez Association

Mit musikalischer Bildung
gegen Armut:

Erfahren Sie mehr ...

3.2.3 Potential und Leistungsfähigkeit der Softwarelösungen

Die Komplexität steigt noch weiter, wenn die gesprochene Sprache wie bei Voice Bot Systemen zunächst über Speech-To-Text Dienste interpretiert werden oder auch spezifisches Fachvokabular verstanden werden muss oder der Sprecher nicht akzentfrei spricht. Während hier für die englische Sprache bereits vortrainierte Modelle existieren, die z.B. medizinisches oder juristisches Fachvokabular abbilden, sind diese für die deutsche Sprache noch eher selten. Die Rückumwandlung der Antworten über Text-To-Speech Dienste funktioniert hingegen schon erstaunlich gut und die Sprachsynthese klingt immer realistischer, wie es auch die modernen Navigationssysteme wie zum Beispiel Google Maps oder die Sprachsynthese der Firma Nuance, die in vielen Fahrzeugen der großen Autohersteller eingebaut ist zeigen. Mit Hilfe der IBM Watson Technologie lassen sich sogar sogenannte Custom-Voices trainieren, bei denen zum Beispiel ein bekannter Werbesprecher eines Unternehmens einige Sätze einsprechen kann aus denen die Software dann eine komplette Sprachsynthese erzeugen kann, die von der Originalstimme kaum noch zu unterscheiden ist.

Bereits 2018 stellte Google auf der Entwicklerkonferenz IO die Voice Software Duplex vor, die in der Lage war per Telefonanruf einen Friseurtermin zu vereinbaren, ohne dass der Mensch am anderen Ende der Leitung merkte, dass er mit einem Bot verbunden war[1]. Viele Teilnehmer der Konferenz und auch Journalisten fanden die Lösung geradezu beängstigend auch wenn die technische Leistung der Software bewundert wurde[2].

Gerade die Voice Bot Technologie bietet Potential die zahlreichen menübasierten Call Center Systeme, die heute noch im Kundenservice existieren zu ersetzen und damit den Kunden viel Zeit und Nerven in Warteschleifen zu sparen und das Kundenerlebnis entscheidend zu verbessern. Auch wenn die Vorstellung von Google Duplex in 2018 spektakulär oder sogar beängstigend erschien, haben sich Voice Systeme noch nicht umfassend verbreitet.  Vor allem das Textverständnis bei schlechten Telefonverbindungen oder lauten Nebengeräuschen gestaltet sich für die Software schwierig. Hinzu kommt, dass es nach wie vor für die Speech-To-Text Dienste auch Probleme bereitet Sprechpausen richtig zu erkennen und erst dann auf die Frage zu antworten, wenn diese abgeschlossen ist. Dies ist leicht nachvollziehbar, wenn man zum Beispiel versucht hat ein Ziel per Sprache in einem Navigationssystem im Auto einzugeben oder auch mit einem der Sprachassistenten wie Google Home oder Amazon Alexa zu kommunizieren.

Auch im Bereich Journalismus oder in der Wissenschaft wurde KI eingesetzt, um automatisiert Zusammenfassung von Texten oder ganze Nachrichtenmeldungen zu erstellen. So lassen sich bereits heute über Software Lösungen der Firmen Retresco, AX Semantics oder Textomatic einfach strukturierte Meldungen wie Wetternachrichten, Sportmeldungen, Finanz- oder Verkehrsnachrichten automatisiert generieren.

 

Auch Geschäftsberichte, medizinische Patientenakten oder Produktbeschreibungen werden heute bereits automatisch durch künstliche Intelligenz erzeugt[1]. Dennoch bedeutet der sogenannte Roboter-Journalismus nicht das Ende von Autoren aus Fleisch und Blut. Während sich gut strukturierte, standardisierte Texte die viele Zahlen enthalten einfach automatisiert erstellen oder zusammenfassen lassen, können die Ergebnisse der Software bei komplexeren Fließtexten noch nicht überzeugen.

Ein weiterer Schritt ist auch über KI gestützte Analyse das sogenannte Sentiment eines Textes zu ermitteln und damit herauszufinden, ob in einem Bericht z.B. eine Person positiv oder negativ dargestellt wird. So ist zum Beispiel die Software Watson Discovery von IBM beim Fernsender ESPN im Einsatz, um für die ESPN Fantasy Football Ranglisten ein Profil der Footballspieler zu erstellen, das Informationen aus zahlreichen Datenquellen wie Nachrichtenartikeln, Blogs, Foren, Ranglisten, Prognosen, Podcasts und Tweets berücksichtigt und sogar mit der Sentiment Analyse bewertet wie beliebt oder unbeliebt der Spieler gerade in den Medien ist[2].

[1]

Robert Pohl, 2020

[2] Klaus Lorbeer, 2020

[1] Vorstellung Google Assistant auf der Konferenz IO  https://www.youtube.com/watch?v=YfvUgH5ByVY

[2] Benedikt Fuest,2018