Die automatische Verarbeitung natürlicher Sprache ist ein wichtiges Anwendungsfeld der künstlichen Intelligenz in allen Kontexten, bei der geschriebene oder gesprochene Sprache analysiert, produziert oder inhaltlich durchsuchbar gemacht werden soll. In dieser Session werden Ansätze für die Verarbeitung geschriebener und gesprochener Sprache in verschiedenen praxisorientierten Anwendungsfeldern präsentiert.
Deep Learning-Verfahren werden mehr und mehr zum
State-of-the-Art in vielen Anwendungen der Klassifikation
und Analyse textueller und gesprochensprachlicher Daten,
zumindest wenn sehr viele Trainingsdaten zur Verfügung
stehen. Je weniger Trainingsdaten verfügbar sind, desto
unzuverlässiger wird das Training komplexer Modelle,
welche die Aspekte der Sprachdaten aufgabenangemessen
abbilden würden.
In meinem Vortrag präsentiere ich zwei Beispiele aus dem
Bereich gesprochener Sprache, bei der die geschickte
Nutzung der inneren Strukturierung von Daten, ermittelt
mit externen Analysewerkzeugen, die performante Nutzung
von Deep Learning ermöglicht obwohl jeweils nur wenig
Trainingsdaten zur Verfügung standen.
Die Anforderungen an die Verfügbarkeit und Abrufbereit von Dokumentationen, FAQs, Support-Dokumenten und Formularen treibt die Entwicklung neuer KI-Methoden voran. Um einen schnellen und einfachen Zugriff auf vorhandene Unternehmensdaten zubekommen, müssen die meist heterogenen Daten in ein einheitliches Format überführt werden. Dafür bieten sich Knowledge Graphs an. In diesem Vortrag zeigen wir, wie man mittels moderner KI-Methoden Texte sinnvoll in Knowledge Graphs überführen und mittels Chatbots und Sprachassistenten abfragen kann.
Kaum eine kommerzielle NLP-Lösung kommt heute noch ohne
den Einsatz von Machine-Learning-Verfahren aus. Die freie
Verfügbarkeit großer vortrainierter Sprachmodelle hat die
Bedeutung von Machine Learning im Natural Language
Processing in den letzten Jahren weiter verstärkt. Bei
aller Begeisterung für die Leistungsfähigkeit dieser
Systeme wird gerne außer Acht gelassen, wie fehlerbehaftet
die Ergebnisse vortrainierter statistischer Modelle oft
sind. Insbesondere für Anwendungsbereiche, in denen eine
sehr hohe Ergebnisqualität wünschenswert oder erforderlich
ist, reichen Verfahren, die ausschließlich auf Machine
Learning basieren, meist nicht aus.
Dieser Vortrag ist ein Plädoyer für hybride
Lösungsansätze. Es wird anhand von Beispielen aus der
kommerziellen NLP-Entwicklung illustriert, wie hybride
Lösungen, die Machine Learning mit klassischen
KI-Verfahren kombinieren, deutlich bessere Ergebnisse
erzielen als rein Machine-Learning-basierte Ansätze.