Menschen, Maschinen und Semantik
Laut Oxford-Wörterbuch ist König definiert als „der männliche Herrscher eines unabhängigen Staates, der eine königliche Familie hat“.
Wenn wir nun nur ein einziges Wort in dieser Definition von männlich zu weiblich ändern würden, die weibliche Herrscherin eines unabhängigen Staates, der eine königliche Familie hat, was würde das bedeuten? Königin, richtig! Es ist ja auch das erste Wort, das uns in den Sinn kommt. Semantisch gesehen, kann ein König als eine Kombination aus einem Mann und einem Königtum in einer abstrakten Form definiert werden. Ebenso ist eine Königin eine Kombination aus einer Frau und einem Königtum. Wenn wir die abstrakte Formulierung kennen, können wir leicht definieren, dass ein Prinz ein Junge plus ein Königtum ist und eine Prinzessin ein Mädchen plus ein Königtum.
Dank der jahrelangen Evolution und der Interaktion mit Sprachen seit dem Tag unserer Geburt ist es uns gelungen, selbst in abstrakten Formen zu kommunizieren. Für uns ist es selbstverständlich, solche semantischen Beziehungen zu finden. Was aber, wenn wir die gleiche Frage einem System der künstlichen Intelligenz (KI) stellen? Das Problem wird dann unglaublich schwierig, und die Antwort liegt in dem schnell wachsenden Teilbereich der KI, der natürlichen Sprachverarbeitung, allgemein bekannt unter der Abkürzung NLP. NLP ermöglicht es modernen Computern, menschliche Sprache zu interpretieren, semantische Beziehungen zwischen Textstücken herzustellen und so mit Menschen zu kommunizieren.
Die Wurzeln des NLP reichen bis in die 1900er Jahre zurück, als der Schweizer Linguistikprofessor Ferdinand de Saussure die Idee der Muster und Funktionen einer Sprache entwickelte. Saussure behauptete, dass eine Sprache ein soziales Phänomen ist, da sie ein strukturiertes System ist, das synchron und diachron betrachtet werden kann. Mit anderen Worten, eine Sprache existiert zu einem bestimmten Zeitpunkt und verändert sich im Laufe der Zeit. Er vertrat die Ansicht, dass Bedeutung innerhalb der Sprache, zwischen Beziehungen und Kontrasten durch Humor, Sarkasmus, Ironie usw. entsteht, wobei die wörtliche Bedeutung weit von der beabsichtigten Bedeutung entfernt ist. Der für den Oscar nominierte Film „The Imitation Game“ (2014) basiert auf der Biografie des britischen Mathematikers und frühen Informatikers Alan Turing, der weithin als Vater der theoretischen Informatik und der KI gilt. Er schrieb 1950 eine Arbeit, in der er einen Test für eine „denkende“ Maschine beschrieb. Er entwickelte einen Test, um die Fähigkeit der Maschine zu bewerten, intelligentes Verhalten zu zeigen, das dem eines Menschen entspricht. Turing schlug vor, dass ein menschlicher Prüfer ein Gespräch mit zwei Spielern, einer Maschine und einem Menschen, führen sollte. Wenn der Prüfer nicht erkennen konnte, welcher Spieler eine Maschine war, hatte das KI-System den Turing-Test erfolgreich bestanden. Turing’s Arbeit legte den Grundstein für die heutigen NLP-Systeme, wie man heute an den Fortschritten in der Chatbot-Industrie sieht.
„Maschinen mögen den Turing-Test bestanden haben, aber sie haben noch einen weiten Weg vor sich, bevor sie anfangen können, Gedanken zu erzeugen.“
NLP: Wissenschaft und Industrie
Zwischen 1950 und 1980 waren die Fortschritte auf dem Gebiet des NLP durch die Rechenleistung und die Verfügbarkeit von Daten begrenzt. Heute haben wir beides in Hülle und Fülle; folglich haben die Algorithmen bei der Textverarbeitung erhebliche Verbesserungen erzielt. Die Daten für 2019 der „Annual Conference of the Association for Computational Linguistics“, einer der wichtigsten Konferenzen in der Linguistik, zeigen einen dramatischen Anstieg der Zahl der eingereichten Forschungsartikel zum Thema NLP. Der Schwerpunkt der KI-Forschungsgruppen hat sich von 2018 bis 2019 fast verdoppelt.
Heute gibt es eine beträchtliche Anzahl von Softwarepaketen und Kodierungsbibliotheken, die die Entwicklung effektiver NLP-Algorithmen ermöglichen. Obwohl NLP schon einige Jahrzehnte alt ist, kann man sagen, dass es gerade erst begonnen hat kleine Fortschritte zu machen!
Angesichts des beispiellosen Wachstums von NLP in der akademischen Welt setzt auch die Industrie rasch maschinelle Lernsysteme ein, um die Vorteile von NLP zu nutzen. Dies kann für verschiedene Aufgaben wie Stimmungsanalyse, Themenextraktion, Textzusammenfassung, semantische Ähnlichkeit, Analyse von unstrukturierten Dokumenten, Inhaltsklassifizierung, Kategorisierung von Nachrichtenartikeln, Analyse von Produktbeschreibungen usw. eingesetzt werden. NLP ist zu einer Brücke der Kommunikation zwischen Computern und Menschen geworden. Maschinen haben jetzt einen Rahmen, der es ihnen ermöglicht, uns besser zu verstehen. Mit der Einführung fortschrittlicher KI-Methoden wie Deep Learning verzeichnet die Branche ein exponentielles Wachstum, das auf Big Data, Rechenleistung und das steigende Interesse an der Kommunikation zwischen Menschen und Computer zurückzuführen ist. Der globale Markt für die Verarbeitung natürlicher Sprache wird bis 2025 auf 34,80 Milliarden geschätzt und verzeichnet im Zeitraum 2020-2025 eine jährliche Wachstumsrate von 21,5 %.
“KI wird unser wichtigster Begleiter im Alltag werden, ähnlich wie unsere Mobiltelefone, nur intelligenter und schlauer.”
Die Beziehungen zwischen den Wörtern
Um auf unsere Frage zurückzukommen: Wie kann ein KI-System verstehen, dass ein Königtum plus eine Frau gleich eine Königin ist? Die Antwort liegt in „Worteinbettungen“, einer Art von Wortdarstellung, die es ermöglicht, dass Wörter mit ähnlicher Bedeutung eine ähnliche Darstellung erhalten. Es handelt sich um eine Darstellung von Wörtern in einem hochdimensionalen Vektorraum, die semantische Beziehungen zwischen Wörtern auf der Grundlage ihrer Position in einem Satz erfasst. Bengio et al. (2003) veröffentlichten einen Forschungsartikel, in dem sie das Konzept der Worteinbettungen vorstellten, das heute die Grundlage für verschiedene NLP-Algorithmen bildet. Die folgende Abbildung veranschaulicht die Antwort auf unsere Frage. Die semantische Beziehung „der König ist zur Königin wie ein Mann zu einer Frau“ ist in Worteinbettungen kodiert. In ähnlicher Weise können Worteinbettungen auch Verb-Zeit-Beziehungen erfassen, „Gehen ist zu gehen wie Schwimmen zu schwimmen“, und Land-Hauptstadt-Beziehungen „Wien ist zu Österreich wie Rom zu Italien wie Berlin zu Deutschland und so weiter…“.
Zusammenfassung
Der Schwerpunkt verlagert sich immer mehr auf die Entwicklung von Online-Anwendungen, die Textinformationen verarbeiten können. Die Vorteile des Einsatzes von KI-Methoden sind in der gesamten Branche gut erprobt und steigern die Effizienz eines Systems. Wir wollen KI-Systeme entwickeln, die die Art und Weise der menschlichen Kommunikation verstehen. Es ist einfacher, einer KI unsere Lebensgewohnheiten beizubringen als andersherum. Obwohl eine Sprache ein strukturiertes System ist, ist sie in sich selbst außerordentlich komplex. Um eine Sprache zu verstehen, muss man zahlreiche Variablen wie Kultur, Dialekte, Geschichte, Wissenschaft, Kunst usw. kennen. Ein perfektes Beispiel dafür ist der Moment, der die Freundschaft zwischen Charlie Chaplin und Albert Einstein bei der Premiere von Chaplins Film „Lichter der Stadt“ markierte. Es soll ein Gespräch zwischen den beiden Vordenkern stattgefunden haben:
„Was ich an Ihrer Kunst am meisten bewundere“, sagte Albert Einstein, „ist ihre Universalität. Sie sagen kein Wort, und doch … die Welt versteht Sie“.
Das ist wahr, antwortete Chaplin: „Aber Ihr Ruhm ist noch größer… die Welt bewundert Sie, auch wenn Sie niemand versteht.“
Heutzutage hat NLP gerade erst begonnen, seine Fähigkeiten unter Beweis zu stellen, während die Zukunft eine überwältigende Integration von NLP in Geschäftsszenarien erleben wird. Wir bei STRG halten uns mit den Fortschritten im NLP auf dem Laufenden. Schreiben Sie uns eine E-Mail an office@strg.at, um mehr darüber zu erfahren, wie NLP in Ihr Unternehmen integriert werden kann, oder besuchen Sie unsere Website https://www.strg.at/, um sich einen Überblick über unsere Dienstleistungen zu verschaffen.
by Dadhichi Shukla
- Call STRG's CEO Jürgen, or write a mail juergen.schmidt@strg.at Mobile: +43 699 1 7777 165