Natürlichsprachliche Künstliche Intelligenz
Institut für Computervisualistik / Universität Koblenz
Kurzportrait
Die Arbeitsgruppe "Natürlichsprachliche Künstliche Intelligenz" am Institut für Computerlinguistik beschäftigt sich mit verschiedenen Themen aus den Forschungsgebieten Analyse und Generierung natürlicher Sprache, die im folgenden kurz umrissen werden. Danach wird ein Überblick über die extern geförderten Projekte gegeben. Im Bereich der Verbesserung der Lehre wurden neue interaktive Lehr- und Lernkonzepte mit dem Computer entwickelt und getestet. Die vorrangige Anwendungsdomäne ist derzeit Syntax und Topologie. Die Konzepte sind aber genereller Natur und sollen auf weitere Ausbildungsfelder der Computerlinguistik übertragen werden. Ausgehend von der kommunikativen Funktion sprachlicher Äusserungen wurden die Besonderheiten natürlichsprachlich fundierter Mensch-Computer-Interaktion betrachtet und daraufhin untersucht, welche Konsequenzen sich ergeben für eine software-ergonomische Gestaltung von aufgabenorientierter Sprachsoftware. Entscheidend dafür sind die Beobachtung, Beschreibung und Analyse von BenutzerInnen-Aktionen im Rahmen von prospektiven Evaluationen (mittels der Wizard-of-Oz-Methodik). Auf dem Gebiet der Topologie im Deutschen, Englischen und Niederländischen fand eine enge Kooperation mit Prof. Dr. Gerard Kempen (University of Leiden und Max Planck Institute in Nijmegen, The Netherlands) statt. Der uniformen Verarbeitung liegt der Formalismus der Performance Grammars zugrunde. Es konnte gezeigt werden, dass eine breite Palette von Sprachphänomenen in polynomieller Zeit verarbeitbar sind. Ein weiterer Formalismus zur Verarbeitung natürlicher Sprache wurde im letzten Jahr näher untersucht, die sogenannten Contextual Grammars. Für diesen Formalismus wurde ein über das Internet zugreifbarer Parser mit einigen Beispielgrammatiken implementiert (siehe http://www.uni-koblenz.de/~harbusch/CG-PARSER/welcome-cg.html). Aufgrund der flachen inneren Struktur (keine Nichtterminale) soll als nächster Arbeitsschritt untersucht werden, ob man für diesen Formalismus mittels statistischer Methoden automatisch Grammatiken aus Corpora extrahieren kann. Neben diesen Arbeitsgebieten einzelner MitarbeiterInnen standen die im folgenden beschriebenen extern finanzierten Projekte im Mittelpunkt: Generierung mit Tree-Adjoining Grammars (TAGs) (siehe InTeGenInE), Einsatz von Sprachtechnologiekomponenten in modernen Communication Centern (siehe CCIRP) und effiziente Texteingabe mit reduzierten Tastaturen (siehe AkKo). Im Projekt InTeGenInE, das von der Deutschen Forschungsgemeinschaft unterstützt wird, wird eine reversible Analyse- und Generierungskomponente für Schema-TAGs entwickelt. Schwerpunkte bei der Entwicklung sind uniforme Verarbeitung aller Wissensbasen, der Reuse von existierenden Wissensbasen durch eine (semi-)automatische Encodierung unterschiedlicher Eingabeformate und die Verarbeitung in Echtzeit. Das entwickelte Modul ist parametriesierbar, so dass es als psycholinguistisches Testbett für Experimente benutzt werden kann. Das Projekt CCIRP (Communication Center Initiative Rheinland-Pfalz) wird in Kooperation mit Prof. Dr. Hampe (Institut für Wirtschaftsinformatik, Universität Koblenz-Landau) und Prof. Dr. Troitzsch (Institut für sozialwissenschaftliche Informatik, Universität Koblenz-Landau) durchgeführt. Finanziert wird es vom Ministerium für Arbeit, Soziales und Gesundheit, sowie dem Ministerium für Wirtschaft, Verkehr, Landwirtschaft und Weinbau. Das Projekt deckt eine breite Themenpalette ab. Darunter fallen der Entwurf eines Curriculums, die Errichtung eines Communication Center Referenzlabors, die Erprobung und Umsetzung von Schulungskonzepten (Train-the-Trainer), sowie die Bereitstellungen einer Simulationsumgebung für reale Anwendungen, die Konzeption und Realisierung einer Virtual Community zum Thema Communication Center, sowie die Durchführung von Workshops zu innovativen Themen wie z.B. Sprachein- und Sprachausgabetechnologien oder Virtualisierung von CC, Medienintegration und Customer Relationship Management (CRM). Das Projekt AkKo (Adaptive, kompakte Texteingabe zur freien Kommunikation für nicht-sprechende BenutzerInnen mit schweren motorischen Störungen), das effiziente Texteingabe mit reduzierten Tastaturen untersucht, ist in der Startphase. Methoden der statistischen Sprachverarbeitung und computerlinguistisches Wissen werden eingesetzt, um nicht eindeutig kodierte Buchstabensequenzen zu disambiguieren und die kontextuell wahrscheinlichsten Worteingabekandidaten zu bestimmen. Diese Texteingabe soll in einem System zur Unterstützten Kommunikation integriert werden, das nicht-sprechenden Menschen mit schweren motorischen Störungen eine effiziente, freie Kommunikation im face-to-face Gespräch oder per Telekommunikation erlaubt.