Artikel finden


Benutzername:
Kennwort:




Anzeige



STUDIUM / Hochschule / Wissenschaft & Forschung / Computer „lernen“ vom Menschen KONTAKT SITEMAP

Software analysiert das Wissen in Wiktionary und Wikipedia

Informatiker der TU Darmstadt haben eine Software entwickelt, die es dem Computer ermöglicht, auf das eigentlich für menschliche Leser bestimmte Wissen in Online-Werken wie Wikipedia oder Wiktionary zuzugreifen. Diese Software bringt nicht nur den Traum des automatischen Sprachverstehens der Realisierung näher, sondern sie birgt dabei auch ein nicht zu unterschätzendes Potential etwa für Wörterbuchverlage.

Um Computern in bescheidenem Umfang Sprachverstehen und intelligentes Verhalten einzuhauchen, waren bislang oft sogenannte "regelbasierte Systeme" im Einsatz, wie sie etwa von Telefonauskunftssystemen oder Hilfefunktionen bei Software bekannt sind. Obwohl diese Systeme meistens sehr komplex aufgebaut sind und von Experten in mühsamer Handarbeit erstellt und optimiert werden, sind ihre Resultate für den Benutzer oft unbefriedigend.

Im Vergleich zu den Geburtsjahren der Künstlichen Intelligenz befindet sich die Forschung heute in einer erheblich besseren Ausgangssituation: Die Rechenleistung moderner Rechnerverbünde ist gigantisch, und die Erfolge in der Entwicklung hocheffizienter statistischer Lernverfahren, wie sie beispielsweise bei der Informationssuche mit Google eingesetzt werden, haben Lösungen für viele Implementierungs-Fragen parat. Doch wie steht es mit digitalen Inhalten?

Quantität und Qualität von Online-Nachschlagewerken

Online-Nachschlagewerke wie Wikipedia und das dazugehörige Wörterbuch Wiktionary erfreuen sich bei Internetbenutzern einer bisher nicht da gewesenen Beliebtheit. Diese "von Benutzern für Benutzer" geschaffenen Werke haben innerhalb kürzester Zeit eine beeindruckende Größe und Qualität erreicht. Sie sind bereits jetzt in vielen Hinsichten den klassischen Nachschlagewerken überlegen.

Computer haben es jedoch nicht leicht, auf das Wissen in Online-Werken zuzugreifen. Denn schließlich wurden diese Werke für Menschen und nicht für Computer geschaffen. Wissenschaftler des UKP Labs im Fachbereich Informatik der TU Darmstadt um Prof. Dr. Iryna Gurevych haben deshalb eine spezielle Software entwickelt, die das menschliche Wissen in Wikipedia und Wiktionary für Computerprogramme analysiert, bereinigt und aufbereitet.

Analyseprogramme für Wikipedia und Wiktionary

"Während für Wikipedia mittlerweile eine Reihe von verschiedenen Zugriffsmöglichkeiten existieren, ist die Software für Wiktionary eine Neuheit. Sie verwandelt das Online-Werk in ein von Computern verarbeitbares multilinguales Netz, das Wörter verschiedener Sprachen miteinander verknüpft und zusätzlich eine große Menge an lexikographischer Information auf Knopfdruck bereitstellt", sagt der Informatiker Christof Müller.

Aljoscha Burchardt vom Center of Research Excellence "E-Learning" an der TU Darmstadt fügt hinzu: "Die Möglichkeit, vom Wissen der Internet-Gemeinschaft mit Hilfe dieser Software zu profitieren, kann die Herstellung von herkömmlichen Wörterbüchern im Verlagswesen revolutionieren. Nicht nur durch Kosteneinsparung, sondern auch durch viel größere Aktualität und thematische Breite, welche im Hinblick auf die ständig neuen Anforderungen in unserer Wissensgesellschaft ganz wichtige Faktoren sind".

Software frei verfügbar

Die Informatiker an der TU Darmstadt wollen die Ergebnisse ihrer Arbeit den Forschern weltweit nicht vorenthalten. Sowohl die Wikipedia- als auch die Wiktionary-Analyse-Software ist für nicht-kommerzielle Forschungszwecke frei verfügbar. Dies erklärt Prof. Dr. Iryna Gurevych so: "Zum einen liegt uns sehr viel dran, die akademische Forschung im Bereich Sprachverstehen international voranzubringen und Synergie-Effekte zu schaffen. Zum anderen wollen wir den Standort TU Darmstadt weltweit im Bereich der semantischen Sprachverarbeitung profilieren."

Teilweise ist dies bereits Wirklichkeit. Denn die Darmstädter Software für Wikipedia ist für alle Sprachen verfügbar, für die es spezifische Wikipedia-Editionen gibt. Und für Wiktionary haben die Wissenschaftler zunächst die englische und die deutsche Sprache angegangen. Der große Vorteil der Online-Werke, nämlich die Verknüpfungen zwischen den Wikipedia-Artikeln und den Wiktionary-Einträgen sowie unter den sprachenspezifischen Editionen werden dabei ausgenutzt, um verschiedene Sprachen automatisch übersetzen zu können. Ein Programm für die Informationssuche in einer Sprache, wo der Umfang der Online-Werke noch relativ klein ist, profitiert so vom Wissen der englischsprachigen Wikipedia-Gemeinschaft, die ungleich größer ist. So kann die Software des UKP Lab noch ein Vielfaches an Wissenspotenzial bereitstellen.

Weitere Informationen:

http://www.ukp.tu-darmstadt.de 

 

Hilf mir, ich bin niedlich!

European Film Gateway

Computer verstehen Textinhalte

Hauptwirkstoff von "Spice" entdeckt

Der dünnste Draht der Welt

Steigende Ausgaben für Forschung

STUDIUM  |   KARRIERE  |   LEBEN   Mediadaten  |   KONTAKT  |   IMPRESSUM
Copyright © Evoluzione Media AG
Eine Verwertung der urheberrechtlich geschutzten Beitrage, insbesondere durch
Vervielfaltigung oder Verbreitung auch in elektronischer Form, ist ohne vorherige
Zustimmung unzulassig und strafbar, soweit sich aus dem Urhebergesetz nichts
anderes ergibt.