Inkrementelle Part-of-Speech-Tagger

URN urn:nbn:de:gbv:18-228-7-2229
URL
Dokumentart: Bachelor Thesis
Institut: Fachbereich Informatik
Sprache: Deutsch
Erstellungsjahr: 2009
Publikationsdatum:
Freie Schlagwörter (Deutsch): Inkrementelle Verarbeitung , PoS-Tagger
Freie Schlagwörter (Englisch): incremental processing , PoS tagger
DDC-Sachgruppe: Informatik
BK - Klassifikation: 54.75

Kurzfassung auf Deutsch:

Part-of-Speech-Tagger sind Programme, die versuchen, für jedes Wort in einem natürlichsprachlichen Satz die Wortart zu ermitteln. Die gängigen POS-Tagger arbeiten satzweise: Sie lesen einen Satz ein und taggen diesen dann. Dieses vorgehen ist für die Verarbeitung in interaktiven Systemen wie zum Beispiel Dialogsystemen inadäquat: Eine Verarbeitung eines Satzes ist damit erst möglich, wenn dieser vollständig gesprochen oder geschrieben wurde und das System kann somit nicht frühzeitig auf Eingaben reagieren. Diese Arbeit befasst sich mit dem inkrementellen PoS-Tagging, bei der die Worte verarbeitet werden, sobald diese dem Tagger zur Verfügung stehen. Hierzu wurden verschiedene Tagger so umgebaut, dass sie einen Satz schon taggen, während sie diesen einlesen.

Hinweis zum Urherberrecht

Für Dokumente, die in elektronischer Form über Datenenetze angeboten werden, gilt uneingeschränkt das Urheberrechtsgesetz (UrhG). Insbesondere gilt:

Einzelne Vervielfältigungen, z.B. Kopien und Ausdrucke, dürfen nur zum privaten und sonstigen eigenen Gebrauch angefertigt werden (Paragraph 53 Urheberrecht). Die Herstellung und Verbreitung von weiteren Reproduktionen ist nur mit ausdrücklicher Genehmigung des Urhebers gestattet.

Der Benutzer ist für die Einhaltung der Rechtsvorschriften selbst verantwortlich und kann bei Mißbrauch haftbar gemacht werden.