Parsing Morphologically Rich Languages with (Mostly) Off-The-Shelf Software and Word Vectors

; ; ;

URN urn:nbn:de:gbv:18-228-7-2147
URL
Dokumentart: InProceedings (Aufsatz / Paper einer Konferenz etc.)
Institut: Fachbereich Informatik
Sprache: Englisch
Erstellungsjahr: 2014
Publikationsdatum:
Originalveröffentlichung: Proceedings of the 2014 Shared Task of the COLING Workshop on Statistical Parsing of Morphologically Rich Languages (2014)
Freie Schlagwörter (Deutsch): Parsing , Morphologie , Pfadselektion , Word embeddings
Freie Schlagwörter (Englisch): parsing , morphology , lattice selection , word embeddings
DDC-Sachgruppe: Informatik
BK - Klassifikation: 54.75

Kurzfassung auf Englisch:

As a contribution to the 2014 SPMRL shared task on parsing morphologically rich languages, we show that it is now possible to achieve high dependency accuracy using existing parsers without the need for intricate multi-parser schemes even if only small amounts of training data are available. We further show that the impact of using word vectors on parsing quality heavily depends on the amount of morphological information that is available. In addition, we discuss the use of parser scores for selection of morphological lattice paths, showing that there is much discriminative power in syntactic parsers for morphological disambiguation.

Hinweis zum Urherberrecht

Für Dokumente, die in elektronischer Form über Datenenetze angeboten werden, gilt uneingeschränkt das Urheberrechtsgesetz (UrhG). Insbesondere gilt:

Einzelne Vervielfältigungen, z.B. Kopien und Ausdrucke, dürfen nur zum privaten und sonstigen eigenen Gebrauch angefertigt werden (Paragraph 53 Urheberrecht). Die Herstellung und Verbreitung von weiteren Reproduktionen ist nur mit ausdrücklicher Genehmigung des Urhebers gestattet.

Der Benutzer ist für die Einhaltung der Rechtsvorschriften selbst verantwortlich und kann bei Mißbrauch haftbar gemacht werden.