Learning thematic role relations for lexical semantic nets

DSpace Repositorium (Manakin basiert)

Zur Kurzanzeige

dc.contributor.advisor Hinrichs, Erhard de_DE
dc.contributor.author Wagner, Andreas de_DE
dc.date.accessioned 2005-09-30 de_DE
dc.date.accessioned 2014-03-18T09:52:26Z
dc.date.available 2005-09-30 de_DE
dc.date.available 2014-03-18T09:52:26Z
dc.date.issued 2004 de_DE
dc.identifier.other 121037843 de_DE
dc.identifier.uri http://nbn-resolving.de/urn:nbn:de:bsz:21-opus-20059 de_DE
dc.identifier.uri http://hdl.handle.net/10900/46255
dc.description.abstract This thesis presents a strategy for the acquisition of thematic role relations (such as AGENT, PATIENT, or INSTRUMENT) by means of statistical corpus analysis, for the purpose of semi-automatically extending lexical-semantic nets. In particular, this work focuses on resources in the style of WordNet (Fellbaum 1998) and EuroWordNet (Vossen 1999). Lexical-semantic nets represent the meanings of words via semantic relations between words and/or word concepts. Semantic (thematic) role relations are conceptual relations which hold between verbs and their nominal arguments (e.g. <eat>--AGENT--<human> or <eat>--PATIENT--<food>). Such relations capture selectional restrictions of verbs. Therefore, the task of acquiring thematic role relations is intrinsically related to the task of acquiring selectional restrictions. Consequently, the core of a strategy for learning role relations consists in a method for learning selectional restrictions (or, more precisely, selectional preferences). For the latter task, a number of methods have been proposed which utilise syntactically analysed corpora and WordNet. To acquire the selectional preferences of a certain verb for a certain argument, the respective complement nouns of that verb are extracted from the corpus, and statistical methods are applied to generalise over these nouns; these generalisations are expressed as a set of WordNet noun concepts. One of these approaches, namely the method proposed by (Abe & Li 1996), constitutes the starting point of my research. However, this approach is not immediately applicable for learning role relations, but requires modifications and extensions for that task. In particular, two aspects have to be taken into account. Firstly, it is crucial that the WordNet concepts acquired to represent selectional preferences of a verb are located at an appropriate level of generalisation (e.g. <food> as PATIENT of <eat>, rather than <cake> or <physical_object>). I develop a modification of the approach which substantially improves its performance in this respect. Secondly, as the existing methods generalise over syntactic complements, they acquire selectional preferences for syntactic rather than semantic arguments. To learn selectional preferences for semantic roles, the syntactic arguments provided by the parsed corpus have to be linked to their underlying roles so that the statistical learning method can be applied to generalise, for example, over all (semantic) Agents of the examined verb rather than over all its (syntactic) subjects. Therefore, I develop a method for linking syntactic to semantic arguments. A further aspect of the overall strategy I present is an appropriate method for mapping the verbs and nouns in the training data to the corresponding WordNet concepts, which is a prerequisite for applying the preference acquisition algorithm. To evaluate the role acquisition approach developed in this thesis, I extract a gold standard from the EuroWordNet database and propose detailed evaluation criteria. Overall, the evaluation results (accuracy rates of up to 84%) show that the approach works effectively. en
dc.description.abstract Die vorliegende Dissertation präsentiert eine Strategie zur Akquisition thematischer Rollen-Relationen (wie AGENT, PATIENT oder INSTRUMENT) mit Hilfe statistischer Korpusanalyse, zum Zweck der semi-automatischen Erweiterung lexikalisch-semantischer Netze. Insbesondere konzentriert sich diese Arbeit auf Wortnetze im Stil von WordNet (Fellbaum 1998) und EuroWordNet (Vossen 1999). Lexikalisch-semantische Netze repräsentieren Wortbedeutungen mit Hilfe semantischer Relationen zwischen Wörtern und/oder Wortkonzepten. Semantische (thematische) Rollen-Relationen sind konzeptuelle Relationen zwischen Verben und ihren nominalen Argumenten (z.B. <eat>--AGENT--<human> oder <eat>--PATIENT--<food>). Solche Relationen erfassen Selektionsrestriktionen von Verben. Aus diesem Grund ist die Akquisition von thematischen Rollen-Relationen untrennbar verbunden mit der Akquisition von Selektionsrestriktionen. Folglich besteht der Kern einer Strategie für das Lernen von Rollen-Relationen in einer Methode zur Akquisition von Selektionsrestriktionen (genauer gesagt, Selektionspräferenzen). Für letzteres Problem sind eine Reihe von Lösungsansätzen auf der Basis syntaktisch annotierter Korpora und WordNet vorgeschlagen worden. Für die Akquisition selektionaler Präferenzen eines bestimmten Verbs für ein bestimmtes Argument werden die entsprechenden Komplement-Nomen dieses Verbs aus dem Korpus extrahiert, und statistische Methoden ermitteln Generalisierungen über diesen Nomen, welche als eine Menge von WordNet-Nomen-Konzepten repräsentiert werden. Einer dieser Ansätze - die von (Abe & Li 1996) vorgeschlagene Methode - bildet den Ausgangspunkt meiner Untersuchungen. Jedoch ist dieses Verfahren nicht direkt für das Lernen von Rollen-Relationen anwendbar, sondern erfordert Modifikationen und Erweiterungen für diese Aufgabe. Insbesondere sind zwei Aspekte zu berücksichtigen. Zum einen ist es entscheidend, dass sich die zur Repräsentation von Selektionspräferenzen akquirierten WordNet-Konzepte auf einer adäquaten Generalisierungsebene befinden (z.B. <food> als PATIENT von <eat>, anstatt <cake> oder <physical_object>). In der Arbeit wird eine Modifikation des Verfahrens entwickelt, die seine Leistungfähigkeit in dieser Hinsicht substanziell erhöht. Zum anderen akquirieren die existierenden Verfahren, da sie über syntaktischen Komplementen generalisieren, Selektionspräferenzen für syntaktische statt für semantische Argumente. Um Selektionspräferenzen für semantische Rollen zu lernen, müssen die syntaktischen Argumente, die das geparste Korpus liefert, auf die ihnen zugrunde liegenden Rollen abgebildet werden, sodass das statistische Lernverfahren so eingesetzt werden kann, dass es beispielsweise über alle (semantischen) Agenten eines Verbs generalisiert anstatt über dessen (syntaktische) Subjekte. Zu diesem Zweck wird eine Methode zur Zuordnung von syntaktischen und semantischen Argumenten (Linking) entwickelt. Ein weiterer Aspekt der Gesamtstrategie, die in dieser Arbeit präsentiert wird, ist eine adäquate Methode zur Abbildung der Verben und Nomen in den Trainingsdaten auf die entsprechenden WordNet-Konzepte, welche eine Voraussetzung für die Anwendung des Algorithmus zur Akquisition von Selektionpräferenzen darstellt. Zum Zweck der Evaluation des in dieser Arbeit entwickelten Verfahrens zur Rollen-Akquisition wird ein Gold-Standard aus der EuroWordNet-Datenbank extrahiert und detaillierte Auswertungskriterien vorgeschlagen. Insgesamt zeigen die Ergebnisse der Evaluation (Accuracy-Raten von bis zu 84%) die Effektivität des Verfahrens. de_DE
dc.language.iso en de_DE
dc.publisher Universität Tübingen de_DE
dc.rights ubt-podok de_DE
dc.rights.uri http://tobias-lib.uni-tuebingen.de/doku/lic_mit_pod.php?la=de de_DE
dc.rights.uri http://tobias-lib.uni-tuebingen.de/doku/lic_mit_pod.php?la=en en
dc.subject.classification Linguistische Datenverarbeitung , Maschinelles Lernen , Semasiologie , Ontologie <Wissensverarbeitung> , Thematische Relation de_DE
dc.subject.ddc 400 de_DE
dc.subject.other Selektionsrestriktionen , Wortnetz de_DE
dc.subject.other Natural Language Processing , Machine Learning , Thematic Relation , Selectional Restrictions , WordNet en
dc.title Learning thematic role relations for lexical semantic nets en
dc.title Lernen thematischer Rollen-Relationen für lexikalisch-semantische Netze de_DE
dc.type PhDThesis de_DE
dcterms.dateAccepted 2004-12-08 de_DE
utue.publikation.fachbereich Sonstige - Neuphilologie de_DE
utue.publikation.fakultaet 5 Philosophische Fakultät de_DE
dcterms.DCMIType Text de_DE
utue.publikation.typ doctoralThesis de_DE
utue.opus.id 2005 de_DE
thesis.grantor 09 Neuphilologische Fakultät de_DE

Dateien:

Das Dokument erscheint in:

Zur Kurzanzeige