• Title/Summary/Keyword: EuroWordNet

Search Result 4, Processing Time 0.017 seconds

Alignment of Hypernym-Hyponym Noun Pairs between Korean and English, Based on the EuroWordNet Approach (유로워드넷 방식에 기반한 한국어와 영어의 명사 상하위어 정렬)

  • Kim, Dong-Sung
    • Language and Information
    • /
    • v.12 no.1
    • /
    • pp.27-65
    • /
    • 2008
  • This paper presents a set of methodologies for aligning hypernym-hyponym noun pairs between Korean and English, based on the EuroWordNet approach. Following the methods conducted in EuroWordNet, our approach makes extensive use of WordNet in four steps of the building process: 1) Monolingual dictionaries have been used to extract proper hypernym-hyponym noun pairs, 2) bilingual dictionary has converted the extracted pairs, 3) Word Net has been used as a backbone of alignment criteria, and 4) WordNet has been used to select the most similar pair among the candidates. The importance of this study lies not only on enriching semantic links between two languages, but also on integrating lexical resources based on a language specific and dependent structure. Our approaches are aimed at building an accurate and detailed lexical resource with proper measures rather than at fast development of generic one using NLP technique.

  • PDF

Eine methodologische Untersuchung der koreanisch-deutschen ILI-Verbindung zur Anwendung der auf dem EuroNet basierten lexikalisch-semantischen Datenbasis (유로워드넷 기반의 어휘 데이터베이스 활용을 위한 한국어-독일어 ILI 대응 방법론 연구)

  • Oh Jang-Geun
    • Koreanishche Zeitschrift fur Deutsche Sprachwissenschaft
    • /
    • v.6
    • /
    • pp.323-344
    • /
    • 2002
  • EuroNet ist eine multilinguale Datenbasis mit WordNets $f\"{u}r\;einige\;europ\"{a}ische$ Sprachen ($holl\"{a}ndisch$, italienisch, spanisch, deutsch, $franz\"{o}sisch$, tschechisch und estnisch). Die WordNets werden genauso wie das amerikanische WordNet $f\"{u}r$ Englisch (Princeton WordNet, Miller et al. 1990) in Synsets (Zusammensetzen der synonymen $W\"{o}rter$) mit grundlegenden lexikalisch-semantischen Relationen zwischen ihnen $ausgedr\"{u}ckt$ strukturiert. Jedes WordNet stellt also ein einzigartiges innersprachliches System $f\"{u}r$ die lexikalischen und konzeptuellen Relationen dar. $Zus\"{a}tzlich$ werden diese auf dem Princeton WordNet basierten WordNets (z.B. GermaNet) mit einem Inter-Linguale-Index (kurz, ILI) verbunden. $\"{U}ber$ diesem Index werden die Sprachen zusammengeschaltet, damit zu gehen ist $m\"{o}glich$, von den $W\"{o}rtern$ in einer Sprache zu den $\"{a}hnlichen\;W\"{o}rtern$ in jeder $m\"{o}glicher$ anderen Sprache. Der Index gibt auch Zugang zu einer geteilten Top-Ontologie von 63 semantischen Unterscheidungen. Diese Top-Ontologie stellt einen allgemeinen semantischen Rahmen $f\"{u}r$ aile Sprachen zur $Verf\"{u}gung,\;w\"{a}hrend$ sprachspezifische Eigenschaften in den einzelnen WordNets beibehalten werden. Die Datenbasis kann, unter anderen, $f\"{u}r$ einsprachige und multilinguale Informationsretrieval benutzt werden. In der vorliegenden Arbeit handelt sich also um eine methodologische Untersuchung der koreanisch-deutschen ILI-Verbindung zur Anwendung der auf dem EuroNet basierten lexikalischen, semantischen Datenbasis. Dabei werden einzelnen Lexeme in koreanischen, deutschen WordNets $zun\"{a}chst$ mit Hilfe der Sense-Analyse semantisch differenziert, und dann durch lexikalische und konzeptuelle Relationen(ILI) miteinander verbunden. Die Equivalezverbindungen dienen, sprachspezifische Konzepte zum ILI abzubilden. Sie werden von einem anderen Synset der moglichen Relationen aus der Euronet-Spezifikation genommen. Wenn es keinen ILI-Rekord gibt, der ein direktes Equivalenz zu einem gegebenen Konzept darstellt, kann das Konzept in der Frage $\"{u}ber$ EQ-Near-Synonymie, EQ-Hyperonymie oder EQ-Hyponymie Relationen verbunden werden.

  • PDF

Eine methodische Betrachtung fur die Erstellung des koreanisch-deutschen WordNets (한독 워드넷 구축을 위한 기본 방법론 고찰)

  • Nam Yu-Sun
    • Koreanishche Zeitschrift fur Deutsche Sprachwissenschaft
    • /
    • v.9
    • /
    • pp.217-236
    • /
    • 2004
  • Das Ziel dieser Arbeit ist es, als eine methodische Grundlage zur Erstellung des koreanisch-deutschen WordNets das Grundwissen $\"{u}ber$ das WordNet und einige bisherige Untersuchungen des WordNets darzulegen. Ais erster Schritt wurde einige grundlegende Punkte $f\"{u}r$ das WordNet im Rahmen des WordNets fur Englisch in Betracht gebracht. Dabei ging es um lexikalische Hierarchie, und um semantische Relationen zwischen den Synsets(Zusammensetzen der synonymen $W\"{o}rter$) wie Synonymy, Antonymy, Hyponymy, Mronymy, Troponomy und Entailment. $Anschlie{\ss}end$ wurden EuroNet und GermaNet in kurzer Form vorgestellt, die auf dem Princeton WordNet basierten. EuroNet ist eine multilinguale Datenbasis mit WordNets $f\"{u}r$ einige europaische Sprachen (hollandisch, italienisch, spanisch, deutsch, franzasisch, tschechisch und estnisch). Dieses auf das Deutsch bezogenen WordNet kann wichtige Hinweise $f\"{u}r$ die Erstellung des koreanisch-deutschen WordNets geben. In Korea wurden auch verschiedene Untersuchungen uber das WordNet $f\"{u}r$ Koreanisch unternommen. Darunter kann insbesondere KORTERM WordNet $f\"f{u}r$ Koreanisch als ein umfassendes System $erw\"{a}hnt$ werden, in dem Nomen, Verben, Adjektive und Adverbien miteinander interagieren. KORTERM WordNet fur Koreanisch ist eine multilinguale Datenbasis mit WordNets $f\"{u}r$ einige asiatische Sprachen (koreanisch, japanisch und chinesisch) und versucht noch die weiteren Sprachen in diese multilinguale Datenbasis hineinzubringen. Nach diesem WordNet wird das koreanisch-deutsche WordNet erstellt.

  • PDF

Construction of Korean WordNet (한국어 워드넷의 구축)

  • Lim, Sung-Shin;Lee, Eun-Ryoung;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 2004.10d
    • /
    • pp.106-111
    • /
    • 2004
  • 사람의 언어를 이해하는 자연언어처리 시스템을 개발하기 위해서는 의미처리를 위한 지식 베이스(knowledge base)가 필요하다. 지금까지 사람이 가진 지식 베이스를 컴퓨터에 도입하려는 많은 노력을 기울이고 있고 그 결과물로 온톨로지(ontology)와 시소러스(thesaurus)가 만들어지고 있다. 외국에서는 지식 베이스의 중요성을 알고 많은 연구를 수행하고 있으며 그 대표적인 사례들에는 Roget's Thesaurus, WordNet, EDR 개념사전, CYC, Euro WordNet 등이 있다. 이 중에서 가장 대표적이며 많은 활용을 보이는 것이 Princeton 대학의 WordNet이다. WordNet은 인간의 어휘지식에 대한 심리 언어학적인 연구의 결과물로써 심리학자와 언어학자들에 의해 10여 년 동안 구축되고 있는 영어에 대한 어휘데이터베이스이다. 본 논문에서는 WordNet을 기반으로 명사에 대해서 영한사전과 국어사전을 이용하여 구축한 한국어 워드넷을 소개하구 구축시 고려한 기본지침을 소개하도록 하겠다.

  • PDF