어휘망(U-WIN)의 구문관계 자동구축

Automatic Construction of Syntactic Relation in Lexical Network(U-WIN)

  • 임지희 (울산대학교 컴퓨터정보통신공학부) ;
  • 최호섭 (한국과학기술정보연구원 정보기술개발단) ;
  • 옥철영 (울산대학교 컴퓨터정보통신공학부)
  • 발행 : 2008.10.15

초록

본 연구에서는 사용자 어휘지능망(U-WIN)의 어휘 관계 중의 하나인 구문관계를 자동으로 구축하는 방법을 제시하고자 한다. 먼저, 구문관계를 형성할 수 있는 후보명사를 용언의 용례에서 문형 정보를 기준으로 추출함으로써, 용언의 세분화된 의미별로 정확하고 다양한 후보명사를 추출할 수 있다. 그러나 추출된 후보명사는 다양한 의미를 지니고 있으므로, 어휘간의 명확한 구문관계를 설정하기 위해서는 후보명사의 여러 의미 중에서 정확한 의미로 결정해야 한다. 그래서 본 연구에서는 용례 매칭 규칙, 구문 패턴, 의미 유사도, 빈도 정보 등을 이용하여 후보명사의 의미를 분별한다. 또한 구문패턴의 빈도 정보를 이용하여 용례에 나타나지 않지만 구문관계를 형성할 수 있는 명사를 추출하여 구문관계를 확장하고자 하였다. 이러한 연구는 명사 중심의 어휘망이 용언과의 구문관계 구축을 통해 형태소 분석, 구문 분석, 의미분석 등에 광범위하게 활용할 수 있는 어휘망의 기반을 다지는 작업이 될 수 있을 것이다.

An extended form of lexical network is explored by presenting U-WIN, which applies lexical relations that include not only semantic relations but also conceptual relations, morphological relations and syntactic relations, in a way different with existing lexical networks that have been centered around linking structures with semantic relations. So, This study introduces the new methodology for constructing a syntactic relation automatically. First of all, we extract probable nouns which related to verb based on verb's sentence type. However we should decided the extracted noun's meaning because extracted noun has many meanings. So in this study, we propose that noun's meaning is decided by the example matching rule/syntactic pattern/semantic similarity, frequency information. In addition, syntactic pattern is expanded using nouns which have high frequency in corpora.

키워드

참고문헌

  1. 최호섭, "대규모 사용자 어휘지능망 구축과 활용", 울산대 박사학위논문, 2007
  2. 홍재성 외, "21세기 세종 계획 <전자사전 개발> 연구보고서", 국립국어원, 2005
  3. 전문용어언어공학센터[KORTERM], 다국어 어휘망 총3권, KAIST Press, 2005
  4. 최호섭, "한국어 명사 개념망 구축-경제용어를 중심으로", ETRI 지식정보검색연구팀 경제개념망 구축결과보고서, 2001
  5. R. Rada, H. Mili, E. Bicknell, M. Blettner, Development and application of a metric on semantic nets, IEEE Transactions on Systems, Man and Cybernetics 19 (1) 17-30, 1989 https://doi.org/10.1109/21.24528
  6. C. Leacock, M. Chodorow, Combining local context and WordNet similarity for word sense identification, in: C. Fellbaum (Ed.), WordNet: An electronic lexical database, MIT Press, pp. 265- 283, 1998
  7. J. Jiang, D. Conrath, Semantic similarity based on corpus statistics and lexical taxonomy, in: Proceedings on International Conference on Research in Computational Linguistics, Taiwan, pp. 19-33, 1997
  8. D. Lin, Using syntactic dependency as a local context to resolve word sense ambiguity, in: Proceedings of the 35th Annual Meeting of the Association for Computational Linguistics, Madrid, pp. 64-71, 1997
  9. P. Resnik, Using information content to evaluate semantic similarity in a taxonomy, in: Proceedings of the 14th International Joint Conference onArtificial Intelligence, Montreal, pp. 448-453, 1995
  10. Wu, Z., Palmer, Verb semantics and lexical selection, 32nd Annual Meeting of the Association for Computational Linguistics, New Mexico State University, LasCruces, New Mexico, 1994
  11. Hirst, G. and D. St.Onge. Lexical Chains as Represenations of Context for the Detection and Correction of Malapropisms. WordNet. C. Fellbaum. Cambridge, MA, The Mit Press, 1995
  12. 국립국어연구원, "<표준국어대사전> 편찬 지침 I-II", 국립국어연구원, 2000