KorLexClas 1.5: A Lexical Semantic Network for Korean Numeral Classifiers

한국어 수분류사 어휘의미망 KorLexClas 1.5

  • 황순희 (부산대학교 인문학연구소) ;
  • 권혁철 (부산대학교 정보컴퓨터공학부) ;
  • 윤애선 (부산대학교 불어불문학과)
  • Published : 2010.01.15

Abstract

This paper aims to describe KorLexClas 1.5 which provides us with a very large list of Korean numeral classifiers, and with the co-occurring noun categories that select each numeral classifier. Differently from KorLex of other POS, of which the structure depends largely on their reference model (Princeton WordNet), KorLexClas 1.0 and its extended version 1.5 adopt a direct building method. They demand a considerable time and expert knowledge to establish the hierarchies of numeral classifiers and the relationships between lexical items. For the efficiency of construction as well as the reliability of KorLexClas 1.5, we use following processes: (1) to use various language resources while their cross-checking for the selection of classifier candidates; (2) to extend the list of numeral classifiers by using a shallow parsing techniques; (3) to set up the hierarchies of the numeral classifiers based on the previous linguistic studies; and (4) to determine LUB(Least Upper Bound) of the numeral classifiers in KorLexNoun 1.5. The last process provides the open list of the co-occurring nouns for KorLexClas 1.5 with the extensibility. KorLexClas 1.5 is expected to be used in a variety of NLP applications, including MT.

본 연구의 목적은 한국어 수분류사 체계를 설정하고, 수분류사와 공기명사 간 의미관계 정보를 제공하는 한국어 수분류사 어휘의미망 "KorLexClas 1.5"의 정보구조와 구축방식을 소개하는 데 있다. KorLex 명사, 동사, 형용사, 부사가 영어 워드넷(Princeton WordNet)을 기반으로 참고구축 방식으로 개발된 것에 비해, KorLexClas 1.0버전과 이를 확장한 1.5버전은 직접구축 방식으로 개발하였다는 점에서, 수분류사의 계층구조와 언어단위 간 의미관계 설정은 매우 방대한 시간과 정교한 구축 방식을 요구한다. 따라서 작업의 효율성을 기함과 동시에, 구축된 어휘의미망의 신뢰성 및 확장성을 높이기 위해, (1) 다양한 기구축 언어자원을 활용하되 상호 검증하는 절차를 거치고, (2) 부분문장 분석방법을 이용하여, 수분류사 및 공기명사 목록을 확장하며, (3) 언어학적 준거를 기준으로 수분류사의 계층구조를 설정하고, (4) 수분류사와 공기명사 간 의미관계 정보를 제공하되 확장성을 확보하기 위해, KorLexNoun 1.5에 '최하위 공통상 위노드(LUB : Least Upper Bound)'를 설정하는 방식을 택한다. 이러한 특성을 가진 KorLexClas 1.5는 기계번역을 비롯한 한국어정보처리의 제 분야에 응용될 수 있다.

Keywords

References

  1. K. Allan, "Classifiers," Language, 53(2), pp.285-311, 1977. https://doi.org/10.2307/413103
  2. W. Croft, "Semantic Universals in Classifier System," Word, 45(2): pp.145-71, 1994. https://doi.org/10.1080/00437956.1994.11435922
  3. C. Goddard, Semantic Analysis: A Practical Introduction, Oxford University Press, Oxford, 1998.
  4. J. Lyons, Semantics, 2 vols., Cambridge University Press, Cambridge, 1979.
  5. A. Wierzbicka, Semantics: Primes and Universals, Oxford University Press, Oxford, 1996.
  6. G. Lakoff, "Classifiers as a Reflection of Mind," (In C. Craig. ed.), Noun Classes and Categorization( pp.13-51), John Benjamins Publishing Company, Amsterdam/Philadelphia, 1986.
  7. K. Allan, Natural Language Semantics, Blackwell, Oxford, 2001.
  8. F. Bond, K. Paik, "Classifying Correspondence in Japanese and Korean," Proc. of the 3rd PACLING 97, pp.58-67, 1997.
  9. C. Fellbaum, ed. WordNet - An Electronic Lexical Database, MIT Press, Cambridge, 1998.
  10. P. Downing, "Pragmatic and Semantic Constraints on Numeral Quantifier Position in Japanese," Linguistics, 29, pp.65-93, 1993. https://doi.org/10.1017/S0022226700000050
  11. C.R. Huang, and K. Ahrens, "Individuals, Kinds and Events: Classifier Coercion of Nouns," Language Sciences, 25, pp.353-373, 2003. https://doi.org/10.1016/S0388-0001(02)00021-9
  12. Y. Matsumoto, "Japanese Numeral Classifiers: A Study of Semantic Categories and Lexical Organization," Linguistics, 31(4), pp.667-713, 1993. https://doi.org/10.1515/ling.1993.31.4.667
  13. S.H. Hwang, A.S. Yoon, H.-C. Kwon, "Semantic Representation of Korean Numeral Classifier and Its Ontology Building for HLT Applications," Language Resources and Evaluation, 42-2, Springer-Verlag, pp.151-172, 2008.
  14. Y.I. Jung, S.H. Hwang, A.S. Yoon, H.-C. Kwon, "Formalization of Ontological Relations of Korean Numeral Classifiers," Lecture Notes in Computer Science 4304, Springer-Verlag, pp.1106-1110, 2006.
  15. S.H. Hwang, A.S. Yoon, H.-C. Kwon, "Semantic Feature-Based Korean Classifier Module for MT Systems," Proc. of the 6th International Conference on Advanced Language Processing and Web Information Technology, pp.146-154, 2007.
  16. F. Bond, K. Ogura, S. Ikehara, "Classifiers in Japanese-to-English Machine Translation," Proc. of the 16th COLING 96, pp.125-130, 1996.
  17. F. Bond, K. Paik, "Reusing an Ontology to Generate Numeral Classifiers," Proc. of the 18th Conference on Computational Linguistics, pp.90-96, 2000.
  18. H. Guo, H. Zhong, "Chinese Classifier Assignment Using SVMs," Proc. of the 4th SIGHAN Workshop on Chinese Language Processing, pp.25-31, 2005.
  19. K. Paik, F. Bond, "Multilingual Generation of Numeral Classifiers Using a Common Ontology," Proc. of the 19th ICCPOL 2001, pp.141-147, 2001.
  20. M. Paul, E. Sumita, S. Yamamoto, "Corpus-based generation of numeral classifier using phrase alignment," Proc. of the 19th COLING, pp.779– 785, 2002.
  21. V. Sornlertlamvanich, W. Pantachat, S. Meknavin, "Classifier assignment by corpus-based approach," Proc. of the 14th COLING, pp.152-159, 1994.
  22. 이기영.최승권.김영길, "영한 자동번역에서의 한국어 분류사의 반자동 구축방법", 제20회 한글 및 한국어 정보처리 학술대회 논문집, pp.134-138, 2008.
  23. 남지순, "수량표현 명사구의 자동 $불{\cdot}한$ 번역을 위한 한국어 단위명사 유형에 대한 연구", 한국프랑스학논집, 54, 한국프랑스학회, pp.1-28, 2006.
  24. 곽추문, "$한{\cdot}중$ 양국 한자 분류사의 쓰임 비교", 한국어의미학 7, 한국어의미학회, 1-28, 2000.
  25. 곽추문, 한국어 분류사 연구, 성균관대학교 국어국문학과 박사학위논문, 1996.
  26. 안정아, 현대 국어 의존 명사의 의미 연구, 고려대학교 국어국문학과 박사학위논문, 2007.
  27. 임홍빈, "국어 분류사의 성격에 대하여", 국어학의 새로운 인식과 전개, 김완진 선생 회갑 기념논총, pp.586-611, 1991.
  28. 유재원, "자연어 처리를 위한 수사의 하위 범주 분류", 언어와 언어학, 제24호, 한국외국어대학교 외국어 종합연구센터 언어연구소, pp.103-110, 1999.
  29. 채완, "국어의 분류사 '개'의 차용 과정과 의미", 진단학보, $N{\circ}82$, 진단학회, pp.193-215, 1996.
  30. 국립국어원, 표준국어대사전 1.0, 두산동아, 2001.
  31. 국립국어원, 세종사전. 2007.
  32. KorLex: http://corpus.fr.pusan.ac.kr/korlex/start.htm
  33. 윤애선.황순희.이은령.권혁철, "한국어 어휘의미망 KorLex 1.5의 구축", 정보과학회지, 제36권 1호, 한국정보과학회, pp.94-110, 2009.
  34. 국립국어원, 현대 국어 사용 빈도 조사: 한국어 학습용 어휘 선정을 위한 기초 조사. 2002.
  35. 고려대 민족문화연구원 전자텍스트연구소 용례추출기, http://ikc.korea.ac.kr/cgi-bin/kwic/kwic.cgi
  36. K.O. Lee, "Role of Semantic and Syntactic Knowledge on the First Language Acquisition of Korean Classifiers," Journal of Korean Association of Child Studies, 18-2, pp.73-85, 1997.