Dynamic Expansion of Semantic Dictionary for Topic Extraction in Automatic Summarization

자동요약의 주제어 추출을 위한 의미사전의 동적 확장

  • Choo, Kyo-Nam (Department of Information and Telecommunication Engineering) ;
  • Woo, Yo-Seob (Department of Information and Telecommunication Engineering)
  • 추교남 (인천대학교 정보통신공학과) ;
  • 우요섭 (인천대학교 정보통신공학과)
  • Published : 2009.06.30

Abstract

This paper suggests the expansion methods of semantic dictionary, taking Korean semantic features account. These methods will be used to extract a practical topic word in the automatic summarization. The first is the method which is constructed the synonym dictionary for improving the performance of semantic-marker analysis. The second is the method which is extracted the probabilistic information from the subcategorization dictionary for resolving the syntactic and semantic ambiguity. The third is the method which is predicted the subcategorization patterns of the unregistered predicate, for the resolution of an affix-derived predicate.

본 논문에서는 자동문서요약 시스템에서 정확하고 실용적인 주제어 추출을 위하여 한국어의 의미론적 특성을 고려한 의미사전의 확장 방법론에 대하여 논하고자 한다. 첫째로 동의어 사전을 통하여 의미표지 분석의 정확도를 높이고자 한다. 둘째로 하위범주화사전에 가중치를 부여하여 구문과 의미 분석에서 가장 올바른 분석 결과를 결정하는 참조 정보로 활용하고자 한다. 셋째로 미등록 용언의 하위범주화패턴 예측을 통하여 한국어에서 접사 파생되는 용언에 대하여 원활한 의미 분석을 수행할 수 있도록 한다.

Keywords

References

  1. 추교남, 우요섭, "문맥과 공통 주제의 의미 분석을 통한 다중 문서의 자동 요약." 한국정보기술학회, 제5권-2호, pp.89-103, 2007
  2. 우요섭, 양승현, 김영섬 등, "시소러스와 용언 패턴을 이용한 의미역 부착 한국어 하위범주화 사전의 구축." 한국정보과학회, 제6권-3호, pp.364-372, 2000
  3. 박현재, 우요섭, "의미 정보를 이용한 이단계 단문 분할." 한국정보처리학회, 제7권-9호. pp.2876-2884, 2000
  4. K. N. Choo., Y. S. Woo. and S. H. Kang, "Automatic Extension of Korean Predicate-based Subcategorization Dictionary from Sense Tagged Corpora." Springer, Lecture Notes in Computer Science 3045, pp.585-592, 2004
  5. 신문기사 종합 시소러스, 한국언론연구원, 2000.
  6. 신현숙 등, 현대 한국어 학습사전, 한국문화사, 2000
  7. K. N. Choo., Y. S. Woo. and H. K. Min, "Icon Language-based Auxiliary Communication System Interface for Language Disorders." Springer, Lecture Notes in Computer Science 3665, pp.93-101, 2005
  8. 추교남, 멀티미디어 XML 문서에 대한 의미 분석 기반의 지능적 자동 요약, 인천대학교 박사학위 논문, 2007