Browse > Article
http://dx.doi.org/10.6109/jkiice.2010.14.6.1403

Keyword Extraction in Korean Using Unsupervised Learning Method  

Shin, Seong-Yoon (군산대학교 컴퓨터공학과)
Rhee, Yang-Won (군산대학교 컴퓨터공학과)
Abstract
Korean information retrieval uses noun as index terms or keywords of representing the document. and noun and keyword extraction is to find all nouns presented in the document, In this paper, we proposes the method of keyword extraction using pre-built dictionary. This method reduces the execution time by reducing unnecessary operations. And noun, even large documents without affecting significantly the accuracy, can be extracted. This paper proposed noun extraction method using the appearance characteristics of the noun and keyword extraction method using unsupervised learning techniques.
Keywords
Noun Extraction; Korean Information; Retrieval; Keyword Extraction; Unsupervised Learning Technique;
Citations & Related Records
연도 인용수 순위
  • Reference
1 심준혁, 김준석, 이근배, "통계와 규칙을 이용한 강인한 품사태거," 제1회 형태소 분석기 및 품사태거 평가 워크숍 논문집, pp.60-75, 1999.
2 권오옥, 정유진, 김미영, 류동원, 이문기, 이종혁, "음절 단위 CYK 알고리즘에 기반한 형태소 분석기 및 품사 태거", 제1회 형태소 분석기 및 품사태거 평가 워크숍 논문집, pp.76-88, 1999.
3 이운재, 김선배, 김길연, 최기선, "모듈화된 형태소 분석기의 구현," 제1회 형태소 분석기 및 품사태거 평가 워크숍 논문집, pp.123-136. 1999.
4 장동현, 맹성현, "학습데이타를 이용하여 생성한 규칙과 사전을 이용한 명사 추출기," 제1회 형태소 분석기 및 품사태거 평가 워크숍 논문집, pp.151-156, 1999.
5 Masaaki NAGATA, Teruka SAITO, Kenji SUZUKI, "Using the web as a bilingual dictionary", Proceedings of the workshop on Data-driven methods in machine translation, pp. 1-8, 2001
6 QING LI, SUNG HYON MYAENG, YUN JIN, KANG Bo-Yeong, " Translation of Unknown Terms via Web Mining for Information Retrieval", Asia Information Retrieval Symposium No 3, vol. 4182, pp. 258-269, 2006
7 Lee D. G., Lee S. Z., Rim H. C., "An Efficient Method for Korean Noun Extraction Using Noun Patterns, Journal of Korean Institute of Information Scientists and Engineers, Vol. 30, No. 2, 2003
8 김지숙, 김영지, 문현정, 우용태, "효율적인 문서 자동 분류를 위한 대표 색인어 추출 기법", 정보기술과 데이터베이스저널, 제8권 제1호, 2001
9 D. D. Lewis and W. A. Gale., "A sequential algorithm for training text classifiers," In Proceedings of the Seventeenth Annual International ACM-SIGIR Conference on Research and Development in Information Retrieval, pp. 3-12, 1994.
10 정민수, "코퍼스로부터 구문분석을 위한 사전 구성," 군산대학교 대학원 석사학위 논문, 1999.
11 이재성, 박재득, 차건희, 박세영, "형태소 분석기 및 품사 태거 평가대회(MATEC99) 개요," 제1회 형태소 분석기 및 품사태거 평가 워크숍 논문집, pp.13-22, 1999.
12 김남철, 서영훈, "형태소 분석기 CMKMA와 색인어추출기 CBKMA/IX," 제1회 형태소 분석기 및 품사태거평가 워크숍 논문집, p.50-59, 1999.
13 이중영, 신병훈, 이공주, 김지은, 안상규, "COM 기반의 다목적 형태소 본석기를 이용한 명사 추출기," 제1회 형태소 분석기 및 품사태거 평가 워크숍 논문집, pp.167-172, 1999.
14 안동언, "좌우접속정보를 이용한 명사추출기," 제1회 형태소 분석기 및 품사태거 평가 워크숍 논문집, pp.173-178, 1999.