Browse > Article
http://dx.doi.org/10.3745/KIPSTB.2008.15-B.6.613

Korean Base-Noun Extraction and its Application  

Kim, Jae-Hoon (한국해양대학교 컴퓨터공학과)
Abstract
Noun extraction plays an important part in the fields of information retrieval, text summarization, and so on. In this paper, we present a Korean base-noun extraction system and apply it to text summarization to deal with a huge amount of text effectively. The base-noun is an atomic noun but not a compound noun and we use tow techniques, filtering and segmenting. The filtering technique is used for removing non-nominal words from text before extracting base-nouns and the segmenting technique is employed for separating a particle from a nominal and for dividing a compound noun into base-nouns. We have shown that both of the recall and the precision of the proposed system are about 89% on the average under experimental conditions of ETRI corpus. The proposed system has applied to Korean text summarization system and is shown satisfactory results.
Keywords
Noun Extraction; Filtering Technique; Segmentation of Compound Noun; Text Summarization;
Citations & Related Records
Times Cited By KSCI : 2  (Citation Analysis)
연도 인용수 순위
1 강승식, “한국어 복합명사 분해 알고리즘”, 정보과학회논문지(B), 제25권, 제1호, pp.172-182, 1998
2 Mani, I. and Maybury Mark T., Advances in Automatic Text, The MIT Press, 1999
3 심준혁, 김준석, 이근배, “통계와 규칙을 이용한 강인한 품사태거”, 제1회 형태소 분석기 및 품사태거 평가 워크숍 발표논문집, pp.60-75, 1999   과학기술학회마을
4 김재훈, 선충녕, 홍상욱, 이성욱, 서정연, 조정미, “KTAG99: 새로운 환경에 쉽게 적응하는 한국어 품사 태깅 시스템”, 제1회 형태소분석기 및 품사태거 평가 워크숍 발표논문집, pp. 99-105, 1999   과학기술학회마을
5 안동언, “좌우접속정보를 이용한 명사추출기”, 제1회 형태소분석기 및 품사태거 평가 워크숍 발표논문집, pp.173-178, 1999   과학기술학회마을
6 이중영, 신병훈, 이공주, 김지은, 안상규, “COM기반의 다목적 형태소 분석기를 이용한 명사추출기”, 제1회 형태소분석기 및 품사태거 평가 워크숍 발표논문집, pp.167-171, 1999   과학기술학회마을
7 최재혁, “형태소 분석을 통한 한영 자동 색인어 추출,” 정보과학회논문지(B), 제23권 제12호, pp.1279-1288, 1996
8 윤보현, 조민정, 임해창, “통계정보와 선호 규칙을 이용한 한국어 복합 명사의 분해”, 정보과학회논문지(B), 제24권, 제8호, pp.900-909, 1997
9 박혁로, 신중호, “비터비 학습 알고리즘을 이용한 한글 복합명사 분석”, 1997 한국정보과학회 가을 학술 발표논문집, Vol.24, No.2, pp.219-222, 1997
10 Aho, V. A. and Ullman, J. D. The Theory of Parsing, Translation, and Compiling, Prentice-Hall, 1972
11 김재훈, 김길창, 한국어에서의 품사 부착 말뭉치의 작성 요령 : KAIST 말뭉치, 한국과학기술원, 전산학과, 기술문서, CS/TR-95-9, 1995
12 Manning, C. D. and Schutze, H. Foundations of Statistical Natural Language Processing, The MIT Press, 1999
13 김준홍, 도합유사도를 이용한 추출요약 시스템, 한국해양대학교, 컴퓨터공학과, 석사학위 논문, 2000
14 Teufel, S. and Moens, M., “Argumentative classification of extracted sentences as a first step towards flexible abstracting,” in Mani, I. and Maybury, M. T., editors, Advances in Automatic Text Summarization, pp.155-171. The MIT Press, 1999
15 김태희, 박혁로, 신중호 “검색/요약/필터링을 위한 텍스트 이해 모형 연구”, 제3회 소프트과학 워크숍, 1999
16 이현아, 이원일 임선숙, 허은경, 이재성, 차건희, 박재득, “표준안에 따른 품사 부착 말뭉치 구축”, 제1회 형태소 분석기 및 품사 태거 평가 워크숍 발표 논문집, pp.40-43, 1999   과학기술학회마을
17 이도길, 류원호, 임해창, “분석 배제 정보와 후절어를 이용한 한국어 명사추출”, 제12회 한글 및 한국어 정보처리 학술대회발표논문집, 서울, 성공회대학교, pp.19-25, 2000   과학기술학회마을
18 Baeza-Yates, R. and Ribeiro-Neto, B., Modern Information Retrieval, Addison Wesley, 1999
19 장동현, 맹성현, “학습데이터를 이용하여 생성한 규칙과 사전을 이용한 명사추출기”, 제1회 형태소분석기 및 품사태거평가 워크숍 발표논문집, pp.151-156, 1999   과학기술학회마을
20 최재혁, “음절수에 따른 한국어 복합명사 분리 방안”, 제8회 한글 및 한국어 정보처리 학술대회 발표논문집, pp.262-267, 1996   과학기술학회마을