DOI QR코드

DOI QR Code

Transliteration Correction Method using Korean Alphabet Viable Prefix

한국어 자모 Viable Prefix를 이용한 외래어 표기 교정 기법

  • 권순호 (부산대학교 컴퓨터공학과) ;
  • 권혁철 (부산대학교 정보컴퓨터공학부, 인지과학협동과정)
  • Received : 2010.07.13
  • Accepted : 2010.10.14
  • Published : 2011.04.30

Abstract

In Korean documents, there are diverse spellings of transliterated foreign loanwords. This fact diminishes the performance of information retrieval systems in that a foreign word can be recognized differently, which is to say, as two or several different words. Thus, information retrieval systems require preprocessing to correct nonstandard loanword spellings prior to searching and recognizing corresponding equivalent words. This paper proposes a method that improves precision and processing efficiency using the Korean alphabet's viable prefix, which prunes a virtual tree from which candidate loanwords are created.

한국어 문서에서 외래어 표기는 한 단어에 대해 한 개만 존재하는 것이 아니라 여러 개의 다른 표기로 사용되고 있다. 이러한 표기상 불일치는 하나의 단어가 다른 개념으로 인식되어 정보 검색 시스템의 성능 저하의 원인이 된다. 따라서 정보 검색 시스템에서는 다양한 외래어 표기에 대해 같은 개념으로 인식하여 검색할 수 있도록 외래어 표기법에 맞는 외래어 표기로 교정하는 전처리가 필요하다. 본 논문에서는 질의어로 외래어가 입력되면, 이를 근거로 외래어 표기법에 맞는 외래어 표기로 교정해주는 방법을 제안한다. 제안하는 기법은 한국어 자모의 viable prefix를 이용하여 후보 외래어 표기를 생성하는 가상 트리를 작성하고 불필요한 외래어를 가지치기함으로써 검색 정확도를 높이고 속도를 개선한다.

Keywords

References

  1. 강병주, 이재성, 최기선, "외국어 음차 표기의 음성적 유사도 비교 알고리즘", 정보과학회 논문지(B), 제26권 제10호, pp.1237-1246, 1999.
  2. 고숙현, 이재성, "문맥을 고려한 유사 외래어 검출 알고리즘의 성능 향상", 한국정보과학회 언어공학연구회 학술발표 논문집, pp.114-121, 2007.
  3. 권순호, 권혁철, "한국어 자모 혼동행렬 기반 유사 외래어 표기검출 기법", 한국정보처리학회 춘계학술발표대회 논문집, 제17권 1호, pp.433-436, 2010.
  4. 김민정, 권혁철, "언어적, 경험적 제약을 이용한 한국어 문자인식 후처리 기법", 정보과학회논문지(B), 제24권 제1호, pp.25-31, 1997.
  5. 김지승, 김광현, 이준호, "입말 표기를 이용한 영어 단어 검색", 한국문헌정보학회지, 제39권 제3호, pp.93-103, 2005. https://doi.org/10.4275/KSLIS.2005.39.3.093
  6. 윤태진, 조환규, "한글 자소정렬을 이용한 온라인 욕설 필터링시스템", 한국정보과학회 학술발표논문집(C), 제36권 제2호, pp.194-198, 2009.
  7. 이재성, "효과적인 외래어 이형태 생성을 위한 확률 문맥 의존치환 방법", 한국콘텐츠학회논문지, 제7권 제2호, pp.73-83, 2007.
  8. 정길순, 권윤형, 맹성현, "외래어와 영어처리를 통한 검색 효과 향상", 한국정보과학회 학술발표논문집, 제24권 제2호, pp.189-192, 1997.
  9. Christopher D. Manning, Prabhakar Raghavan, and Hinrich Schutze, 'Introduction to Infomation Retrieval', pp.58-59, Cambridge University Press, 2008.
  10. Lawrence Phillips, Hanging on the Metaphone, Computer Language, Vol.7, No.12, pp.39-43, 1990.
  11. S. M. Chaware and S. Rao, "Phonetic Matching through Writing Style", International Conference and Workshop on Emerging Trends in Technology, pp.541-543, 2010.
  12. Victoria J. Hodge and Jim Austin, "An Evaluation of Phonetic Spell Checkers", Technical Report YCS 338, Department of Computer Science of the University of York, 2001.