DOI QR코드

DOI QR Code

A Study of the framework of search patterns for Hangul characters and its relationship with Hangout code for Hangeul Character based Index

한글 글자 단위 인덱스를 위한 검색 유형 정의 및 한글 부호계와의 연관성에 관한 연구

  • 이중화 (동의대학교 컴퓨터소프트웨어공학과) ;
  • 이종민 (동의대학교 컴퓨터소프트웨어공학과) ;
  • 김성우 (동의대학교 컴퓨터소프트웨어공학과)
  • Published : 2007.06.30

Abstract

In this paper, We investigate the search patterns that are applied to the character based word search and make the search algorithm. We used to various hangout coded set that are KS X 1001 hangeul coded set and unicode 3.0 for the character based word search algorithm. In each case, We study of efficiency of algorithms that are related to hangeul coded set.

본 논문에서는 한글 인덱스를 구현할 때 글자 단위를 기본으로 하는 경우 적용될 수 있는 검색 유형 (search pattern) 들은 어떠한 것들이 존재할 수 있는지에 대해 살펴보고, 검색 알고리즘에 적용시켜 본다. 이때 부호계와의 연관성과 효율성을 따져보기 위해서 KS X 1001의 두 바이트 조합형과 두 바이트 완성형, 그리고 유니코드 3.0의 조합형 부호계와 완성형 부호계 등 여러가지 부호계를 사용할 때에 대해 기본 검색 알고리즘을 적용해 본다.

Keywords

References

  1. 박미란, 나연묵멀티미디어학회 논문제 제1권 제2호 (1998.12) 162-172
  2. 김철수(Cheol-Su Kim)외 2인, 이중 배열 트라이 구조를 이용한 학국어 전자 사전의 구축, 정보과학회논문지(B) 제23권 제1호, 1996. 1, pp. 85-94 (10pages)
  3. 이근용 외 2인, 사전 검색 알고리즘을 이용한 자소 단위 한국어 형태소 분석, 한국정보과학회 1995년도 가을 학술발표논문집 제22권 제2호(A), 1995. 10, pp. 619-622
  4. 김희철 외2인, 다차원 이진트리를 한글색인사전의 구현,, 한국정보과학회 1998년도 봄 학술발표논문집 제25권 제1호(B), 1998. 4, pp. 452-454
  5. 김경석, 컴퓨터속의 한글이야기 둘째보따리-유니코드 3.0 및 ISO/IEC 10646 소개, 부산대학교 출판부, 1999
  6. ISO/IEC 10646-1:1993(E). International Standard. 1st edition. Information technology - Universal MultipleOctet Coded Character Set (UCS) - Part 1: Architecture and Basic Multilingual Plane, May 1, 1993. ISO
  7. The Unicode Consortium, The Unicode Standard, Version 5.0, Addison-Wesley Professional, 2006