Natural Language Information Retrieval by Fuzzy Inference

퍼지 추론에 의한 자연언어 정보 검색

  • Park, Hyeon-Gyu (Graduate School of Korea Advanced Institute of Science and Technology) ;
  • O, Jong-Hun (Graduate School of Korea Advanced Institute of Science and Technology) ;
  • Kim, Myeong-Ho (Dept. of Computer Science, Korea Advanced Institute of Science and Technology) ;
  • Choe, Gi-Seon (Dept. of Computer Science, Korea Advanced Institute of Science and Technology) ;
  • Lee, Gwang-Hyeong
  • Published : 2001.06.01

Abstract

인터넷 전자 상거래 시스템에서 주로 일어나는 정보 검색은 사용자의 상품정보 요구라고 할 수 있다. 이와 같이 사용자가 원하는 상품 정보를 웹 환경에서 검색하기 위해서는 편리한 검색 환경의 제공뿐만 아니라, 검색 성능의 효율성 또한 우수해야 한다. 인터넷 인구와 온라인 쇼핑몰의 급격한 증가로 인해 다양한 조건 검색에 의한 상품검색 요구가 증대되고 있다. 또한, 이러한 상품의 검색 결과는 사용자의 의도와 의미상으로 밀접한 관계를 가져야 한다. 자연언어 정보검색은 이러한 요구의 중요한 대안으로 대두되고 있으나, 자연언어 자체가 가지는 애매한 의미의 해석 등으로 인하여 상용 시스템에 적용하는데 많은 어려움이 있다. 본 논문에서는 이러한 문제점을 해결하기 위하여 퍼지추론을 이용한다. 입력된 자연언어 질의에서 형태소 분석을 통하여 데이터베이스 질의에 사용될 수 있는 의미어(content word)를 추출한 후, 의미어들을 재구성하여 템플릿을 작성한다. 작성된 템플릿은 퍼지 추론을 통하여 의미의 애매성을 해소하고 데이터베이스 질의로 변환하여 사용자의 질의 의도와 부합되는 검색 결과를 제시한다.

Keywords

References

  1. J. Chae and S. Lee, 'Identifying Basic Patterns of Korean Natural Language Query,' In NLPRS'95, pp.606-611, 1995
  2. R. Fagin, 'Combining Fuzzy Information from Multiple Systems,' J. of Computer and System Sciences, Vol.58, pp.83-99, 1999 https://doi.org/10.1006/jcss.1998.1600
  3. Informix Technical Brief, 'Informix Web Datablade Module,' Informix Corp
  4. A. Klein, J. Martiasek, and H. Trost, 'The treatment of noun phrase queries in a natural language database access system,' In COLING-ACL'98 workshop on the computational treatment of nominals, pp.39-45, 1998
  5. KM. Lee, H. Lee-Kwang, 'Fuzzy Information Processing for Expert Systems,' Int. J. of Uncertainty, Fuzziness and Knowledge-Based Systems, Vol.3, No.1, pp.93-109, 1995 https://doi.org/10.1142/S0218488595000098
  6. R. Nelken and N. Francez, 'Querying Temporal Databases Using Controlled Natural Language,' In COLING'2000, pp.1076-1080, 2000 https://doi.org/10.3115/992730.992808
  7. L. R. Rabiner, 'A Tutorial on Hidden Markov Models and Selected Application in Speech Recognition,' Proceedings of the IEEE, Vol.77, No.2, pp.257-286 https://doi.org/10.1109/5.18626
  8. L. Zadeh, 'Fuzzy Sets,' Inf. Control, Vol.8, pp.338-353, 1965 https://doi.org/10.1016/S0019-9958(65)90241-X
  9. L. Zadeh, 'The Concept of a Linguistic Variable and Its Application to Approximate Reasoning,' Inf. Science, Vol.8, No.3, pp.199-249, 1975 https://doi.org/10.1016/0020-0255(75)90036-5
  10. 강승식, '전자거래 시스템에서 가격지정 연산자의 인식', 제11회 한글 및 한국어정보처리학회, pp.85-88, 1999
  11. 김재훈, '오류-보정 기법을 이용한 어휘 모호성 해소', 한국과학기술원 전산학과 박사학위 논문, 1996
  12. 김진동, 임희석, 임해창, 'Twoply HMM : 한국어의 특성을 고려한 형태소 단위의 품사 태깅 모델', 정보과학논문지(B), 제24권 제12호, pp.1502-1512, 1997
  13. 신중호, 한영석, 박영찬, 최기선, '어절구조를 반영한 은닉 마르코프 모델을 이용한 한국어 품사 태깅', 제6회 한글 및 한국어 정보처리 학술대회, pp.389-394, 1997
  14. 윤성희, '한국어 자연언어 질의 문장 파생에서의 중의성 해소', 정보과학논문지(B), 제24권 12호, pp.1482-1492, 1997
  15. 이광형, 오길록, '퍼지 이론과 응용', 홍릉과학출판사, 서울, 1992
  16. 이정규, 이상주, 임희석, 임해창, '규칙기반 한국어 품사 태깅을 위한 어휘 규칙 획득의 수작업 최소화 방안', 제24회 한국정보과학회 춘계학술발표대회논문집, Vol.24, No.1, pp.479-482
  17. 이호동, 박종철, '결합범주문법을 이용한 자연언어 인터페이스', 한국정보과학회 추계학술발표논문집, Vol.27(II), pp.173-175, 2000
  18. 임희석, 김진동, 임해창, '어절 태그 변형 규칙을 이용한 한국어 품사 태거', 정보과학회논문지(B), 제24권 제6호, pp.673-684, 1997
  19. 채진석, 김성기, 이석호, '한국어 데이터베이스 검색을 위한 질의 시스템의 설계 및 구현', 정보과학회논문지, 제20권 제6호, pp.810-820, 1993