A Study of using Emotional Features for Information Retrieval Systems

감정요소를 사용한 정보검색에 관한 연구

  • 김명관 (서울보건대학 전산정보처리과) ;
  • 박영택 (숭실대학교 컴퓨터학부)
  • Published : 2003.10.01


In this paper, we propose a novel approach to employ emotional features to document retrieval systems. Fine emotional features, such as HAPPY, SAD, ANGRY, FEAR, and DISGUST, have been used to represent Korean document. Users are allowed to use these features for retrieving their documents. Next, retrieved documents are learned by classification methods like cohesion factor, naive Bayesian, and, k-nearest neighbor approaches. In order to combine various approaches, voting method has been used. In addition, k-means clustering has been used for our experimentation. The performance of our approach proved to be better in accuracy than other methods, and be better in short texts rather than large documents.

감정요소를 사용한 정보검색시스템은 감정에 기반한 정보검색을 수행하기 위하여 감정시소러스를 구성하였으며 이를 사용한 감정요소추출기를 구현하였다. 감정요소추출기는 기본 5가지 감정 요소를 해당 문서에서 추출하여 문서를 벡터화시킨다. 벡터화시킨 문서들은 k-nearest neighbor, 단순 베이지안 및 상관계수기법을 사용한 2단계 투표방식을 통해 학습하고 분류하였다. 실험결과 분류 방식과 K-means를 이용한 클러스터링에서 감정요소에 기반한 방식이 더 우수하다는 결과와 5,000 단어 미만의 문서 검색에 감정기반 검색이 유리하다는 것을 보였다.



  1. Aha, D.W., 'Instance-Based Learning Methods,' Machine Learning, 6, pp.37-66, 1991
  2. Alpaydim, E., 'Voting Over Condensed Nearest Neighbors,' Bogazici Univ., 1995
  3. Alpaydim, E., 'GAL: Networks that Grow When They Leam and Shrink When Thery Forget,' International Computer Science Institute, Berkeley : CA, TR-91-032, 1996
  4. Clark, M.S., 'Affect and Cognition,' LEA Publishers, 1982
  5. Colby, M., 'Modeling a paranoid mind,' The Behavioral and Brain Sciences, 4(4), pp.515-560, 1981
  6. Dyer, M.G., 'In depth understanding,' MIT Press, 1983
  7. Dyer, M.G., 'Emotions and their computation,' Cognition and Emotion, 1(3), pp.323-347, 1987
  8. Elliot, C.D., 'A Process model of emotions in a multi-agent system,' Ph,D thesis, north-west Univ., 1992
  9. Fisher, D., 'Knowledge Acquisition via Incremental Conceptual Clustering,' Machine Learning, 2, pp.139-172, 1987
  10. Hart, P.E., 'The Condensed Nearest Neighbor Rule,' IEEE Transaction on Information Thery, 14, pp.515-516, 1968
  11. Miller, G.A., 'Wordnet : An On-line Lexical Data Base,' Hillsdale, 1993
  12. Mitchell, T., 'Machine Learning,' McGraw-Hill, 1997
  13. Reeves, J.F., 'Computational morality : A process model of belief conflict and resolution for story understanding,' Technical Report UCLA-AI-91-05, UCLA AI Lab, 1991
  14. Roget, P.M., 'Roget's Thesaurus,' Gramercy Books, 1979
  15. Salton, G., 'Automatic Text Processing,' Addison Wesley, 1989
  16. Sestito, S., 'Automated Knowledge Acquisition,' Prentice Hall, 1994
  17. Wright, I.P., 'Emotional Agents,' Ph. D. thesis, Univ. of Birmingham, 1997
  18. 한국리서치 미디어인덱스, '2002년 1R 조사결과,', 2002
  19. 유상진 외 3인, '현대 통계학,' 법영사, 1997
  20. 정영미, '정보 검색론,' 정음사, pp.181-208, 1986
  21. 김명관, 박영택, '감정기반 정보 검색시스템에 관한 연구,' 한국문헌정보학회, 제32권 제4호, 1998
  22. 'Automatic Cluster Detection,', 2003
  23. 김명관, '2단계 분류기법을 이용한 영상 분류기 개발,' 컴퓨터산업교육학회눈문지, Vol.3, No.5, May, 2002