DOI QR코드

DOI QR Code

나이브베이즈 분류모델과 협업필터링 기반 지능형 학술논문 추천시스템 연구

A Study of Intelligent Recommendation System based on Naive Bayes Text Classification and Collaborative Filtering

  • 이상기 (한국과학기술정보연구원 정보서비스실) ;
  • 이병섭 ((주)아르고넷 개발팀) ;
  • 박병용 (성균관대학교 문헌정보학과, KISTI 정보서비스실) ;
  • 황혜경 (한국과학기술정보연구원 지식기반실)
  • 투고 : 2010.06.25
  • 심사 : 2010.10.11
  • 발행 : 2010.10.30

초록

정보기술과 인터넷의 발달로 학술정보가 폭발적으로 증가하고 있다. 정보 과잉으로 인해 연구자들은 필요한 정보를 찾거나 필터링하는데 더 많은 시간과 노력을 투입하고 있다. 이용자들이 원하는 정보를 예측하여 관심 가질만한 정보를 선별하여 추천하는 시스템을 전문가시스템, 데이터마이닝, 정보검색 등 다양한 분야에서 오래 전부터 연구하여 왔다. 최근에는 콘텐츠기반추천시스템과 협업필터링을 결합하거나 다른 분야 모델을 접목한 하이브리드 추천시스템으로 발전하고 있다. 본 연구에서는 기존 추천시스템 문제를 해결하고 대규모 정보센터나 도서관에서 학술논문을 효율적이고 지능적으로 추천하기 위해 협업필터링과 나이브베이즈모델을 결합한 새로운 방식의 추천시스템을 제시하였다. 즉, 협업필터링 방식으로 과도한 특성화(Over-specialization) 문제를 해결하고, 나이브베이즈모델을 통해 평가정보나 이용정보가 부족한 신규콘텐츠 추천문제를 해소하였다. 본 모델을 검증하기 위해 한국과학기술정보연구원 NDSL에서 제공하는 식품과 전기 분야 학술논문에 적용하여 실험하였다. 현재 NDSL 이용자 4명에게 피드백을 받은 결과 추천논문에 상당히 만족하는 것으로 나타났다.

Scholarly information has increased tremendously according to the development of IT, especially the Internet. However, simultaneously, people have to spend more time and exert more effort because of information overload. There have been many research efforts in the field of expert systems, data mining, and information retrieval, concerning a system that recommends user-expected information items through presumption. Recently, the hybrid system combining a content-based recommendation system and collaborative filtering or combining recommendation systems in other domains has been developed. In this paper we resolved the problem of the current recommendation system and suggested a new system combining collaborative filtering and Naive Bayes Classification. In this way, we resolved the over-specialization problem through collaborative filtering and lack of assessment information or recommendation of new contents through Naive Bayes Classification. For verification, we applied the new model in NDSL's paper service of KISTI, especially papers from journals about Sitology and Electronics, and witnessed high satisfaction from 4 experimental participants.

키워드

참고문헌

  1. 김명찬. 2003. 텍스트 마이닝을 이용한 스팸메일 방지 기술. 정보통신부.
  2. 김성희, 엄재은. 2008. 기계학습을 이용한 문서 자동분류에 관한 연구, 정보관리연구. 39(4): 47-66. https://doi.org/10.1633/JIM.2008.39.4.047
  3. 김재경, 안도현, 조윤호. 2003. 인터넷 쇼핑몰을 위한 데이터마이닝 기반 개인별 상품추천 방법론의 개발. 한국지능정보시스템학회논문지, 9(3): 177-191.
  4. 김찬주, 황규백. 2009. 소셜 북마킹 시스템의 스패머 탐지를 위한 기계학습 기술의 성능비교. 정보과학회논문지: 컴퓨팅의 실제 및 레터, 15(1): 345-349.
  5. 김판준, 이재윤. 2007. 문헌간 유사도를 이용한 자동분류에서 미분류 문헌의 활용에 관한 연구. 정보관리학회지, 24(1): 251-252. https://doi.org/10.3743/KOSIM.2007.24.1.251
  6. 박지선, 김택헌, 류영석, 양성봉. 2002. 추천시스템을 위한 2-way 협동적 필터링 방법을 이용한 예측알고리즘, 정보과학회지, 29(9): 669-675.
  7. 안신현. 2007. 콘텐츠 추천 시스템에 관한 이슈. [cited 2010. 6. 10].
  8. 연종흠, 심준호, 이상구. 2010. 확장된 나이브 베이즈 분류기를 활용한 질문-답변 커뮤니티의 질문 분류. 정보과학회논문지: 컴퓨팅의 실제 및 레터, 16(1): 95-100.
  9. 이재문. 2003. 휴리스틱을 이용한 KNN의 효율성 개선. 정보처리학회논문지, 10-B(6): 719-720.
  10. 이충무, 이상기, 이병섭. 2009. 추천시스템과 소셜 네트워크를 융합한 지능형 연구자연 결망 구축. 정보관리연구, 40(1) : 199-215.
  11. 정영미, 이용구. 2005. 정보검색 성능 향상을 위한 단어 의미 중의성 해소 모형에 관한 연구. 정보관리연구, 22(2): 125-145. https://doi.org/10.3743/KOSIM.2005.22.2.125
  12. 최종후. 2000. AnswerTree를 이용한 데이터 마이닝 의사결정나무분석. 서울:SPSS 아카데미.
  13. 한성희. 2009. 추천시스템기술소개. KBS 방송기술연구소.
  14. 홍태호. 2005. 클러스터링 기반 사례기반추론을 이용한 웹 개인화 추천시스템. 한국지능정보시스템학회논문지, 11(1): 107-121.
  15. Balabanovic, M., and Shoham Y. 1997. "Fab: Content-Based, Collaborative Recommendation." Communications of the Association for Computing Machinery, 40(3): 66-72.
  16. Baumann, S., and Hummel, O. 2005. "Enhancing Music Recommendation Algorithms Using Cultural Metadata." Journal of New Music Research Research. 34(2): 161-172. https://doi.org/10.1080/09298210500175978
  17. Kim, J.K., Cho, Y.H., Kim, W.J., Kim, J.R, and J.H. Suh. 2002. "A Personalized Recommendation Procedure for Internet Shopping Support." Electronic Commerce Research and Applications, 1(3): 301-313. https://doi.org/10.1016/S1567-4223(02)00022-4
  18. Konstan, J.A., Miller, B.N., Maltz, D. 1997. Herlocker, J.L., Gordon, L.R., and Riedl, J. 1997. "GroupLens: Applying Collaborative Filtering to Usenet News." Communications of the Association for Computing Machinery. 40(3): 77-87. https://doi.org/10.1145/245108.245126
  19. Krulwich, B., and Burkey, C. 1996. "Learning user information interests through extraction of semantically significant phrases." Proceedings of the AAAI Spring Symposium on Machine Learning in Information Access.
  20. Li, Q., and B.M. Kim. 2003. "Clustering Approach for Hybrid Recommender System." Proceedings of IEEE/WIC International Conference on Web Intelligence, 33-39.
  21. Miyahara, K., Pazzani, M.J. 2000. "Improvement of Collaborative Filtering with the Simple Bayesian Classifier". Lecture notes in computer science, 1886.
  22. Pedro Domingos and Michael Pazzani. 1996. "Beyond Independence: Conditions for the Optimality of the Simple Bayesian Classifier." in Proceedings of the 13th International Conference on Machine Learning. 105-122.
  23. Robles, V., Larranaga, P., Menasalvas, E., Perez, M.S., Herves, V. 2003. "Improvement of Naive Bayes Collaborative Filtering Using Interval Estimation." Proceedings of the 2003 IEEE/WIC International Conference on Web Intelligence, 168-174.
  24. Roh, T.H., Oh, K.J., and Han, I., 2003. "The Collaborative Filtering Recommendation Based on SOM Cluster-Indexing CBR." Expert Systems with Applications, 25(3): 413-423. https://doi.org/10.1016/S0957-4174(03)00067-8
  25. Sarwar, B.M., Karypis, G., Konstan, J.A., and Riedl, J., 2001. "Item-Based Collaborative Filtering Recommendation Algorithms." Proceedings of the 10th International World Wide Web Conference, 285-295.
  26. Schafer, J.B., Konstan, J.A., Riedl, J., 1999. "Recommender Systems in e-Commerce." Proceedings of the ACM Conference on Electronic Commerce.
  27. Shardanand, U., and Maes, P. 1995. "Social Information Filtering: Algorithms for Automating." Proceedings of the SIGCHI conference on Human factors in computing systems. 210-217.
  28. Sheth, B., and Maes, P. 1993. "Evolving agents for personalized information filtering." Proceedings of the 9th IEEE Conference on Artificial Intelligence for Applications.
  29. Weng, S.-S., and M.-J. Liu. 2004. "Feature-Based Recommendations for One -to-One Marketing." Expert Systems with Applications, 26(4): 493-508. https://doi.org/10.1016/j.eswa.2003.10.008

피인용 문헌

  1. Review and Analysis of Recommender Systems vol.41, pp.2, 2015, https://doi.org/10.7232/JKIIE.2015.41.2.185