DOI QR코드

DOI QR Code

A Text-based Similarity Measure for Scientific Literature

텍스트 기반 논문 유사도 계산 방안

  • Yoon, Seok-Ho (Department of Electronics and Computer Engineering, Hanyang University) ;
  • Hwang, Won-Seok (Department of Electronics and Computer Engineering, Hanyang University) ;
  • Kim, Sang-Wook (Department of Electronics and Computer Engineering, Hanyang University)
  • 윤석호 (한양대학교 전자컴퓨터통신공학과) ;
  • 황원석 (한양대학교 전자컴퓨터통신공학과) ;
  • 김상욱 (한양대학교 전자컴퓨터통신공학과)
  • Published : 2010.04.23

Abstract

본 논문에서는 텍스트 기반 유사도 계산 방안을 이용하여 논문들 간의 유사도를 계산하는 방안을 제안한다. 논문 데이터베이스에는 논문의 본문이 거의 저장되어 있지 않다. 따라서 논문 데이터베이스에 저장되어 있는 논문의 제목과 요약글들의 키워드들을 이용하여 기존 텍스트 기반 유사도 계산 방안으로 논문들 간의 유사도를 계산할 수 있다. 그러나 논문의 제목과 요약글은 논문의 본문이 가지고 있는 키워드들에 비해서 너무나도 적은 수의 키워드들을 가지고 있기 때문에 해당 키워드들만으로 논문들 간의 유사도를 계산하면 정확도가 낮을 수 있다. 따라서 본 논문에서는 논문을 표현하는 키워드의 수를 증가시키기 위해서 새로운 논문 유사도 계산 방안을 제안한다. 실험을 통하여 제안하는 방안의 우수성을 검증한다.

Keywords