Browse > Article
http://dx.doi.org/10.9728/dcs.2011.12.4.457

An Empirical Study on Improvement model for Measuring of Project Similarity  

Jung, Ok-Nam (국가과학기술위원회)
Rhew, Sung-Yul (숭실대학교 컴퓨터학부)
Kim, Jong-Bae (숭실대학교 IT정책경영학과)
Publication Information
Journal of Digital Contents Society / v.12, no.4, 2011 , pp. 457-465 More about this Journal
Abstract
The annual R&D investment in Korea increased by an average of 12.2percent during the last 5 years. Therefore, prevention of duplicate projects being performed became an important factor in promoting the efficiency of R&D investment and the originality of R&D projects. On measuring the similarity of projects, the measurement model used to estimate the accuracy of the similarity is crucial. In this paper, we propose an advanced measurement model on checking the similarity of R&D projects for promoting the efficiency of R&D investment. The proposed model is made up of the following steps for the model measurement, sampling and analyzing. During the sampling step, we append the abstract of R&D reports on the search engine based on document vector. We then measure the similarity on projects to use research title network which is consists of the compound keyword and the weight of items on during the analysis. The proposed method improved the accuracy for measuring the similarity of projects by an average of 0.19 over the existing search engine and by 9.25 over the simple keyword search on R&D projects. On searching the similarity with the appending conditions and high sampling, it improved the accuracy of measuring the similarity of R&D projects.
Keywords
Similarity; Complex Keyword; U-WIN; Document Vector;
Citations & Related Records
Times Cited By KSCI : 10  (Citation Analysis)
연도 인용수 순위
1 조정현, 정현기, 김유섭, "웹 검색과 문서 유사도를 활용한 2 단계 신문 기사 표절 탐지 시스템", 정보처리학회논문지 B, 제16-B권 제2호, 2009
2 최성필, 정창후, 전홍우, 조현양, "시맨틱 구문 트리 커널을 이용한 생명공학 분야 전문용어간 관계 식별 및 분류연구", 한국문헌정보학회지, 제45권 제2호, 2011
3 강보영, 김대원, "개선된 클러스터 유사도를 이용한 범주형 데이터의 계층적 클러스터링", 정보과학회논문지 : 소프트웨어 및 응용, 제38권 제1호, 2011
4 고방원, 김영철, "패턴매칭을 이용한 유사도 비교 분석", 한국컴퓨터정보학회논문지, 제15권, 제1호, 2010
5 하정요, 최미영, 최형일, "색상과 형태를 이용한 내용 기반 영상 검색", 한국컴퓨터정보학회논문지, 제13권, 제1호, 2008
6 조혜정, 김지은, 손채봉, 정광수, 오승준, "통계적 분석 기반 불법 복제 비디오 영상 감식 방법", 방송공학회논문지,제14권 제6호 , 2009
7 지정훈, 우균, 조환규, "굼벨분포 모델을 이용한 표절프로그램 자동탐색 및 추적", 정보처리학회논문지, 제16-A권 제6호, 2009
8 Y. Yang and X Liu, A reexamination of text categorization methods, In SIGIR-99, 1999
9 황인수, "인터넷 검색과 형태소분석을 이용한 표절검사시스템의 개발에 관한 연구", JOURNAL OF INFORMATION TECHNOLOGY APPLICATIONS & MANAGEMENT, 제16권 제1호, 2009
10 류창건, 김형준, 조환규, "한글 말뭉치를 이용한 한글 표절 탐색 모델 개발", 정보과학회지 제14권 제2호, 2008
11 이홍주, Mark Klein, "유사도 알고리즘을 활용한 시맨틱프로세스 검색방안", 경영정보학연구 제18권 제1호, 2008
12 백종범, 김성민, 이수원, "특허 정보 검색을 위한 대체어 후보 추출 방법", 정보과학회논문지 : 컴퓨팅의 실제 및 레터, 제15권 제4호, 2009
13 김윤종, "데이터마이닝 기법을 활용한 대학연구센터 지원사업의 유사성 검토방안 연구"
14 최호섭, "어휘망 구축작업에서 발견되는 한국어사전의 문제와 그 해결",국어학회 전국학술대회, 제34회, 2007
15 안정은, 윤종민, "형태학적 특성 기반의 유사문헌 검증기법을 이용한 표준특허 사례연구", 한국정보과학회 2010 한국컴퓨터종합학술발표논문집, 2010
16 박동진, 최기석, 이명선, 이상태, "유사과제 파악을 위한 검색 알고리즘의 개발에 관한 연구", 한국콘텐츠학회논문지, Vol.9 No. 11, 2009