Dataset construction and Automatic classification of Department information appearing in Domestic journals

국내 학술지 출현 학과정보 데이터셋 구축 및 자동분류

  • Byungkyu Kim (Dept. of data-centric problem solving research, KISTI) ;
  • Beom-Jong You (Dept. of data-centric problem solving research, KISTI) ;
  • Hyoung-Seop Shim (Dept. of Open Data Convergence Research, KISTI)
  • 김병규 (한국과학기술정보연구원 데이터기반문제해결연구단) ;
  • 류범종 (한국과학기술정보연구원 데이터기반문제해결연구단) ;
  • 심형섭 (한국과학기술정보연구원 개방형데이터융합연구단)
  • Published : 2023.01.11

Abstract

과학기술 문헌을 활용한 계량정보분석에서 학과정보의 활용은 매유 유용하다. 본 논문에서는 한국과학기술인용색인데이터베이스에 등재된 국내 학술지 논문에 출현하는 대학기관 소속 저자의 학과정보를 추출하고 데이터 정제 및 학과유형 분류 처리를 통해 학과정보 데이터셋을 구축하였다. 학과정보 데이터셋을 학습데이터와 검증데이터로 이용하여 딥러닝 기반의 자동분류 모델을 구현하였으며, 모델 성능 평가 결과는 한글 학과정보 기준 98.6%와 영문 학과정보 기준 97.6%의 정확률로 측정되었다. 향후 과학기술 분야별 지적관계 분석 및 논문 주제분류 등에 학과정보 자동분류 처리기의 활용이 기대된다.

Keywords

Acknowledgement

이 논문은 한국과학기술정보연구원 주요사업의 지원을 받아 수행된 연구임