DOI QR코드

DOI QR Code

Improvement of BigCloneBench Using Tree-Based Convolutional Neural Network

트리 기반 컨볼루션 신경망을 이용한 BigCloneBench 개선

  • 박건우 (한양대학교 대학원 컴퓨터공학과) ;
  • 홍성문 (한양대학교 대학원 컴퓨터공학과) ;
  • 김현하 (소프토피아(주)) ;
  • 도경구 (한양대학교 ERICA 소프트웨어학부)
  • Received : 2019.06.01
  • Accepted : 2019.06.20
  • Published : 2019.06.30

Abstract

BigCloneBench has recently been used for performance evaluation of code clone detection tool using machine learning. However, since BigCloneBench is not a benchmark that is optimized for machine learning, incorrect learning data can be created. In this paper, we have shown through experiments using machine learning that the set of Type-4 clone methods provided by BigCloneBench can additionally be found. Experimental results using Tree-Based Convolutional Neural Network show that our proposed method is effective in improving BigCloneBench's dataset.

기계 학습을 이용하여 의미가 유사한 코드 클론을 탐지하는 도구의 성능 평가에 빅클론벤치를 많이 활용한다. 하지만 빅클론벤치는 기계 학습에 최적화된 벤치마크가 아니기 때문에 그대로 기계 학습에 사용하면 잘못된 학습 데이터가 만들어질 수 있다. 본 연구에서는 빅클론벤치에서 제공하고 있는 코드 클론 데이터에서 누락된 타입-4 클론을 기계 학습을 이용하여 추가로 찾아 보완함으로써 빅클론벤치를 개선할 수 있음을 실험적으로 밝힌다. 트리 기반 컨볼루션 신경망을 이용한 기계 학습 모델을 사용해서 개선된 데이터를 학습했을 때, 기존의 데이터를 학습했을 때에 비해 기계 학습의 정확도 및 성능이 향상되었음을 확인하였다.

Keywords