DOI QR코드

DOI QR Code

트리 기반 컨볼루션 신경망을 이용한 BigCloneBench 개선

Improvement of BigCloneBench Using Tree-Based Convolutional Neural Network

  • 박건우 (한양대학교 대학원 컴퓨터공학과) ;
  • 홍성문 (한양대학교 대학원 컴퓨터공학과) ;
  • 김현하 (소프토피아(주)) ;
  • 도경구 (한양대학교 ERICA 소프트웨어학부)
  • 투고 : 2019.06.01
  • 심사 : 2019.06.20
  • 발행 : 2019.06.30

초록

기계 학습을 이용하여 의미가 유사한 코드 클론을 탐지하는 도구의 성능 평가에 빅클론벤치를 많이 활용한다. 하지만 빅클론벤치는 기계 학습에 최적화된 벤치마크가 아니기 때문에 그대로 기계 학습에 사용하면 잘못된 학습 데이터가 만들어질 수 있다. 본 연구에서는 빅클론벤치에서 제공하고 있는 코드 클론 데이터에서 누락된 타입-4 클론을 기계 학습을 이용하여 추가로 찾아 보완함으로써 빅클론벤치를 개선할 수 있음을 실험적으로 밝힌다. 트리 기반 컨볼루션 신경망을 이용한 기계 학습 모델을 사용해서 개선된 데이터를 학습했을 때, 기존의 데이터를 학습했을 때에 비해 기계 학습의 정확도 및 성능이 향상되었음을 확인하였다.

BigCloneBench has recently been used for performance evaluation of code clone detection tool using machine learning. However, since BigCloneBench is not a benchmark that is optimized for machine learning, incorrect learning data can be created. In this paper, we have shown through experiments using machine learning that the set of Type-4 clone methods provided by BigCloneBench can additionally be found. Experimental results using Tree-Based Convolutional Neural Network show that our proposed method is effective in improving BigCloneBench's dataset.

키워드