Annual Conference of KIPS (한국정보처리학회:학술대회논문집)
- 2017.11a
- /
- Pages.306-309
- /
- 2017
- /
- 2005-0011(pISSN)
- /
- 2671-7298(eISSN)
DOI QR Code
A Study on Composite Data Type Inference using Word2vec Deep Learning Scheme on Binary File
바이너리 파일에서 Word2Vec 딥러닝 기법을 이용한 복합 자료형 추론 연구
- Min, Ye Sul (Dept. of Information Communication Engineering, Dongguk University) ;
- Jung, Hyunoh (Dept. of Computer Science and Engineering, Dongguk University) ;
- Lee, Hyerin (Dept. of Computer Science and Engineering, Dongguk University) ;
- Lee, Sungyeon (Dept. of Computer Science and Engineering, Dongguk University) ;
- ;
- Jeong, Junho (Electronic Commerce Institute, Dongguk University) ;
- Son, Yunsik (Dept. of Computer Science and Engineering, Dongguk University)
- 민예슬 (동국대학교 정보통신공학과) ;
- 정현오 (동국대학교 컴퓨터공학과) ;
- 이혜린 (동국대학교 컴퓨터공학과) ;
- 이승연 (동국대학교 컴퓨터공학과) ;
- 우드아커벙 오퐁 (동국대학교 컴퓨터공학과) ;
- 정준호 (동국대학교 전자상거래연구소) ;
- 손윤식 (동국대학교 컴퓨터공학과)
- Published : 2017.11.01
Abstract
소프트웨어의 보안에 대한 중요성이 점차 높아짐에 따라, 소스코드 기반의 소프트웨어의 보안약점 분석 기법에서 더 나아가 소스 코드가 존재하지 않는 바이너리 파일을 대상으로 분석을 수행하는 연구가 진행되고 있다. 왜냐하면 소프트웨어 개발의 복잡성 증가에 따른 서드파티 라이브러리 활용과 레거시 코드의 관리 부재, 임베디드 소프트웨어의 특성 등으로 인해 소스 코드가 존재하지 않는 바이너리 코드의 사용이 늘어나고 있기 때문이다. 따라서 최근 바이너리 코드에 내제된 보안약점을 분석하기 위해서 중간코드를 이용하여 정적분석을 수행하는 다양한 연구가 진행되고 있다. 중간언어를 사용함으로 실행환경에 따라 달라지는 바이너리 코드가 중간언어로만 변환이 된다면 동일한 형태의 보안약점 분석기술을 통해 효과적인 수행이 가능하다. 본 논문에서는 이러한 바이너리 코드로부터 중간언어로 변환시 컴파일 과정에서 상실된 복합 자료형을 재구성하기 위해 Word2vec 딥러닝 기법을 이용한 추론기법을 제안한다.
Keywords