A Study on Detecting Personal Information from Image Files

이미지파일에 포함된 개인정보추출에 관한 연구

  • Lee, Minsuk (Dept. of Computer Science & Engineering, Chungnam National University) ;
  • Kim, Sukhyeon (Dept. of Computer Science & Engineering, Chungnam National University) ;
  • Yoon, Jiae (Dept. of Computer Science & Engineering, Chungnam National University) ;
  • Won, Yoojae (Dept. of Computer Science & Engineering, Chungnam National University)
  • 이민석 (충남대학교 컴퓨터공학과) ;
  • 김숙현 (충남대학교 컴퓨터공학과) ;
  • 윤지애 (충남대학교 컴퓨터공학과) ;
  • 원유재 (충남대학교 컴퓨터공학과)
  • Published : 2017.01.10

Abstract

최근 정보통신기술의 비약적 발전에 따라 문서 제작 과정 또한 디지털 방식의 형태가 주를 이루게 되었다. 하지만 이와 더불어 문서를 통한 개인 정보 유출의 문제 또한 대두되게 되었다. 본 논문에서는 이미지 형식의 문서의 유출 방지를 위해 광학문자인식(OCR)을 활용한 문자인식 기능과 개인정보 검출 기능을 통합적으로 수행 한하여 기존 OCR엔진과의 차별점을 두었다. 또한 원하는 경로의 파일 탐색을 가능하도록 하고, 선택한 경로에 저장되어 있는 이미지파일 내의 검출 문자들을 정규표현식을 사용해 특정한 개인정보 패턴과 매칭하여 문서 내 포함된 개인정보를 반환하여 출력한다. 이러한 개인정보 검출 결과 중요 개인정보가 포함된 파일을 사용자에게 별도로 통보하도록 한다. 따라서 본 논문에서는 기존의 개인정보 검출 과정의 번거로움을 극복하여 사용자의 편의 향상과 더불어 문서를 통한 개인정보의 유출을 사전에 방지 할 수 있도록 하였다.

Keywords