Anonymization Techniques Suitable for Real Medical Datasets

실제 의료 데이터 분석을 통한 데이터 익명화 방법 제시

  • Kwon, Yong-Jin (School of Computer Science & Engineering, Seoul National University) ;
  • Yeon, Jong-Heum (School of Computer Science & Engineering, Seoul National University) ;
  • Lee, Sang-Goo (School of Computer Science & Engineering, Seoul National University)
  • 권용진 (서울대학교 컴퓨터공학과) ;
  • 연종흠 (서울대학교 컴퓨터공학과) ;
  • 이상구 (서울대학교 컴퓨터공학과)
  • Published : 2011.06.29

Abstract

정부, 병원, 공공기관, 기업 등에서 많은 양의 개인 정보를 수집하고, 다양한 목적으로 수집한 데이터를 공개하기도 한다. 프라이버시 보호를 위해 공개할 데이터를 어떻게 익명화를 할 것인지 많은 연구가 되었지만, 알고리즘 적용의 어려움과 데이터에 대한 비현실적인 가정 때문에 실제 데이터에 적용되는 사례는 찾아보기 힘들다. 본 논문에서는 먼저 다양한 익명화 방법에 대한 분류를 하고, 장단점을 살펴본다. 그리고 의료기관에서 의료 데이터를 공개하는 경우를 고려하여 실제 의료 데이터가 갖는 특징을 파악하고, 의료 데이터에 적용할 수 있는 프라이버시 모델(privacy model) 과 알고리즘에 적용하기 위한 의료데이터의 기본 형태에 대해 제시한다.

Keywords

Acknowledgement

Supported by : 한국연구재단