초록
빅데이터 시대의 도래로 다양한 데이터들이 발생되고 있다. 많은 산업 부분에서는 이러한 데이터들을 수집하여 분석하고자 한다. 하지만 사용자 정보 수집은 직접적인 개인정보 유출을 초래할 수 있다. 구글(Google) 사에서 제안한 지역 차분 프라이버시 기법은 데이터 변조를 통해 사용자 정보 수집에 있어 발생할 수 있는 개인정보 유출을 방지한다. 이러한 데이터 변조를 통한 개인정보 유출 방지는 그 변조되는 정도가 높을수록 개인정보를 강력히 보장하지만 이와 반대로 데이터의 활용도는 현저히 떨어진다. 그래서 데이터 변조의 정도를 데이터 수집목적에 적합하게 설정해야한다. 본 논문에서 제시하는 시뮬레이션 도구는 지역 차분 프라이버시를 만족하는 사용자 정보 수집에 있어 설정해야하는 다양한 변수값을 데이터 수집환경에 맞게 적용함으로써 데이터 수집가가 자신의 환경에 맞는 데이터 수집을 할 수 있도록 지원한다.
In theses days, data has been explosively generated in diverse industrial areas. Accordingly, many industries want to collect and analyze these data to improve their products or services. However, collecting user data can lead to significant personal information leakage. Local differential privacy (LDP) proposed by Google is the state-of-the-art approach that is used to protect individual privacy in the process of data collection. LDP guarantees that the privacy of the user is protected by perturbing the original data at the user's side, but a data collector is still able to obtain population statistics from collected user data. However, the prevention of leakage of personal information through such data perturbation mechanism may cause the significant reduction in the data utilization. Therefore, the degree of data perturbation in LDP should be set properly depending on the data collection and analysis purposes. Thus, in this paper, we develop the simulation tool which aims to help the data collector to properly chose the degree of data perturbation in LDP by providing her/him visualized simulated results with various parameter configurations.