• 제목/요약/키워드: De-Identification

검색결과 374건 처리시간 0.024초

빅데이타 비식별화 기술과 이슈 (De-identification Techniques for Big Data and Issues)

  • 우성희
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 춘계학술대회
    • /
    • pp.750-753
    • /
    • 2017
  • 최근 스마트폰, SNS, 사물인터넷이 확산되면서 생겨나는 빅데이타의 처리와 활용이 ICT 분야의 새로운 성장 동력으로 부상하고 있다. 하지만 이러한 빅데이터의 활용을 위해서는 개인정보 비식별화가 이루어져야한다. 비식별화는 개인의 데이터가 특정인과 연결되지 않도록 데이터 셋으로부터 식별정보를 제거하는 것으로 정보를 수집, 처리, 보관 혹은 배포하는데 있어 발생할 수 있는 개인정보노출의 위험을 줄이며 그 정보를 활용하고 공유하는데 그 목적을 두고 있다. 비식별화된 정보는 또한 재식별화되어 개인정보보호의 논란이 되고 있지만 빅데이터등의 개인정보가 비식별 처리되어 활용되는 사례는 점차 증가하고 있다. 또한 많은 비식별화 가이드라인의 등장과 함께 개인정보 비식별화 방법이 제시되고 있다. 따라서 본 연구에서는 빅데이타 비식별화 과정과 사후관리를 서술, 비식별화 방법을 비교분석하고 비식별화와 개인정보보호 관련 이슈와 해결과제를 제시한다.

  • PDF

의료정보 비식별화와 해결과제 (De-identification of Medical Information and Issues)

  • 우성희
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 추계학술대회
    • /
    • pp.552-555
    • /
    • 2017
  • 빅데이타의 활용과 개인정보보호의 균형점을 찾기 위해 등장한 것이 비식별화이다. 특히 다양한 준식별자 정보 및 민감정보를 처리하는 의료분야에서는 EMR 및 음성, 카카오톡과 같은 의료 상담, SNS 등의 자료 사용을 위해서는 반드시 비식별화를 하여야 한다. 하지만 이를 위한 독립된 의료정보 보호법 및 비식별화를 위한 법제화도 되어 있지 않는 상황이다. 따라서 본 연구에서 국내외 개인정보 비식별화 현황, 의료정보 비식별화 현황 및 사례 그리고 의료정보 보호와 비식별화를 위한 해결과제와 이슈를 제시한다.

  • PDF

A Study on De-Identification of Metering Data for Smart Grid Personal Security in Cloud Environment

  • Lee, Donghyeok;Park, Namje
    • Journal of Multimedia Information System
    • /
    • 제4권4호
    • /
    • pp.263-270
    • /
    • 2017
  • Various security threats exist in the smart grid environment due to the fact that information and communication technology are grafted onto an existing power grid. In particular, smart metering data exposes a variety of information such as users' life patterns and devices in use, and thereby serious infringement on personal information may occur. Therefore, we are in a situation where a de-identification algorithm suitable for metering data is required. Hence, this paper proposes a new de-identification method for metering data. The proposed method processes time information and numerical information as de-identification data, respectively, so that pattern information cannot be analyzed by the data. In addition, such a method has an advantage that a query such as a direct range search and aggregation processing in a database can be performed even in a de-identified state for statistical processing and availability.

호텔 이용 고객의 개인정보 비식별화 방안에 관한 연구 (A Study on the de-identification of Personal Information of Hotel Users)

  • 김태경
    • 디지털산업정보학회논문지
    • /
    • 제12권4호
    • /
    • pp.51-58
    • /
    • 2016
  • In the area of hotel and tourism sector, various research are analyzed using big data. Big data is being generated by any digital devices around us all the times. All the digital process and social media exchange produces the big data. In this paper, we analyzed the de-identification method of big data to use the personal information of hotel guests. Through the analysis of these big data, hotel can provide differentiated and diverse services to hotel guests and can improve the service and support the marketing of hotels. If the hotel wants to use the information of the guest, the private data should be de-identified. There are several de-identification methods of personal information such as pseudonymisation, aggregation, data reduction, data suppression and data masking. Using the comparison of these methods, the pseudonymisation is discriminated to the suitable methods for the analysis of information for the hotel guest. Also, among the pseudonymisation methods, the t-closeness was analyzed to the secure and efficient method for the de-identification of personal information in hotel.

Meso-scale based parameter identification for 3D concrete plasticity model

  • Suljevic, Samir;Ibrahimbegovic, Adnan;Karavelic, Emir;Dolarevic, Samir
    • Coupled systems mechanics
    • /
    • 제11권1호
    • /
    • pp.55-78
    • /
    • 2022
  • The main aim of this paper is the identification of the model parameters for the constitutive model of concrete and concrete-like materials capable of representing full set of 3D failure mechanisms under various stress states. Identification procedure is performed taking into account multi-scale character of concrete as a structural material. In that sense, macro-scale model is used as a model on which the identification procedure is based, while multi-scale model which assume strong coupling between coarse and fine scale is used for numerical simulation of experimental results. Since concrete possess a few clearly distinguished phases in process of deformation until failure, macro-scale model contains practically all important ingredients to include both bulk dissipation and surface dissipation. On the other side, multi-scale model consisted of an assembly micro-scale elements perfectly fitted into macro-scale elements domain describes localized failure through the implementation of embedded strong discontinuity. This corresponds to surface dissipation in macro-scale model which is described by practically the same approach. Identification procedure is divided into three completely separate stages to utilize the fact that all material parameters of macro-scale model have clear physical interpretation. In this way, computational cost is significantly reduced as solving three simpler identification steps in a batch form is much more efficient than the dealing with the full-scale problem. Since complexity of identification procedure primarily depends on the choice of either experimental or numerical setup, several numerical examples capable of representing both homogeneous and heterogeneous stress state are performed to illustrate performance of the proposed methodology.

재식별 시간에 기반한 k-익명성 프라이버시 모델에서의 k값에 대한 연구 (Analysis of k Value from k-anonymity Model Based on Re-identification Time)

  • 김채운;오준형;이경호
    • 한국빅데이터학회지
    • /
    • 제5권2호
    • /
    • pp.43-52
    • /
    • 2020
  • 빅데이터 활용 기술의 발전으로 데이터의 저장 및 공유가 늘어나면서 그에 따른 프라이버시 침해가 일어나게 되었다. 이 문제를 해결하기 위해 비식별 기술이 도입되었지만 비식별된 데이터에 대해서도 재식별이 가능하다는 것이 여러 차례 증명되었다. 재식별 가능성이 존재하기 때문에 완전히 안전할 수 없지만 그럼에도 불구하고 충분한 비식별처리가 이루어져야 하는데, 현재 법령이나 규제는 어느 정도로 비식별 처리를 해야 하는지 정량적으로 규정하고 있지 않다. 본 논문에서는 재식별 작업을 할 때 소요되는 시간을 고려하여 적절한 비식별 기준을 제시하려고 한다. 다양한 비식별 평가 모델 중에서 k-익명성 모델에 대해 집중적으로 연구하였으며 어느 정도의 k값이 적절한 지 판단하였다. 본 연구의 결과를 일반화시킬 수 있다면 각종 법률 및 규제에서 적절한 비식별 강도를 규정하는 데 사용할 수 있을 것이다.

Identification of Volterra Kernels of Nonlinear Van do Vusse Reactor

  • Kashiwagi, Hiroshi;Rong, Li
    • Transactions on Control, Automation and Systems Engineering
    • /
    • 제4권2호
    • /
    • pp.109-113
    • /
    • 2002
  • Van de Vusse reactor is known as a highly nonlinear chemical process and has been considered by a number of researchers as a benchmark problem for nonlinear chemical process. Various identification methods for nonlinear system are also verified by applying these methods to Van de Vusse reactor. From the point of view of identification, only the Volterra kernel of second order has been obtained until now. In this paper, the authors show that Volterra kernels of nonlinear Van de Vusse reactor of up to 3rd order are obtained by use of M-sequence correlation method. A pseudo-random M-sequence is applied to Van de Vusse reactor as an input and its output is measured. Taking the crosscorrelation function between the input and the output, we obtain up to 3rd order Volterra kernels, which is the highest order Volterra kernel obtained until now for Van de Vusse reactor. Computer simulations show that when Van de Vusse chemical process is identified by use of up to 3rd order Volterra kernels, a good agreement is observed between the calculated output and the actual output.

인공지능 학습용 데이터의 개인정보 비식별화 자동화 도구 개발 연구 - 영상데이터기반 - (Research on the development of automated tools to de-identify personal information of data for AI learning - Based on video data -)

  • 이현주;이승엽;전병훈
    • Journal of Platform Technology
    • /
    • 제11권3호
    • /
    • pp.56-67
    • /
    • 2023
  • 최근 데이터 기반 산업계의 오랜 숙원이었던 개인정보 비식별화가 2020년 8월 데이터3법[1]이 개정되어 명시화 되었다. 4차 산업시대의 원유[2]라 불리는 데이터를 산업 분야에서 활성화할 수 있는 기틀이 되었다. 하지만, 일각에서는 비식별개인정보(personally non-identifiable information)가 정보주체의 기본권 침해를 우려하고 있는 실정이다[3]. 이에 개인정보 비식별화 자동화 도구인 Batch De-Identification Tool을 개발 연구를 수행하였다. 본 연구에서는 첫 번째로, 학습용 데이터 구축을 위해 사람 얼굴(눈, 코, 입) 및 다양한 해상도의 자동차 번호판 등을 라벨링하는 이미지 라벨링 도구를 개발하였다. 두 번째로, 객체 인식 모델을 학습하여 객체 인식 모듈을 실행함으로써 개인정보 비식별화를 수행할 수 있도록 하였다. 본 연구의 결과로 개발된 개인정보 비식별화 자동화 도구는 온라인 서비스를 통해 개인정보 침해 요소를 사전에 제거할 수 있는 가능성을 보여주었다. 이러한 결과는 데이터 기반 산업계에서 개인정보 보호와 활용의 균형을 유지하면서도 데이터의 가치를 극대화할 수 있는 가능성을 제시하고 있다

  • PDF

음성 비식별화 모델과 방송 음성 변조의 한국어 음성 비식별화 성능 비교 (Comparison of Korean Speech De-identification Performance of Speech De-identification Model and Broadcast Voice Modulation)

  • 김승민;박대얼;최대선
    • 스마트미디어저널
    • /
    • 제12권2호
    • /
    • pp.56-65
    • /
    • 2023
  • 뉴스와 취재 프로그램 같은 방송에서는 제보자의 신원 보호를 위해 음성을 변조한다. 음성 변조 방법으로 피치(pitch)를 조절하는 방법이 가장 많이 사용되는데, 이 방법은 피치를 재조절하는 방식으로 쉽게 원본 음성과 유사하게 음성 복원이 가능하다. 따라서 방송 음성 변조 방법은 화자의 신원 보호를 제대로 해줄 수 없고 보안상 취약하기 때문에 이를 대체하기 위한 새로운 음성 변조 방법이 필요하다. 본 논문에서는 Voice Privacy Challenge에서 비식별화 성능이 검증된 Lightweight 음성 비식별화 모델을 성능 비교 모델로 사용하여 피치 조절을 사용한 방송 음성변조 방법과 음성 비식별화 성능 비교 실험 및 평가를 진행한다. Lightweight 음성 비식별화 모델의 6가지 변조 방법 중 비식별화 성능이 좋은 3가지 변조 방법 McAdams, Resampling, Vocal Tract Length Normalization(VTLN)을 사용하였으며 한국어 음성에 대한 비식별화 성능을 비교하기 위해 휴먼 테스트와 EER(Equal Error Rate) 테스트를 진행하였다. 실험 결과로 휴먼 테스트와 EER 테스트 모두 VTLN 변조 방법이 방송 변조보다 더 높은 비식별화 성능을 보였다. 결과적으로 한국어 음성에 대해 Lightweight 모델의 변조 방법은 충분한 비식별화 성능을 가지고 있으며 보안상 취약한 방송 음성 변조를 대체할 수 있을 것이다.

A study on the method of measuring the usefulness of De-Identified Information using Personal Information

  • Kim, Dong-Hyun
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권6호
    • /
    • pp.11-21
    • /
    • 2022
  • 국내외에서 개인정보의 안전한 활용을 위한 비식별 조치에 대한 관심이 높아지고 있으나 불충분한 비식별 조치 및 추론 등을 통해 비식별 정보가 재식별되는 사례가 발생하고 있다. 이러한 문제점을 보완하고 비식별 조치 신기술을 발굴하기 위해 비식별 정보의 안전성과 유용성을 경진하는 대회를 국내와 일본에서 개최하고 있다. 본 논문은 이러한 경진대회에서 사용되고 있는 안전성과 유용성 지표를 분석하고 보다 효율적으로 유용성을 측정할 수 있는 새로운 지표를 제안하고 검증하고자 한다. 비식별 처리 분야에 수학 및 통계 분야의 전문가가 현저히 부족하여 많은 모집단을 통한 검증은 할 수는 없었지만 신규 지표에 대한 필요성과 타당성에 대해 매우 긍정적인 결과를 도출할 수 있었다. 우리나라의 방대한 공공데이터를 비식별 정보로 안전하게 활용하기 위해서는 이러한 유용성 측정 지표에 대한 연구가 꾸준히 진행되어야 하며, 본 논문을 시작으로 보다 활발한 연구가 진행되길 기대한다.