• 제목/요약/키워드: Distributed Differential Privacy

검색결과 4건 처리시간 0.016초

Privacy-Preserving Aggregation of IoT Data with Distributed Differential Privacy

  • Lim, Jong-Hyun;Kim, Jong-Wook
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권6호
    • /
    • pp.65-72
    • /
    • 2020
  • 오늘날 사물 인터넷은 우리에게 편의를 제공하기 위해 가정, 산업 현장 및 병원을 포함한 많은 장소에서 사용된다. 다양한 장치가 네트워크에 연결됨에 따라 많은 서비스들이 실시간 데이터 수집, 저장 및 분석을 통해 새로운 가치를 창출하고 있다. 이처럼 많은 분야에서 IoT 장치 내의 센서 및 통신 기능을 활용하는 서비스 및 애플리케이션을 개발하고 있다. 예시로 산업 분야에서 Samsung과 LG는 자사의 IoT 애플리케이션을 통해 가전과 IoT 기기를 연결하여 스마트 홈을 구축하는 서비스를 제공하며, 의료 및 건강 분야에서 Samsung과 Xioami와 같은 기업들은 피트니스 워치 및 앱을 통해 심전도를 확인하거나 운동량을 기록, 관리한다. 위 같은 사례에서 스마트 홈을 구축하는 서비스의 경우에 수집한 데이터를 통해 해당 가정의 생활 패턴이나 출퇴근 여부 등의 민감정보를 유출할 수 있다. 또한 의료 데이터로 사용하기 위해 측정한 데이터를 통해 개인 정보와 질병의 존재와 같은 민감정보를 유출할 수 있다. 따라서 이를 보호하기 위해 해당 논문이 제안하는 방법에 따라 데이터를 수집, 배포한다면 데이터를 제공하는 사용자의 개인 정보 보호에 위협을 막을 수 있다. 이를 해결하기 위해 최근에는 프라이버시 보호 데이터 처리에 차분 프라이버시(DP)가 채택되어왔다. 따라서 DP를 기반으로 스마트워치 플랫폼에서 건강 데이터를 안전하게 수집할 수 있는 방법을 제안하며, 이를 통해 위와 같이 다양한 분야에서 프라이버시를 보호하는 환경에서의 데이터 수집 및 배포를 가능케 할 수 있다.

Clustering-Based Federated Learning for Enhancing Data Privacy in Internet of Vehicles

  • Zilong Jin;Jin Wang;Lejun Zhang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제18권6호
    • /
    • pp.1462-1477
    • /
    • 2024
  • With the evolving complexity of connected vehicle features, the volume and diversity of data generated during driving continue to escalate. Enabling data sharing among interconnected vehicles holds promise for improving users' driving experiences and alleviating traffic congestion. Yet, the unintentional disclosure of users' private information through data sharing poses a risk, potentially compromising the interests of vehicle users and, in certain cases, endangering driving safety. Federated learning (FL) is a newly emerged distributed machine learning paradigm, which is expected to play a prominent role for privacy-preserving learning in autonomous vehicles. While FL holds significant potential to enhance the architecture of the Internet of Vehicles (IoV), the dynamic mobility of vehicles poses a considerable challenge to integrating FL with vehicular networks. In this paper, a novel clustered FL framework is proposed which is efficient for reducing communication and protecting data privacy. By assessing the similarity among feature vectors, vehicles are categorized into distinct clusters. An optimal vehicle is elected as the cluster head, which enhances the efficiency of personalized data processing and model training while reducing communication overhead. Simultaneously, the Local Differential Privacy (LDP) mechanism is incorporated during local training to safeguard vehicle privacy. The simulation results obtained from the 20newsgroups dataset and the MNIST dataset validate the effectiveness of the proposed scheme, indicating that the proposed scheme can ensure data privacy effectively while reducing communication overhead.

분산 OSN 환경에서 프라이버시 보호를 위한 그룹 기반의 데이터 퍼튜베이션 기법 (A Group based Privacy-preserving Data Perturbation Technique in Distributed OSN)

  • 이주형;박석
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권12호
    • /
    • pp.675-680
    • /
    • 2016
  • 다양한 모바일 기기와 모바일 플랫폼 기술의 발전에 따라 online social network(OSN) 사용자 수는 꾸준히 증가하고 있다. OSN 사용자들은 서비스를 통해 자유로운 의사소통과 정보 공유, 그리고 인맥 확대와 같은 사회적 활동을 할 수 있게 되지만, 이는 새로운 사용자 프라이버시 문제를 야기 한다. 이와 같은 사용자 프라이버시 침해 우려를 막기 위해 다양한 분산 OSN 아키텍처들이 소개되어 왔지만, 이 또한 기술적으로 사용자에게 자신의 데이터에 대해 완벽한 통제권을 부여하지 못한다. 본 논문은 OSN 사용자 정보에 대한 통제권의 부재를 해결하기 위해 personal data storage(PDS)를 사용한다. 또한 사용자 친구들을 각기 다른 프라이버시 레벨을 가지는 친구 그룹으로 그룹핑 한 뒤 각기 다른 사용자 친구 그룹들이 자신의 그룹 프라이버시 레벨에 맞는 사용자의 차등된 텍스트 데이터를 제공받도록 함으로써 사용자 프라이버시와 서비스 유틸리티 모두를 고려한 시스템 아키텍처를 제안하였다.

금융데이터의 성능 비교를 통한 연합학습 기법의 효용성 분석 (Utility Analysis of Federated Learning Techniques through Comparison of Financial Data Performance)

  • 장진혁;안윤수;최대선
    • 정보보호학회논문지
    • /
    • 제32권2호
    • /
    • pp.405-416
    • /
    • 2022
  • AI기술은 데이터 기반의 기계학습을 이용하여 삶의 질을 높여주고 있다. 기계학습을 이용시, 분산된 데이터를 전송해 한곳에 모으는 작업은 프라이버시 침해가 발생할 위험성이 있어 비식별화 과정을 거친다. 비식별화 데이터는 정보의 손상, 누락이 있어 기계학 습과정의 성능을 저하시키며 전처리과정을 복잡하게한다. 이에 구글이 2017년에 데이터의 비식별화와 데이터를 한 서버로 모으는 과정없이 학습하는 방법인 연합학습을 발표했다. 본 논문은 실제 금융데이터를 이용하여, K익명성, 차분프라이버시 재현데이터의 비식별과정을 거친 데이터의 학습성능과 연합학습의 성능간의 차이를 비교하여 효용성을 분석하였으며, 이를 통해 연합학습의 우수성을 보여주고자 한다. 실험결과 원본데이터 학습의 정확도는 91% K-익명성을 거친 데이터학습은 k=2일 때 정확도 79%, k=5일 때76%, k=7일 때 62%, 차분프라이버시를 사용한 데이터학습은 𝜖=2일 때 정확도 52%, 𝜖=1일 때 50%, 𝜖=0.1일 때 36% 재현데이터는 정확도 82%가 나왔으며 연합학습의 정확도는 86%로 두번째로 높은 성능을 보여 주었다.