DOI QR코드

DOI QR Code

Privacy Preserving Techniques for Deep Learning in Multi-Party System

멀티 파티 시스템에서 딥러닝을 위한 프라이버시 보존 기술

  • Hye-Kyeong Ko (Dept. of Computer Engineering, Sungkyul Universkty)
  • 고혜경 (성결대학교 컴퓨터공학과)
  • Received : 2023.03.10
  • Accepted : 2023.04.06
  • Published : 2023.05.31

Abstract

Deep Learning is a useful method for classifying and recognizing complex data such as images and text, and the accuracy of the deep learning method is the basis for making artificial intelligence-based services on the Internet useful. However, the vast amount of user da vita used for training in deep learning has led to privacy violation problems, and it is worried that companies that have collected personal and sensitive data of users, such as photographs and voices, own the data indefinitely. Users cannot delete their data and cannot limit the purpose of use. For example, data owners such as medical institutions that want to apply deep learning technology to patients' medical records cannot share patient data because of privacy and confidentiality issues, making it difficult to benefit from deep learning technology. In this paper, we have designed a privacy preservation technique-applied deep learning technique that allows multiple workers to use a neural network model jointly, without sharing input datasets, in multi-party system. We proposed a method that can selectively share small subsets using an optimization algorithm based on modified stochastic gradient descent, confirming that it could facilitate training with increased learning accuracy while protecting private information.

딥러닝은 이미지, 텍스트와 같이 복잡한 데이터를 분류 및 인식하는데 유용한 방법으로 딥러닝 기법의 정확도는 딥러닝이 인터넷상의 AI 기반의 서비스를 유용하게 하는데 기초가 되었다. 그러나 딥러닝에서 훈련에 사용되는 방대한 양의 사용자 데이터는 사생활 침해 문제를 야기하였고 사진이나 보이스와 같이 사용자이 개인적이고 민감한 데이터를 수집한 기업들이 데이터들을 무기한으로 소유한다. 사용자들은 자신의 데이터를 삭제할 수 없고 사용되는 목적도 제한할 수 없다. 예를 들면, 환자 진료기록에 대한 딥러닝 기술을 적용하기 원하는 의료기관들과 같은 데이터소유자들은 사생활과 기밀유지 문제로 환자의 데이터를 공유할 수 없고 딥러닝 기술의 혜택을 받기 어렵다. 우리는 멀티 파티 시스템에서 다수의 작업자들이 입력 데이터집합을 공유하지 않고 신경망 모델을 공동으로 사용할 수 있는 프라이버시 보존 기술을 적용한 딥러닝 방법을 설계한다. 변형된 확률적 경사 하강에 기초한 최적화 알고리즘을 이용하여 하위 집합을 선택적으로 공유할 수 있는 방법을 이용하였고 결과적으로 개인정보를 보호하면서 학습 정확도를 증가시킨 학습을 할 수 있도록 하였다.

Keywords

Acknowledgement

이 논문은 2023년도 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원을 받아 수행된 연구임 (No.NRF-2021R1A2C1012827)

References

  1. A. Hannun, C. Case, J. Casper, B. Catanzaro, G. Diamos, E. Elsen, R, Prenger, S. Satheesh, S.sengupta, and A. Coates, "Deepspeech: Scaling up end-to-end speech recognition," 2014. DOI: 10.48550/arXiv.1412.5567
  2. S. W. Lee, "Development of a Method for ACF Bonding Based on Machine Vision," The Journal of the Convergence on Culture Technology (JCCT), Vol. 4, No. 3, pp. 209-212, 2018. DOI: 10.17703/JCCT.2018.4.3.209
  3. H. Lee and J. Choi, "Implementation of Smart Ventilation Control System using IoT and Machine Learning," The Journal of the institute of Internet, Broadcasting and Communication (JIIBC), Vol. 20, No. 2, 2020. DOI:10.7236/JIIBC.2020.20.2.283
  4. D. Shultz, "When your voice betrays you," Science, Vol. 347, No. 6221, 2015. DOI: 10.1126/science.347.6221.494
  5. Y. S. Lee, "Analysis on machine learning-as-a-s ervice," International Journal of Advanced Culture Technology (IJACT), Vol. 6, No. 4, pp. 303-308, 2018. DOI: 10.17703//IJACT2018.6.4.303
  6. J. Bos, K. Lauter, and M. Naehrig, "Private predictive analysis on encrypted medical data," Informatics, Vol. 50, pp. 234-243, 2014. DOI: 10.1016/j.jbi.2014.04.003
  7. M. Pathak, S. Rane, W. Sun, and B. Raj, "Privacy preserving probabilistic inference with hidden markov models," In proc. of 2011 IEEE International Conference on acoustics, Speech and Signal Processing, pp. 1-3, 2011. DOI: 10.1109/ICASSP.2011.5947696
  8. P. Xie, M. Bilenko, T. Finley, R. Gilad-Bachrach, K. Lauter, and M. Naehrig, "Crypto-nets: Neural networks over encrypted data,"arXiv:1412.6181, 2014. DOI: 10.48550/arXiv.1412.6181
  9. M. Liang, Z. Li, T. Chen, and J. Zeng, "Integrative data analysis of multi-platform cancer data with a multimodal deep learning approach," In Proc. of IEEE/ACM transactions on computational iology and bioinformatics, Vol. 12, No. 4, pp. 928-937, 2015. DOI:10.1109/TCBB.2014.2377729
  10. M. Pathak, S. Rane, W. Sun, and B. Raj, "Multiparty different privacy via aggregation of locally trained classifiers," In Proc. of International Coference on Neural Information Processing Systems, pp. 1876-1884, 2010.
  11. Y. LeCun, L. Bottou, Y. Bengio, and P. Haffner, "Gradient-based learning applied to document recognition,"IEEE, Vol. 86, No. 11, pp. 2278-2324, 1998. DOI: 10.1109/5.726791
  12. https://github.com/torch/nn