• 제목/요약/키워드: Sensitive Data

검색결과 2,480건 처리시간 0.031초

하둡 상에서 ARIA 알고리즘을 이용한 HDFS 데이터 암호화 기법의 설계 및 구현 (Design and Implementation of HDFS Data Encryption Scheme Using ARIA Algorithms on Hadoop)

  • 송영호;신영성;장재우
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제5권2호
    • /
    • pp.33-40
    • /
    • 2016
  • 최근 소셜 네트워크 서비스(SNS)의 발전으로 빅데이터가 출현하였고, 이를 분석하기 위한 분산 병렬 플랫폼으로 하둡이 개발되었다. 하둡을 사용하는 기업은 개인적인 정보가 포함된 데이터를 분석하여 마케팅 등에 활용하고 있다. 이에 따라, 하둡에 저장된 센서티브(sensitive) 데이터의 유출을 방지하기 위한 데이터 암호화 연구가 수행되었다. 하지만 기존 데이터 암호화에 대한 연구는 국외 표준인 AES 암호화 알고리즘만을 지원하는 한계점이 존재한다. 한편 정부에서는 데이터 암호화 알고리즘으로 ARIA 알고리즘을 국내 표준으로 지정하였다. 본 논문에서는 하둡 상에서 ARIA 알고리즘을 이용한 HDFS 데이터 암호화 기법을 제안하였다. 첫째, 제안하는 암호화 기법은 하둡의 분산 컴퓨팅 환경에서 ARIA 암호화 및 복호화를 수행하는 HDFS 블록 분할 컴포넌트를 제공한다. 둘째, 제안하는 암호화 기법은 데이터의 마지막 블록이 128비트 단위의 데이터가 아닐 경우, 더미(dummy) 데이터를 추가하여 암호화 및 복호화를 수행하는 가변길이 데이터 처리 컴포넌트를 제공한다. 마지막으로 성능 평가를 통해, 제안하는 ARIA 기반 암호화 기법이 텍스트 문자열 처리 응용 및 과학 데이터 분석 응용에서 효과적으로 사용될 수 있음을 보였다.

마이데이터 서비스 수용 의도와 요인에 대한 사용자와 금융사 직원의 인식 비교 연구: Q 방법론을 활용하여 (A Comparative Analysis on the Perceptions of Users' and Financial Company Employees' on MyData Services: Using Q Methodology)

  • 이정우;김철민;송영규;박현지
    • 한국IT서비스학회지
    • /
    • 제21권3호
    • /
    • pp.1-25
    • /
    • 2022
  • The financial MyData service has implemented in January 2022 and launched 45 services by banks, securities, credit cards and fintech companies. This study applied the Q methodology, to identify the user types of MyData services and compared the perceptions of employees of financial institutions who plan and develop the MyData services. There are three types of MyData service users: active users, limited users who focus on consumption and asset status inquiry, and sensitive users for personal information. There were two types of recognition of financial company employees. One is the active user support other is the sensitive user for personal information support. The analysis of subjective perceptions can be used as a reference for establishing a company's MyData service marketing strategy and establishing related policies to improve the MyData ecosystem.

MapReduce 환경에서 재그룹핑을 이용한 Locality Sensitive Hashing 기반의 K-Nearest Neighbor 그래프 생성 알고리즘의 개선 (An Improvement in K-NN Graph Construction using re-grouping with Locality Sensitive Hashing on MapReduce)

  • 이인희;오혜성;김형주
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권11호
    • /
    • pp.681-688
    • /
    • 2015
  • k-Nearest Neighbor(k-NN)그래프는 모든 노드에 대한 k-NN 정보를 나타내는 데이터 구조로써, 협업 필터링, 유사도 탐색과 여러 정보검색 및 추천 시스템에서 k-NN그래프를 활용하고 있다. 이러한 장점에도 불구하고 brute-force방법의 k-NN그래프 생성 방법은 $O(n^2)$의 시간복잡도를 갖기 때문에 빅데이터 셋에 대해서는 처리가 곤란하다. 따라서, 고차원, 희소 데이터에 효율적인 Locality Sensitive Hashing 기법을 (key, value)기반의 분산환경인 MapReduce환경에서 사용하여 k-NN그래프를 생성하는 알고리즘이 연구되고 있다. Locality Sensitive Hashing 기법을 사용하여 사용자를 이웃후보 그룹으로 만들고 후보내의 쌍에 대해서만 brute-force하게 유사도를 계산하는 two-stage 방법을 MapReduce환경에서 사용하였다. 특히, 그래프 생성과정 중 유사도 계산하는 부분이 가장 많은 시간이 소요되므로 후보 그룹을 어떻게 만드는 것인지가 중요하다. 기존의 방법은 사이즈가 큰 후보그룹을 방지하는데 한계점이 있다. 본 논문에서는 효율적인 k-NN 그래프 생성을 위하여 사이즈가 큰 후보그룹을 재구성하는 알고리즘을 제시하였다. 실험을 통해 본 논문에서 제안한 알고리즘이 그래프의 정확성, Scan Rate측면에서 좋은 성능을 보임을 확인하였다.

망분리 환경에서 민감정보를 안전하게 처리하기 위한 기술적 방안 (The Technological Method for Safe Processing of Sensitive Information in Network Separation Environments)

  • 이주승;김일한;김현수
    • 융합보안논문지
    • /
    • 제23권1호
    • /
    • pp.125-137
    • /
    • 2023
  • 공공기관을 필두로 민감정보를 취급하는 기업들은 사이버 공격 예방을 위하여 업무망과 인터넷망을 분리 구축하고, 강한 접근통제를 바탕으로 중요 데이터를 보호하고 있다. 그렇기에 업무망과 인터넷망이 연결되는 접점을 수반하는 시스템은 관리적, 기술적으로 안전한 보안환경 구축이 필수적으로 요구되고 있다. 기관에서 사용하고자 하는 모바일 장치의 경우 기기를 통제하기 위한 MDM(Mobile Device Management) 솔루션이 그 예라 할 수 있다. 이 시스템은 모바일 장치 정보, 사용자 정보 등의 민감정보를 인터넷망에서 취급하여 동작하므로 운영 시 각별한 보안대책이 요구된다. 본 연구에서 인터넷망에서 반드시 운영되어야 하는 시스템에서의 민감정보 데이터 처리를 내부망에서 관리할 수 있도록 모델을 제시하였으며, 이를 망연동 솔루션을 기반으로 한 MDM 솔루션을 중심으로 기능 설계 및 구축하였다.

Implementation of Qualitative Unrelated Question Model for Obtaining Sensitive Information at Internet Survey

  • 박희창;명호민
    • Journal of the Korean Data and Information Science Society
    • /
    • 제13권2호
    • /
    • pp.341-354
    • /
    • 2002
  • This paper is planned to use randomized response technique which is an indirect response technique on internet as a way of obtaining much more precise information, not revealing secrets of responsors, considering that respondents are generally reluctant to answer in a survey to get sensitive information targeting employees, customers, etc.

  • PDF

Implementation of Forced Answer Model for Sensitive Information at On-Line Survey

  • Park, Hee-Chang;Ryu, Jee-Hyun;Lee, Sung-Yong
    • Journal of the Korean Data and Information Science Society
    • /
    • 제14권3호
    • /
    • pp.489-499
    • /
    • 2003
  • In this paper we implement the system for the forced answer model which is an indirect response technique on the internet as a way of obtaining much more precise information, not revealing secrets of responsors. In this system we consider that respondents are generally reluctant to answer in a survey to get sensitive information targeting employees, customers, etc.

  • PDF

Implementation of Quantitative Unrelated Question Model for Obtaining Sensitive Information at On-Line Survey

  • Park, Hee-Chang;Ryu, Jee-Hyun;Lee, Sung-Yong
    • Journal of the Korean Data and Information Science Society
    • /
    • 제14권3호
    • /
    • pp.591-603
    • /
    • 2003
  • This paper is planned to use randomized response technique which is an indirect response technique on internet as a way of obtaining much more precise information, not revealing secrets of responsors, considering that respondents are generally reluctant to answer in a survey to get sensitive information targeting employees, customers, etc.

  • PDF

Assessment for Efficiency of Two-Stage Randomized Response Technique

  • Park, Kyung-Ho
    • Communications for Statistical Applications and Methods
    • /
    • 제7권2호
    • /
    • pp.427-433
    • /
    • 2000
  • In this paper, we review several two-stage randomized response techniques for gathering self-report data when persons are asked sensitive question. Also efficiencies and privacy protections based on the two-stage randomized response procedures are compared. Finally, we find optimal parameter conditions.

  • PDF

A Study on the Effects of Parameter Sensitivity on Matched Field Processing

  • Park, Cheolsoo;Woojae Seong;Park, Hang-Soon;Lee, Kyu-Yeul
    • The Journal of the Acoustical Society of Korea
    • /
    • 제20권1E호
    • /
    • pp.31-37
    • /
    • 2001
  • Matched Field Processing (MFP) is a successive process of correcting mismatches between true and assumed parameters by matching the measured acoustic field data with numerically simulated data which we call replica. The MFP is widely used both in geo-acoustic parameter inversions and in source localizations. Whether a certain parameter can be inverted effectively or whether a source can be localized correctly depends on the amount of the influence that a parameter has on the acoustic field during the matching process. Sensitive parameters can be better estimated than the less sensitive ones in MFP. On the contrary, the sensitive parameters affect adversely on the source localization results when they have uncertainties. In this paper, a sensitivity index is defined based upon the field variation resulting from the perturbed parameters. Numerical test results show that the index behaves in accordance with the results of source localization under a mismatched environment and also with the inversion solutions.

  • PDF

비정규 공정 데이터에 대한 공정능력의 측도 및 평가 (Measure and Assessment of Process Capability for Nonnormal Process Data)

  • 김홍준;송서일
    • 한국품질경영학회:학술대회논문집
    • /
    • 한국품질경영학회 1998년도 The 12th Asia Quality Management Symposium* Total Quality Management for Restoring Competitiveness
    • /
    • pp.594-609
    • /
    • 1998
  • In this dissertation, a new process capability index $C_{psk}$ is introduced for non-normal process. The Pearson curve and the Johnson curve are selected for capability index calculation and data modeling the normal-based index $C_{psk}$ is used as the model for non-normal process. A significant result of this research find that the ranking of the seven indices, $C_p,\;C_{pk},\;C_{pm},\;C^{\ast}_{pm},\;C_{pmk},\;C_s,\;C_{psk}$ in terms of sensitivity to departure of the process median from the target value T=M from the most sensitive one up to the least sensitive are $C_{psk},\;C_{s},\;C_{pmk},\;C^{\ast}_{pm},\;C_{pm},\;C_{pk},\;C_p$. i.e, By the criteria adopted for evaluation of PCI's $C_{psk}$ is the most sensitive to the departure of the process median from target and $C_p$ is least

  • PDF