• Title/Summary/Keyword: Big Data privacy

Search Result 125, Processing Time 0.022 seconds

개인정보 비식별화를 위한 개체명 유형 재정의와 학습데이터 생성 방법 (Re-defining Named Entity Type for Personal Information De-identification and A Generation method of Training Data)

  • 최재훈;조상현;김민호;권혁철
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.206-208
    • /
    • 2022
  • 최근 빅데이터 산업이 큰 폭으로 발전하는 만큼 개인정보 유출로 인한 사생활 침해 문제의 관심도 높아졌다. 자연어 처리 분야에서는 이를 개체명 인식을 통해 자동화하려는 시도들이 있었다. 본 논문에서는 한국어 위키피디아 문서의 본문에서 비식별화 정보를 지닌 문장을 식별해 반자동으로 개체명 인식 데이터를 구축한다. 이는 범용적인 개체명 인식 데이터에 반해 비식별화 대상이 아닌 정보에 대해 학습되는 비용을 줄일 수 있다. 또한, 비식별화 정보를 분류하기 위해 규칙 및 통계 기반의 추가적인 시스템을 최소화할 수 있는 장점을 가진다. 본 논문에서 제안하는 개체명 인식 데이터는 총 12개의 범주로 분류하며 의료 기록, 가족 관계와 같은 비식별화 대상이 되는 정보를 포함한다. 생성된 데이터셋을 이용한 실험에서 KoELECTRA는 0.87796, RoBERTa는 0.88575의 성능을 보였다.

  • PDF

인공지능(AI) 기반 인사관리의 윤리적·법적 영향 (Ethical and Legal Implications of AI-based Human Resources Management)

  • 이정우;이정수;권지훈;차민이;김규태
    • 융합신호처리학회논문지
    • /
    • 제25권2호
    • /
    • pp.100-112
    • /
    • 2024
  • 이 연구는 인공지능(AI)을 인적 자원 관리에 활용하는 것의 윤리적 및 법적 함의, 특히 채용 과정에서 AI 인터뷰에 초점을 맞추어 조사합니다. 추론, 학습, 적응과 같은 인간 지능과 관련된 작업을 수행할 수 있는 컴퓨터 프로그램의 능력으로 정의되는 AI는 점점 더 HR 관행에 통합되고 있습니다. AI가 주도하는 인터뷰를 통해 채용에 AI를 배치하면 효율성과 객관성을 약속하지만, 동시에 중요한 윤리적 및 법적 문제도 제기됩니다. 이러한 문제에는 AI 알고리즘의 잠재적 편향, AI 의사 결정 과정의 투명성, 데이터 프라이버시 문제, 기존 노동법 및 규정 준수 등이 포함됩니다. 이 논문은 사례 연구를 분석하고 관련 문헌을 검토함으로써 이러한 과제에 대한 포괄적인 이해를 제공하고 AI 기반 HR 관행에서 윤리적 및 법적 준수를 보장하기 위한 권장 사항을 제시하는 것을 목표로 합니다. 연구 결과는 AI가 채용 효율성을 향상시킬 수 있지만, 위험을 완화하고 공정하고 투명한 채용 관행을 보장하기 위해 견고한 윤리 지침과 법적 프레임워크를 마련하는 것이 필수적임을 시사합니다.

의료법의 개인정보보호에 관한 연구 (A Study on the Protection of Personal Information in the Medical Service Act)

  • 성수연
    • 의료법학
    • /
    • 제21권2호
    • /
    • pp.75-103
    • /
    • 2020
  • 의료기술의 발전과 환자 진료 향상 등을 목적으로 빅데이터나 인공지능에 의료정보를 분석·활용하면 유전적 질병이나 암 등 특이 질병 등에 대비할 수 있어 의료정보가 공유되어야 한다는 목소리가 높아지고 있다. 환자의 개인정보에 관한 활용과 보호는 동전의 양면과 같다. 의료기관 또는 의료인은 일반 정보처리자와 다른 환경적 특수성과 민감도가 높은 개인정보를 처리함에 있어 신중하여야 한다. 대체적으로 환자의 개인정보는 의료인이나 의료기관에서 수집·생성부터 파기까지 개인정보를 처리하고 있으나 의료법의 개인정보에 관한 용어 사용의 혼재되어 있거나 적용 범위가 명확하지 않아 판례의 해석에 의존하고 있다. 의료법 제23조의 전자의무기록에 저장·보관된 개인정보는 고유식별정보만을 의미하는 것이 아니라 진료기록부 등 의무기록의 개인정보와 동일하며, 그 내용은 인적 정보, 고유식별정보, 진료정보, 재산정보 등을 포함한다. 의료인이나 의료기관 개설자는 의료법 제24조의4 진료정보가 침해된 경우 제23조의 개인정보와 동일하게 취급하여야 하는지에 대해 전자의무기록에 환자의 민감정보가 기록·저장·보관되어 있으므로 특별히 개인정보 중 진료정보만을 의미한다고 볼 수 없다. 의료법 제19조의 정보 누설 금지는 업무상 알게 된 '비밀'에서 '정보'로 개정되었으나 명칭만 바뀌었을 뿐 보호법익은 형법상의 비밀과 동일하여 환자의 개인정보자기결정권을 보호하고 있지 못하다. 개인정보보호법과 지역보건법은 '업무상 알게 된 정보'에서의 보호법익을 개인정보자기결정권으로 보아 누출, 위조, 변조, 훼손 등 개인정보 침해 행위에 대하여 동일하게 벌칙을 규정하고 있다. 의료법의 개인정보 보호 규정은 용어의 정의가 불명확하여 정보주체 및 정보처리자, 국민에게 적용 범위 등 혼란을 일으킬 수 있어 용어가 통일적으로 정비되어야 할 필요가 있으며, 개인정보 보호에 관한 특별법인 의료법과 일반법인 개인정보보호법의 규정 내용이나 범위가 일치하지 않아 해석상 혼란이 생길 수 있어 개인정보 보호에 대하여 일정한 한계를 보인다. 환자의 개인정보는 민감정보로서 그 활용과 처리에 있어 안전하게 보호되어야 한다. 개인정보 보호 원칙에 따라 개인정보를 처리하여야 하며, 정보주체인 환자나 보호자의 권리인 사생활의 비밀과 자유, 인격권, 개인정보자기결정권을 보장하여야 할 것이다.

IoT 환경의 비식별 개인 민감정보관리 강화에 대한 연구 (A Study on Reinforcing Non-Identifying Personal Sensitive Information Management on IoT Environment)

  • 양윤민;박순태;김용민
    • 한국콘텐츠학회논문지
    • /
    • 제20권8호
    • /
    • pp.34-41
    • /
    • 2020
  • IoT 시장의 안정화와 급속한 확장의 시대가 도래하고 있다. IoT 환경에서는 사물이 상황에 따라 통신의 주도권을 갖는 통신 환경이 발생할 수 있으며, 불특정 다수의 IoT 환경과의 통신이 발생하여 개인 민감정보의 철저한 관리의 필요성이 증대되고 있다. 특히 IoT 환경에서는 센서 간의 통신 과정에서 개인 식별 정보를 제외한 개인의 생활 패턴, 주변 환경 정보 등의 민감한 비식별 정보의 유출로 프라이버시 침해의 우려가 증대된다. IoT로 인한 환경의 변화로 얻는 이점도 있으나, 개인의 민감정보가 자신도 모르는 사이에 빅데이터라는 명목으로 어디론가 전송되는 문제점도 있다. IoT 환경에서 센서를 통해 전송되는 개인 민감정보의 안전한 관리를 위해 초기 수집 방법과 민감정보 국외 이전 관리에 관한 사항, 그리고 2020년 8월 5일 시행되는 데이터 3법으로 IoT 환경의 비식별 개인정보의 활용의 본격적인 활성화가 예상됨에 따라 IoT 환경의 비식별 개인정보 보호 강화를 위한 사항을 제안하고자 한다.

온라인 관여가 디지털 유료 콘텐츠 이용에 미치는 영향 (Effects of Online Engagement on Uses of Digital Paid Contents)

  • 양정애;송인덕
    • 한국콘텐츠학회논문지
    • /
    • 제18권9호
    • /
    • pp.468-481
    • /
    • 2018
  • 본 연구는 콘텐츠 유료 이용에 대한 주요 예측변인으로 온라인상에서 이용자의 관여 행동에 주목하고, 이 요인이 실제 유료 콘텐츠 이용에 미치는 영향을 경험적 데이터를 통해 확인하기 위해 수행되었다. 이러한 연구목적을 위해 정보통신정책연구원이 매년 시행하는 한국미디어패널조사의 2016년 데이터를 분석하였다. 만 20세 이상 성인남녀 8,313명의 응답을 분석한 결과, 온라인 관여, 그 중에서도 적극적 관여(게시물, 댓글 작성 등 콘텐츠 생산에 대한 직접 기여)는 모든 예측변인들 가운데 종속변인을 설명하는 데 있어 기여도가 가장 큰 요인인 것으로 확인됐다. 그에 비해 소극적 관여(공유, 평점주기, 투표 등의 간접적 콘텐츠 생산 기여)는 개인의 성격특성, 온라인 프라이버시 염려와 함께 유의미한 영향이 없는 변인인 것으로 나타났다. 이러한 연구결과는 유료 콘텐츠 판매를 통해 수익을 올리고자 하는 서비스 내지 플랫폼 사업자들의 수익 향상을 위해서는 이용자의 온라인 행동 데이터 수집이 필요하며, 이를 정교하게 분석해 목표를 명확히 한 마케팅 전략을 펼치는 것이 필요하다는 것을 시사한다.

블랙 박스 모델의 출력값을 이용한 AI 모델 종류 추론 공격 (Model Type Inference Attack Using Output of Black-Box AI Model)

  • 안윤수;최대선
    • 정보보호학회논문지
    • /
    • 제32권5호
    • /
    • pp.817-826
    • /
    • 2022
  • AI 기술이 여러 분야에 성공적으로 도입되는 추세이며, 서비스로 환경에 배포된 모델들은 지적 재산권과 데이터를 보호하기 위해 모델의 정보를 노출시키지 않는 블랙 박스 상태로 배포된다. 블랙 박스 환경에서 공격자들은 모델 출력을 이용해 학습에 쓰인 데이터나 파라미터를 훔치려고 한다. 본 논문은 딥러닝 모델을 대상으로 모델 종류에 대한 정보를 추론하는 공격이 없다는 점에서 착안하여, 모델의 구성 레이어 정보를 직접 알아내기 위해 모델의 종류를 추론하는 공격 방법을 제안한다. MNIST 데이터셋으로 학습된 ResNet, VGGNet, AlexNet과 간단한 컨볼루션 신경망 모델까지 네 가지 모델의 그레이 박스 및 블랙 박스 환경에서의 출력값을 이용해 모델의 종류가 추론될 수 있다는 것을 보였다. 또한 본 논문이 제안하는 방식인 대소 관계 피쳐를 딥러닝 모델에 함께 학습시킨 경우 블랙 박스 환경에서 약 83%의 정확도로 모델의 종류를 추론했으며, 그 결과를 통해 공격자에게 확률 벡터가 아닌 제한된 정보만 제공되는 상황에서도 모델 종류가 추론될 수 있음을 보였다.

Contact Tracking Development Trend Using Bibliometric Analysis

  • Li, Chaoqun;Chen, Zhigang;Yu, Tongrui;Song, Xinxia
    • Journal of Information Processing Systems
    • /
    • 제18권3호
    • /
    • pp.359-373
    • /
    • 2022
  • The new crown pneumonia (COVID-19) has become a global epidemic. The disease has spread to most countries and poses a challenge to the healthcare system. Contact tracing technology is an effective way for public health to deal with diseases. Many experts have studied traditional contact tracing and developed digital contact tracking. In order to better understand the field of contact tracking, it is necessary to analyze the development of contact tracking in the field of computer science by bibliometrics. The purpose of this research is to use literature statistics and topic analysis to characterize the research literature of contact tracking in the field of computer science, to gain an in-depth understanding of the literature development status of contact tracking and the trend of hot topics over the past decade. In order to achieve the aforementioned goals, we conducted a bibliometric study in this paper. The study uses data collected from the Scopus database. Which contains more than 10,000 articles, including more than 2,000 in the field of computer science. For popular trends, we use VOSviewer for visual analysis. The number of contact tracking documents published annually in the computer field is increasing. At present, there are 200 to 300 papers published in the field of computer science each year, and the number of uncited papers is relatively small. Through the visual analysis of the paper, we found that the hot topic of contact tracking has changed from the past "mathematical model," "biological model," and "algorithm" to the current "digital contact tracking," "privacy," and "mobile application" and other topics. Contact tracking is currently a hot research topic. By selecting the most cited papers, we can display high-quality literature in contact tracking and characterize the development trend of the entire field through topic analysis. This is useful for students and researchers new to field of contact tracking ai well as for presenting our results to other subjects. Especially when comprehensive research cannot be conducted due to time constraints or lack of precise research questions, our research analysis can provide value for it.

금융권 인공지능 도입 및 활용 사례 연구 (A Case Study on the Introduction and Use of Artificial Intelligence in the Financial Sector)

  • 김병준;윤소빈;김미옥;전삼현
    • 산업진흥연구
    • /
    • 제8권2호
    • /
    • pp.21-27
    • /
    • 2023
  • 본 연구는 인공지능에 대한 정부와 금융권의 정책 및 활용 사례를 연구하고, 금융권의 향후 정책 과제를 도출 하고자 한다. Gartner에 따르면 2022년 금융업을 이끌어가는 주목할 기술로 '생성형 AI', '자율시스템', '프라이버스 강화 컴퓨테이션(PEC)'을 선정하였다. 금융권은 인공지능, 빅데이터, 블록체인 등 신기술의 발전으로 금융 부분의 혁신을 촉진하고 있다. 코로나 팬데믹 이후 재택근무의 확산 등으로 인한 데이터의 공유, 개인정보 보호 등의 관심이 높아지면서 디지털 신기술에 대한 기업의 변화가 기대된다. 글로벌 금융권 회사들도 디지털 신기술을 활용하여 상품 개발이나 기존 업무의 관리 및 운영에 대한 프로세스 혁신을 도모하고자 IT 비용에 대한 지출을 확대하고 있다. 금융권은 디지털 신기술을 활용하여 자금세탁 방지, 업무 효율성 제고, 개인정보 보호 강화 등의 업무에 적용하고 있다. 산업 간 경계가 사라지는 빅블러의 시대에 새로운 진입자들의 도전에서 경쟁 우위를 선점하기 위해서는 금융권들이 신기술을 업무에 적극 활용해야 한다.

마이데이터 생태계 구축을 위한 플랫폼 모델 설계 (Designing a Platform Model for Building MyData Ecosystem)

  • 강남규;최희석;이혜진;한상준;이석형
    • 인터넷정보학회논문지
    • /
    • 제22권2호
    • /
    • pp.123-131
    • /
    • 2021
  • 4차 산업혁명은 인공지능, 빅데이터 등과 같은 데이터 기반의 디지털 기술로 촉발되었으며, 데이터의 활용 범위를 보호 대상으로만 생각했던 개인정보의 영역까지도 확장하려는 움직임이 빠르게 진행되고 있다. 데이터 3법의 개정을 통해 본인 동의하에 개인정보가 자유롭게 이동하고 활용될 수 있는 법·제도는 마련되었으나, 개인정보의 수집부터 관리와 활용까지 전 과정을 아우를 수 있는 플랫폼의 지원도 필요할 것이다. 본 논문에서는 개인정보를 활용한 마이데이터 생태계 구축에 적용할 수 있는 플래폼 모델을 제안하고자 한다. 마이데이터 플랫폼 구축을 위해 필수적으로 갖추어야 할 6가지의 기능적 요건들과 그 기능들을 구현하기 위한 절차와 방법 등에 대하여 설명한다. 6가지 필수 기능으로 개인정보 위임열람·수집·활용·제공 동의 절차와 마이데이터 선별공유, 다운로드, 데이터 영수증 기능을 포함하며, 데이터 수집·저장·연계·융합을 위한 절차와 표준화에 대하여 설명한다. 그리고 통제적인 개인정보 접근을 위한 이용자 인증체계와 데이터 활용을 위한 API 게이트웨이, 마이데이터 플랫폼 서비스를 위한 필수 기능들에 대하여 살펴 본다. 마지막으로 본 논문에서 제안한 모델을 대전시 마이데이터 플랫폼 구축에 적용한 사례와 플랫폼 내에서 운영되는 응용서비스로서 대전시 교통약자의 이동을 지원하는 사례를 살펴본다.

제4차 산업혁명시대 인문사회학적 쟁점과 과제에 관한 연구 (A Study on Issues and Tasks of Humanity and Social Science in a Fourth Industrial Revolution Era)

  • 김진영;허완규
    • 디지털융복합연구
    • /
    • 제16권11호
    • /
    • pp.137-147
    • /
    • 2018
  • 융합, 초연결, 인공지능을 특성으로 한 4차 산업혁명 시대에 대한 대비와 정책마련을 위해 본 논문은 개별적으로 논의되고 있는 인문사회학적 쟁점들을 통합적으로 정리하였다. 그 결과, 인공지능기술(무인) 측면에서는 노동의 의미와 형태의 변화를 논의하면서 전통적 일자리의 감소, 프로젝트형 근로관계, 기본소득 및 로봇세에 대한 이슈에서부터 인공지능기술의 법적 책무와 자동화된 불평등 이슈까지 정리하였다. 초연결과 빅데이터 기술(무선 & 무한) 측면에서는 보안과 사이버 해킹 문제, 프라이버시 침해 문제가 부각되었다. 블록체인과 생명공학(무정부) 기술에서는 향후 중앙집권의 약화 및 개방화 사회로의 변화와 더불어 빅데이터를 기반으로 한 부의집중화, 디지털격차, 생명공학 기술의 윤리적 문제 등이 논의되었다. 공유경제(무소유) 측면에서는 시민윤리와 인간의 상품화라는 문제점이 부각되었다. 마지막으로 가상현실(무감각)기술의 발전은 사이버증후군, 대인기피증, 문제회피, 상상력 억압 등의 부작용과 이에 대한 법적 질서의 필요성이 논의되고 있다.