• 제목/요약/키워드: 데이터윤리

검색결과 134건 처리시간 0.022초

국내 대학 연구윤리지침의 연구데이터 관련 내용 분석 (A Study on the Analyzing Research Data-related Content in the Research Ethics Guidelines of Korean Universities)

  • 장수현;남영준
    • 한국비블리아학회지
    • /
    • 제35권1호
    • /
    • pp.221-241
    • /
    • 2024
  • 본 연구의 목적은 변화하는 연구 환경에 맞춘 국내 대학의 연구윤리지침의 방향성을 제안하는 것이다. 이를 위해 국내외 연구윤리지침과 연구진실성 관련 원칙을 분석해 연구데이터 관리와 연구진실성 간 연관성을 파악하였으며 해외 연구전문대학의 연구데이터 관련 지침 현황을 확인하였다. 이러한 분석 결과와 국내 4년제 대학 204개교를 대상으로 대학 연구윤리지침에서 나타난 "연구데이터" 관련 내용의 통계 결과를 비교해 본 연구는 국가 차원의 연구윤리지침인 연구윤리 확보를 위한 지침과 각 대학의 연구윤리지침의 연구데이터 관련 측면에 대한 시사점을 도출하였다.

데이터로 인해 발생하는 자연어처리 분야의 윤리적 이슈 (Ethical Issues in Natural Language Processing arising from Data)

  • 강혜린;장연지;강예지;박서윤;김한샘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.26-31
    • /
    • 2022
  • 자연어처리에서 데이터는 굉장히 많은 부분을 차지하고 중요한 역할이지만, 데이터로 인한 윤리적 이슈 또한 많이 나타난다. 본 연구는 자연어처리에서의 데이터 흐름의 과정에서 나타날 수 있는 윤리적 이슈를 단계별로 정리하였다. 이는 복잡한 자연어처리 과정의 특성과 자연어처리 분야에서 나타나는 상황을 모두 고려한 것이다. 또한 단계별로 정리한 이슈를 토대로 자연어처리가 더 나은 방향으로 나아가기 위한 데이터 관점에서의 미래 방향을 제시하였다.

  • PDF

멀티턴 대화에서 윤리적인 발화 생성을 위한 새로운 데이터 세트 (A New Dataset for Ethical Dialogue Generation in Multi-Turn Conversations)

  • 장빈;김서현;박규병
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.446-448
    • /
    • 2022
  • 별개의 분류 모델을 이용하여 비윤리 발화를 억제하려 했던 과거의 시도들과는 달리, 본 연구에서는 데이터 추가를 통한 발화 생성 단계에서의 윤리성 체화에 대해 실험하였다. 본 연구에서는 분류 모델로는 감지하기 어려운 멀티턴 비윤리 공격으로 이루어진 새로운 대화 데이터 세트를 소개하고, 해당 데이터 세트를 통해 개선된 챗봇 대화 모델의 방어 성능을 공개한다.

비윤리적 한국어 발언 검출을 위한 새 데이터 세트 (A New Dataset for Korean Toxic Comment Detection)

  • 박진원;나영윤;박규병
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.606-609
    • /
    • 2021
  • 최근 한국에서도 이루다의 윤리 이슈를 기점으로 딥러닝 모델의 윤리적 언어학습 필요성이 대두되었다. 그럼에도 불구하고 영어 데이터에 비해 한국어 데이터는 Korean Hate Speech Detection Dataset 이 유일하다. 이번 연구에서는 기존 데이터 세트의 유연성이 떨어지고 세부 라벨이 제한적이라는 문제를 개선한 새로운 데이터 세트를 제안하고, 해당 데이터 세트에 대하여 다양한 신경망 분류 모델을 적용한 벤치마크 결과를 공개한다.

대화형 AI 시스템에서 윤리적 UX 접근 방식의 개념 모델 (Conceptual Model of Ethical UX Approach in Conversational AI System)

  • 안성희
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.572-573
    • /
    • 2022
  • 본 논문은 메타버스 환경에서 문제가 대두되고있는 AI 윤리(ethic)를 배경으로 인터랙션을 통해 사람들의 온라인과 오프라인의 결정요소에 직접적으로 영향을 미치는 대화형 AI가 어떻게 윤리적으로 진화될 수 있을지에 대한 공학적 솔루션을 UX 관점으로 찾아보는 기술 전략 연구라고 할 수 있다. 연구의 가설은 AI 의 머신러닝과정에 개별 사용자 그룹의 경험데이터가 반드시 포함되고 고려되어야 AI 는 오류값을 줄이고 윤리적으로 대응할 수 있다는 전제이다. 이를 위하여 본 논문은 기존의 머신러닝과 대화형 AI 의 UX 관점의 다이아로그 플로우 등을 연구 분석하고 사용자 데이터들을 실험하여 메타버스 서비스 환경에서의 기존에 논의되고 있는 컨택스트기반의 AI 머신러닝 과정에 사용자의 정성적 경험데이터를 추가한 윤리적 UX 접근 개념 모델을 제안 하였다. 아직은 개념모델 단계이고 시스템에서는 지금까지 다르지 않았던 비정량적인 감정과 융합적경험을 어떻게 문화적으로 코드화 하고 시스템적인 랭귀지와 연결시킬 수 있을지에 대한사용자 연구가 후속연구로 진행될 예정이다.

  • PDF

사회복지정보화의 윤리적 쟁점 - 사회보장정보시스템을 통한 데이터감시를 중심으로- (Social Welfare Ethics in the Information Age - Focusing on Dataveillance through Social Welfare Information System -)

  • 김수영
    • 한국사회복지학
    • /
    • 제68권1호
    • /
    • pp.193-224
    • /
    • 2016
  • 본 연구는 사회보장정보시스템을 통한 데이터감시를 사례로, 사회복지영역의 정보화를 둘러싼 윤리적 쟁점들을 짚어보는 데 그 목적이 있다. 2015년 정부는 차세대 사회보장정보시스템을 개발하면서 정보시스템을 통한 부정수급 적발과 사각지대 발굴기능을 강화할 계획이라고 밝혔다. 그러나 부정수급과 사각지대를 조사하기 위해서는 취약계층에 대한 데이터감시가 불가피하다. 이에 본 논문은 데이터 감시를 둘러싼 논쟁들을 살펴보고, 이어서 사회보장정보시스템을 활용한 데이터감시가 어떤 윤리적 문제점을 안고 있는지 프라이버시, 정확성, 소유권, 접근성의 이슈를 중심으로 구체적으로 분석했다. 나아가 데이터감시를 넘어 정보화 시대에 사회복지가 고민해야할 본질적인 윤리적 딜레마들을 살펴본 후, 시론적 수준에서나마 윤리적 난제들을 개선하기 위한 방안을 제안해보고자 했다.

  • PDF

암시적 비윤리 데이터를 활용한 언어 모델의 강건성 평가 (Evaluation of Language Model Robustness Using Implicit Unethical Data)

  • 김유진;정가연;김한샘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.633-637
    • /
    • 2023
  • 암시적 비윤리 표현은 명시적 비윤리 표현과 달리 학습 데이터 선별이 어려울 뿐만 아니라 추가 생산 패턴 예측이 까다롭다. 고로 암시적 비윤리 표현에 대한 언어 모델의 감지 능력을 기르기 위해서는 모델의 취약성을 발견하는 연구가 반드시 선행되어야 한다. 본 논문에서는 암시적 비윤리 표현에 대한 표기 변경과 긍정 요소 삽입이라는 두 가지 변형을 통해 모델의 예측 변화를 유도하였다. 그 결과 모델이 야민정음과 외계어를 사용한 언어 변형에 취약하다는 사실을 발견하였다. 이에 더해 이모티콘이 텍스트와 함께 사용되는 경우 텍스트 자체보다 이모티콘의 효과가 더 크다는 사실을 밝혀내었다.

  • PDF

국내외 데이터법·정책 분석 및 시사점: 미국, 영국, EU의 사례를 중심으로 (Analysis of the Global Data Law & Policy and its Implications: Focusing on the cases of the United States, the United Kingdom, and the European Union)

  • 윤상필;권헌영
    • 정보화정책
    • /
    • 제28권2호
    • /
    • pp.98-113
    • /
    • 2021
  • 본 연구는 우리나라와 미국, 영국, EU의 국가 데이터전략, 데이터 정책과 제도 및 거버넌스를 비교함으로써 우리 환경에 맞는 시사점을 제안했다. 비교분석 결과 범정부 차원의 데이터 정책을 총괄할 수 있는 거버넌스, 데이터 윤리를 포함하는 데이터 정책을 고려할 수 있어야 할 것으로 보인다. 이에 본 연구는 데이터 정책의 총괄 거버넌스 확립을 위해 국가 차원의 최고데이터책임자(CDO)를 요구하면서 대통령 소속 데이터특별위원회를 두거나 대통령 비서실 내에 가칭 '국가디지털혁신실'을 설치하는 방안을 제시했다. 또한 민간 부문의 데이터도 규율할 수 있는 데이터산업기본법의 제정, 데이터 중심 보안과 정보보호 체계, 설명가능성과 책임 등 신뢰 확보를 위해 요구되는 공공부문의 데이터 전문역량과 전문가 윤리 관념 기반의 공직윤리 및 인사, 교육훈련 제도와의 연계 등을 제안했다.

금융분야 AI의 윤리적 문제 현황과 해결방안

  • 이수련;이현정;이아람;최은정
    • 정보보호학회지
    • /
    • 제32권3호
    • /
    • pp.57-64
    • /
    • 2022
  • 우리 사회에서 AI 활용이 더욱 보편화 되어가고 있는 가운데 AI 신뢰에 대한 사회적 요구도 증가했다. 특히 최근 대화형 인공지능'이루다'사건으로 AI 윤리에 대한 논의가 뜨거워졌다. 금융 분야에서도 로보어드바이저, 보험 심사 등 AI가 다양하게 활용되고 있지만, AI 윤리 문제가 AI 활성화에 큰 걸림돌이 되고 있다. 본 논문에서는 인공지능으로 발생할 수 있는 윤리적 문제를 활용 도메인과 데이터 분석 파이프라인에 따라 나눈다. 금융 AI 기술 분야에 따른 윤리 문제를 분류했으며 각 분야별 윤리사례를 제시했고 윤리 문제 분류에 따른 대응 방안과 해외에서의 대응방식과 우리나라의 대응방식을 소개하며 해결방안을 제시했다. 본 연구를 통해 금융 AI 기술 발전에 더불어 윤리 문제에 대한 경각심을 고취시킬 수 있을 것으로 기대한다. 금융 AI 기술 발전이 AI 윤리와 조화를 이루며 성장하길 바라며, 금융 AI 정책 수립 시에도 AI 윤리적 문제를 염두해 두어 차별, 개인정보유출 등과 같은 AI 윤리 규범 미준수로 파생되는 문제점을 줄이며 금융분야 AI 활용이 더욱 활성화되길 기대한다.

Web of Science 빅데이터를 활용한 텍스트 마이닝 기반의 정보윤리 이슈 탐색 (Exploring Information Ethics Issues based on Text Mining using Big Data from Web of Science)

  • 김한성
    • 컴퓨터교육학회논문지
    • /
    • 제22권3호
    • /
    • pp.67-78
    • /
    • 2019
  • 본 연구의 목적은 Web of Science(WoS)에서 제공하는 학술 빅데이터를 활용하여 정보윤리 이슈를 탐색하고 향후 정보과 정보윤리 교육을 위한 시사점을 제공하는 것에 있다. 이를 위해 WoS에서 제공하는 학술논문 중 정보윤리와 관련해 출판된 318편의 논문을 텍스트 마이닝 하였다. 구체적으로는 R을 활용해 주요키워드에 대한 빈도 분석(TF, DF, TF-IDF), 토픽 모델링 기반의 정보윤리 이슈 분석, 그리고 각 이슈에 대한 연도별 출연 빈도를 분석하여 정보윤리 연구의 경향성을 탐색하였다. 주요 결과를 살펴보면 다음과 같다. 첫째, TF-IDF를 통해 'digital', 'student', 'software', 'privacy' 등의 단어가 주요 키워드임을 확인하였다. 둘째, 토픽 모델링 분석 결과, 'Professional value', 'Cyber-bullying', 'AI and Social Impact' 등을 포함한 총 8개 이슈로 분석되었고, 그 중, 'Professional value'와 'Cyber-bullying' 이슈가 상대적으로 높은 비율을 차지하고 있었다. 본 연구는 이러한 분석 결과를 기초로 우리나라 정보윤리 교육을 시사점을 논의하였다.