• 제목/요약/키워드: 분야 편향성

검색결과 18건 처리시간 0.011초

품질이 관리된 스트레스 측정용 테이터셋 구축을 위한 제언 (Recommendations for the Construction of a Quslity-Controlled Stress Measurement Dataset)

  • 김태훈;나인섭
    • 스마트미디어저널
    • /
    • 제13권2호
    • /
    • pp.44-51
    • /
    • 2024
  • 스트레스 측정용 데이터셋의 구축은 건강, 의료분야, 심리향동, 교육분야 등 현대의 다양한 응용 분야에서 핵심적인 역할을 수행하교 있다. 특히, 스트레스 측정용 인공지능 모델의 효율적인 훈련을 위해서는 다양한 편향성을 제거하고 품질 관리된 데이터셋을 구축하는 것이 중요하다. 본 논문에서는 다양한 편향성 제거를 통한 품질의 관리된 스트레스 측정용 데이터셋 구축에 관하여 제안하였다. 이를 위해 스트레스 정의 및 측정도구 소개, 스트레스 인공지능 데이터 셋 구축과정, 품질향상을 위한 편향성 극복 전략 그리고 스트레스 데이터 수집시 고려사항을 제시하였다. 특히, 데이터셋 품질을 관리하기 위해 데이터셋 구축시 고려사항과, 발생할 수 있는 선택편향, 측정편향, 인과관계편향, 확증편향, 인공지능편향과 같은 다양한 편향서에 대해 검토하였다. 본 논문을 통해 스트레스 데이터 수집시 고려사항과 스트레스 데이터셋의 구축에서 발생할 수 있는 다양한 편향성을 체계적으로 이해하고, 이를 극복하여 품질이 보장된 데이터셋을 구축하는데 기여할 것으로 기대된다.

한국의 사회적 맥락에서의 ChatGPT의 독성 및 편향성 분석 (Analysis of Toxicity and Bias of ChatGPT within Korean Social Context)

  • 이승윤;박찬준;김경민;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.539-545
    • /
    • 2023
  • 초거대 언어모델은 심화된 언어적 이해를 요구하는 여러 분야에 높은 영향력을 미치고 있으나, 그에 수반되는 편향성과 윤리성에 대한 우려 또한 함께 증대되었다. 특히 편향된 언어모델은 인종, 성적 지향 등과 같은 다양한 속성을 가진 개인들에 대한 편견을 강화시킬 수 있다. 그러나 이러한 편향성에 관한 연구는 대부분 영어 문화권에 한정적이며 한국어에 관한 연구 또한 한국에서 발생하는 지역 갈등, 젠더 갈등 등의 사회적 문제를 반영하지 못한다. 이에 본 연구에서는 ChatGPT의 내재된 편향성을 도출하기 위해 의도적으로 다양한 페르소나를 부여하고 한국의 사회적 쟁점들을 기반으로 프롬프트 집합을 구성하여 생성된 문장의 독성을 분석하였다. 실험 결과, 특정 페르소나 또는 프롬프트에 관해서는 지속적으로 유해한 문장을 생성하는 경향성이 나타났다. 또한 각 페르소나-쟁점에 대해 사회가 갖는 편향된 시각이 모델에 그대로 반영되어, 각 조합에 따라 생성된 문장의 독성 분포에 유의미한 차이를 보이는 것을 확인했다.

  • PDF

논문 인용 영향력 측정 지수의 편향성에 대한 연구: KCI 수록 논문을 대상으로 (Discipline Bias of Document Citation Impact Indicators: Analyzing Articles in Korean Citation Index)

  • 이재윤;최상희
    • 정보관리학회지
    • /
    • 제32권4호
    • /
    • pp.205-221
    • /
    • 2015
  • 학술지의 인용빈도를 특정하여 산출된 지수로 단일 논문의 영향력을 평가하는 것에 대한 비판으로 인해 단일 논문의 인용 영향력을 측정하는 인용지수에 대한 연구가 다양하게 시도되었다. 이 연구에서는 8개의 단일 논문 인용영향력 평가 지수를 살펴보고 KCI 논문 데이터베이스를 대상으로 각 인용지수의 분야별 편향성을 조사하여 보았다. 대상 지수는 단순 인용빈도, 페이지랭크, f-값, CCI, c-지수, 단일문헌 h-지수, 단일문헌 hs-지수, cl-지수였다. 분석결과 페이지랭크가 학문 분야별 균등성, 학문 분야 내에서 학술지별 균등성 영역에서 가장 편향성이 없는 것으로 나타났다. 반면에 단순 인용빈도는 특정 학문분야나 특정 학술지에 편향된 결과를 산출할 가능성이 높은 것으로 나타났다. KCI 데이터베이스에서는 논문의 단순 인용빈도만 제공하고 있는데, 분야별 균등성을 가장 잘 유지하는 지수인 논문 페이지랭크를 함께 제공할 필요가 있다. 아울러 인용한 문헌의 인용빈도만으로 산출이 가능해서 이용자의 검색 결과로부터 바로 산출할 수 있는 지역 네크워크 지수 중에서는 cl-지수가 가장 균등성을 잘 유지하므로 계산 과정과 서비스가 손쉬운 지수로 함께 제공하는 것도 검토해야 한다.

부분 단어 토큰화 기법을 이용한 뉴스 기사 정치적 편향성 자동 분류 및 어휘 분석 (Automatic Classification and Vocabulary Analysis of Political Bias in News Articles by Using Subword Tokenization)

  • 조단비;이현영;정원섭;강승식
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권1호
    • /
    • pp.1-8
    • /
    • 2021
  • 뉴스 기사의 정치 분야는 보수, 진보와 같이 양극화된 편향적 특성이 존재하며 이를 정치적 편향성이라고 한다. 뉴스 기사로부터 편향성 문제를 분류하기 위해 키워드 기반의 학습 데이터를 구축하였다. 대부분의 임베딩 연구에서는 미등록어로 인한 문제를 완화시키기 위해 형태소 단위로 문장을 구성한다. 본 논문에서는 문장을 언어 모델에 의해 세부적으로 분할하는 부분 단어로 문장을 구성할 경우 미등록어 수가 감소할 것이라 예상하였다. 부분 단어 토큰화 기법을 이용한 문서 임베딩 모델을 제안하며 이를 SVM과 전방향 뉴럴 네트워크 구조에 적용하여 정치적 편향성 분류 실험을 진행하였다. 형태소 토큰화 기법을 이용한 문서 임베딩 모델과 비교 실험한 결과, 부분 단어 토큰화 기법을 이용한 문서 임베딩 모델이 78.22%로 가장 높은 정확도를 보였으며 부분 단어 토큰화를 통해 미등록어 수가 감소되는 것을 확인하였다. 분류 실험에서 가장 성능이 좋은 임베딩 모델을 이용하여 정치적 인물을 기반한 어휘를 추출하였으며 각 성향의 정치적 인물 벡터와의 평균 유사도를 통해 어휘의 편향성을 검증하였다.

커피시장의 새로운 흐름 원두커피자판기가 몰려온다

  • 한국자동판매기공업협회
    • 벤딩인더스트리
    • /
    • 제1권4호통권4호
    • /
    • pp.29-34
    • /
    • 2002
  • 20년 이상 인스턴트만을 고집해 온 국내 커피자판기 시장에 있어 올 들어 새로운 흐름이 형성되고 있다. 시장포화로 인한 신규 수요창출에 애를 먹는 기존 시장에 있어 새로운 시장발전 대안 모델로 원두커피자판기가 새롭게 등장하고 있는 것. 인스턴트 커피자판기의 편향성을 탈피, 이제는 원두시장으로 가야만 하는 절박한 상황에서 많은 업체들의 시장도전이 이어지고 있는 것은 분명 반가운 일이다. 일부에서는 아직까지는 시기상조라는 부정적인 의식이 있은 것도 사실이지만 몰려오는 원두커피자판기들은 이제 거부할 수 없는 대세적 흐름을 만들고 있다. 과연 올 한해 이러한 원두커피자판기 분야의 도전들이 새로운 커피자판기 시장발전의 전환점을 제시 할 수 있을까? 금호 기획특집란에서는 활발하게 시도되고 있는 각업체들의 사업동향과 출사표를 들어보고 시장발전 가능성을 진단하는 시간을 마련했다.

  • PDF

웹 아카이브 OASIS에 관한 고찰 (Research on the OASIS, a Web Archive in Korea)

  • 윤정옥
    • 한국문헌정보학회지
    • /
    • 제44권2호
    • /
    • pp.5-27
    • /
    • 2010
  • 이 연구에서는 국립중앙도서관이 구축 운영하는 웹 아카이브인 OASIS의 특성과 문제점을 살펴보았다. OASIS 웹 사이트를 통해 제공되는 웹 자원 콘텐츠의 현황을 검토하고, 향후 필요한 개선 방안을 제 안하였다. 이 연구를 위해 2009년 5월 20일부터 7월 2일 사이 OASIS 웹 사이트에서 '문학'과 '사회과학'분야의 콘텐츠 및 이용 가능한 서비스를 검토한 결과, 수집된 콘텐츠의 주제 분포의 편중, 저작자/발행자 편향성과 권위의 근거 미약, 정보의 유일성과 최신성 결여, 웹 문서와 웹 사이트의 중복 수집, 학술적가치의 근거 결여 등 문제점이 발견되었다. 주제전문가의 활용과 실명제, 메타데이터 요소 추가 및 기본적 목표의식의 지속적 확인 등이 필요함을 제안하였다.

기술문서 분류를 위한 통계기반 기계학습 모델 성능비교 및 한계 연구 (Performance Comparison of Statistics-Based Machine Learning Model for Classification of Technical Documents)

  • 김진구;유헌창
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.393-396
    • /
    • 2022
  • 본 연구는 국방과학기술 분야의 특허 및 논문 실적을 이용하여 통계기반 기계학습 모델 4 종을 학습하고, 실제 분석 대상기관의 데이터 입력결과를 분석하여 실용성에 대한 한계점 분석을 목적으로 한다. 기존 연구에서는 특허분류코드를 기준으로 분류하여 특수 목적으로 활용하거나 세부 연구 범위 내 연구 주제탐색 및 특징연구 등 미시적인 관점에서의 상세연구 활용 목적인 반면, 본 연구는 거시적인 관점에서 연구의 전체적인 흐름과 경향성 파악을 목적으로 한다. 이에 ICT 기술 138 종의 특허 및 논문 30,965 건과 국방과학기술 192 종의 특허 및 논문 23,406 건을 학습데이터로 각 모델을 학습하였다. 비교한 통계기반 학습모델은 Support Vector Machines, Decision Tree, Naive Bayes, XGBoost 모델이다. 학습데이터에 대한 학습검증 단계에서는 최대 99.4%의 성능을 보였다. 다만, 실제 분석대상기관의 특허 및 논문 12,824 건으로 입력분석한 결과, 모델별 편향성 문제, 데이터 전처리 이슈, 다중클래스 및 다중레이블 문제를 확인, 도출한 문제에 대한 해결방안을 제시하고 추가 연구의 방향성을 제시한다.

텍스트 유사성을 위한 파라미터 및 비 파라미터 측정 (Parametric and Non Parametric Measures for Text Similarity)

  • 존 믈랴히루;김종남
    • 융합신호처리학회논문지
    • /
    • 제20권4호
    • /
    • pp.193-198
    • /
    • 2019
  • 인터넷상에서의 진짜 및 가짜 정보의 범람이 수많은 텍스트 분석에 대한 연구를 이끌었다. 문헌 표기 없이 타인의 저작물을 무단 복제 및 관련 없는 연구결과 조작 등이 한동안 세간의 주목을 이끌었다. 연구 분야에서 표절과 이의 대항 및 감소를 위해 다양한 도구들이 개발되었다. Pearson Spearman 본 연구에서는 코사인 유사성과 및 상관관계를 이용하는 파라미터 및 비 파라미터 방법을 이용하여 문장 유사성을 측정한다. Pearson 코사인 유사성과 상관관계는 가장 높은 유사성 계수를 얻었으나 Spearman 상관관계는 낮은 유사성 계수를 보여주었다. 본 논문에서는 정상성 가정과 편향성에 의존하는 파라미터 방법들에 반하도록 비정상성 가정으로 인한 문장 유사도를 측정하는 데 있어 비 파라미터 방법들을 사용하는 것을 제안한다.

국가적 차원의 유망연구영역 탐색: Scopus 데이터베이스를 이용한 과학계량학적 접근 (Identification of Emerging Research at the national level: Scientometric Approach using Scopus)

  • 여운동;손은수;정의섭;이창환
    • 정보관리연구
    • /
    • 제39권3호
    • /
    • pp.95-113
    • /
    • 2008
  • 급속도로 변화하는 과학기술 환경 속에서 기업들은 현존하는 기술의 발전을 모니터링함과 동시에 새롭게 부상하는 유망기술을 찾아야만 경쟁력을 가질 수 있다. 각 국가에서는 경쟁적으로 유망연구 영역을 찾고 있는데, 대부분의 국가에서는 전문가 평가를 기반으로 한 델파이 방법으로 유망기술을 탐색하고 있다. 그러나 델파이와 같은 전문가방식은 기본적으로 전문가의 주관적 판단에 의지하기 때문에 편향성과 이에 따른 문제가 발생한다. 본 연구에서는 델파이 방법의 기술예측방법이 가지는 문제점을 개선하기 위해 과학계량학적 방법으로 유망연구영역을 탐색하였다. 탐색과정에서는 다음 3가지의 특별한 노력을 통해 과학계량학적 방법의 성능을 제고하고자 하였다. 첫째, 데이터베이스 선정에 있어서 공학 등 저널수가 적은 기술분야에서도 유망연구영역의 도출이 가능한가를 고려하였다. 둘째, 과학기술 전분야를 대상으로 하는 분석에서 과학기술분야별로 가지고 있는 인용수의 차이로 인해 발생하는 문제점을 해결하고자 부분인용계상(fractional citation counting)과 이동평균을 이용한 선형회귀분석을 도입하였다. 셋째, 과학계량학적 분석으로 나온 결과를 정성적으로 검증하여 과학계량학적 방법에 의한 오류를 최소화 하였다. 최종 290개의 유망연구영역을 선정하였으며, 각 영역은 기술의 네트워크상에서 가시화하였다. 본 연구에서는 Scopus 데이터베이스가 사용되었으며, 데이터마이닝과 가시화에는 한국과학기술정보연구원에서 개발한 KnowledgeMatrix가 사용되었다.

캐릭터산업의 정책변인연구 (Analysis on elements of policy changes in character industry)

  • 한창완
    • 만화애니메이션 연구
    • /
    • 통권33호
    • /
    • pp.597-616
    • /
    • 2013
  • 캐릭터산업은 저작권리를 중심으로 한 지식기반산업이면서 제조업과 서비스업의 판매가치를 촉진시키고 매출효과를 강화하는 보완재적 산업특성을 지니고 있어서 전 산업분야에 걸쳐 기능적으로 작동될 수 있는 창조경제의 핵심동력이다. 2003년부터 시작된 정부의 캐릭터관련 정책은 연관산업간의 연계효과 극대화, 국내 캐릭터의 해외진출확대, 유통구조 개선을 통한 저작권 강화, 캐릭터상품의 질적강화를 통한 산업기반 확대 등에 중점을 두었다. 이러한 정책성과로 인해, 2007년 이후, 연관콘텐츠의 성공사례가 구체화되기 시작했고, 국내외 캐릭터산업은 보다 체계적인 진화과정을 거치게 된다. 창작캐릭터의 자체적인 산업육성 노하우가 축적되고, 만화, 애니메이션, 게임, 소설, 영화, 뮤지컬 등으로 시작된 연관캐릭터가 시장세분화전략에 의해 활성화되면서 캐릭터산업의 범위 및 산업적 통계의 재설정이 요구되기 시작했다. 특히, 2009년 이후 정부는 '세계 5대 캐릭터 강국'으로의 목표를 설정하고, 글로벌 스타캐릭터 발굴, 연관산업간 네트워크 구축지원, 홍보채널 다양화 및 프로모션 강화, 라이선싱 비즈니스 활성화 등의 정책을 발굴하게 된다. 특히, 2013년을 기점으로 캐릭터를 활용한 캐릭터 체험전 등의 전시시장, 키즈카페 등의 시간관리형 캐릭터 실내테마파크, SNS의 이모티콘을 중심으로 한 디지털캐릭터 수요시장, 캐릭터 뮤지컬을 중심으로 한 공연시장 등 새로운 캐릭터시장이 지속적으로 개발되고, 기존 오프라인의 불법복제시장이 국내외적으로 대형화되면서 그에 따른 체계적인 정책대안이 필요하게 되었다. 진화하는 캐릭터 소비시장과 플랫폼 다양화 시대에 대응하여, 캐릭터산업을 활성화시키고 새로운 캐릭터디자인 및 관련 콘텐츠를 지원하기 위해서는 캐릭터산업의 정책변인을 전제로 한 전략방향의 입체적 설정이 요구된다. 지난 정부의 정책성과와 국내외 캐릭터산업의 시장현황, 그리고 진화방향을 분석하여 정책변인을 구체화시키면 다음과 같다. 현재 국내캐릭터산업의 정책변인은 플랫폼 다양화에 따른 디지털 캐릭터시장의 소비다층화, 한류중심의 캐릭터상품 융합콘텐츠화, 불법콘텐츠의 지하경제 양성화, 세분화된 시장의 수용자 편향성관리 등으로 분석되며, 이는 미국과 일본 및 유럽의 기존 캐릭터산업 강국들과는 다른 차원의 정책이슈를 발굴하게 된다. 결국 국내외시장의 연관콘텐츠 저작권계약 모델개발, 플랫폼 경제의 수익모델 다각화, 한류확대에 연계된 목표시장 추가개발, 평생캐릭터의 연령별 맞춤형 시장전략 등이 캐릭터 수요시장진화에 따른 대안으로 제시된다.