• 제목/요약/키워드: Hate speech

검색결과 32건 처리시간 0.025초

인터넷 혐오표현 대응방안에 관한 탐색적 연구 : 노출경험 사례 및 전문가 심층인터뷰 분석을 중심으로 (Exploratory Study on Countering Internet Hate Speech : Focusing on Case Study of Exposure to Internet Hate Speech and Experts' in-depth Interview)

  • 김경희;조연하;배진아
    • 한국콘텐츠학회논문지
    • /
    • 제20권2호
    • /
    • pp.499-510
    • /
    • 2020
  • 본 연구의 목적은 최근 심각한 사회문제로 대두되고 있는 인터넷 혐오표현의 원인과 대응방안을 모색하는 것이다. 혐오표현을 경험한 대학생들의 에세이 분석을 통해 인터넷 혐오표현에 대한 노출 실태를 분석했으며, 전문가 심층인터뷰를 통해 인터넷 혐오표현 확산의 원인을 진단하고 대응방안을 제시했다. 대학생들은 인터넷에서 여성, 노인, 성소수자, 지역 대상의 혐오표현을 경험했으며, 혐오표현을 확산시키는 주요 매체는 뉴스 댓글과 SNS, 온라인 게임이었다. 인터넷 혐오표현의 원인은 개인적 차원에서 인간 존엄성에 대한 인식 부족, 미디어 리터러시 능력의 부재 등으로, 사회적 차원에서 차별과 혐오에 대한 교육의 미흡, 혐오표현을 재생산하는 미디어 등으로 분석됐다. 이와 함께 법·제도적, 사회적, 교육적 차원에서 인터넷 혐오표현 문제를 개선하는 방안이 제시되었다.

BERT-Based Logits Ensemble Model for Gender Bias and Hate Speech Detection

  • Sanggeon Yun;Seungshik Kang;Hyeokman Kim
    • Journal of Information Processing Systems
    • /
    • 제19권5호
    • /
    • pp.641-651
    • /
    • 2023
  • Malicious hate speech and gender bias comments are common in online communities, causing social problems in our society. Gender bias and hate speech detection has been investigated. However, it is difficult because there are diverse ways to express them in words. To solve this problem, we attempted to detect malicious comments in a Korean hate speech dataset constructed in 2020. We explored bidirectional encoder representations from transformers (BERT)-based deep learning models utilizing hyperparameter tuning, data sampling, and logits ensembles with a label distribution. We evaluated our model in Kaggle competitions for gender bias, general bias, and hate speech detection. For gender bias detection, an F1-score of 0.7711 was achieved using an ensemble of the Soongsil-BERT and KcELECTRA models. The general bias task included the gender bias task, and the ensemble model achieved the best F1-score of 0.7166.

순서형 회귀분석을 활용한 악성 댓글 분류 (Hate Speech Classification Using Ordinal Regression)

  • 이세영;박새롬
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.735-736
    • /
    • 2021
  • 인터넷에서 댓글 시스템은 자신의 의사표현을 위한 시스템으로 널리 사용되고 있다. 하지만 이를 악용하여 상대방에 대한 혐오를 드러내기도 한다. 악성댓글에 대한 적절한 대처를 위해 빠르고 정확한 탐지는 필수적이다. 본 연구에서는 악성 댓글 분류 문제를 해결하기 위해서 순서가 있는 분류 레이블의 성질을 활용한 순서형 회귀 (Ordinal regression) 기반의 분류 모델을 제안한다. 일반적인 분류 모형과는 달리 혐오 발언 정도에 따라 다중 레이블을 부여하여 학습을 진행하였다. 실험을 통해 Korean Hate Speech Dataset에 대해 LSTM기반의 모형의 출력층을 다르게 구성하여 순서형 회귀 기반의 모형들의 성능을 비교하였다. 결과적으로 예측 결과에 대한 조율이 가능한 순서형 회귀 모형이 일반적인 순서형 회귀 모형에 비해서 편향된 예측에 대해 추가적인 성능 향상을 보였다.

  • PDF

Hate Speech Detection Using Modified Principal Component Analysis and Enhanced Convolution Neural Network on Twitter Dataset

  • Majed, Alowaidi
    • International Journal of Computer Science & Network Security
    • /
    • 제23권1호
    • /
    • pp.112-119
    • /
    • 2023
  • Traditionally used for networking computers and communications, the Internet has been evolving from the beginning. Internet is the backbone for many things on the web including social media. The concept of social networking which started in the early 1990s has also been growing with the internet. Social Networking Sites (SNSs) sprung and stayed back to an important element of internet usage mainly due to the services or provisions they allow on the web. Twitter and Facebook have become the primary means by which most individuals keep in touch with others and carry on substantive conversations. These sites allow the posting of photos, videos and support audio and video storage on the sites which can be shared amongst users. Although an attractive option, these provisions have also culminated in issues for these sites like posting offensive material. Though not always, users of SNSs have their share in promoting hate by their words or speeches which is difficult to be curtailed after being uploaded in the media. Hence, this article outlines a process for extracting user reviews from the Twitter corpus in order to identify instances of hate speech. Through the use of MPCA (Modified Principal Component Analysis) and ECNN, we are able to identify instances of hate speech in the text (Enhanced Convolutional Neural Network). With the use of NLP, a fully autonomous system for assessing syntax and meaning can be established (NLP). There is a strong emphasis on pre-processing, feature extraction, and classification. Cleansing the text by removing extra spaces, punctuation, and stop words is what normalization is all about. In the process of extracting features, these features that have already been processed are used. During the feature extraction process, the MPCA algorithm is used. It takes a set of related features and pulls out the ones that tell us the most about the dataset we give itThe proposed categorization method is then put forth as a means of detecting instances of hate speech or abusive language. It is argued that ECNN is superior to other methods for identifying hateful content online. It can take in massive amounts of data and quickly return accurate results, especially for larger datasets. As a result, the proposed MPCA+ECNN algorithm improves not only the F-measure values, but also the accuracy, precision, and recall.

Between Love and Hate: The New Korean Wave, Japanese Female Fans, and Anti-Korean Sentiment in Japan

  • Ahn, Ji-Hyun;Yoon, E Kyung
    • Journal of Contemporary Eastern Asia
    • /
    • 제19권2호
    • /
    • pp.179-196
    • /
    • 2020
  • Despite the enormous success in Japan of Korean popular culture, including TV dramas and K-pop, over the past few decades, anti-Korean sentiment in the country has become increasingly visible and intense. In this article, we examine how young Japanese female fans of Korean popular culture engage with the Korean Wave discourse while also engaging with―or, rather, disengaging from―anti-Korean movements and hate speech. Whereas previous scholarship on the Korean Wave has emphasized the power of active fans' agency, this paper investigates how the fans who passionately and self-reflexively consume Korean popular culture understand and react to the growing anti-Korean sentiment in Japan. Through in-depth interviews with 15 of these fans in their 20s and 30s, we show how they have navigated the discursive space between appreciation for Korean culture and anti-Koreanism in Japan.

트위터에서의 COVID-19와 관련된 반시민성 주제 탐색: 혐오 대상 및 키워드 분석 (Investigating Topics of Incivility Related to COVID-19 on Twitter: Analysis of Targets and Keywords of Hate Speech)

  • 김규리;오찬희;주영준
    • 정보관리학회지
    • /
    • 제39권1호
    • /
    • pp.331-350
    • /
    • 2022
  • 본 연구는 코로나바이러스감염증-19 (이하 코로나19)로 인해 생겨난 코로나19 반시민성 주제와 코로나19 혐오 정서를 파악하기 위해 소셜미디어 중 하나인 트위터의 코로나19 관련 게시물을 분석하였다. 2019년 12월 1일부터 2021년 8월 31일까지 21개월 동안 작성된 코로나19 관련 혐오 대상별(지역, 공공시설 혐오, 특정 인구 집단 혐오, 종교 혐오) 게시물 수집 및 전처리를 진행하여 총 63,802개의 게시물을 분석하였다. 혐오 대상별 빈도 분석, 다이나믹 토픽 모델링, 키워드 동시 출현 네트워크 분석 기법을 통하여 혐오 대상별 반시민성 주제와 혐오 키워드를 파악하였다. 첫째, 빈도 분석 결과, 지역, 공공시설 혐오는 상대적으로 증가하는 추세를 보이고 특정 인구 집단과 종교 혐오는 상대적으로 감소하는 추세를 확인할 수 있었다. 둘째, 다이나믹 토픽 모델링 분석 결과, 지역, 공공시설 혐오는 '대구, 경북지방 혐오', '지역 간 혐오', '공공시설 혐오'로 나타났고, 특정 인구 집단 혐오는 '중국 혐오', '바이러스 전파자', '실외(야외)활동 제재'로 나타났으며, 종교 혐오는 '신천지', '기독교', '종교 내 감염', '방역 의무 거부', '확진자 동선 비난'으로 나타났다. 셋째, 키워드 동시 출현 네트워크 분석 결과, 지역, 공공시설 혐오(코로나, 대구, 확진자, 신천지, 경북, 지역), 특정 인구 집단 혐오(코로나바이러스, 우한폐렴, 우한, 중국, 중국인, 사람, 입국, 금지), 종교 혐오(신천지, 코로나, 교회, 대구, 확진자, 감염) 등을 핵심 키워드로 확인할 수 있었다. 본 연구는 소셜 미디어를 활용한 국내 코로나19 혐오 대상 및 키워드 파악을 통해 코로나19 관련한 대중의 반시민성 여론을 파악하고자 하였다. 특히 기존의 선행연구에서 시도하지 않았던 주제인 코로나19 관련 혐오에 데이터 마이닝기법을 이용하여 소셜 미디어에서 표출하는 대중의 반시민성 주제와 혐오 정서 탐색은 대중들의 여론을 파악하는 것이 의의가 있다. 더불어 본 연구 결과는 포스트 코로나 시대를 대비하는 문화적 소통 방안의 제도 및 정책 수립 기여를 위한 기본 자료에 기초할 수 있다는 점에서 실질적 함의를 시사한다.

한국 곤충 국명 속에 나타난 혐오 표현과 일본어 잔재 (Hate Speech and Usage of Japanese in Korean Insect Common Name)

  • 강승호;김삼규
    • 한국응용곤충학회지
    • /
    • 제60권2호
    • /
    • pp.155-165
    • /
    • 2021
  • 우리나라의 생물상 52,628종의 35.4%를 차지하는 곤충 18,638종의 국명 유형을 크게 11개(색깔, 크기, 모양, 식물, 위치, 생태, 외국어, 사람이름, 고유, 생리, 긍정·부정)범주로 구분하고, 그 뜻은 무엇인지를 조사하였다. 그 중 인종차별, 장애 및 생김새의 차별, 지역 차별 등의 혐오표현이 사용된 유형 506개에 대해 심층적으로 분석하여, 해당 표현의 본 뜻과 함께 향후 사용할 만한 대체 용어를 제시하였다. 더불어 일본어 표현(일본어, 일본인 이름, 일본 지명 등)이 사용된 유형 508개에 대해 분석하여, 세부 유형을 밝히고 해당 생물종의 국명의 사용이 적절하지 않다고 판단되는 경우에 대체 용어를 제시하였다.

Harmful Disinformation in Southeast Asia: "Negative Campaigning", "Information Operations" and "Racist Propaganda" - Three Forms of Manipulative Political Communication in Malaysia, Myanmar, and Thailand

  • Radue, Melanie
    • Journal of Contemporary Eastern Asia
    • /
    • 제18권2호
    • /
    • pp.68-89
    • /
    • 2019
  • When comparing media freedom in Malaysia, Myanmar, and Thailand, so-called "fake news" appears as threats to a deliberative (online) public sphere in these three diverse contexts. However, "racist propaganda", "information operations" and "negative campaigning" might be more accurate terms that explain these forms of systematic manipulative political communication. The three cases show forms of disinformation in under-researched contexts and thereby expand the often Western focused discourses on hate speech and fake news. Additionally, the analysis shows that harmful disinformation disseminated online originates from differing contextual trajectories and is not an "online phenomenon". Drawing on an analysis of connotative context factors, this explorative comparative study enables an understanding of different forms of harmful disinformation in Malaysia, Myanmar, and Thailand. The connotative context factors were inductively inferred from 32 expert interviews providing explanations for the formation of political communication (control) mechanisms.

온라인 게임 내 혐오표현과 게임문화 개선에 대한 연구 (A Study on Improvement of Hate Speech and Game Culture in Online Game)

  • 김미선;이도영;이종원
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제60차 하계학술대회논문집 27권2호
    • /
    • pp.299-302
    • /
    • 2019
  • 현재 게임을 즐기는 유저의 스펙트럼은 미취학 아동부터 노년에 이르기까지 매우 넓어졌다. 반면, 온라인 게임 내의 헤이트 스피치는 최근 사회적 문제로 대두되고 있다. 헤이트스피치 문제는 점차 심각해져가고 있지만 이 문제를 개선하기 위한 가이드라인은 명확히 제시되어 있지 않다. 본 논문에서는 온라인 게임 내 텍스트와 음성 채팅을 통해 발생하는 헤이트 스피치의 현황과 문제점을 알아보고 그에 대한 해결방향을 제시한다.

  • PDF

온라인상에서 공유되는 노인에 대한 사회적 인식과 태도: 소셜 빅데이터 분석을 중심으로 (Social Perceptions and Attitudes toward the Elderly Shared Online: Focusing on Social Big Data Analysis)

  • 안순태;이하나;정순둘
    • 한국노년학
    • /
    • 제41권4호
    • /
    • pp.505-525
    • /
    • 2021
  • 본 연구의 목적은 온라인상에서 '노인'이 어떠한 표현들로 지칭되고 있는지, 해당 단어의 쓰임새는 어떠한지 살펴보는 것이다. 구체적으로, 노인 낙인이라는 이론적 개념에 근거하여, 노인에 대한 이미지와 태도, 혐오표현의 특성 등을 분석하였다. 이를 위해 본 연구는 익명의 대화가 오가는 소셜 빅데이터를 기반으로 텍스트 마이닝을 실시하였다. 본 연구를 통해 확인한 결과는 다음과 같다. 첫째, 온라인상에서 공유되는 노인 이미지는 대체로 부정적인 것으로 확인됐다. 둘째, 노인에 대한 부정적 이미지로 인해 이들을 대하는 태도 역시 부정적인 경향이 높았다. 셋째, 본 연구를 통해 확인된 노인 관련 지칭어를 살펴보면, '노인네', '틀딱', '할머니', '꼰대', '늙은이', '할배' 등이 상위 빈도를 차지했다. 이 중, '틀딱', '꼰대'는 주로 노인을 부정적으로 평가하거나 비난하는 댓글에서 확인됐으며, 이러한 표현에는 청년들에게 짐만 되는 노인들을 향한 혐오와 차별의 의미가 담겨 있었다. 넷째, 온라인상에서의 노인 혐오표현은 노인을 주제로 한 콘텐츠가 아닌 정치/경제 관련 이슈에서 더 많이 발견되었다. 이상의 결과를 토대로 본 연구는 세대 간 이해를 높이는 방안에 대해 논의하였다.