• 제목/요약/키워드: Profanity

검색결과 14건 처리시간 0.026초

Profane or Not: Improving Korean Profane Detection using Deep Learning

  • Woo, Jiyoung;Park, Sung Hee;Kim, Huy Kang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권1호
    • /
    • pp.305-318
    • /
    • 2022
  • Abusive behaviors have become a common issue in many online social media platforms. Profanity is common form of abusive behavior in online. Social media platforms operate the filtering system using popular profanity words lists, but this method has drawbacks that it can be bypassed using an altered form and it can detect normal sentences as profanity. Especially in Korean language, the syllable is composed of graphemes and words are composed of multiple syllables, it can be decomposed into graphemes without impairing the transmission of meaning, and the form of a profane word can be seen as a different meaning in a sentence. This work focuses on the problem of filtering system mis-detecting normal phrases with profane phrases. For that, we proposed the deep learning-based framework including grapheme and syllable separation-based word embedding and appropriate CNN structure. The proposed model was evaluated on the chatting contents from the one of the famous online games in South Korea and generated 90.4% accuracy.

BERT를 활용한 초등학교 고학년의 욕설문장 자동 분류방안 연구 (A Study on Automatic Classification of Profanity Sentences of Elementary School Students Using BERT)

  • 심재권
    • 창의정보문화연구
    • /
    • 제7권2호
    • /
    • pp.91-98
    • /
    • 2021
  • 코로나19로 인해 초등학생이 온라인 환경에 머무는 시간이 증가함에 따라 작성하는 게시글, 댓글, 채팅의 양이 증가하였고, 타인의 감정을 상하게 하거나 욕설을 하는 등의 문제가 발생하고 있다. 네티켓을 초등학교에서 교육하고 있지만, 교육시간이 부족할 뿐 아니라 행동의 변화까지 기대하기는 어려움이 있어 자연어처리를 통한 기술적인 지원이 필요한 상황이다. 본 연구는 초등학생이 작성하는 문장에 사전언어학습 모델에 적용하여 자동으로 욕설문장을 필터링하는 실험을 진행하였다. 실험은 온라인 학습 플랫폼에서 초등학교 4-6학년의 채팅내역을 수집하였고, 채팅 내역중에 욕설로 신고되어 판정된 욕설문장을 함께 수집하여 사전학습된 언어모델을 통해 훈련하였다. 실험결과, 욕설문장을 분류한 결과 75%의 정확률을 보이는 것으로 분석되어 학습 데이터가 충분히 보완된다면, 초등학생이 사용하는 온라인 플랫폼에서 적용할 수 있음을 보여주었다.

변형된 비속어 탐지를 위한 토큰 기반의 분류 및 데이터셋 (Token-Based Classification and Dataset Construction for Detecting Modified Profanity)

  • 고성민;신유현
    • 정보처리학회 논문지
    • /
    • 제13권4호
    • /
    • pp.181-188
    • /
    • 2024
  • 기존의 비속어 탐지 방법들은 의도적으로 변형된 비속어를 식별하는 데 한계가 있다. 이 논문에서는 자연어 처리의 한 분야인 개체명 인식에 기반한 새로운 방법을 소개한다. 우리는 시퀀스 레이블링을 이용한 비속어 탐지 기법을 개발하고, 이를 위해 한국어 악성 댓글 중 일부 비속어를 레이블링하여 직접 데이터셋을 구축하여 실험을 수행하였다. 또한 모델의 성능을 향상시키기 위하여 거대 언어 모델중 하나인 ChatGPT를 활용해 한국어 혐오발언 데이터셋의 일부를 레이블링을 하는 방식으로 데이터셋을 증강하여 학습을 진행하였고, 이 과정에서 거대 언어 모델이 생성한 데이터셋을 인간이 필터링 하는 것만으로도 성능을 향상시킬 수 있음을 확인하였다. 이를 통해 데이터셋 증강 과정에는 여전히 인간의 관리감독이 필요함을 제시하였다.

여자 중학생 대상 욕설 중재 앱 프로그램 개발 및 효과 (Development and Effectiveness of a Profanity Intervention Application)

  • 조미경;신기수
    • 한국학교보건학회지
    • /
    • 제31권2호
    • /
    • pp.88-97
    • /
    • 2018
  • Purpose: The purpose of this study was to investigate the effects of a profanity intervention application on interpersonal relationship ability, aggression, and empathic ability among female middle school students. Method: The subjects of the present study were freshmen students at a girls' middle school in Gyeonggi-do. The profanity intervention application was implemented from November 20th to 27th, 2017. The pre- and post-tests were conducted one week before and two weeks after the intervention, respectively. The study was designed as a randomized controlled study and the collected data were analyzed using SPSS/WIN 23.0 (Chicago, IL). A homogeneity test between the two groups was performed using $x^2$ test, Fisher's exact test, independent t-test, and ANCOVA. Results: The two groups were found to be homogeneous in the pre-test. After the implementation of the profanity intervention application, aggression significantly decreased (F=20.17, p<.001) and interpersonal reactivity (F=5.92, p=.023) and empathy (F=11.10, p=.003) significantly increased in the experimental group compared to the control group. Among the factors related with aggression, verbal aggression, anger, and hostility significantly decreased in the experimental group. Meanwhile, among the factors of interpersonal reactivity, empathic concern and perspective-taking significantly increased and, among the factors of empathy, cognitive empathy significantly increased in the experimental group compared to the control group. Conclusion: Based on the findings of the present study, various intervention programs that can consistently improve the moral and ethical sensitivity of students should be presented starting from elementary school to prevent verbal violence in adolescents.

Accessibility of Korean Cultural Values at Screens: Decoding Patterns of North American Audiences

  • Xiuli, Chen;Sirui, Yao;Jiyeon, Baek;Jiena, Sha;Kesu, Lin;Kyung-young, Chung
    • International Journal of Advanced Culture Technology
    • /
    • 제10권4호
    • /
    • pp.153-159
    • /
    • 2022
  • This research investigates the accessibility of Korean modern values at screens from the perspectives of North American audiences while consuming Korean films and TV dramas. In order to decode Korean cultural values at screens, this study collects the data of 266 Korean films and TV dramas distributed in North America from IMDb platform, unlocking that the success of box office for Korean projects in North America is positively correlated with the characteristics of Violence & Gore and Profanity. Meanwhile, the audiences' positive responses to the violent project mainly depends on the degree of "Sex and Nudity", the plots of "social groups". The current success of Korean cultural and creative industry as well as the future global markets strengths are analyzed in this research. Stuart Hall's cultural studies approach and cultural psychological account theory are applied to discuss the success of Korean entertainment industry in the transnational cultural communication.

변형된 비속어 탐지를 위한 토큰 분류 (Token Classification for Detecting Modified Profanity)

  • 고성민;신유현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.498-499
    • /
    • 2023
  • 비속어 탐지 기법으로 주로 사용되는 비속어 데이터베이스 활용 방식 혹은 문장 자체를 혐오, 비혐오로 분류하는 방식은 변형된 비속어 탐지에 어려움이 있다. 본 논문에서는 자연어 처리 태스크 중 하나인 개체명 인식 방법에서 착안하여 시퀀스 레이블링 기반의 비속어 탐지 방법을 제안한다. 한국어 악성 댓글 중 비속어 부분에 대해 레이블링 된 데이터셋을 구축하여 실험을 진행하고, 이를 통해 F1-Score 약 0.88 의 결과를 보인다.

반 전역 정렬을 이용한 온라인 게임 변형 욕설 필터링 시스템 (The Online Game Coined Profanity Filtering System by using Semi-Global Alignment)

  • 윤태진;조환규
    • 한국콘텐츠학회논문지
    • /
    • 제9권12호
    • /
    • pp.113-120
    • /
    • 2009
  • 온라인 게임에서의 언어폭력 문제는 매우 심각하지만 그에 대한 효과적인 정책이나 기술적인 방법은 부족한 상황이다. 온라인 게임 서비스 업체에서는 금칙어 리스트를 작성하여 Swear Filter를 이용한 고정된 형식의 문자열 검색 방식을 통해 문제를 해결하려고 하고 있으나 사용자들은 다양한 방법으로 욕설을 조합 또는 변형시켜 기존의 필터링을 회피하고 있다. 특히 한글은 욕설의 변형이 매우 쉬운 특성을 가지고 있다. 본 논문에는 한글에 기초한 변형 욕설을 효율적으로 탐색하여 걸러내는 알고리즘을 제시한다. 이 알고리즘의 주된 특징은 변형 욕설의 표준형 변환과 자소단위의 반 전체 정렬(semi-global alignment), 이다. 실험 결과 저자들이 다양한 인터넷 게임 환경에서 직접 수집한 다종의 욕설 단어들에 대하여 약 90%의 우수한 필터링 성능을 보였다.

딥러닝 기반 비속어 필터링 채팅 프로그램 설계 및 구현 (Design and Implementation of Profanity Filtering Chat Program Based on Deep Learning)

  • 이건환;박주찬;최동원;이연경;최호빈;한연희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.998-1001
    • /
    • 2019
  • 최근에 게임이나 채팅 프로그램 내에서의 비속어 필터링은 금칙어 기반으로 운영되고 있다. 하지만 금칙어 기반의 프로그램은 여러 한계점을 보이며, 따라서, 본 논문에서는 'Text-CNN'을 활용한 딥러닝 기법에 기반하여 비속어 필터링 프로그램을 제안한다. 데이터의 자질을 '자모' 단위로 전처리하여 학습시키고 어느 부분이 비속어인지 검출하여 마스킹 처리하는 'LIME 알고리즘'을 사용하여 우리의 프로그램을 이용하는 사용자들에게 바른 언어습관을 지향하며 더 나아가 올바른 인터넷 문화를 조성할 수 있도록 필터링 채팅 프로그램을 제안한다.

실시간 채팅 환경에서 문장 분석을 이용한 대상자 및 비속어 검출 (Target and Swear Word Detection Using Sentence Analysis in Real-Time Chatting)

  • 염충석;장준영;장유환;김현철;박희민
    • 반도체디스플레이기술학회지
    • /
    • 제20권1호
    • /
    • pp.83-87
    • /
    • 2021
  • By the increase of internet usage, communicating online became an everyday thing. Thereby various people have experienced profanity by anonymous users. Nowadays lots of studies tried to solve this problem using artificial intelligence, but most of the solutions were for non-real time situations. In this paper, we propose a Telegram plugin that detects swear words using word2vec, and an algorithm to find the target of the sentence. We vectorized the input sentence to find connections with other similar words, then inputted the value to the pre-trained CNN (Convolutional Neural Network) model to detect any swears. For target recognition we proposed a sequential algorithm based on KoNLPY.

컴퓨터 게임에서의 언어 표현변화를 통한 인터넷 윤리 확립에 관한 연구 (Study on Establishment of Internet ethics expressed through Language convert in computer games)

  • 박구락
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권11호
    • /
    • pp.47-52
    • /
    • 2012
  • 오늘날 인터넷은 모든 분야에서 활용되고 있다. 그러나 일상생활의 일부분이 된 인터넷 상에서 인터넷 윤리 의식은 부족한 상태에 놓여있다. 특히 성장기에 있는 청소년들 사이에서 익명성이 보장되는 점을 악용하여, 악플이나 무분별한 욕의 사용 등 사이버폭력으로 이어져 여러 사회 문제가 발생하고 있다. 또한 청소년들이 즐기는 fps온라인 게임에서 욕설 및 비속어의 사용이 늘어나고 있고, 사이버 폭력의 피해도 증가하고 있다. 사이버 폭력의 피해유형을 보면 욕설과 비속어로 조사되었고 연령대가 낮을수록 피해가 증가하는 것으로 조사되었다. 이러한 문제점들을 예방하기 위해 많은 홍보와 공익광고 등이 진행되고 있으나, 그 기대 효과는 미흡한 실정이다. 또한 욕설과 비속어 단어를 사용하면 삭제되거나 블라인드 처리를 하는 서비스를 제공하고 있으나 이것은 근본적인 해결책으로 볼 수 없다. 본 논문은 fps온라인 게임에 적용할 수 있는 언어 변환 프로세스를 제안한다. 제안된 언어 변환 프로세스를 게임에 적용한다면, 욕설 및 비속어를 다른 언어로 순화시켜주므로, 욕설과 비속어로 인한 사이버 폭력을 줄일 수 있을 것으로 예상된다.