Browse > Article
http://dx.doi.org/10.30693/SMJ.2020.9.3.98

Swearword Detection Method Considering Meaning of Words and Sentences  

Yi, Moung Ho (조선대학교 소프트웨어창업공학과 대학원)
Lim, Myung Jin (조선대학교 컴퓨터공학과 대학원)
Shin, Ju Hyun (조선대학교 신산업융합학부)
Publication Information
Smart Media Journal / v.9, no.3, 2020 , pp. 98-106 More about this Journal
Abstract
Currently, as Internet users increase, the use of swearword is indiscriminately increasing. As a result, cyber violence among teenagers is increasing very seriously, and among them, cyber-language violence is the most serious. In order to eradicate cyber-language violence, research on detection of swearword has been conducted, but the method of detecting swearword by looking at the meaning of words and the flow of context is insufficient. Therefore,in this paper,we propose a method of detecting swearword using FastText model and LSTM model so that deliberately modified swearword and standard language can be accurately detected by looking at the flow of context.
Keywords
Swearword Detection; Meaning of Word; Meaning of Sentences; FastText; LSTM;
Citations & Related Records
Times Cited By KSCI : 4  (Citation Analysis)
연도 인용수 순위
1 "사이버폭력 - 위키백과 우리 모두의 백과사전", 위키백과, https://ko.wikipedia.org/wiki/사이버폭력 (accessed March. 10, 2019)
2 정한라, "국내외 사이버폭력 사례 및 각국의 대응방안," Internet & Security Focus, 31-47쪽, 2013년 10월
3 "'사이버 폭력'에 목숨 끊은 학생…죽음까지 조롱한 가해자", SBS News, https://news.sbs.co.kr/news/endPage.do?news_id=N1004932661&plink=COPYPASTE&cooper=SBSNEWSEND&plink=COPYPASTE&cooper=SBSNEWSEND (accessed March. 12, 2019)
4 "'카톡' 욕설 차단 기능", 여성신문, http://www.womennews.co.kr/news/articleView.html?idxno=55721 (accessed March. 21, 2019)
5 임명진, 김판구, 신주현, "리뷰의 의미적 토픽 분류를 적용한 감성 분석 모델," 스마트미디어저널, 제9권 제2호, 69-77쪽, 2020년 06월   DOI
6 "워드 임베딩 - 딥 러닝을 이용한 자연어 처리 입문", wikidocs, https://wikidocs.net/33520(accessed May. 03, 2019)
7 Tomas Mikolov, Kai Chen, Greg Corrado, Jeffrey Dean, "Efficient Estimation of Word Representations in Vector Space", 2013
8 Jeffrey Pennington, Richard Socher, Christopher D. Manning, "GloVe: Global Vectors for Word Representation", 2014
9 조현수, 이상구, "FastText를 적용한 한국어 단어임베딩", 한국정보과학회, 705-707쪽, 2017년 12월
10 이태석, 강승식, "LSTM 기반의 sequence-to-sequence 모델을 이용한 한글 자동 띄어쓰기," 스마트미디어저널, 제7권, 제4호, 17-23쪽, 2018년   DOI
11 "2019년 사이버폭력 실태조사 결과 발표", 대한민국 정책 브리핑, http://www.korea.kr/news/pressReleaseView.do?newsId=156373560 (accessed Jan., 31, 2020)
12 안성만, 정여진, 이재준, 양지헌, "한국어 음소 단위 LSTM 언어모델을 이용한 문장 생성," 한국지능정보시스템학회, 71-88쪽, 2017년 6월
13 박승현, 이은지, 김판구, "한글 편집거리 알고리즘을 이용한 한국어 철자오류 교정방법," 스마트미디어저널, 제6권, 제1호, 16-21쪽, 2017년 3월
14 김수현, 문현수, 이영석, "인터넷 채팅에서 편집거리 알고리즘을 이용한 비속어 탐지 방법," 한국정보과학회 학술발표논문집, 2012-2014쪽, 2018년 12월
15 유주연, "이미지 학습 기반의 텍스트 필터링 개선 연구", 성균관대학교 석사학위 논문, 2019. 8