Browse > Article
http://dx.doi.org/10.5392/JKCA.2021.21.09.750

A Filtering Method of Malicious Comments Through Morpheme Analysis  

Ha, Yeram (사상경찰서)
Cheon, Junseok (부산대학교 정보융합공학과)
Wang, Inseo (부산대학교 정보융합공학과)
Park, Minuk ((주)유시스)
Woo, Gyun (부산대학교 정보융합공학과)
Publication Information
Abstract
Even though the replying comments on Internet articles have positive effects on discussions and communications, the malicious comments are still the source of problems even driving people to death. Automatic detection of malicious comments is important in this respect. However, the current filtering method of the malicious comments, based on forbidden words, is not so effective, especially for the replying comments written in Korean. This paper proposes a new filtering approach based on morpheme analysis, identifying coarse and polite morphemes. Based on these two groups of morphemes, the soundness of comments can be calculated. Further, this paper proposes various impact measures for comments, based on the soundness. According to the experiments on malicious comments, one of the impact measures is effective for detecting malicious comments. Comparing our method with the clean-bot of a portal site, the recall is enhanced by 37.93% point and F-measure is also enhanced up to 47.66 points. According to this result, it is highly expected that the new filtering method based on morpheme analysis can be a promising alternative to those based on forbidden words.
Keywords
Malicious Comments; Morpheme Analysis; Soundness of Comments; Impact of Comments;
Citations & Related Records
Times Cited By KSCI : 1  (Citation Analysis)
연도 인용수 순위
1 여론집중도조사위원회, 2016~2018 뉴스 이용집중도 조사 결과 발표, 문화체육관광부, 2018.
2 J. Huggins, SeleniumHQ Browser Automation, https://www.selenium.dev.
3 꼬꼬마 형태소 분석기, http://kkma.snu.ac.kr.
4 하예람, 비속어 분포를 고려한 뉴스 댓글 필터링 방법, 부산대학교, 석사학위논문, 2020.
5 방송통신심의위원회, "인터넷 내용 등급 서비스란?," http://www.safenet.ne.kr/dstandard.do.
6 하예람, 박민욱, 우균, "비속어와 높임말의 분포를 고려한 인터넷 뉴스 댓글 분석," 2019년 한국정보과학회종합학술대회, 제9권, 제1호, pp.509-513, 2019.
7 박은정, 조성준, "KoNLPy: 쉽고 간결한 한국어 정보처리 파이썬 패키지," 한글 및 한국어 정보처리 학술대회 논문집, 제26회, 2014.
8 한국게임산업진흥원, 게임언어 건전화 지침서 연구 - 게임 내 채팅언어의 표준화를 중심으로-,2008.
9 안태형, "악성 댓글의 범위와 유형," 우리말연구, 제32권, pp.109-131, 2013.
10 정현정, "네이버.카카오 욕설 DB 합친다. 중소 커뮤니티에도 제공," 전자신문, https://m.etnews.com/20210718000047.
11 연합뉴스, "네이버.카카오 스포츠뉴스 댓글 잠정 중단...'선수 고통 심각'(종합)," https://www.yna.co.kr/view/AKR20200807067551017.
12 박문서, "인터넷 익명성과 전자상거래," 한국통상정보학회, Vol.4, No.2, pp.201-222, 2002.
13 헌법재판소, 정보통신망 이용촉진 및 정보보호 등에 관한 법률 제44조의5 제1항 제2호 등 위헌확인, https://law.go.kr/헌재결정례/(2010헌마47,20120823).
14 경찰청, 전체 사이버범죄 발생.검거 현황, https://www.police.go.kr/www/open/publice/publice0204.jsp.
15 이윤정, 지정훈, 우균, 조환규, "인터넷 게시물의 댓글분석 및 시각화," 한국콘텐츠학회논문지, 제9권, 제7호, pp.45-56, 2009.   DOI
16 Thorsten Joachims, SVMLight: Support Vector Machine, https://www.cs.cornell.edu/people/tj/svm_light/.
17 S. E. Robertson, "Documentation Note: Specificity and Weighted Retrieval," Journal of Documentation, Vol.30, No.1, pp.41-46 1974.   DOI
18 김묘실, 강승식, "SVM을 이용한 악성 댓글 판별 시스템의 설계 및 구현," 한국정보과학회 언어공학연구회 학술대회, pp. 285-289, 2006.
19 김현정, 윤영미, 이병문, "향상된 FFP(Feature Frequency Profile)을 활용한 악성 댓글의 판별시스템," 한국정보기술학회논문지, 제9권, 제1호, pp.207-216, 2011.
20 홍진주, 인터넷 악성댓글 탐지 기법, 숭실대학교 소프트웨어특성화대학원, 석사학위논문, 2016.
21 L. Richardson, Beautiful Soup Documentation, https://www.crummy.com/software/BeautifulSoup/bs4/doc.
22 K. Reitz, Requests: HTTP for HumansTM, https://docs.python-requests.org/en/master.
23 S. E. Robertson, "The probability ranking principle in information retrieval," Journal of Documentation, Vol.33, No.4, pp.294-340, 1977.   DOI
24 G. E. Sims, S. Jun, G. A. Wu, and S. Kim, "Alignment-free genome comparison with feature frequency profiles (FFP) and optimal resolutions," Proceedings of the National Academy of Sciences, Vol.106, No.8, pp.2677-2682, 2009.
25 김영일, 김영준, 김영진, 김경일, "악성 댓글의 특성: 한국어와 영어의 인터넷 뉴스 댓글 비교," 한국콘텐츠학회논문지, 제19권, 제1호, pp.548-558, 2019.   DOI
26 liwc.wpengine.com, Linguistic Inquiry and Word Count, http://liwc.wpengine.com/.
27 이창환, 심정미, 윤애선, "언어적 특성을 이용한 '심리학적 한국어 글분석 프로그램(KLIWC)' 개발 과정에 대한 고찰," 한국인지과학회, 제16권, 제2호, pp.93-121, 2005.
28 S. E. Robertson, Term specificity, letter to the editor], 1972.