DOI QR코드

DOI QR Code

An analysis study on the quality of article to improve the performance of hate comments discrimination

악성댓글 판별의 성능 향상을 위한 품사 자질에 대한 분석 연구

  • Received : 2021.11.18
  • Accepted : 2021.12.13
  • Published : 2021.12.31

Abstract

One of the social aspects that changes as the use of the Internet becomes widespread is communication in online space. In the past, only one-on-one conversations were possible remotely, except when they were physically in the same space, but nowadays, technology has been developed to enable communication with a large number of people remotely through bulletin boards, communities, and social network services. Due to the development of such information and communication networks, life becomes more convenient, and at the same time, the damage caused by rapid information exchange is also constantly increasing. Recently, cyber crimes such as sending sexual messages or personal attacks to certain people with recognition on the Internet, such as not only entertainers but also influencers, have occurred, and some of those exposed to these cybercrime have committed suicide. In this paper, in order to reduce the damage caused by malicious comments, research a method for improving the performance of discriminate malicious comments through feature extraction based on parts-of-speech.

인터넷의 사용이 광범위 해져감에 따라 변화되는 사회적 측면 중 하나는 온라인 공간에서의 의사소통이다. 과거에는 물리적으로 같은 공간에 있을 때를 제외하고는 일대일 대화만 원격으로 가능했지만, 요즘은 게시판이나 커뮤니티, 소셜네트워크서비스(SNS) 등을 통해 다수의 사람들과 원격으로 소통할 수 있는 기술이 발달했다. 이러한 정보통신망의 발달로 생활이 편리해지고, 동시에 급격한 정보교류에 따른 피해도 끊임없이 증가하고 있다. 최근에는 연예인뿐 아니라 인플루언서 등 인터넷에서 인지도가 높은 특정인에게 성적인 메시지를 보내거나 인신공격을 가하는 등의 사이버 범죄가 발생하고 있으며, 이들 사이버 범죄에 노출된 이들 중 일부는 극단적인 선택을 하기도 하였다. 본 논문에서는 악성 댓글로 인한 피해를 줄이기 위해 음성 부분별 기능추출을 통한 차별적 악성 댓글의 성능향상 방안을 연구하였다.

Keywords

Acknowledgement

본 논문은 2020학년도 조선대학교 학술연구지원금의 지원을 받아 연구되었음.

References

  1. D. Gillmor, INTRODUCTION TO THE PAPERBACK EDITION in We the Media: Grassroots Journalism by the People, for the People, xvi O'Reilly, 2004.
  2. 유홍식, "악성댓글에 대한 제3자 효과 연구," 한국방송학보, 제24권, 238-278쪽, 2010년
  3. 김진우, 조혜인, 이봉규, "인공신경망을 적용한 악성댓글 분류 모델들의 성능 비교," 한국디지털콘텐츠학회논문지, 제20권, 제7호, 1429-1437쪽, 2019년
  4. 성대경, 이현우, 이창영, 김아영, 박성배, "확률 기반 악성댓글 판별," 한국정보처리학회 추계학술발표대회, 제21권, 제2호, 905-908쪽, 2014년 11월
  5. 이중원, "CyberBullyWordNet:오피니언 마이닝에서의 비난 댓글 파악을 위한 방법 개발", 경희대학교 석사학위 논문, 2017년
  6. 하예람, "비속어 분포를 고려한 뉴스 댓글 필터링 방법", 부산대학교 석사학위 논문, 2020년
  7. 김세한, "인공신경망을 이용한 인터넷 악성 댓글탐지 기법", 숭실대학교 석사학위 논문, 2016년
  8. 이성록, 조민제, 조수완, 김혜정, "악성댓글분류를 위한 데이터 전처리 인공신경망 모델 성능 비교," 대한전자공학회 하계학술대회 논문집, 2003-2005쪽, 2020년 8월
  9. 김유영, 송민, "영화 리뷰 감성분석을 위한 텍스트 마이닝 기반 감성 분류기 구축," 한국지능정보시스템 학회 지능정보연구, 제22권, 제3호, 71-89쪽, 2016년 9월
  10. 김천중, "SVM을 이용한 SNS 댓글 적합성 판단," 한국정보과학회 동계학술발표회 논문집, 775-777쪽, 2015년 12월
  11. 김묘실, "SVM을 이용한 악성 댓글 판별 시스템의 설계 및 구현", 국민대학교 교육대학원 석사학위논문, 2006년
  12. 김현정, 윤영미, 이병문, "향상된 FFP(Feature Frequency Profile)을 활용한 악성 댓글의 판별시스템," 한국 정보기술학회 논문지, 제9권, 제1호, 207-216쪽, 2011년
  13. 이현상, 이희준, 오세환, "하이웨이 네트워크 기반 CNN모델링 및 사전 외 어휘 처리 기술을 활용한 악성 댓글 분류 연구," 정보시스템연구, 제29권, 제3호, 103-117쪽, 2020년 9월
  14. 정민철, 이지현, 오하영, "앙상블 머신러닝 모델기반 유튜브 스팸 댓글 탐지" 한국정보통신학회논문지, 제24권, 제5호, 576-583쪽, 2020년 5월 https://doi.org/10.6109/JKIICE.2020.24.5.576
  15. 어동선, "빅데이터를 이용한 텍스트마이닝 기법의 성능 비교", 인제대학교 석사학위 논문, 2015년
  16. "서포트 벡터 머신", 위키피디아. 2020년 7월 10일 수정, https://ko.wikipedia.org/wiki/서포트_벡터_머신 (accessed May, 31, 2021)
  17. 문종민, "품사기반 자질 추출을 통한 악성댓글 판별 성능 향상 방법", 조선대학교 산업기술창업대학원 석사학위 논문, 2021년 8월
  18. 홍진주, 김세한, 박제원, 최재현, "감성분석과 SVM을 이용한 인터넷 악성댓글 탐지 기법," 한국정보통신학회논문지, 제20권, 제2호, 260-267쪽, 2016년 https://doi.org/10.6109/JKIICE.2016.20.2.260
  19. 안형준, "단어 임베딩 및 언어심리학적 변인을 이용한 온라인 뉴스 댓글에 대한 반응 분석," Journal of KIIT, 제18권, 제6호, 107-115쪽, 2020년
  20. 이재호, 한동욱, 김하영, 안병구, "머신러닝 기반 인터넷 비속어 필터링 시스템," 대한전자공학회 학술대회, 제41권, 제2호, 852-853쪽, 2018년
  21. 장윤재, 이은주, "있는 그대로의 댓글 vs. 승인받은 댓글 vs. 인용된 댓글," 사회과학연구 논총, 제33권, 제1호, 377-416쪽, 2017년
  22. 신효정, 최소운, 이경호, 이공주, "기계 학습을 이용한 악성 댓글 판별 시스템," 제 27회 한글 및 한국어 정보처리 학술대회 논문, 178-180쪽, 2015년 10월
  23. 배민영, 차정원, "Topic Signature를 이용한 댓글 분류 시스템," 정보과학회논문지: 소프트웨어 및 응용, 제35권, 제12호, 80-81쪽, 2008년
  24. 안정국, 김희웅, "한글 감성어 사전 API 구축 및 자연어 처리의 활용," 한국지능정보시스템학회 학술대회논문집, 177-182쪽, 2014년
  25. 황재원, 고영중, "감정 분류를 위한 한국어 감정 자질 추출 기법과 감정 자질의 유용성 평가," Korean journal of cognitive science, 제19권, 제4호, 499-517쪽, 2008년 https://doi.org/10.19066/cogsci.2008.19.4.008
  26. 임명진, 김선미, 신주현, "미세먼지와 진료과목의 상관관계 분석을 통한 연관성 예측 방법," 스마트미디어저널, 제7권, 제3호, 22-28쪽, 2018년 9월 https://doi.org/10.30693/SMJ.2018.7.3.22
  27. 임명진, 김판구, 신주현, "리뷰의 의미적 토픽 분류를 적용한 감성 분석 모델," 스마트미디어저널, 제9권, 제2호, 69-77쪽, 2020년 06월 https://doi.org/10.30693/SMJ.2020.9.2.69
  28. 이명호, 임명진, 신주현, "단어와 문장의 의미를 고려한 비속어 판별 방법," 스마트미디어저널, 제9권, 제3호, 98-106쪽, 2020년 9월 https://doi.org/10.30693/SMJ.2020.9.3.98
  29. 김정인, 박상진, 김형주, 최준호, 김한일, 김판구, " 나이브 베이즈 기반 소셜 미디어 상의 신조어 감성 판별 기법," 스마트미디어저널, 제9권, 제14호, 51-59쪽, 2020년 03월