Browse > Article
http://dx.doi.org/10.30693/SMJ.2020.9.1.51

Sensitivity Identification Method for New Words of Social Media based on Naive Bayes Classification  

Kim, Jeong In (조선대학교 컴퓨터공학과)
Park, Sang Jin (조선대학교 컴퓨터공학과)
Kim, Hyoung Ju (제주대학교 컴퓨터교육과)
Choi, Jun Ho (조선대학교 소프트웨어융합공학과)
Kim, Han Il (조선대학교 자유전공학부)
Kim, Pan Koo (조선대학교 컴퓨터공학과)
Publication Information
Smart Media Journal / v.9, no.1, 2020 , pp. 51-59 More about this Journal
Abstract
From PC communication to the development of the internet, a new term has been coined on the social media, and the social media culture has been formed due to the spread of smart phones, and the newly coined word is becoming a culture. With the advent of social networking sites and smart phones serving as a bridge, the number of data has increased in real time. The use of new words can have many advantages, including the use of short sentences to solve the problems of various letter-limited messengers and reduce data. However, new words do not have a dictionary meaning and there are limitations and degradation of algorithms such as data mining. Therefore, in this paper, the opinion of the document is confirmed by collecting data through web crawling and extracting new words contained within the text data and establishing an emotional classification. The progress of the experiment is divided into three categories. First, a word collected by collecting a new word on the social media is subjected to learned of affirmative and negative. Next, to derive and verify emotional values using standard documents, TF-IDF is used to score noun sensibilities to enter the emotional values of the data. As with the new words, the classified emotional values are applied to verify that the emotions are classified in standard language documents. Finally, a combination of the newly coined words and standard emotional values is used to perform a comparative analysis of the technology of the instrument.
Keywords
New Words; Sensitivity Identification; Naive Bayes Classification; Text Mining; Opinion Mining;
Citations & Related Records
연도 인용수 순위
  • Reference
1 장경현, "신조어 연어의 형성원리," 인문논총, 제66권, 269-297쪽, 2011년 12월   DOI
2 강아름, 이상연, 이건, "매스미디어 상 인터넷 용어 처리를 위한 은닉 마코프 모델기반 신조어 추출," 한국지능시스템학회 학술발표 논문집, 제25권, 제1호, 119-120쪽, 2015년 4월
3 안정은, "Text Mining 기법을 이용한 표준특허 기술의 유사도 측정방법," 한국정보과학회 학술발표논문집, 제36권, 제1호, 1-5쪽, 2009년 6월
4 이한동, 김종배, "복합명사를 포함하는 개선된 키워드 추출 방법," 예술인문사회융합멀티미디어논문지, 제7권, 제10호, 857-864쪽, 2017년 10월   DOI
5 이성직, 김한준, "TF-IDF의 변형을 이용한 전자뉴스에서의 키워드 추출 기법," 한국전자거래학회지, 제14권, 제4호, 59-73쪽, 2009년 11월
6 대한민국의 인터넷 신조어 목록(2018), https://ko.wikipedia.org/wiki/대한민국의_인터넷_신조어_목록 (accessed Mar., 12, 2020).
7 홍택은, 김정인, 신주현, "인스타그램 이미지와 텍스트 분석을 통한 사용자 감정 분류," 스마트미디어저널, 제5권, 제1호, 61-68쪽, 2016년 3월
8 장경애, 박상현, 김우제, "인터넷 감정기호를 이용한 긍정/부정 말뭉치 구축 및 감정분류 자동화," 정보과학회논문지, 제42권, 제4호, 512-521쪽, 2015년 4월
9 이종화, 레환수, 이현규, "오피니언 마이닝을 통한 국내와 수입 의류 제품에 대한 고객 평판 연구," 인터넷전자상거래연구, 제15권, 제3호, 223-234쪽, 2015년 6월
10 김동성, 김종우, "온라인 여론의 감성분석을 위한 감성용어 자동화 추출 방안 연구," 한국경영정보학회 학술대회논문집, 제2016권, 제6호, 187-189 쪽, 2016년 6월
11 한나눔(2018), http://semanticweb.kaist.ac.kr/home/index.php/HanNanum (accessed Mar., 12, 2020).
12 조하나, 정연오, 이재동, 이지형, "인터넷 뉴스 댓글의 감성 분석을 통한 오피니언 마이닝," 한국지능시스템학회학술발표논문집, 제23권, 제1호, 149-150쪽, 2013년4월
13 박승현, 이은지, 김판구, "한글 편집거리 알고리즘을 이용한 한국어 철자오류 교정방법," 스마트미디어저널, 제6권, 제1호, 16-21쪽, 2017년 3월
14 차준석, 김정인, 김판구, "단어 간 의미적 연관성을 고려한 어휘 체인 기반의 개선된 자동 문서요약 방법," 스마트미디어저널, 제6권, 제1호, 22-29쪽, 2017년 3월
15 최성자, 손민영, 김영학, "키워드 기반 블로그 마케팅을 위한 연관 키워드 추천 시스템," 정보과학회 컴퓨팅의 실제 논문지, 제22권, 제5호, 246-251쪽, 2016년 5월   DOI
16 안광모, 김윤석, 김영훈, 서영훈, "Levenshtein 거리를 이용한 영화평 감성 분류," 한국디지털콘텐츠 학회 논문지, 제14권, 제4호, 581-587쪽, 2013년 12월