• Title/Summary/Keyword: 한국어 감성 분류

Search Result 54, Processing Time 0.024 seconds

Effective Korean sentiment classification method using word2vec and ensemble classifier (Word2vec과 앙상블 분류기를 사용한 효율적 한국어 감성 분류 방안)

  • Park, Sung Soo;Lee, Kun Chang
    • Journal of Digital Contents Society
    • /
    • v.19 no.1
    • /
    • pp.133-140
    • /
    • 2018
  • Accurate sentiment classification is an important research topic in sentiment analysis. This study suggests an efficient classification method of Korean sentiment using word2vec and ensemble methods which have been recently studied variously. For the 200,000 Korean movie review texts, we generate a POS-based BOW feature and a feature using word2vec, and integrated features of two feature representation. We used a single classifier of Logistic Regression, Decision Tree, Naive Bayes, and Support Vector Machine and an ensemble classifier of Adaptive Boost, Bagging, Gradient Boosting, and Random Forest for sentiment classification. As a result of this study, the integrated feature representation composed of BOW feature including adjective and adverb and word2vec feature showed the highest sentiment classification accuracy. Empirical results show that SVM, a single classifier, has the highest performance but ensemble classifiers show similar or slightly lower performance than the single classifier.

Automatic Construction and Evaluation of Movie Domain Korean Sentiment Dictionary (영화도메인 한국어 감성사전의 자동구축과 평가)

  • Cho, Heeryon;Choi, Sang-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.04a
    • /
    • pp.585-587
    • /
    • 2015
  • 본 연구에서는 네이버 영화평을 학습데이터로 사용하여 영화평 감성분류에 필요한 감성사전을 자동으로 구축하는 방법에 대해 제안한다. 이 때 학습데이터의 분량과 긍정/부정 영화평의 비율을 달리하여 네 가지의 학습데이터를 마련하고, 각 경우에 대하여 감성사전과 나이브베이즈(이하, NB) 분류기를 구축한 후, 이 둘의 성능을 비교했다. 네 종류의 학습데이터로 구축한 감성사전과 NB 분류기를 이용하여 영화평 감성 자동분류 성능을 비교한 결과, 네 경우의 평균 균형정확도는 감성사전이 78.2%, NB 분류기가 66.1%였다.

Contextualized Embedding-based Korean Movie Review Sentiment Analysis (문맥 표현 기반 한국어 영화평 감성 분석)

  • Park, Cheoneum;Kim, Geonyeong;Kim, Hyunsun;Lee, Changki
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.75-78
    • /
    • 2018
  • 감성 분석은 특정 대상에 대한 의견을 수집하고 분류하는 과정이다. 그러나 자연어에 담김 사람의 주관을 파악하는 일은 어려운 일로써, 기존의 감성 단어 사전이나 확률 모델은 이러한 문제를 해결하기 어려웠으나 딥 러닝의 발전으로 문제 해결을 시도할 수 있게 됐다. 본 논문에서는 사전 학습된 문맥 표현을 한국어 감성 분석에 활용하여 더 높은 성능을 낼 수 있음을 보인다.

  • PDF

Building Emotional Dictionary to Analysis a Good Feeling of a Book (도서 호감도 분석을 위한 감성어 사전구축 방안)

  • Lee, Tae-Seok;Lee, Su-Myeong;Gang, Seung-Sik
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.147-150
    • /
    • 2015
  • 감성은 개인적인 생활경험을 통해 표현되며 동일한 감정상태와 정보자극을 주더라도 다른 감성이 발생될 뿐만 아니라 개인, 사회, 문화 요인에 따라서 크게 변한다. 따라서 다른 영역의 감성과 도서에 대한 감성이 같지 않기 때문에 별도의 감성 사전 구축이 필요하다. 구축된 감성사전은 비슷한 성향의 도서와 사람을 묶어 추천해 주는데 활용할 수 있다. 감성 사전 구축을 위한 원천 정보로 네티즌이 책을 읽고 호감도와 함께 짧은 문장으로 쓴 소감을 활용하였다. 감성분석에서 가장 기본이 되는 분류는 긍정과 부정으로 나누는 것이다. 하지만, 실제로 도서를 추천하기위해서 긍정과 부정으로만 구분하는 것은 충분하지 않다. 따라서 본 연구에서는 도서에 대해서 감성을 긍정과 부정의 호감정도와 감성의 활성도를 조합한 8개의 감성으로 분류하고 각각의 지수를 함께 산출하여 감성어 사전을 구축하고 활용하는 방안을 제시하였다.

  • PDF

Automatic Generation of Emotional Comments on News-Articles using Sequence-to-Sequence Model (Sequence-to-Sequence 모델을 이용한 신문기사의 감성 댓글 자동 생성)

  • Park, Chun-Young;Park, Yo-Han;Jeong, Hye-Ji;Kim, Ji-Won;Choi, Yong-Seok;Lee, Kong-Joo
    • 한국어정보학회:학술대회논문집
    • /
    • 2017.10a
    • /
    • pp.233-237
    • /
    • 2017
  • 본 논문은 신문기사의 감성 댓글을 생성하기 위한 시스템을 제시한다. 감성을 고려한 댓글 생성을 위해 기존의 Sequence-to-Sequence 모델을 사용하여 긍정, 부정, 비속어 포함, 비속어 미포함 유형의 4개의 감성 모델을 구축한다. 하나의 신문 기사에는 다양한 댓글이 달려있지만 감성 사전과 비속어 사전을 활용하여 하나의 댓글만 선별하여 사용한다. 분류한 댓글을 통해 4개의 모델을 학습하고 감성 유형에 맞는 댓글을 생성한다.

  • PDF

Emotional Tag and Evaluation Method for Personalized Curation (개인화 큐레이션을 위한 감성 분류 및 평가)

  • Im, Ji-Hui;Sung, Joo-Won;Koo, Hyung-Keun;Ock, Cheol-Young;Chang, Du-Seong
    • Annual Conference on Human and Language Technology
    • /
    • 2014.10a
    • /
    • pp.122-126
    • /
    • 2014
  • 감성은 콘텐츠 구매과정에서 결정적인 요소로 작용하며, 영화 콘텐츠의 탐색/소비 과정에서도 콘텐츠 소비의 새로운 기준이다. 그러므로 본 연구에서는 콘텐츠의 내용과 감성을 반영하기 위한 감성분류체계를 제안하였다. 제안한 감성분류체계를 기반으로 사용자의 취향과 감성에 기반하여 콘텐츠를 분류/추천하여 개인화된 편성을 제공하는 것을 "감성 큐레이션"이라 정의하고, 이를 위한 감성기반 큐레이션 방법론을 기술하고 실험을 통해 추천 효과를 입증하였다. 큐레이션은 기존의 개인화 추천과 달리 고객 취향뿐만이 아닌, 신선함, 다양성을 제공할 수 있어야 하며, 상용 큐레이션 서비스에서는 실제 시청으로 연결되는 비율이 중요하다. 본 연구에서는 큐레이션 성능 평가를 위해 성향인지도, 신선도, 다양성에 기반한 만족도 설문조사 방법과 함께, 콘텐츠의 전체 시청률 대비 큐레이션을 통해 추천되어 증가된 시청률의 확대 비율인 Lift score 라는 새로운 평가 방법을 제안하여 그 효용성을 증명하였다.

  • PDF

Generative-model based Aspect-Based sentiment Analysis (한국어에서 T5를 사용한 속성 기반 감성 분류 모델)

  • Sangyeon YU;Sang-Woo Kang
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.586-590
    • /
    • 2023
  • 인터넷과 소셜미디어 사용량의 급증으로, 제품 리뷰, 온라인 피드백, 소셜 미디어 게시물 등을 통해 고객의 감정을 파악하는 것이 중요해졌다. 인공지능이 활용되어 고객이 제품이나 서비스의 어떤 부분에 만족하거나 불만을 가지는지를 분석하는 연구를 ABSA라고 하며 이미 해외에서는 이런 연구가 활발하게 이루어지는 반면, 국내에서는 상대적으로 부족한 상황이다. 이 연구에서는 ABSA의 두 개의 주요 작업인 ACD와 ASC에 대해 생성 모델 중 하나인 T5 모델을 사용하는 방법론을 제시한다. 이 방법론은 기존 판별 모델을 사용하는 것에 비해 시간과 성능 측면에서 크게 향상되었음을 보여준다.

  • PDF

Data Sampling Strategy for Korean Speech Emotion Classification using wav2vec2.0 (wav2vec2.0을 활용한 한국어 음성 감정 분류를 위한 데이터 샘플링 전략)

  • Mirr-Shin;Youhyun Shin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.493-494
    • /
    • 2023
  • 음성 기반의 감정 분석은 인간의 감정을 정확하게 파악하는 데 중요한 연구 분야로 자리잡고 있다. 최근에는 wav2vec2.0과 같은 트랜스포머 기반의 모델이 음성 인식 분야에서 뛰어난 성능을 보이며 주목받고 있다. 본 연구에서는 wav2vec2.0 모델을 활용하여 한국어 감성 발화 데이터에 대한 감정 분류를 위한 데이터 샘플링 전략을 제안한다. 실험을 통해 한국어 음성 감성분석을 위해 학습 데이터를 활용할 때 감정별로 샘플링하여 데이터의 개수를 유사하게 하는 것이 성능 향상에 도움이 되며, 긴 음성 데이터부터 이용하는 것이 성능 향상에 도움이 됨을 보인다.

Movie Corpus Emotional Analysis Using Emotion Vocabulary Dictionary (감정 어휘 사전을 활용한 영화 리뷰 말뭉치 감정 분석)

  • Jang, Yeonji;Choi, Jiseon;Park, Seoyoon;Kang, Yejee;Kang, Hyerin;Kim, Hansaem
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.379-383
    • /
    • 2021
  • 감정 분석은 텍스트 데이터에서 인간이 느끼는 감정을 다양한 감정 유형으로 분류하는 것이다. 그러나 많은 연구에서 감정 분석은 긍정과 부정, 또는 중립의 극성을 분류하는 감성 분석의 개념과 혼용되고 있다. 본 연구에서는 텍스트에서 느껴지는 감정들을 다양한 감정 유형으로 분류한 감정 말뭉치를 구축하였는데, 감정 말뭉치를 구축하기 위해 심리학 모델을 기반으로 분류한 감정 어휘 사전을 사용하였다. 9가지 감정 유형으로 분류된 한국어 감정 어휘 사전을 바탕으로 한국어 영화 리뷰 말뭉치에 9가지 감정 유형의 감정을 태깅하여 감정 분석 말뭉치를 구축하고, KcBert에 학습시켰다. 긍정과 부정으로 분류된 데이터로 사전 학습된 KcBert에 9개의 유형으로 분류된 데이터를 학습시켜 기존 모델과 성능 비교를 한 결과, KcBert는 다중 분류 모델에서도 우수한 성능을 보였다.

  • PDF

An Effective Segmentation Scheme for Korean Sentence Classification tasks (한국어 문장 분류 태스크에서의 효과적 분절 전략)

  • Kim, Jin-Sung;Kim, Gyeong-Min;Son, Junyoung;Lim, Heuiseok
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.173-177
    • /
    • 2021
  • 분절을 통한 양질의 입력 자질을 구성하는 것은 언어모델의 문장에 대한 이해도를 높이기 위한 필수적인 단계이다. 분절은 문장의 의미를 이해하는 데 있어 중요한 역할을 하기 때문이다. 따라서, 한국어 문장 분류 태스크를 수행함에 있어 한국어의 특징에 맞는 분절 기법을 선택하는 것은 필수적이다. 명확한 판단 기준 마련을 위해, 우리는 한국어 문장 분류 태스크에서 가장 효과적인 분절 기법이 무엇인지 감성 분석, 자연어 추론, 텍스트 간 의미적 유사성 판단 태스크를 통해 검증한다. 이 때 비교할 분절 기법의 유형 분류 기준은 언어학적 단위에 따라 어절, 형태소, 음절, 자모 네 가지로 설정하며, 분절 기법 외의 다른 실험 환경들은 동일하게 설정하여 분절 기법이 문장 분류 성능에 미치는 영향만을 측정하도록 한다. 실험 결과에 따르면 자모 단위의 분절 기법을 적용한 모델이 평균적으로 가장 높은 성능을 보여주며, 반복 실험 간 편차가 적어 일관적인 성능 결과를 기록함을 확인할 수 있다.

  • PDF