• 제목/요약/키워드: 감정어휘 사전

검색결과 29건 처리시간 0.021초

딥러닝 모델(BERT)과 감정 어휘 사전을 결합한 음원 가사 감정 분석 (Analysis of Emotions in Lyrics by Combining Deep Learning BERT and Emotional Lexicon)

  • 윤경섭;오종민
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.471-474
    • /
    • 2022
  • 음원 스트리밍 서비스 시장은 지속해서 성장해왔다. 그중 최근에 가장 성장세가 돋보이는 서비스는 Spotify와 Youtube music이다. 두 서비스의 추천시스템은 사용자가 좋아할 만한 음악을 계속해서 추천해 줌으로써 많은 사랑을 받고 있다. 추천시스템 성능은 추천에 활용할 수 있는 변수(Feature) 수에 비례한다고 볼 수 있다. 최대한 많은 정보를 알아야 사용자가 원하는 추천이 가능하기 때문이다. 본 논문에서는 기존에 존재하는 감정분류 방법론인 사전기반과 딥러닝 BERT를 사용한 머신기반 방법론을 적절하게 결합하여 장점을 유지하면서 단점을 보완한 하이브리드 감정 분석 모델을 제안함으로써 가사에서 느껴지는 감정 비율을 분석한다. 감정 비율을 음원 가중치 변수로 사용하면 감정 정보를 포함한 고도화된 추천을 기대할 수 있다.

  • PDF

사전 학습 언어 모델을 활용한 감정 말뭉치 구축 연구 (A Study on the Construction of an Emotion Corpus Using a Pre-trained Language Model )

  • 장연지 ;비립 ;강예지 ;강혜린 ;박서윤 ;김한샘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.238-244
    • /
    • 2022
  • 감정 분석은 텍스트에 표현된 인간의 감정을 인식하여 다양한 감정 유형으로 분류하는 것이다. 섬세한 인간의 감정을 보다 정확히 분류하기 위해서는 감정 유형의 분류가 무엇보다 중요하다. 본 연구에서는 사전 학습 언어 모델을 활용하여 우리말샘의 감정 어휘와 용례를 바탕으로 기쁨, 슬픔, 공포, 분노, 혐오, 놀람, 흥미, 지루함, 통증의 감정 유형으로 분류된 감정 말뭉치를 구축하였다. 감정 말뭉치를 구축한 후 성능 평가를 위해 대표적인 트랜스포머 기반 사전 학습 모델 중 RoBERTa, MultiDistilBert, MultiBert, KcBert, KcELECTRA. KoELECTRA를 활용하여 보다 넓은 범위에서 객관적으로 모델 간의 성능을 평가하고 각 감정 유형별 정확도를 바탕으로 감정 유형의 특성을 알아보았다. 그 결과 각 모델의 학습 구조가 다중 분류 말뭉치에 어떤 영향을 주는지 구체적으로 파악할 수 있었으며, ELECTRA가 상대적으로 우수한 성능을 보여주고 있음을 확인하였다. 또한 감정 유형별 성능을 비교를 통해 다양한 감정 유형 중 기쁨, 슬픔, 공포에 대한 성능이 우수하다는 것을 알 수 있었다.

  • PDF

영화의 흥행 성과와 리뷰 감정어휘와의 관계 분석 (Relationship Analysis between the Box Office Performance and Sentimental Words in Movie Review)

  • 문성민;하효지;이경원
    • 디자인융복합연구
    • /
    • 제14권4호
    • /
    • pp.1-16
    • /
    • 2015
  • 본 연구는 영화 리뷰 값이 1000개 이상인 673개의 영화를 대상으로 영화 장르별로 관객들이 느끼는 감정 어휘의 분포를 탐색하고 영화 흥행도와 감정 어휘의 관계를 파악하는데 목적이 있다. 분석을 위해 네이버 영화 리뷰를 크롤링하고 감정 어휘 사전을 활용하여 7개의 대표 감정 어휘, 영화 티켓 판매액, 영화 관람 관객 수, 상영 스크린 수, 한 스크린 당 영화 관람 관객 수, 영화의 장르, 영화의 영문 이름으로 구성된 데이터를 생성하였다. 연구 목적을 위한 분석은 상관관계 분석 방법과 Parallel coordinates 시각화 분석 방법을 사용하였다. 연구 결과로는 첫째, 장르에 따른 영화 흥행도를 분석하여 영화 흥행도가 가장 높은 장르는 코미디이고 가장 낮은 장르는 호러라는 결과를 확인하였다. 둘째, 모든 장르에서 'Happy'와 'Surprise'의 값이 높게 나오지만 다른 장르들에 비해 판타지 장르의 영화는 지루한 감정이 많이 느껴지고, SF장르의 영화는 화나는 감정이 많이 느껴진다는 결과를 확인 하였다. 셋째, 모든 장르의 감정 어휘 별 상관관계를 분석하여 Disgust'의 값이 높아질 때 'Anger'의 값도 높아지고, 'Happy'의 값이 높아질 때 'Surprise'의 값은 낮아진다라는 결과를 확인하였다. 넷째, 영화 흥행도에 따른 감정 어휘를 분석하여 영화 흥행도와 'Happy'는 선형 관계이지만 영화 흥행도와 'Fear'는 비선형 관계인 것을 확인 하였다.

소설 『こころ』에 나타난 감정표현 '포(怖)'에 관한 번역 양상 - 한국어 번역 작품과 영어 번역 작품을 중심으로 - (A study about the aspect of translation on 'Hu(怖)' in novel 『Kokoro』 - Focusing on novels translated in Korean and English -)

  • 양정순
    • 비교문화연구
    • /
    • 제53권
    • /
    • pp.131-161
    • /
    • 2018
  • 감정표현은 마음 의식의 내적 정태를 나타내는 것으로, 그 종류에는 '감정표현어휘', '고백표현', '문 구성', '간투사 표현', '사역 수동 수수 표현', '조사' '호칭', '문체 선택' 등이 제시되고 있다. 본고는 이러한 감정표현 가운데서 감정을 묘사하는 어휘를 중심으로, "こころ"에 나타난 '포(怖)'의 감정표현의 번역 양상을 '품사' '주어처리' '의미 분류'로 나누어 분석했다. 그 결과 '포(怖)'에 관한 번역 양상을 보면, 사전에 제시된 지시적 표현 이외에, '포(怖)'의 의미가 아닌 다른 표현, 다른 품사로도 번역되었음을 알 수 있었다. 일본어 문에서 사용된 '포(怖)'의 감정 어휘에 대해, 한국어역은 일부 '명사', '관용구', '부사+동사'를 제외하고는 대체로 일본어와 유사한 품사로 번역되었다. '명사'인 경우는 용언으로 풀어 설명한 후 강조 어휘를 더해 번역했으며, '부사+동사'는 2개 이상의 어휘가 이용된 어구로 번역되기도 했다. 상황에 따라 번역 어휘는 'Fear류(類)' 뿐 아니라 'Surprise류(類)'와 'Sadness류(類)'의 어휘까지도 다양하게 사용되었다. 영어 역의 경우, 한국어 역에서 보였던 것과 다른 양상을 보였다. 주로 '동사⇨동사, be+동사의 과거분사', '형용사⇨형용사, 동사, be+동사의 과거분사' '명사⇨be+동사의 과거분사'로 번역되었으며, 'Surprise류(類)', 'Anger류(類)', 'Fear류(類)' 등의 감정을 표현하는 어휘 외에 감정 주체의 상태를 표현할 수 있는 어휘까지 이용되는 등 매우 다양했다. 일본어 문의 감정 주체의 유무에 따른 한국어 역은 대체로 일본어 문과 유사한 문 구조로 번역되었고, 감정 주체가 생략된 3인칭인 일부 예에서는 생략된 요소가 복원 가능하도록 유도한 번역이 보였다. 영어 역을 보면, 일본어 문의 감정 주체의 생략 유무와 관계없이 감정 주체와 판단 주체까지도 복원했으며, 서술자 중심의 주어를 내세워 그에 따른 서술어를 선정해 번역하기도 했다. 그러나 주어 자리에는 반드시 감정을 느끼는 사람만 사용된 것이 아니라 사건, 행위, 감정의 요인 등이 사용되기도 했으며, 화자가 화자의 감정을 직접적으로 서술하기 보다는 주변 상황과 장면을 설명하면서 그로 인해 일어나는 감정을 서술한 경우도 있었다.

결합가 이론에 의한 독일어 감정동사 연구 (Valenztheoretische Untersuchung der deutschen Emotionsverben)

  • 김수남
    • 한국독어학회지:독어학
    • /
    • 제6집
    • /
    • pp.23-55
    • /
    • 2002
  • 이 논문의 목적은 수없이 많은 독일어 동사들 가운데 사람의 심리-감정을 표현하는 동사, 소위 감정동사(Emotionsverben: Verben der Gefuhlsbewegung)를 하나의 어휘-의미장(lexikalisch-semantisches Feld)으로 보고 이들의 통사구조 및 의미구조를 파악하여 결합가 모형화 하는 것이다. 우리는 감정동사의 통사 구조 및 의미구조를 기술하기 위해 동사 중심의 결합가 이론과 격이론을 이론적$\cdot$방법론적 토대로 삼았다. 또한 우리는 감정동사를 보충어의 수와 형태에 따라 크게 세 가지 그룹, 즉 2개의 보충어를 갖는 그룹 I(이 그룹에 속하는 동사들은 무생물(사물)을 주어로 갖는다)과 그룹 II(이 그룹에 속하는 동사들은 유생물(사람)을 주어로 갖는다) 그리고 3개의 보충어를 갖는 그룹 III(사람과 사람간의 관계를 나타낸다)으로 구분하였다. 예증을 위해 개별 동사에 대해 용례를 제시했다. 2개의 보충어를 갖는 그룹 II를 보충어의 수의성 여부에 따라 하위 분류했다. 보충어의 형태는 명사구(Sn, Sd, Sa, Sa)와 전치사구(pS)에 한정했으며 - 지면관계상 개별 동사의 예문으로 제시하진 않았지만 - 문장형태의 보충어, 예를 들어 dass-문장(Nsdass)과 부정사문(Inf)도 고려하여 통사적 문형(syntaktisches Satzmodell)과 의미적문형(semantisches Satzmodell)에서 제시하였다. 결국 이 논문은 독일어를 배우는 이들에게 독일어 동사의 통사구조 및 의미구조를 보다 쉽게 설명할 수 있는 하나의 방법론을 제시함은 물론, 나아가서는 결합가 사전에서 동사 내항 기술을 위한 기본적인 토대를 제공할 것이다

  • PDF

주관적 웰빙 상태 측정을 위한 비정형 데이터의 상황기반 긍부정성 분석 방법 (Analyzing Contextual Polarity of Unstructured Data for Measuring Subjective Well-Being)

  • 최석재;송영은;권오병
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.83-105
    • /
    • 2016
  • 의료IT 서비스의 유망 분야인 정신건강 증진을 위한 주관적 웰빙 서비스(subjective well-being service) 구현의 핵심은 개인의 주관적 웰빙 상태를 정확하고 무구속적이며 비용 효율적으로 측정하는 것인데 이를 위해 보편적으로 사용되는 설문지에 의한 자기보고나 신체부착형 센서 기반의 측정 방법론은 정확성은 뛰어나나 비용효율성과 무구속성에 취약하다. 비용효율성과 무구속성을 보강하기 위한 온라인 텍스트 기반의 측정 방법은 사전에 준비된 감정어 어휘만을 사용함으로써 상황에 따라 감정어로 볼 수 있는 이른바 상황적 긍부정성(contextual polarity)을 고려하지 못하여 측정 정확도가 낮다. 한편 기존의 상황적 긍부정성을 활용한 감성분석으로는 주관적 웰빙 상태인 맥락에서의 감성분석을 할 수 있는 감정어휘사전이나 온톨로지가 구축되어 있지 않다. 더구나 온톨로지 구축도 매우 노력이 소요되는 작업이다. 따라서 본 연구의 목적은 온라인상에 사용자의 의견이 표출된 비정형 텍스트로부터 주관적 웰빙과 관련한 상황감정어를 추출하고, 이를 근거로 상황적 긍부정성 파악의 정확도를 개선하는 방법을 제안하는 것이다. 기본 절차는 다음과 같다. 먼저 일반 감정어휘사전을 준비한다. 본 연구에서는 가장 대표적인 디지털 감정어휘사전인 SentiWordNet을 사용하였다. 둘째, 정신건강지수를 동적으로 추정하는데 필요한 비정형 자료인 Corpora를 온라인 서베이로 확보하였다. 셋째, Corpora로부터 세 가지 종류의 자원을 확보하였다. 넷째, 자원을 입력변수로 하고 특정 정신건강 상태의 지수값을 종속변수로 하는 추론 모형을 구축하고 추론 규칙을 추출하였다. 마지막으로, 추론 규칙으로 정신건강 상태를 추론하였다. 본 연구는 감정을 분석함에 있어, 기존의 연구들과 달리 상황적 감정어를 적용하여 특정 도메인에 따라 다양한 감정 어휘를 파악할 수 있다는 점에서 독창성이 있다.

질의 기반 사용자 감정상태 예측 (Query-based User Emotion Prediction)

  • 민혜진;강인호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.211-214
    • /
    • 2014
  • 본 연구에서는 질의를 기반으로 사용자의 감정상태를 예측하는 방법을 제안한다. 제안방법은 자극-감정 규칙베이스 구축, 규칙확률 값 기반 질의 랭킹, 질의 랭킹 기반 사용자 감정예측의 단계로 구성된다. 방법의 적절성을 검증하기 위하여 힘들다와 심심하다에 대한 결과로 사용자평가를 실시하였다. 힘들다의 결과에서는 힘들다 정도에 대한 점수가 높은 질의들을 지속적으로 검색하는 사용자들을 힘들다라고 판단할 수 있다고 분석되었다. 심심하다의 결과에서는 방법 간 유의미한 차이를 보이지 않았으나, 특정 개별질의의 지속적인 패턴을 분석하는 것이 좀 더 높은 점수를 얻은 것으로 평가되었다.

  • PDF

소설 『こころ』에 나타난 감정표현 '경(驚)'에 관한 번역 양상 - 한국어 번역 작품과 영어 번역 작품을 중심으로 - (A study about the aspect of translation on 'Kyo(驚)' in novel 『Kokoro』 -Focusing on novels translated in Korean and English)

  • 양정순
    • 비교문화연구
    • /
    • 제51권
    • /
    • pp.329-356
    • /
    • 2018
  • 감정표현의 종류에는 감정을 묘사하는 어휘, 감탄문 수사의문 등의 감정표현을 위한 문 구성, 간투사 표현, 발상태도의 부사, 문체 등이 제시되고 있다. 본고는 이러한 감정표현 가운데서 감정을 묘사하는 어휘를 중심으로, "こころ"에 나타난 '경(驚)'의 감정 표현의 번역 양상을 분석했다. 그 결과 '경(驚)'에 관한 번역 양상을 보면 사전에 제시한 대로의 어휘로 번역되는 경우도 있었지만 꼭 그렇지만은 아니라는 것을 알 수 있었다. 일본어 문에서 사용된 '경(驚)'의 감정 어휘에 대해, 한국어 역에서는 대체로 '동사⇨동사, 형용사', '부사+동사⇨동사' '부사⇨부사'로 번역되었지만, 감정표현을 강조하기 위해 다른 어휘가 더해진 경우가 있었다. 일부 '명사'는 용언을 이용해 번역되기도 했다. 상황에 따라 번역어휘는 'Surprise류(類)' 뿐 아니라 'Fear류(類)'과 'Sadness류(類)'의 어휘까지도 다양하게 사용되었다. 영어 역의 경우, 한국어 역에서 보였던 것과 다른 양상을 보였다. 주로 '동사⇨be+동사의 과거분사', '부사+동사⇨be+동사의 과거분사' '부사⇨be+동사의 과거분사'로 번역되었으며, 'Surprise류(類)', 'Fear류(類)' 등의 감정을 표현하는 동사 외에 감정 주체의 상태를 대체 표현할 수 있는 동사로 까지도 이용되는 등 매우 다양했다. 문중에 감정주체가 있는 경우의 한국어 역은 대체로 일본어 문과 일 대 일 대응 방식을 보였다. 문중에 감정주체가 없는 경우도 유사한 성향을 보이면서도, 3인칭인 경우에는 생략된 요소가 복원 가능하도록 유도한 번역이 보였다. 영어 역을 보면, 문중에 감정주체가 있는 경우에서만 아니라, 문중에 감정주체가 없는 경우도 생략된 감정주체 및 이를 판단하는 판단주체까지도 복원시켜 번역했다. 일본어와 한국어와 달리 주어는 감정을 느끼는 사람만 온 것이 아니라, 사건, 행위, 감정을 일으키는 원인이 제시되기도 했다.

감정 자질을 이용한 한국어 문장 및 문서 감정 분류 시스템 (A Korean Sentence and Document Sentiment Classification System Using Sentiment Features)

  • 황재원;고영중
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권3호
    • /
    • pp.336-340
    • /
    • 2008
  • 최근 감정 분류에 대한 관심이 높아져 연구가 활발히 진행되고 있다. 문서 전체에 관한 감정의 분류도 중요하지만, 문서를 이루고 있는 문장에 관한 분류도 점차 그 필요성이 높아지고 있다. 본 논문에서는 한국어 감정 분류 시스템 구축을 위해서 추출된 한국어 감정 자질을 이용한 한국어 문장 및 문서 감정 분류에 관해 연구한다. 한국어 감정 분류의 시작은 감정을 내포한 대표적인 어휘로부터 시작하며, 이와 같은 감정 자질들은 문장 및 문서의 감정을 분류하는데 결정적인 관여를 한다. 한국어 감정 자질의 추출을 위하여 영어 단어 시소러스 정보를 이용하여 자질들을 확장하고, 영한사전을 통해 확장된 자질들을 번역함으로써 감정 자질들을 추출하였다. 추출된 감정 자질들을 사용하여, 단어 벡터로 표현된 입력문서를 이진 분류기인 지지벡터 기계(SVM: Support Vector Machine)를 이용하여 문장과 문서에 내포된 감정을 판단하고 평가하였다.

웰니스워드넷: 비정형데이터와 상황적 긍부정성에 기반하여 주관적 웰빙 상태를 무구속적으로 모니터링하기 위한 워드넷 개발 (WellnessWordNet: A Word Net for Unconstrained Subjective Well-Being Monitor ing Based on Unstructured Data and Contextual Polarity)

  • 송영은;남수현;권오병
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.1-21
    • /
    • 2016
  • 주관적 웰빙 서비스(subjective well-being service)는 Wellness IT의 주요 서비스이며 개인의 주관적 웰빙 상태를 무구속적이고 비용 효율적으로 측정하는 방법이 중요하다. 이를 위해 감성어휘사전을 활용할 수 있으나 감성어만으로 주관적 웰빙 상태를 측정할 수는 없으며 웰니스 어휘 사전이 별도로 구축될 필요가 있다. 더욱이 기존의 감성어휘사전은 동일한 감정어에 대해 한가지만의 감성값을 제공함으로써 그 용어를 사용한 사람의 특징에 따라 감성값이 변경될 수 있다는 점을 간과하고 있다. 따라서 본 연구의 목적은 현존하는 감성어휘사전 중에서 표현력이 가장 뛰어난 SenticNet을 기반으로 하여 SenticNet에서 제공하는 정보를 통해 스트레스, 우울, 분노, 행복감 등 웰니스 상태를 추정한 결과를 추가한 WellnessWordNet 을 개발하는 것이다. 또한 실제 사람들을 대상으로 WellnessWordNet 에 근거한 웰니스 상태 추정 정확도를 검증해 보았다. 본 논문의 독창성은 WellnessWordNet 웰니스 상태 언어에 대한 값을 제공할 뿐더러, 성별이나 연령과 같은 사람의 특성에 따라 다른 감성값을 제공하는 최초의 감성어휘사전이라는 것이다.