• 제목/요약/키워드: 텍스트 정서 분류 방법

검색결과 9건 처리시간 0.031초

정서 차원 공간에서 소설의 지배 정서 분석 및 분류 (Analyzing and classifying emotional flow of story in emotion dimension space)

  • 이신영;함준석;고일주
    • 인지과학
    • /
    • 제22권3호
    • /
    • pp.299-326
    • /
    • 2011
  • 소설, 블로그, 채팅 메시지, 상품평 등의 텍스트는 전반적인 정서의 흐름을 가지고 있다. 텍스트 간의 정서 흐름의 유사도를 비교하면 유사한 정서 흐름을 갖는 텍스트를 분류할 수 있고, 상품 추천이나 의견 수집 등에 활용할 수 있다. 본 논문에서는 텍스트에서 정서 단어를 순차적으로 추출하고 쾌-불쾌, 활성화의 2차원으로 분석하여 텍스트의 정서 흐름을 파악하였다. 또한 텍스트의 순차적인 흐름을 시간 차원으로 설정하여 텍스트의 전반적인 정서 흐름인 '지배 정서(dominant emotion)'를 파악하기 위하여 쾌-불쾌, 활성화, 시간의 3차원 공간에서 정서 흐름을 탐색하였다. 또한 이 3차원 공간 안에서 유클리드 거리를 사용하여 지배 정서 흐름의 유사도를 계산함으로써 유사한 정서 흐름을 가지는 텍스트를 분류하는 방법을 제안하였다. 제안한 방법을 통해 한국 근대 단편 소설들을 분석하여 지배 정서를 분석하였고 유사한 지배 정서를 가지는 소설들을 분류하였다.

  • PDF

사용자의 정서 단어 분류에 기반한 정서 분류와 선택 방법 (A Classification and Selection Method of Emotion Based on Classifying Emotion Terms by Users)

  • 이신영;함준석;고일주
    • 감성과학
    • /
    • 제15권1호
    • /
    • pp.97-104
    • /
    • 2012
  • 최근에 사용자에 의한 대량의 텍스트 데이터가 발생하면서 사용자의 정보, 의견 등을 분석하는 오피니언 마이닝이 중요하게 부각되고 있다. 오피니언 마이닝 중 특히 정서 분석은 제품, 사회적 이슈, 정치인에 대한 호감 등에 대한 개인적 의견이나 정서를 분석하여 긍정, 부정이나 행복, 슬픔 등의 정서를 분석하는 연구 분야이다. 정서 분석을 위해서 정서 차원 이론의 정서가와 각성 차원의 2차원 공간을 사용하고, 이 공간에서 정서가 분포하는 영역을 설정하여 매핑하는 방법을 사용한다. 그러나 기존에는 정서의 분포 영역을 임의로 설정하는 문제가 있었다. 본 논문에서는 이 문제를 해결하기 위해, 한국어 정서 단어 목록을 사용해 사용자 설문을 실시하여 2차원 상에 12개 정서의 분포를 구성하였다. 또한 2차원 상의 특정 정서 상태가 여러 개의 정서에 중첩되는 경우, 정서에 소속될 확률을 사용한 룰렛휠 방법을 사용하여 하나의 정서를 선택하는 방법을 제안하였다. 제안한 방법을 사용하여 텍스트에서 정서 단어를 추출하여 텍스트를 정서로 분류할 수 있다.

  • PDF

A Text Sentiment Classification Method Based on LSTM-CNN

  • Wang, Guangxing;Shin, Seong-Yoon;Lee, Won Joo
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권12호
    • /
    • pp.1-7
    • /
    • 2019
  • 머신 러닝의 심층 개발로 딥 러닝 방법은 특히 CNN(Convolution Neural Network)에서 큰 진전을 이루었다. 전통적인 텍스트 정서 분류 방법과 비교할 때 딥 러닝 기반 CNN은 복잡한 다중 레이블 및 다중 분류 실험의 텍스트 분류 및 처리에서 크게 발전하였다. 그러나 텍스트 정서 분류를 위한 신경망에도 문제가 있다. 이 논문에서는 LSTM (Long-Short Term Memory network) 및 CNN 딥 러닝 방법에 기반 한 융합 모델을 제안하고, 다중 카테고리 뉴스 데이터 세트에 적용하여 좋은 결과를 얻었다. 실험에 따르면 딥 러닝을 기반으로 한 융합 모델이 텍스트 정서 분류의 예측성과 정확성을 크게 개선하였다. 본 논문에서 제안한 방법은 모델을 최적화하고 그 모델의 성능을 개선하는 중요한 방법이 될 것이다.

생성 AI 기반 감정 수레바퀴 모델을 활용한 사용자 리뷰 감정 분석 (Generative AI based Emotion Analysis of Consumer Reviews Using the Emotion Wheel)

  • 박유림;김현희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.1204-1205
    • /
    • 2023
  • 본 논문은 소비자의 리뷰 데이터를 기반으로 한 새로운 감성 분석 방법을 제안한다. 긍정, 부정, 중립으로 분류하는 전통적 감성 분석방법은 텍스트에 나타난 감정의 섬세한 차이를 파악하기 어렵다. 이에 본 연구에서는 GPT 모델을 사용하여 텍스트에서 사용자의 감정을 8 가지의 카테고리로 세분화한다. 부정적 정서를 가진 리뷰에서 분노, 혐오, 실망과 같은 구체적인 감정들을 직관적으로 파악할 수 있었고, 감정의 강도까지 파악할 수 있었다. 제안된 방법을 통해 기업은 고객의 요구 사항을 정확하게 인지할 수 있으며, 고객 맞춤형 서비스 개선에 기여할 수 있다는 점이 기대된다.

텍스트를 이미지화하기 위한 Interface 제작에 관한 연구 -작품 "Yesterday to Today"를 중심으로- (The Study of Making Interface for Text to Image)

  • 이우현;이성영;김규정
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 3부
    • /
    • pp.194-198
    • /
    • 2007
  • 본 연구의 주제는 텍스트를 어떻게 회화적이미지로 전환시킬 수 있을까?에 대한 것이다. 오늘날 디지털 환경 속에 있는 우리는 이미지 중심의 세계 속에 살고 있다. 과거 텍스트가 해왔던 정보의 생산과 전달 그리고 저장의 역할을 오늘날은 상당부분 이미지가 하게 되었다. 하지만 그럼에도 불구하고 아날로그 방식과 정서는 여전히 우리 곁에 남아있는 것도 사실이다. "Yesterday to Today"는 문자의 최소 단위인 알파벳을 통하여 이미지를 재현하려는 작품이다. 이 작품은 크게 두 가지 Idea로 이루어지는데 하나는 복수개의 실시간 영상 소스를 이용하여 이미지를 구성해내는 것과, 다른 하나는 텍스트에 의한 이미지의 변환이다. 복수개의 실시간 영상 소스는 프로그램이 작동하는 컴퓨터와 직/간접적으로 연결되어 전달되는데, 직접적으로 연결되어 근거리의 특정한 지점으로부터 영상 소스를 받을 수 있고, 또 하나의 방법은 인터넷을 통한하나 이상의 원거리 지점으로부터 보내어지는 영상을 조합하여 받을 수 있다. 프로그램 구현 개념은 픽셀 소스 카메라에서 캡쳐된 최초 이미지를 명도, 색상, 채도로 분류하고, 이것의 각각을 26개의 구간-자판의 개수에 의하여 정해짐-으로 나누고, 다시 그 각각의 구간을 26단계로 나눈다. 이렇게 나누어진 구간들은 알파벳과 1:1로 대응시켜 결과이미지의 해당 부분을 수치대로 재현하도록 프로그램 시킨다. 이미지의 부분들을 지정하기 위하여 특정한 텍스트로부터 알파벳의 빈도수를 조사했는데, 이 조사를 바탕으로 빈도수의 많고 적음에 따라 이미지부분들이 26개 구간으로 정해졌다. 이미지 재현 방법은 사용자가 모니터 위의 Result Image Cam을 통하여 얻고자 하는 이미지를 캡쳐한 후, 특정한 텍스트를 타이핑하면 이미지를 재현할 수 있는데, -입력된 텍스트의 알파벳은 프로그램이 지정한 HSI 컬러 모델의 영역과 1:1로 대응하게 하였다-이 이미지는 특정 장소에 실시간으로 받아진 영상을 데이터화 한 소스에 의하여 만들어진다. 이미지를 재현할 때 텍스트에 따라 알파벳 빈도수는 달라질 수 있으므로 비록 최초 이미지가 동일할지라도 얻고자하는 결과 이미지가 달라진다. 그러므로 사용자는다양한 창조적 경험을 할 수 있다.

  • PDF

텍스트마이닝 기법을 이용한 제 2형 당뇨환자 온라인 담론의 어휘 및 구문구조 분석 (Lexical and Phrasal Analysis of Online Discourse of Type 2 Diabetes Patients based on Text-Mining)

  • 황문현;박정식
    • 디지털융복합연구
    • /
    • 제12권6호
    • /
    • pp.655-667
    • /
    • 2014
  • 본 연구는 질병과 관련한 온라인 포럼에서 추출한 언어 데이터를 통해 제 2형 당뇨병 환자의 질병에 대한 담론을 양적으로 분석하였다. 또한 환자 언어행위의 양적분석을 통해 환자들의 주요 관심사와 심리적 특징의 일반화가 가능한지에 대해 실증적으로 검증하였다. 분석방법으로는 기존의 인터뷰에 기반한 정성적 연구방법론과 달리 환자들의 담론 표본 전체를 파싱 (parsing)과 POS 태깅을 통해 언어학적으로 형태소 분류를 하였다. 주요 어휘빈도 추출과 N-gram을 통한 최빈도 구문구조 분석을 병행하여, 질병과 관련한 이슈의 주요 범주와 심리상태에 관한 언어적인 특징을 살펴보았다. 연구 결과 환자들의 자발적 대화는 주로 다이어트, 운동, 증상, 약물치료, 심리상태의 5가지 범주로 나타나고 있음을 확인하였고, 최빈도 구문구조 분석을 통해 질병치료와 식생활습관 개선 전반에 대한 부정적인 견해가 두드러진 것을 확인하였다. 결과적으로 의료진의 정확한 정보 전달과 전문가의 조언, 정서적 지원 등이 당뇨환자에 대한 심리적 상태에 중요한 만큼 심리치료 서비스이 개선이 필요할 것으로 보인다. 이런한 결과는 기존의 의료제도 안에서의 환자의 관심사와 심리적 특징이 온라인 상에서도 적절하게 투영되고 있음을 시사한다.

Eye Tracker를 활용한 페이스북상에서 공감 정도가 사용자 시선에 미치는 영향 (The effect of Empathy in Eye vision to users in Facebook using an Eye Tracker)

  • 김수완;신동희
    • 디지털콘텐츠학회 논문지
    • /
    • 제15권3호
    • /
    • pp.387-393
    • /
    • 2014
  • 본 연구는 세계에서 가장 많은 사용자들이 사용하고 있는 소셜네트워크 서비스인 페이스북에 중점을 두고 연구를 진행하였다. 페이스북상에서 사용자들에게 보여지는 콘텐츠들이 이용자들 개개인의 정서에 따라 차이점이 있을 것이라는 의문을 시작으로 실제 '공감'이라는 감정에 초점을 두어 연구를 진행하였다. 이러한 공감적인 요소는 페이스북 상에서 노출되는 콘텐츠 내에 실제 어떠한 영향을 미치는지에 대해 텍스트 중심과 이미지 중심의 콘텐츠로 분류를 하였고, 사람의 시선 이동을 측정하는 안구추적기(Eye-Tracker)를 통하여 공감 정도에 따라 선호하는 콘텐츠와 그 영향력을 보다 과학적인 방법으로 접근하고자 하였다. 해당 연구를 통하여 실제 사용자들에게 노출되는 페이스북 콘텐츠의 공감 정도에 따른 더 효과적인 콘텐츠를 제공하고자 하며, 실제 이용자들의 시선과 공감여부를 측정하는 일반공감척도를 이용하여 앞서 수집한 Eye-Tracker자료와 비교분석 하고자 한다.

심리학적 언어분석 프로그램 개발을 위한 융합연구: 기존 프로그램의 비교와 관련 문헌의 동향 분석 (A Convergence Study for Development of Psychological Language Analysis Program: Comparison of Existing Programs and Trend Analysis of Related Literature)

  • 김영준;최원일;김태훈
    • 한국융합학회논문지
    • /
    • 제12권11호
    • /
    • pp.1-18
    • /
    • 2021
  • 내용어 기반 빈도 분석은 의도적 기만이나 반어적 표현에 분명한 한계가 있지만, 많이 사용되는 한국어 분석 프로그램인 KLIWC는 기능어 분석을, KrKwic는 동시출현빈도를 시각화하는 방법으로 발전했다. 하지만 개발된 지 십수 년이 지나 여러 문제점으로 개선이 필요한 상황이다. 그래서 KLIWC와 KrKwic를 분석하여 새 심리학적 언어분석 프로그램을 개발하고자 하였다. 첫째로 두 프로그램의 특징을 분석하였다. 특히, 기능어 분석기능 제고를 위해서 KLIWC와 한국어 형태소 분석기의 형태소 분류를 비교하였고, 심리적 분석의 강화를 위해 심리사전의 구조와 체계를 분석하였다. 분석 결과 한나눔 품사 분석기가 가장 세분화되었지만, 인칭대명사에서는 KLIWC가, 어미와 어말어미에서는 KKMA의 품사 분류가 더 세분화되어 있어, 기능어 분석 강화를 위해 여러 품사 분석기의 통합적 사용을 제안하였다. 둘째로 이 프로그램들로 텍스트를 분석한 연구들의 연구동향을 분석하였다. 분석 결과 두 프로그램이 복합학 분야 등 다양한 학술분야에서 사용되고 있었다. 특히 논문과 보고서의 분석에는 KrKwic가 많이 사용되었고, 글쓴이의 생각, 정서, 성격 비교 연구에는 KLIWC가 많이 사용되었다. 이 결과를 바탕으로 새로운 심리학적 언어분석 프로그램의 필요성과 개발 방향에 대해 제언하였다.

MZ세대에 대한 대중감성 연구: 소셜미디어(SNS) 감성 분석을 통해 (A Study on Popular Sentiment for Generation MZ: Through social media (SNS) sentiment analysis)

  • 안명숙
    • 문화기술의 융합
    • /
    • 제9권1호
    • /
    • pp.19-26
    • /
    • 2023
  • 본 연구에서는 소셜 미디어 빅데이터 감성분석 방법을 통해 'MZ세대'에 대한 대중 감성을 살펴보았다. 분석을 위해 소비자 계정 SNS 텍스트를 살펴보고 내용상 외부 감성과 MZ세대 본인들의 감성을 분류하여 긍정 및 부정 감성 요인들을 제시하였다. 이에 따른 결론은 'MZ세대' 관련하여 호감과 흥미의 긍정정서가 72.1%로, 부정적인 감성비율 27.9 % 보다 높았다. 긍정감성에서 기성세대들은 'MZ세대의 개성과 당당함에 대한 호감', '새로운 가치관을 가진 MZ세대에 대한 흥미'를 보였다. 이에 비해 MZ세대들은 '자신들의 당당함, 발랄함 및 개성 세대라는 점'과 '소소한 성장주의'에 대한 호감을 갖고 있다. MZ세대 외부의 부정감성은 'MZ세대의 결혼기피, 취업난, 빚투자 및 퇴사 트랜드에 대해 걱정', '꼰대 취급하는 MZ 세대 미움', 'MZ세대와 대화하기 힘듦'으로 나타났다. 한편, MZ세대 본인들이 느끼는 부정감성은 '일반화에 대한 거부감', '세대 및 젠더 갈등과 기성세대보다 심한 경쟁에 대한 거부감', '풍요로운 시대의 상대적 실패감', '예고된 기후재앙 속에서 살아야하는 슬픔'으로 나타났다. 따라서 기성세대는 MZ세대를 일반화하여 바라볼 것이 아니라 개인으로 보아야 하며, 세대간 이해와 공감으로 갈등을 완화해야한다. 세대 갈등, 젠더 갈등 및 환경문제 해결을 위한 공동체적인 고민의 필요성도 있다.