• 제목/요약/키워드: Sentiment Intensity

검색결과 11건 처리시간 0.024초

문장 감정 강도를 반영한 개선된 자질 가중치 기법 기반의 문서 감정 분류 시스템 (A Document Sentiment Classification System Based on the Feature Weighting Method Improved by Measuring Sentence Sentiment Intensity)

  • 황재원;고영중
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권6호
    • /
    • pp.491-497
    • /
    • 2009
  • 본 논문은 한국어 문서감정 분류에서 각 문장의 감정 정도의 차이를 고려하여 자질의 가중치를 계산하는 방법을 제안한다. 감정자질은 어휘 자원으로서 감정을 가지는 단어들의 집합이며, 학습데이터를 이용하여 이 감정자질의 카이제곱 통계량 값(${\chi}^2$ statistic)을 얻을 수 있다. 이렇게 얻어진 카이제곱 통계량 값으로 문서에서 출현한 각 문장의 감정강도를 수치화 할 수 있다. 각 문장의 감정강도는 문서에서 가장 강한 감정을 가진 문장에 근한 비율로 계산되며, 이 값을 TF-IDF 가중치 기법에 적용하여 최종적인 자질의 가중치를 결정하게 된다. 그리고 일반적으로 문서 분류에서 뛰어난 성능을 보여주는 지지벡터기계(Support Vector Machine)를 사용하여 기계학습을 수행한 후 성능을 평가한다. 성능평가에서 제안된 기법은 문장감정의 강도를 고려하지 않은 내용어(Content Word) 기반의 자질을 사용한 경우보다 약 2.0%의 성능향상을 얻었다.

감정 단어의 의미적 특성을 반영한 한국어 문서 감정분류 시스템 (A Korean Document Sentiment Classification System based on Semantic Properties of Sentiment Words)

  • 황재원;고영중
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권4호
    • /
    • pp.317-322
    • /
    • 2010
  • 본 논문은 감정단어(Sentiment Word)의 의미적 특성을 반영하여 한국어 문서 감정분류 시스템의 성능을 향상시킬 수 있는 방법을 제안한다. 감정단어는 감정을 가지는 단어를 의미하며, 감정단어들의 집합은 감정자질(Sentiment Feature)로써 감정분류를 위한 중요한 어휘 자원이다. 감정자질은 일반적으로 사용될 때와 특정 영역(Domain)에서 사용될 때에 그 감정 정도의 차이를 가진다. 감정자질이 일반적으로 사용될 때 그 감정 정도는 검색 엔진을 통해 얻을 수 있는 스니핏(Snippet)을 통해 추정할 수 있으며, 특정 영역에서 사용될 때의 감정 정도는 실험 말뭉치를 이용하여 추정할 수 있다. 이렇게 추정된 감정자질의 감정 정도 수치를 의미지향성이라고 하며, 문서내의 문장의 감정 강도를 추정하기 위해 이용된다. 문장의 감정 강도가 추정되면 문장 감정 강도를 감정자질의 가중치에 반영하게 된다. 본 논문은 지지 벡터 기계(Support Vector Machine)를 이용하여 일반적, 영역 의존적, 일반적/영역 의존적 의미지향성을 반영한 경우에 대해 성능을 평가한다. 평가 결과, 앞의 3가지 경우에 모두 성능 향상을 얻었으며 일반적/영역 의존적 의미지향성을 반영한 경우, 일반적인 정보 검색에서 사용하는 내용어(Content Word) 기반의 자질을 사용한 경우보다 3.1%의 성능 향상을 얻을 수 있었다.

심리학적 감정과 소셜 웹 자료를 이용한 감성의 실증적 분류 (Empirical Sentiment Classification Using Psychological Emotions and Social Web Data)

  • 장문수
    • 한국지능시스템학회논문지
    • /
    • 제22권5호
    • /
    • pp.563-569
    • /
    • 2012
  • 소셜 웹이 확산되면서 오피니언 마이닝 혹은 감성 분석 연구가 주목을 받고 있다. 감성 분석을 위해서는 감성을 판별하기 위한 감성자원이 제공되어야 한다. 기존 감성 분석에서는 감성의 극성에 대한 강도를 표현하는 방법으로 리소스를 구축하고 이를 통하여 의견의 극성을 결정하였다. 본 논문에서는 의견의 극성뿐만 아니라 긍/부정의 근거가 되는 감성의 카테고리를 구성하고자 한다. 본 논문에서는 합리적인 분류를 위하여 심리학적 감정들을 초기 감성으로 정의한다. 그리고 실제로 소셜 웹에서 사용되는 감성의 분포를 얻기 위하여 소셜 웹의 텍스트를 분석하여 감성 정보를 추출한다. 추출한 감성 정보를 이용하여 초기 감성들을 재분류함으로써 소셜 웹을 위한 감성 카테고리를 구성한다. 본 논문에서는 이 방법을 통하여 23개의 감성 카테고리를 제시한다.

Social Media Analytics to Understand the Construction Industry Sentiments

  • Shrestha, K. Joseph;Mani, Nirajan;Kisi, Krishna P.;Abdelaty, Ahmed
    • 국제학술발표논문집
    • /
    • The 9th International Conference on Construction Engineering and Project Management
    • /
    • pp.712-720
    • /
    • 2022
  • The use of social media to disseminate news and interact with project stakeholders is increasing over time in the construction industry. Such social media data can be analyzed to get useful insights of the industry such as demands of new housing construction and satisfaction of construction workers. However, there has been a limited attempts to analyze social media data related to the construction industry. The objective of this study is to collect and analyze construction related tweets to understand the overall sentiments of individuals and organizations about the construction industry. The study collected 87,244 tweets from April 6, 2020, to April 13, 2020, which had hashtags relevant to the construction industry. The tweets were then analyzed to evaluate its sentiments polarity (positive or negative) and sentiment intensity or scores (-1 to +1). Descriptive statistics were produced for the tweets and the sentiment scores were visualized in a scatterplot to show the trend of the sentiment scores over time. The results shows that the overall sentiment score of all the tweets was slightly positive (0.0365). Negative tweets were retweeted and marked as favorite by more users on average than the positive ones. More specifically, the tweets with negative sentiments were retweeted by 2,802 users on average compared to the tweets with positive sentiments (247 average retweet count). This study can potentially be expanded in the future to produce a real time indicator of the construction market industry such as the increased availability of construction jobs, improved wage rates, and recession.

  • PDF

SNS 기반 여론 감성 분석 (Sentiment Analysis for Public Opinion in the Social Network Service)

  • 하상현;노태협
    • 문화기술의 융합
    • /
    • 제6권1호
    • /
    • pp.111-120
    • /
    • 2020
  • 본 연구는 소셜네트워크서비스(SNS)상의 빅데이터를 이용한 텍스트 분석기법의 응용으로서 설문 조사 기반의 여론 조사 방법론과 달리 비정형적 언어 기반의 감성 여론 조사 방법론을 제안한다. 기존의 설문 기반 여론 분석모형에 대한 대안적 방법으로 주관성에 기초한 감성 분류 모형을 이용하였다. 이를 위하여, 제20대 국회의원 선거운동 기간 중 선거 관련 실시간 트위터 자료를 수집하여 속성 기반 감성 분석을 이용한 여론의 극성과 강도에 대한 실증 분석을 수행하였다. 개별 SNS에서 사용된 단어의 극성을 분류하기 위해 Lasso 및 Ridge 회귀 모형을 이용하여 극성에 영향력이 큰 변수를 추출하였다. 추출된 변수가 극성에 미치는 긍정 및 부정에 대한 영향을 구분하고, 영향력의 강도를 분석하였다. 대중들이 소셜네트워크상에서 표현한 내용을 바탕으로 한 여론에 대한 긍정 및 부정의 감성 분석을 통해 여론의 향방을 예측하고 극성분석 모형의 정확도를 측정하여, 여론 조사 분야에서 감성 분석 방법론의 적용가능성을 확인하였다.

포스트 코로나 뉴노멀에 대한 대중감성 연구: 소셜미디어(SNS) 빅데이터 분석을 통해 (Research on public sentiment of the post-corona new normal: Through social media (SNS) big data analysis)

  • 안명숙
    • 문화기술의 융합
    • /
    • 제8권2호
    • /
    • pp.209-215
    • /
    • 2022
  • 본 연구의 목적은 '포스트 코로나 뉴노멀'에 관한 소셜 미디어(social media) 빅데이터를 분석하여 한국사회에서 '포스트코로나 뉴노멀'에 대한 대중 인식을 감성 측면에서 살펴봄으로서 포스트 코로나 시대를 선제적으로 대처하기 위한 기초자료를 제공하는 것이다. 자료 수집 및 분석을 위하여 빅데이터 분석 프로그램인 '텍스톰' (textom)의 감성분석 프로그램을 활용하였다. 데이터 수집기간은 2020년 10월 5일부터 2021년 10월 5일까지 1년이고, 수집 채널은 다음(daum)과 네이버(naver)의 블로그, 카페, 트위터 및 페이스북으로 설정하였다. 이 채널에서 수집된 총 3,770개의수집텍스트를 편집, 정제한 원문데이터가 본 연구를 위해 사용되었다. 분석의 결과는 다음과 같다. 첫째, '포스트 코로나 뉴노멀'에 대해 호감과 흥미 감성이 가장 높다. 즉 일상 회복과 기술 성장 및 새로워진 미래에 대한 기대 등 낙관적 감성이 77.62%로 주도적임을 알 수 있다. 둘째, 슬픔과 거부감 같은 부정 감성은 전체의 22.38%이나, 감성의 강도는 23.91%로 비율보다 높아 이 부정 감성이 강렬하다는 것을 시사한다. 본 연구는 '포스트 코로나 뉴노멀'에 대한 빅데이터 분석을 통해서 대중의 긍정 및 부정감성의 세부 요인분석의 기여도가 있다.

한국 포털 사이트 검색강도가 주가 동조성 및 위험에 미치는 영향 (The Effect of Portal Search Intensity on Stock Price Synchronicity and Risk: Evidence from Korea)

  • 김민수;허몽하;권혁준
    • 한국전자거래학회지
    • /
    • 제25권4호
    • /
    • pp.125-141
    • /
    • 2020
  • 최근의 연구들에서는 투자자들의 관심이나 감정이 주식 거래행태와 주가 변동에 미치는 영향에 대한 분석들이 증가하고 있다. 본 연구에서는 투자자들의 관심과 감정을 측정하기 위해 한국의 네이버 검색지수를 이용하여, 포털 검색량과 검색의 변동성이 주가동조성 및 총위험, 체계적 위험에 미치는 영향을 분석하였다. 먼저 평균적인 검색량이 증가할수록 주가동조성은 증가하는 반면, 검색의 변동성은 주가동조성을 감소시키는 것을 관찰하였다. 다음으로 평균 검색량과 검색의 변동성은 모두 주식의 총위험과 체계적 위험을 증가시키는 것으로 나타났다. 이러한 결과는 주가를 변동시키는 사건이 발생할 경우에만 개인투자자들의 검색이 증가하기 때문인 것으로 해석된다. 이러한 결과는 포트폴리오 분석, 고정효과 회귀분석 및 동적 패널 모형에서 일관되게 관찰된다.

브랜드 개성 효과: 트위터 상의 브랜드 개성 전달이 온라인 커뮤니티 참여에 미치는 영향 (The Brand Personality Effect: Communicating Brand Personality on Twitter and its Influence on Online Community Engagement)

  • 루스 안젤리 크루즈;이홍주
    • 지능정보연구
    • /
    • 제20권1호
    • /
    • pp.67-101
    • /
    • 2014
  • 새로운 기술의 활용은 고객과의 관계를 맺기위한 기업들의 마케팅 전략을 변모시켜왔다. 새로운 기술 중에서 소셜 미디어는 기업들이 온라인 고객들에게 다가가기 위한 도구이며, 유명한 소셜 미디어 사이트 중의 하나는 마이크로 블로깅 플랫폼인 트위터이다. 매일 5억건이상의 트윗이 발생하기때문에 연구자들에게는 풍부한 데이터의 원천이며, 기업들에겐 매력적인 마케팅 채널이다. 그럼에도 불구하고 효과적인 트위터 활용전략을 수립하는 것이 어려우며, 이는 적절한 트위터 활용에 대한 이론적인 또는 실증적인 검증이 이루어지지 않았기 때문이다. 본 연구는 기업들이 마케팅 채널로서의 트위터를 어떻게 효과적으로 활용할 수 있는지에 대한 실증적인 근거를 브랜드 개성과 브랜드 관여를 중심으로 연구하여 제공하고자 한다. 본 연구는 Aaker의 브랜드 개성에 대한 연구에서 제시한 브랜드 개성 척도를 활용하여 트위터 메시지가 브랜드 개성을 띄고 있는지와 이에 따른 고객들의 참여와 반응을 분석하고자 한다. 또한, 제품의 관여도에 따라서 조절효과가 존재하는지도 분석하였다. 23개 브랜드의 8주간의 트위터 계정의 포스팅을 수집하였으며, 오피니언 마이닝을 통하여 연구 가설을 검증하였다. 구체적인 본 연구의 목적은 첫째로 마케팅 연구에서 제시된 브랜드 개성의 개념이 소셜 미디어인 트위터에도 적용이 가능한지 분석하는 것이다. 둘째는 오프라인 브랜드 개성과 온라인 브랜드 개성간의 일치여부와 소셜 미디어 브랜드 커뮤니티의 활성화간의 관계를 밝히고자 한다. 마지막으로, 제품의 관여도에 따라 온라인/오프라인 브랜드 개성의 일치도가 조절효과를 갖는지를 분석하고자 한다.

텍스트마이닝 기반의 효율적인 장소 브랜드 이미지 강도 측정 방법 (An Efficient Estimation of Place Brand Image Power Based on Text Mining Technology)

  • 최석재;전종식;비스워스 수브르더;권오병
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.113-129
    • /
    • 2015
  • 장소 브랜딩은 특정 장소에 대한 의미 부여를 통해 장소성의 정체성 및 공동가치를 생성하며 가치 창출을 하는데 중요한 활동이며, 장소 브랜드에 대한 이미지 파악을 통해 이루어진다. 이에 마케팅, 건축학, 도시건설학 등 여러 분야에서는 인상적인 장소 브랜드의 이미지를 구축하기 위하여 많은 노력을 기울이고 있다. 하지만 설문조사를 포함한 대면조사 방법은 대부분 주관적인 작업이며 측정에 많은 인력 또는 고도의 전문 인력이 소요되어 고비용을 발생시키므로 보다 객관적이면서도 비용효과적인 브랜드 이미지 조사 방법이 필요하다. 이에 본 논문은 텍스트마이닝을 통하여 장소 브랜드의 이미지 강도를 객관적이고 저비용으로 얻는 방법을 찾는 것을 목적으로 한다. 제안하는 방법은 장소 브랜드 이미지를 구성하고 있는 요인과 그 키워드들을 관련 웹문서에서 추출하며, 추출된 정보를 통해 특정 장소의 브랜드 이미지 강도를 측정하는 방법이다. 성능은 안홀트 방법에서 평가에 사용하는 전세계 50개 도시 이미지 인덱스 순위와의 일치도로 검증하였다. 성능 비교를 위해 임의로 순위를 매기는 방법, 안홀트의 설문방식대로 일반인이 평가하는 방법, 본 논문의 방법을 사용하되 안홀트의 방법으로 학습한 것으로 유의한 것으로 추정되는 평가 항목만을 반영하는 방법과 비교하였다. 그 결과 제안된 방법론은 정확성, 비용효율성, 적시성, 확장성, 그리고 신뢰성 측면에서 우수함을 보일 수 있었다. 따라서 본 연구에서 제안한 방법론은 안홀트 방식에 상호 보완적으로 사용될 수 있을 것이다. 향후에는 장소 브랜드 이미지를 형성하는 속성 별로 등장횟수를 계산 한 후에 장소 브랜드에 대한 태도, 연상, 그리고 브랜드 자산과의 인과관계를 자동으로 파악할 수 있는 부분까지 구현하고 실증적 실험을 할 예정이다.

텍스트 마이닝을 활용한 Youtube 광고에 대한 소비자 인식 분석 (A Study on Analysis of consumer perception of YouTube advertising using text mining)

  • 엄성원
    • 경영과정보연구
    • /
    • 제39권2호
    • /
    • pp.181-193
    • /
    • 2020
  • 본 연구는 최근에 이슈가 되고 있는 텍스트마이닝을 활용하여 소비자 인식을 분석한 연구이다. 이를 위해 삼성갤럭시 Youtube 광고에 대한 소비자 리뷰 분석을 통해 소비자들이 가지고 있는 삼성 갤럭시에 대한 인식을 분석하였다. 분석을 위해 Youtube 광고의 소비자 리뷰 1,819개를 추출하였다. 이를 데이터 전처리 과정을 거쳐 광고와 관련된 키워드를 명사, 형용사, 부사로 분류하여 추출하였다. 이후 빈도 분석 및 감성 분석을 실시하였으며 마지막으로 구조적 등위성 분석을 통한 군집화를 실시하였다. 본 연구 결과를 간략히 요약하면 다음과 같다. 첫 번째 가장 많이 언급된 단어는 갤럭시 노트(n=217), 좋음(n=135), 펜(n=40), 기능(n=29) 등으로 나타났다. 이는 소비자들이 광고를 통해 "갤럭시 노트", "좋음", "펜", "기능"은 삼성 핸드폰 제품에 대해 기능적인 면이 좋고, 노트 펜에 대해서 긍정적으로 높게 인식한다고 판단할 수 있다. 추가적으로 "삼성페이", "혁신", "디자인", "아이폰" 등에 대한 인식은 삼성 핸드폰에 대해 혁신적인 디자인과 삼성페이의 기능적인 면에서 상당히 좋은 평가를 하는 것을 알 수 있다. 두 번째, Youtube 광고에 대한 감성분석 결과이다. 감성 분석 결과 감성강도 비율이 긍정(75.95%)로 부정(24.05%)보다 높게 나타났다. 이는 소비자들이 삼성 갤럭시 모바일폰에 대해 긍정적으로 인식하고 있음을 의미한다. 감성 키워드 분석 결과 긍정키워드의 경우는 "좋다", "후하다", "혁신적", "최고다", "빠르다", "예쁘다" 등으로 나타났으며, 부정키워드의 경우는 "겁난다", "울고싶다", "불편", "아쉽다", "싫다" 등이 추출되었다. 본 연구이 시사점은 기존 광고에 대한 소비자 인식 연구를 살펴보면 대부분 정량적 분석 방법에 의한 연구가 대부분이었다. 본 연구에서는 광고에 대한 정량적 연구 방법에서 탈피하여 정성적 연구를 통해 소비자 인식분석을 시도하였다. 이는 향후 연구에도 많은 영향을 미칠 것으로 판단되며, 정성적 연구를 통해 소비자 인식 연구의 출발점이 될 것으로 확신한다.