• 제목/요약/키워드: Sentiment word analysis

검색결과 123건 처리시간 0.021초

소셜미디어를 통한 우울 경향 이용자 담론 주제 분석 (An Analysis of the Discourse Topics of Users who Exhibit Symptoms of Depression on Social Media)

  • 서하림;송민
    • 정보관리학회지
    • /
    • 제36권4호
    • /
    • pp.207-226
    • /
    • 2019
  • 우울증은 전 세계적으로 많은 사람들이 겪고 있으며, 최근 다양한 분야에서 꾸준히 우울증에 대한 연구가 수행되고 있다. 특히 사람들이 본인의 스트레스나 감정 상태에 대해 소셜미디어에 공유한 글을 통해 그들의 심리나 정신건강에 대해 파악해보고자 하는 맥락에서 소셜미디어를 활용한 연구 역시 유의미하게 받아들여지고 있다. 이에 본 연구에서는 우울 경향의 이용자와 그렇지 않은 이용자들의 2016년부터 2019년 2월까지의 트위터 데이터를 수집하여 어떤 주제적, 어휘 사용의 특성을 보이는지 보고자 하였으며, 우울 경향의 시기별로도 어떤 차이를 보이는지 살펴보기 위해 우울 경향 관측 날짜를 기준으로 하여 이전(before) 시기와 이후(after) 시기를 구분하여 실험을 수행하였다. 토픽모델링, 동시출현 단어분석, 감성분석 방법을 통해 우울 경향과 비(非)우울 경향 이용자의 텍스트의 주제적 차이를 살펴보았고, 감성 반응에 따라 사용한 어휘에 대해서도 살펴봄으로써 어떠한 특성이 있는지 확인해 보았다. 데이터 수집 단계에서 '우울' 표현을 포함한 텍스트 데이터 수집방법을 통해 비교적 긴 기간, 많은 양의 데이터를 수집할 수 있었고, 또한 우울 경향의 여부와 시기적 구분에 따른 관심 주제에 대한 차이도 확인할 수 있었다는 점에서 유의미하다고 볼 수 있다.

개미 군집 최적화 알고리즘과 센티워드넷을 이용한 사용자 감성 동향 분석 방법 연구 (A Study on Sentiment Trend Analysis Method Using Ant Colony Optimization Algorithm and SentiWordNet)

  • 권경락;강대현;최수봉;박한샘;정인정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.948-951
    • /
    • 2014
  • 본 논문에서는 개미 군집 최적화 알고리즘과 센티워드넷(SentiWordNet)을 이용한 감성 분석 방법을 제안한다. 먼저, 데이터 수집 단계에서는 소설 웹(예: 페이스북)으로부터 주어 (subject), 서술어(predicate), 목적어(object)의 3 개의 요소로 구성된 RDF (Resource Description Framework)의 형태로 데이터를 수집한다. 그리고 개미 군집 최적화 알고리즘을 이용하여 수집된 RDF 튜플(tuple)을 수치화한 후, 사용자의 감성에 대하여 제안한 수식을 이용하여 페르몬(pheromone)을 계산한다. 센티워드넷을 통하여 얻은 감성 지수를 반영하여 이전 단계에서 계산된 여러 개의 페르몬 값에 대한 전체 감성 지수를 계산한다. 제안한 방법의 타당성 검증을 위하여 전체 감성 지수를 바탕으로 계산된 사용자의 감성 동향이 적절하게 분석됨을 사용자의 실제 생활과의 비교를 통하여 보인다.

화장품 회사의 빅데이터분석을 통한 브랜드컨셉 개발 사례분석 (A Case Study on the Development of New Brand Concept through Big Data Analysis for A Cosmetics Company)

  • 이주민;방정혜
    • 지식경영연구
    • /
    • 제21권3호
    • /
    • pp.215-228
    • /
    • 2020
  • 본 연구는 경쟁이 심한 화장품 시장에 새롭게 뛰어들어 빅데이터 분석을 활용하여 브랜드 컨셉을 개발한 기업의 사례를 소개하고 있다. 안티에이징 관련 좋은 원재료 기술을 보유한 스킨리버스랩은 기능성화장품 시장에 새롭게 브랜드를 출시하였다. SNS 데이터를 화장품에 대한 소비자 태도, 기능성화장품에 대한 소비자 태도, 기능성화장품의 대표 경쟁사 분석, 소비자의 제품 사용 경험 등의 4가지 측면에서 분석하여 로지컬리스킨이라는 매력적인 브랜드 컨셉을 개발하였다. AI 기반 빅데이터 분석 툴인 루미노소를 이용하여 맥락 기반의 감성분석, 연관어 분석, 워드클라우드 분석 등을 통해 소비자에 대한 인사이트를 도출하였다. 로지컬리스킨은 유명잡지나 앱에서 다수의 상을 수상하며 글로벌 트랜드 기준에 부합한 제품으로 인정을 받았고, 미국, 홍콩을 포함한 6개 국가에 진출하였다. 로지컬리스킨 사례는 외부 데이터 만으로 소비자 인사이트를 도출하여 신생 기업이 신규 브랜드로 시장에 진출한 사례이며, AI 기반 감성 분석을 적용한 사례로서 의의가 있다.

Safeguarding Korean Export Trade through Social Media-Driven Risk Identification and Characterization

  • Sithipolvanichgul, Juthamon;Abrahams, Alan S.;Goldberg, David M.;Zaman, Nohel;Baghersad, Milad;Nasri, Leila;Ractham, Peter
    • Journal of Korea Trade
    • /
    • 제24권8호
    • /
    • pp.39-62
    • /
    • 2020
  • Purpose - Korean exports account for a vast proportion of Korean GDP, and large volumes of Korean products are sold in the United States. Identifying and characterizing actual and potential product hazards related to Korean products is critical to safeguard Korean export trade, as severe quality issues can impair Korea's reputation and reduce global consumer confidence in Korean products. In this study, we develop country-of-origin-based product risk analysis methods for social media with a specific focus on Korean-labeled products, for the purpose of safeguarding Korean export trade. Design/methodology - We employed two social media datasets containing consumer-generated product reviews. Sentiment analysis is a popular text mining technique used to quantify the type and amount of emotion that is expressed in the text. It is a useful tool for gathering customer opinions regarding products. Findings - We document and discuss the specific potential risks found in Korean-labeled products and explain their implications for safeguarding Korean export trade. Finally, we analyze the false positive matches that arise from the established dictionaries that were used for risk discovery and utilize these classification errors to suggest opportunities for the future refinement of the associated automated text analytic methods. Originality/value - Various studies have used online feedback from social media to analyze product defects. However, none of them links their findings to trade promotion and the protection of a specific country's exports. Therefore, it is important to fill this research gap, which could help to safeguard export trade in Korea.

속성선택방법과 워드임베딩 및 BOW (Bag-of-Words)를 결합한 오피니언 마이닝 성과에 관한 연구 (Investigating Opinion Mining Performance by Combining Feature Selection Methods with Word Embedding and BOW (Bag-of-Words))

  • 어균선;이건창
    • 디지털융복합연구
    • /
    • 제17권2호
    • /
    • pp.163-170
    • /
    • 2019
  • 과거 10년은 웹의 발달로 인한 데이터가 폭발적으로 생성되었다. 데이터마이닝에서는 대용량의 데이터에서 무의미한 데이터를 구분하고 가치 있는 데이터를 추출하는 단계가 중요한 부분을 차지한다. 본 연구는 감성분석을 위한 재표현 방법과 속성선택 방법을 적용한 오피니언 마이닝 모델을 제안한다. 본 연구에서 사용한 재표현 방법은 백 오즈 워즈(Bag-of-words)와 Word embedding to vector(Word2vec)이다. 속성선택(Feature selection) 방법은 상관관계 기반 속성선택(Correlation based feature selection), 정보획득 속성선택(Information gain)을 사용했다. 본 연구에서 사용한 분류기는 로지스틱 회귀분석(Logistic regression), 인공신경망(Neural network), 나이브 베이지안 네트워크(naive Bayesian network), 랜덤포레스트(Random forest), 랜덤서브스페이스(Random subspace), 스태킹(Stacking)이다. 실증분석 결과, electronics, kitchen 데이터 셋에서는 백 오즈 워즈의 정보획득 속성선택의 로지스틱 회귀분석과 스태킹이 높은 성능을 나타냄을 확인했다. laptop, restaurant 데이터 셋은 Word2vec의 정보획득 속성선택을 적용한 랜덤포레스트가 가장 높은 성능을 나타내는 조합이라는 것을 확인했다. 다음과 같은 결과는 오피니언 마이닝 모델 구축에 있어서 모델의 성능을 향상시킬 수 있음을 나타낸다.

Extracting and Clustering of Story Events from a Story Corpus

  • Yu, Hye-Yeon;Cheong, Yun-Gyung;Bae, Byung-Chull
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권10호
    • /
    • pp.3498-3512
    • /
    • 2021
  • This article describes how events that make up text stories can be represented and extracted. We also address the results from our simple experiment on extracting and clustering events in terms of emotions, under the assumption that different emotional events can be associated with the classified clusters. Each emotion cluster is based on Plutchik's eight basic emotion model, and the attributes of the NLTK-VADER are used for the classification criterion. While comparisons of the results with human raters show less accuracy for certain emotion types, emotion types such as joy and sadness show relatively high accuracy. The evaluation results with NRC Word Emotion Association Lexicon (aka EmoLex) show high accuracy values (more than 90% accuracy in anger, disgust, fear, and surprise), though precision and recall values are relatively low.

Learning Algorithms in AI System and Services

  • Jeong, Young-Sik;Park, Jong Hyuk
    • Journal of Information Processing Systems
    • /
    • 제15권5호
    • /
    • pp.1029-1035
    • /
    • 2019
  • In recent years, artificial intelligence (AI) services have become one of the most essential parts to extend human capabilities in various fields such as face recognition for security, weather prediction, and so on. Various learning algorithms for existing AI services are utilized, such as classification, regression, and deep learning, to increase accuracy and efficiency for humans. Nonetheless, these services face many challenges such as fake news spread on social media, stock selection, and volatility delay in stock prediction systems and inaccurate movie-based recommendation systems. In this paper, various algorithms are presented to mitigate these issues in different systems and services. Convolutional neural network algorithms are used for detecting fake news in Korean language with a Word-Embedded model. It is based on k-clique and data mining and increased accuracy in personalized recommendation-based services stock selection and volatility delay in stock prediction. Other algorithms like multi-level fusion processing address problems of lack of real-time database.

형용사만을 사용한 의견어 사전의 한계점 분석 (Analysis of limitations using only adjectives sentiment word dictionary)

  • 유원희;지혜성;양영욱;임희석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.373-375
    • /
    • 2011
  • 최근 많은 연구가 되고 있는 오피니언 마이닝은 의견어 사전의 구축이 가장 기본적으로 선행되어야 하는 연구이다. 오피니언 마이닝의 의견어 사전 구축 연구는 영어를 중심으로 많은 연구가 진행 되었다. 하지만 형용사 위주의 의견어 사전 구축으로 많은 부분의 문제들이 해결되는 영어에 비해서 한국어는 여러 가지 품사와 문장구조를 고려하여 의견어 사전을 구축해야한다. 이것을 실험으로 밝히기 위하여 형용사로만 구성되어진 의견어 사전을 구축하고 영화평에 적용하여 분석해 봄으로써 형용사로만 구성되어진 의견어 사전의 한계점을 확인한다. 실험은 세종계획 말뭉치에서 나타나는 형용사로 구성된 의견어 사전을 구축하고 네이버 랩에서 제공하는 영화평을 형용사로 구성된 의견어 사전으로 의견 분석하여 시행하였다. 분석 결과 재현율 약 50%, 정확률 약 60%정도의 성능을 보였다.

도플갱어 브랜드 이미지 효과에 대한 실증적 분석: 인터넷 커뮤니티를 중심으로 (An Empirical Analysis of Doppelgänger Brand Image Effects: Focused on the Internet Community)

  • 조혁준;김성근;강주영
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제26권1호
    • /
    • pp.21-51
    • /
    • 2017
  • Recently there have been an increasing number of companies suffering a negative brand image in the major media. Thompson et al. (2006) defined this as "$Doppelg{\ddot{a}}nger$ Brand Image." The images mentioned above have been created and propagated on Internet communities, which are one of the major paths of online spreading. This study will empirically analyze the effect of each $Doppelg{\ddot{a}}nger$ brand image on the customer's brand attitude, using a text-mining method focusing on "A company"'s case. This study will also cover the change in customer brand attitudes related to the company's correspondence in a situation in which the $Doppelg{\ddot{a}}nger$ brand image exists. In addition, the study will determine the presence of a priming effect after the spread of the $Doppelg{\ddot{a}}nger$ brand image. To that end, we collected 974 comments from 94,889 posts and A's official blogs related to A from B community, the largest automobile community site in Korea. Through this investigation, we obtained the following results. First, there was a significant difference in the ratio of negative sentiment of internet community before and after $Doppelg{\ddot{a}}nger$ brand image. Second, with regard to the topic modeling, the ratio of articles including negative topics increased and the other article ratio decreased over time. Finally, we found that there is a priming effect about negative brand image of "A company."

단어패턴 빈도를 이용한 단문 오피니언 문서 분류기법의 실험적 평가 (An Experimental Evaluation of Short Opinion Document Classification Using A Word Pattern Frequency)

  • 장재영;김일민
    • 한국인터넷방송통신학회논문지
    • /
    • 제12권5호
    • /
    • pp.243-253
    • /
    • 2012
  • 데이터 마이닝의 문서분류 기술에서 발전된 오피니언 마이닝은 이제 국외뿐만 아니라 국내 산업에서 중요한 관심분야로 자리잡아가고 있다. 오피니언 마이닝의 핵심은 문서에서 감정 단어를 추출하여 긍정/부정 여부를 얼마나 정확하게 판별하느냐를 평가하는 것이다. 국내에서도 이에 관련된 많은 연구가 이루어 졌으나 아직 실용적으로 적용할 만큼의 분류 정확도를 보이지 않고 있다. 한국어의 경우 비문법적 표현, 감정단어의 다양성 등으로 인해 문서의 극성을 판별하기가 쉽지 않기 때문이다. 본 논문에서는 문법적 요소를 최대한 배제하고 단어패턴의 빈도만을 고려한 새로운 오피니언 문서 분류기법을 제안한다. 제안된 방법에서는 문서를 단어들의 리스트로 추상화한 후, 패턴들의 빈도를 이용하여 기계학습 알고리즘을 적용한다. 이후에 적절한 스코어 함수를 적용하여 문서의 극성을 판별한다. 또한 제안된 기법의 정확도를 평가하기 위해서 실험결과를 제시한다.