• 제목/요약/키워드: Online data mining

검색결과 292건 처리시간 0.03초

영화 흥행성과 예측을 위한 온라인 리뷰 마이닝 연구: 개봉 첫 주 온라인 리뷰를 활용하여 (Predicting Movie Revenue by Online Review Mining: Using the Opening Week Online Review)

  • 조승연;김현구;김범수;김희웅
    • 경영정보학연구
    • /
    • 제16권3호
    • /
    • pp.113-134
    • /
    • 2014
  • 온라인 리뷰는 네트워크 기술의 발전을 통해 그 영향력이 확대되고 있다. 특히, 사전 정보로 통해 소비가 결정되는 영화는 온라인 리뷰가 소비자들의 영화 결정에도 중요한 영향을 미치고 있다. 이에 본 연구는 영화관련 온라인 리뷰를 영화 소비 후 소비자들의 평가 정보라 가정하고, 이를 활용한 영화 흥행성과 예측모형을 제시하고자 한다. 선행 연구를 통하여 영화관련 온라인 리뷰에 감독, 배우, 스토리, 효과 등의 독립적인 속성 및 종합적인 평가가 있음을 확인하였으며, 본 연구에서는 각 속성을 2개 이상 평가하고 있는 복합형 리뷰 10가지를 추가하여 총 15가지로 온라인 리뷰 분류하였다. 2010년부터 2013년까지 개봉한 한국영화 중 상업영화 209개의 개봉 첫 주 온라인 리뷰를 온라인 리뷰 마이닝을 진행하고, 최종적으로 리뷰 마이닝 결과를 판별분석을 통한 영화 흥행성적 예측모형을 제시한다. 판별분석을 실시한 결과, 온라인 리뷰로부터 도출된 감독, 배우, 효과 및 스토리 관련 평가와 개봉 첫 주 전체 온라인 리뷰 수가 유의미하게 변별하였다.

빅데이터 기반 시민의견 모니터링 방안 연구 : "경기지역화폐"를 중심으로 (A Study on Monitoring Method of Citizen Opinion based on Big Data : Focused on Gyeonggi Lacal Currency (Gyeonggi Money))

  • 안순재;이새미;유승의
    • 디지털융복합연구
    • /
    • 제18권7호
    • /
    • pp.93-99
    • /
    • 2020
  • 본 연구에서는 비정형적인 대용량의 텍스트 자료로부터 유의미한 정보를 추출하는 빅데이터 분석방법 중 텍스트 마이닝을 이용하여 시행 중인 정책과 제도에 대한 시민의견을 모니터링 할 수 있는지 확인하였다. '경기지역화폐'와 관련된 5,108건의 신문기사와 748건의 온라인 카페글을 수집하여 빈도분석, TF-IDF분석, 연관분석, 워드트리 시각화 분석을 수행하였다. 그 결과로 기사에서는 지역화폐의 도입 목적, 제공되는 혜택, 사용방법에 관련된 내용이 많았고 카페글에서는 지역화폐의 실사용과 관련된 내용 위주로 작성이 되어있음을 확인하였다. 또한 지역화폐 활성화를 위해서 뉴스는 정보전달자로서 지역화폐의 홍보에 관여하고 있었고 카페글은 지역화폐 사용자인 시민들의 의견으로 이루어져 사용과 관련된 실제적인 정보 교환의 장으로 기능하고 있었다. 지역화폐뿐만 아니라 다양한 정책과 제도에 관해서도 SNS와 텍스트 마이닝을 통해 시민들의 의견을 수렴하여 효과적으로 활성화시킬 수 있을 것으로 보인다.

Competitive intelligence in Korean Ramen Market using Text Mining and Sentiment Analysis

  • Kim, Yoosin;Jeong, Seung Ryul
    • 인터넷정보학회논문지
    • /
    • 제19권1호
    • /
    • pp.155-166
    • /
    • 2018
  • These days, online media, such as blogospheres, online communities, and social networking sites, provides the uncountable user-generated content (UGC) to discover market intelligence and business insight with. The business has been interested in consumers, and constantly requires the approach to identify consumers' opinions and competitive advantage in the competing market. Analyzing consumers' opinion about oneself and rivals can help decision makers to gain in-depth and fine-grained understanding on the human and social behavioral dynamics underlying the competition. In order to accomplish the comparison study for rival products and companies, we attempted to do competitive analysis using text mining with online UGC for two popular and competing ramens, a market leader and a market follower, in the Korean instant noodle market. Furthermore, to overcome the lack of the Korean sentiment lexicon, we developed the domain specific sentiment dictionary of Korean texts. We gathered 19,386 pieces of blogs and forum messages, developed the Korean sentiment dictionary, and defined the taxonomy for categorization. In the context of our study, we employed sentiment analysis to present consumers' opinion and statistical analysis to demonstrate the differences between the competitors. Our results show that the sentiment portrayed by the text mining clearly differentiate the two rival noodles and convincingly confirm that one is a market leader and the other is a follower. In this regard, we expect this comparison can help business decision makers to understand rich in-depth competitive intelligence hidden in the social media.

딥러닝 기반 뉴로사이언스 마이닝 기법을 이용한 고객 매력/유용성 인지 (CAUP) 예측 성능에 관한 탐색적 연구: Dark vs Light 사용자 인터페이스 (UI)를 중심으로 (Exploring the Performance of Deep Learning-Driven Neuroscience Mining in Predicting CAUP (Consumer's Attractiveness/Usefulness Perception): Emphasis on Dark vs Light UI Modes)

  • 김민경;;이건창
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.19-22
    • /
    • 2022
  • In this work, we studied consumers' attractiveness/usefulness perceptions (CAUP) of online commerce product photos when exposed to alternative dark/light user interface (UI) modes. We analyzed time-series EEG data from 31 individuals and performed neuroscience mining (NSM) to ascertain (a) how the CAUP of products differs among UI modes; and (b) which deep learning model provides the most accurate assessment of such neuroscience mining (NSM) business difficulties. The dark UI style increased the CAUP of the products displayed and was predicted with the greatest accuracy using a unique EEG power spectra separated wave brainwave 2D-ConvLSTM model. Then, using relative importance analysis, we used this model to determine the most relevant power spectra. Our findings are considered to contribute to the discovery of objective truths about online customers' reactions to various user interface modes used by various online marketplaces that cannot be uncovered through more traditional research approaches like as surveys.

  • PDF

텍스트마이닝을 통한 댓글의 공감도 및 비공감도에 영향을 미치는 댓글의 특성 연구 (Applying Text Mining to Identify Factors Which Affect Likes and Dislikes of Online News Comments)

  • 김정훈;송영은;진윤선;권오병
    • 한국IT서비스학회지
    • /
    • 제14권2호
    • /
    • pp.159-176
    • /
    • 2015
  • As a public medium and one of the big data sources that is accumulated informally and real time, online news comments or replies are considered a significant resource to understand mentalities of article readers. The comments are also being regarded as an important medium of WOM (Word of Mouse) about products, services or the enterprises. If the diffusing effect of the comments is referred to as the degrees of agreement and disagreement from an angle of WOM, figuring out which characteristics of the comments would influence the agreements or the disagreements to the comments in very early stage would be very worthwhile to establish a comment-based eWOM (electronic WOM) strategy. However, investigating the effects of the characteristics of the comments on eWOM effect has been rarely studied. According to this angle, this study aims to conduct an empirical analysis which understands the characteristics of comments that affect the numbers of agreement and disagreement, as eWOM performance, to particular news articles which address a specific product, service or enterprise per se. While extant literature has focused on the quantitative attributes of the comments which are collected by manually, this paper used text mining techniques to acquire the qualitative attributes of the comments in an automatic and cost effective manner.

글로벌 화장품 브랜드의 소비자 만족도 분석: 텍스트마이닝 기반의 사용자 후기 분석을 중심으로 (Customer Satisfaction Analysis for Global Cosmetic Brands: Text-mining Based Online Review Analysis)

  • 박재훈;김예림;강수빈
    • 품질경영학회지
    • /
    • 제49권4호
    • /
    • pp.595-607
    • /
    • 2021
  • Purpose: This study introduces a systematic framework to evaluate service satisfaction of cosmetic brands through online review analysis utilizing Text-Mining technique. Methods: The framework assumes that the service satisfaction is evaluated by positive comments from online reviews. That is, the service satisfaction of a cosmetic brand is evaluated higher as more positive opinions are commented in the online reviews. This study focuses on two approaches. First, it collects online review comments from the top 50 global cosmetic brands and evaluates customer service satisfaction for each cosmetic brands by applying Sentimental Analysis and Latent Dirichlet Allocation. Second, it analyzes the determinants that induce or influence service satisfaction and suggests the guidelines for cosmetic brands with low satisfaction to improve their service satisfaction. Results: For the satisfaction evaluation, online review data were extracted from the top 50 global cosmetic brands in the world based on 2018 sales announced by Brand Finance in the UK. As a result of the satisfaction analysis, it was found that overall there were more positive opinions than negative opinions and the averages for polarity, subjectivity, positive ratio, and negative ratio were calculated as 0.50, 0.76, 0.57, and 0.19, respectively. Polarity, subjectivity and positive ratio showed the opposite pattern to negative ratio, and although there was a slight difference in fluctuation range and ranking between them, the patterns are almost same. Conclusion: The usefulness of the proposed framework was verified through case study. Although some studies have suggested a method to analyze online reviews, they didn't deal with the satisfaction evaluation among competitors and cause analysis. This study is different from previous studies in that it evaluates service satisfaction from a relative point of view among cosmetic brands and analyze determinants.

온라인 리뷰 데이터의 오피니언마이닝을 통한 콘텐츠 만족도 분석 시스템 설계 (A Design of Satisfaction Analysis System For Content Using Opinion Mining of Online Review Data)

  • 김문지;송은정;김윤희
    • 인터넷정보학회논문지
    • /
    • 제17권3호
    • /
    • pp.107-113
    • /
    • 2016
  • 소셜 네트워크 서비스(SNS)의 활성화로 웹상에는 방대한 양의 온라인 리뷰들이 생산되고 있으며, 이러한 온라인 리뷰들은 다양한 콘텐츠들에 대한 의견 데이터로써 콘텐츠 이용자와 제공자들에게 가치 있는 정보로 활용되고 있다. 한편, 온라인 리뷰에 대한 중요도가 높아짐에 따라 온라인 리뷰를 분석하여 글쓴이의 의견이나 평가, 태도, 감정 등을 추출해 내는 오피니언마이닝에 대한 연구가 활발하게 진행되고 있다. 그러나 기존의 오피니언마이닝 연구들에서는 리뷰의 의견 분류에만 초점을 맞추어 감성 분석 기법을 설계하였기 때문에 리뷰 속에 내포되어있는 작성자의 자세한 만족도까지는 알 수 없었으며, 감성 분석 기법이 특정 콘텐츠에 한정되어있어 도메인이 같지 않은 다른 콘텐츠들에는 적용될 수 없다는 문제점이 있었다. 이에 본 연구에서는 기존 의견 분류 방법에 강도를 주어 좀 더 세밀한 감성 분석을 수행하고, 이 결과를 통계적 척도에 적용하여 리뷰에 내포되어 있는 작성자의 자세한 만족도를 도출 할 수 있는 감성 분석 기법을 제안한다, 그리고 제안한 기법을 바탕으로 도메인에 상관없이 다양한 콘텐츠에 적용되어 콘텐츠의 만족도를 분석 할 수 있는 시스템을 설계하였다. 또한 방대한 양의 리뷰 데이터들을 빠르고 효율적으로 처리하기 위해 빅 데이터 처리도구인 하둡을 기반으로 시스템을 구축하였다. 본 시스템을 통해 콘텐츠 이용자는 보다 효율적인 의사결정을, 제공자들은 빠른 반응분석을 할 수 있어 본 시스템은 사용자의 의견을 필요로 하는 다양한 분야에 매우 실용적으로 활용 될 것으로 기대한다.

The Impact of Online Reviews on Hotel Ratings through the Lens of Elaboration Likelihood Model: A Text Mining Approach

  • Qiannan Guo;Jinzhe Yan
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권10호
    • /
    • pp.2609-2626
    • /
    • 2023
  • The hotel industry is an example of experiential services. As consumers cannot fully evaluate the online review content and quality of their services before booking, they must rely on several online reviews to reduce their perceived risks. However, individuals face information overload owing to the explosion of online reviews. Therefore, consumer cognitive fluency is an individual's subjective experience of the difficulty in processing information. Information complexity influences the receiver's attitude, behavior, and purchase decisions. Individuals who cannot process complex information rely on the peripheral route, whereas those who can process more information prefer the central route. This study further discusses the influence of the complexity of review information on hotel ratings using online attraction review data retrieved from TripAdvisor.com. This study conducts a two-level empirical analysis to explore the factors that affect review value. First, in the Peripheral Route model, we introduce a negative binomial regression model to examine the impact of intuitive and straightforward information on hotel ratings. In the Central Route model, we use a Tobit regression model with expert reviews as moderator variables to analyze the impact of complex information on hotel ratings. According to the analysis, five-star and budget hotels have different effects on hotel ratings. These findings have immediate implications for hotel managers in terms of better identifying potentially valuable reviews.

관계형 다차원모델에 기반한 온라인 고객리뷰 분석시스템의 설계 및 구현 (Study on Designing and Implementing Online Customer Analysis System based on Relational and Multi-dimensional Model)

  • 김근형;송왕철
    • 한국콘텐츠학회논문지
    • /
    • 제12권4호
    • /
    • pp.76-85
    • /
    • 2012
  • 오피니언마이닝 기법은 대량의 고개리뷰들에 나타나는 핵심개체 또는 속성들에 대하여 고객들이 느끼는 긍정 또는 부정의 정도를 계산할 수 있지만, 그 분석능력이 단순하다는 한계가 있다. 본 논문에서는 온라인 고객리뷰들에 대하여 다차원적으로 분석할 수 있는 기법을 제안하였다. 기존의 OLAP기법을 텍스트 데이터형에 적용할 수 있도록 수정하였다. 다차원 분석모델은 명사축과 형용사축, 문서축으로 구성되는 3차원 공간 개념을 4개의 관계형 테이블로 실체화 한 것이다. 다차원 분석모델은 기존의 오피니언마이닝, 정보요약, 클러스터링 알고리즘들을 융합할 수 있는 새로운 틀이라는 점에서 그 가치가 있다. 본 논문에서 제안한 다차원 분석모델과 알고리즘들을 실제로 구현하여 온라인 고객리뷰에 대한 복잡한 분석을 수행할 수 있음을 확인하였다.

국내 소비자의 일본 패션제품에 대한 정치적 소비 연구 (Korean Consumers' Political Consumption of Japanese Fashion Products)

  • 최영현;이규혜
    • 한국의류학회지
    • /
    • 제44권2호
    • /
    • pp.295-309
    • /
    • 2020
  • In 2019, Japan announced trade regulations against Korean products; consequently, the sales of Japanese products in Korea dropped due to a Korean consumers' boycott. This study measured the Korean consumers' political consumption behavior toward Japanese fashion products. Unstructured text data from online media sources and consumer posted sources such as blog and SNS were collected. Text mining techniques and semantic network analysis were used to process unstructured data. This study used text mining techniques and semantic network analysis to process data. The results identified boycotting Japanese fashion products and buycotting alternative products and Korean brands due to consumers' political consumption. Two brand cases were investigated in detail. Online text data before and after the political action were compared and significant changes in consumption as well as emotional expressions were identified. Product related industry sectors were identified in terms of the political consumption of fashion: liquor, automobile and tourism industry sectors were closely linked to the fashion sector in terms of boycotting. More "boycott" and "buycott" fashion brands (reflected in consumer attitudes and feelings) were detected in consumer driven texts than in media driven sources.