• 제목/요약/키워드: Sentiment word analysis

검색결과 125건 처리시간 0.026초

일기를 통해 본 귀농·귀촌인 '일상 경관' 인식 - 텍스트 마이닝 적용 - (Analysis of Urban-to-Rural Migrants' Perceptions of the 'Everyday Landscape' Using Diary-Based Text Mining)

  • 오정심
    • 헤리티지:역사와 과학
    • /
    • 제57권3호
    • /
    • pp.184-199
    • /
    • 2024
  • 본 논문은 세계적인 변화 흐름 속에서 '일상 경관'의 중요성이 부각된 배경을 탐구하고, 귀농·귀촌인 관점에서 일상 경관을 분석한 결과를 제시했다. 전라남도 '곡성군' 사례를 중심으로, 귀농·귀촌인이 작성한 '일기' 460건을 수집하여 '텍스트 마이닝'의 주요 기법인 '빈도수 분석', '토픽 모델링', '감성 분석' 등으로 분석했다. 명사형 형태소의 분석 결과를 인지적 측면에서, 형용사형 형태소의 분석 결과를 감성적 측면에서 해석했다. 특히 기존 감성 분석 방법의 한계를 극복하기 위해 '시맨틱 네트워크 분석'을 활용해 단어 네트워크 목록을 추출했고, 목록에서 감정을 나타내는 '형용사'와 공기 관계로 연결된 '명사'를 검토하여 감성의 대상과 내용을 확인했다. 이러한 방법은 기존 연구에서 찾아보기 어려운 차별화된 접근법이다. 연구 결과에서 나타난 흥미로운 사실은 해당 귀농·귀촌인이 '동네 산책길 꽃', '텃밭 수확', '동네 행사', '카페 공간' 등을 중요하게 인식한다는 것이다. 이들 모두는 시각적 요소를 갖춘 일상 경관이다. 현재 많은 농촌 마을은 주거 경관을 개선하고 사람들의 관심을 끌어모으기 위해서 지붕 색상을 하나로 통일하거나 담벼락에 벽화를 그리고 있다. 그러나 시각적 임팩트는 그러한 인위적인 조치로 생겨나지 않는다. 현재의 정책 및 제도에 대한 비판적 검토와 개선이 필요하다. 본 논문은 일기와 텍스트 마이닝을 활용하여 귀농·귀촌인 관점에서 일상 경관을 연구한 첫 사례로서 의미가 있다. 본 논문을 통해 일상 경관 관련 연구가 활성화되기를 기대한다.

Global Big Data Analysis Exploring the Determinants of Application Ratings: Evidence from the Google Play Store

  • Seo, Min-Kyo;Yang, Oh-Suk;Yang, Yoon-Ho
    • Journal of Korea Trade
    • /
    • 제24권7호
    • /
    • pp.1-28
    • /
    • 2020
  • Purpose - This paper empirically investigates the predictors and main determinants of consumers' ratings of mobile applications in the Google Play Store. Using a linear and nonlinear model comparison to identify the function of users' review, in determining application rating across countries, this study estimates the direct effects of users' reviews on the application rating. In addition, extending our modelling into a sentimental analysis, this paper also aims to explore the effects of review polarity and subjectivity on the application rating, followed by an examination of the moderating effect of user reviews on the polarity-rating and subjectivity-rating relationships. Design/methodology - Our empirical model considers nonlinear association as well as linear causality between features and targets. This study employs competing theoretical frameworks - multiple regression, decision-tree and neural network models - to identify the predictors and main determinants of app ratings, using data from the Google Play Store. Using a cross-validation method, our analysis investigates the direct and moderating effects of predictors and main determinants of application ratings in a global app market. Findings - The main findings of this study can be summarized as follows: the number of user's review is positively associated with the ratings of a given app and it positively moderates the polarity-rating relationship. Applying the review polarity measured by a sentimental analysis to the modelling, it was found that the polarity is not significantly associated with the rating. This result best applies to the function of both positive and negative reviews in playing a word-of-mouth role, as well as serving as a channel for communication, leading to product innovation. Originality/value - Applying a proxy measured by binomial figures, previous studies have predominantly focused on positive and negative sentiment in examining the determinants of app ratings, assuming that they are significantly associated. Given the constraints to measurement of sentiment in current research, this paper employs sentimental analysis to measure the real integer for users' polarity and subjectivity. This paper also seeks to compare the suitability of three distinct models - linear regression, decision-tree and neural network models. Although a comparison between methodologies has long been considered important to the empirical approach, it has hitherto been underexplored in studies on the app market.

주거환경에 대한 거주민의 만족도와 영향요인 분석 - 직방 아파트 리뷰 빅데이터와 딥러닝 기반 BERT 모형을 활용하여 - (Analysis of Resident's Satisfaction and Its Determining Factors on Residential Environment: Using Zigbang's Apartment Review Bigdata and Deeplearning-based BERT Model)

  • 권준현;이수기
    • 지역연구
    • /
    • 제39권2호
    • /
    • pp.47-61
    • /
    • 2023
  • 주거환경에 대한 만족도는 주거지 선택 및 이주 등에 영향을 미치는 주요인으로, 도시에서의 삶의 질과 직접적으로 연결된다. 최근 온라인 부동산 서비스의 증가로 주거환경에 대한 사람들의 만족도를 쉽게 확인할 수 있으며, 사람들이 평가하는 내용을 바탕으로 주거환경 만족 요인에 대한 분석이 가능하다. 이는 기존에 활용되던 설문조사 등의 방식보다 더 많은 양의 평가를 효율적으로 활용할 수 있음을 의미한다. 본 연구는 서울특별시를 대상으로 온라인 부동산 서비스인 '직방'에서 수집된 약 3만여 건의 아파트 리뷰를 분석에 활용하였다. 리뷰에 포함된 추천 평점을 토대로, 아파트 리뷰를 긍정적, 부정적으로 분류하고, 딥 러닝 기반 자연어 처리 모델인 BERT(Bidirectional Encoder Representations from Transformers)를 사용하여 리뷰를 자동으로 분류하는 모델을 개발하였다. 이후 SHAP(SHAPley Additive exPlanation)를 이용하여 분류에 중요한 역할을 하는 단어 토큰을 도출함으로 주거환경 만족도의 영향요인을 도출하였다. 더 나아가 Word2Vec을 이용하여 관련 키워드를 분석함으로써 주거환경에 대한 만족도 개선을 위한 우선 고려사항을 제시하였다. 본 연구는 거주자의 정성평가 자료인 아파트 리뷰 빅데이터와 딥러닝을 활용하여 주거환경에 대한 만족도를 긍정적, 부정적으로 자동 분류하는 모형을 제안하여 그 영향요인을 도출하는데 의의가 있다. 분석결과는 주거환경 만족도 향상을 위한 기초자료로 활용될 수 있으며 향후 아파트 단지 인근 주거환경 평가, 신규 단지 및 기반시설의 설계 및 평가 등에 활용될 수 있다.

재난취약계층의 위험이슈분석 -어린이, 임산부 사례를 중심으로- (Risk Issue Analysis of Disaster Vulnerable Groups -Focusing on Cases of Children and Pregnant Women)

  • 김신혜;권설아
    • 한국콘텐츠학회논문지
    • /
    • 제21권7호
    • /
    • pp.291-303
    • /
    • 2021
  • 현대사회에서 노인, 장애인, 외국인, 어린이 등 재난취약계층의 수가 빠르게 증가하고 있다. 이러한 재난에 취약한 계층의 일반적인 특성은 경제적 어려움으로 인하여 주거형태가 재난에 취약하고, 재난에 노출되면 회복력이 더디다는 것이다. 본 연구는 재난취약계층에 대한 대상자 위험이슈분석을 통해 새롭게 도출되는 위험이슈를 파악하고, 정책개발의 기초자료를 제공하는 데 그 목적이 있다. 연구방법은 재난취약계층 중에서 어린이와 임산부의 사례를 중심으로 최근 10년간('10-19) 소셜미디어의 이슈 데이터를 중심으로 소셜네트워크 분석을 수행하였고, 연구결과 첫째, 이슈의 추이를 살펴보면 특정 사건의 발생과 연관성을 갖는다. 둘째, 위기관리의 유형, 대상, 관리방식에 대한 인식이 분석되었다. 셋째, 위험이슈의 해결방안이나 대상의 특성을 반영한 감정어가 분석되었고, 부정적인 감성을 유발하는 단어도 분석되었다. 따라서 본 기초데이터를 바탕으로 정부와 지자체는 국민의 정서분석과 대중의 인식을 토대로 급변하는 재난환경의 효율적인 위기관리체계를 구축하기를 바란다.

Public Opinion on Lockdown (PSBB) Policy in Overcoming COVID-19 Pandemic in Indonesia: Analysis Based on Big Data Twitter

  • Suratnoaji, Catur;Nurhadi, Nurhadi;Arianto, Irwan Dwi
    • Asian Journal for Public Opinion Research
    • /
    • 제8권3호
    • /
    • pp.393-406
    • /
    • 2020
  • The discourse on the lockdown in Indonesia is getting stronger due to the increasing number of positive cases of the coronavirus and the death rate. As of August 12, 2020, the confirmed number of COVID-19 cases in Indonesia reached 130,718. There were 85,798 victims who have recovered and 5,903 who have died. Data show a significant increase in cases of COVID-19 every day. For this reason, there needs to be an evaluation of the government policy of the Republic of Indonesia in dealing with the COVID-19 pandemic in Indonesia. An evaluation of policies for handling the pandemic must include public opinion to determine any weaknesses of this policy. The development of public opinion about the lockdown policy can be understood through social media. During the COVID-19 pandemic, measuring public opinion through traditional methods (surveys) was difficult. For this reason, we utilized big data on social media as research data. The main purpose of this study is to understand public opinion on the lockdown policy in overcoming the COVID-19 pandemic in Indonesia. The things observed included: volume of Twitter users, top influencers, top tweets, and communication networks between Twitter users. For the methodological development of future public opinion research, the researchers outline the obstacles faced in researching public opinion based on big data from Twitter. The research results show that the lockdown policy is an interesting issue, as evidenced by the number of active users (79,502) forming 133,209 networks. Posts about the lockdown on Twitter continued to increase after the implementation of the lockdown policy on April 10, 2020. The lockdown policy has caused various reactions, seen from the word analysis showing 14.8% positive sentiment, 17.5% negative, and 67.67% non-categorized words. Sources of information who have played the roles of top influencers regarding the lockdown policy include: Jokowi (the president of the Republic of Indonesia), online media, television media, government departments, and governors. Based on the analysis of the network structure, it shows that Jokowi has a central role in controlling the lockdown policy. Several challenges were found in this study: 1) choosing keywords for downloading data, 2) categorizing words containing public opinion sentiment, and 3) determining the sample size.

온라인 고객 리뷰를 활용한 제품 효과 분석 기법 (A Technique for Product Effect Analysis Using Online Customer Reviews)

  • 임영서;이소영;이지나;류보경;김현희
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권9호
    • /
    • pp.259-266
    • /
    • 2020
  • 본 논문에서는 온라인 고객 리뷰를 활용하여 건강 보조제, 화장품 등 현재의 상태를 개선하기 위해 사용되는 제품을 대상으로 그 효과를 알아보기 위한 제품 효과 분석 기법을 제시하였다. 제안하는 제품 효과 분석 기법은 블로그 포스팅에 존재하는 광고를 자동 제거하고, 효과 분석을 위한 증상, 효과, 증가, 및 감소로 이루어진 단어 사전을 구축하며, 제안하는 알고리즘을 통해 제품의 효과를 측정한다. 제품 효과 분석 기법을 검증하기 위해 정답 레이블이 존재하는 네이버 쇼핑 리뷰 데이터셋을 대상으로 성능평가를 실시하였으며, 전통적인 긍부정 사전과 RNN 모델과 성능을 비교하였다. 실험 결과, 본 논문에서 제안하는 효과 분석 기법이 다른 두가지 방법보다 정확도가 뛰어남을 보여주었다. 또한, 아토피 피부염, 여드름 치료제에 제안하는 기법을 적용하여 소셜 미디어에 나타난 효과적인 치료법을 소개하였다. 본 논문에서 제시한 알고리즘은 블로그를 포함한 여러 매체의 리뷰로부터 제품의 효과를 점수화할 수 있으므로 다양한 제품군과 소셜 미디어에 적용될 수 있을 것으로 보인다.

온라인 구전이 구매의도에 미치는 영향: 정보원 유형간 구전방향의 불일치성을 중심으로 (Whose Opinion Matters More? A Study on the Effect of Contradictory Word of Mouth on the Intention of Purchase)

  • 김수지;김범수
    • 지식경영연구
    • /
    • 제25권2호
    • /
    • pp.115-134
    • /
    • 2024
  • 인터넷의 지속적인 발전과 다양한 모바일 기기의 확산으로 인해 소비자 구매결정에 대한 인터넷 구전의 영향력은 끊임없이 증가하고 있는 상황이다. 그러나 다양한 정보원으로부터 상반된 내용의 많은 정보를 접하는 소비자들은 끊임없이 정보의 신뢰성에 대해 고민하게 되고 이에 따라 제품 종류 별 구전 영향력이 큰 정보원의 유형에 대한 연구가 지속되고 있다. 이에 본 연구에서는 정보원 유형간 구전방향이 불일치할 경우, 소비자들이 어떠한 정보원의 구전에 더욱 영향을 받는지 온라인 구전을 전문가와 일반소비자 구전으로 나눈 후, 계층적 베이지언 분석방법론을 통해 분석하였다. 연구 결과, 전문가 구전과 일반소비자의 구전 방향성이 일치할 경우에는 기존 연구와 같이 구매의도에 정의 영향을 미치는 것을 확인하였다. 나아가 전문과 구전과 일반소비자의 구전 방향성이 불일치할 경우에는 소비자의 구매의도가 전문가 보다는 일반소비자의 구전 방향성에 더욱 영향을 받는 것을 확인할 수 있었다. 본 연구에서는 표본집단의 크기가 작더라도 데이터 시뮬레이션을 통해 분석이 가능한 베이지언 방법론을 적용해 분석을 시도하였다. 이를 통해 한정된 데이터로 여러 소집단에 대한 분석 가능성을 확인한 것은 향후 더욱 세분화된 제품군과 다양한 정보원 유형의 온라인 구전 효과 연구에 기여하고 온라인 마케팅 관리자에게 유용한 실무적 시사점을 제공할 것으로 기대한다.

Analyzing Correlations between Movie Characters Based on Deep Learning

  • Jin, Kyo Jun;Kim, Jong Wook
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권10호
    • /
    • pp.9-17
    • /
    • 2021
  • 인간은 사회적인 동물로서, 대화로써 정보를 얻거나 사회적인 교류를 해왔다. 대화는 두 사람 이상의 작은 모임에서 서로 말을 편하게 주고받는 것으로, 한 사람이 다른 사람에게 가지는 감성에 따라 그 말의 분위기가 달라질 수 있다. 영화에서 인물들과 인물들이 펼치는 이야기는 중요한 요소로 작용하며, 인물들 간의 관계는 이야기와 인물 간의 대사를 이해하는데 꼭 필요하다. 그러나 이런 정보를 영화에서 자동으로 추출하는 방법은 아직까지 연구되지 않아서 관객들에게 제공되고 있지 못하고 있다. 따라서, 영화 속 양상을 자동으로 분석하는 모델이 필요하다. 본 논문에서는 딥 러닝 기법을 활용하여 각 영화 등장 인물들 간의 감성을 측정하여 영화 속 인물들 간의 관계를 효과적으로 분석하는 방법을 제안한다. 제안 방법은 먼저 영화 대본으로부터 주요 인물들을 추출하고, 주요 인물들 간의 대화를 효과적으로 찾는다. 그런 다음, 주요 인물들 간의 관계를 분석하기 위하여, 감성 분석을 수행하여 전체 시간 간격 내 대사의 위치에 따라 가중치를 부여하고 점수를 수집한다. 또한, 실데이터를 이용한 실험을 통하여 제안 기법이 효과적으로 영화 등장 인물들 간의 감성을 분석할 수 있음을 보인다.

치킨 리뷰의 이면: 텍스트 마이닝을 통한 리뷰의 탐색적 분석을 중심으로 (BEHIND CHICKEN RATINGS: An Exploratory Analysis of Yogiyo Reviews Through Text Mining)

  • 김준겸;최은솔;윤수현;이유빈;김동환
    • 한국콘텐츠학회논문지
    • /
    • 제21권11호
    • /
    • pp.30-40
    • /
    • 2021
  • 코로나 19의 영향으로 배달앱 시장이 빠르게 성장하며, 리뷰와 평점이 더욱 중요해지고 있다. 그러나 급격하게 늘어난 리뷰와 평점의 신뢰도에 의문이 제기되고 있다. 따라서 본 연구는 리뷰와 평점을 탐색적으로 분석하여 배달앱 리뷰의 신뢰도와 유용성을 파악하고, 이를 높일 방법을 탐구하였다. 텍스트 마이닝 기법을 사용하여 도출한 결과는 다음과 같다. 첫째, 요기요와 네이버 지도, 구글 지도의 음식점 평점을 분석한 결과, 요기요는 가장 우편향된 평점 분포를 보여주었다. 둘째, 요기요의 세부 평점 요인(맛, 양, 배달)간에는 모두 강한 양의 상관관계가 있었고, 이는 부정 리뷰의 단어 분석에서도 드러났다. 셋째, 리뷰의 극성에 따라 사용되는 품사와 형태소의 비율이 달랐다. 넷째, 전체 리뷰 데이터에서 367개의 부정어를 선별한 후, 이를 분류하여 치킨 전용 부정어 사전을 제작하였다. 본 연구는 치킨 리뷰의 탐색적 분석을 통해 앞으로 배달앱 리뷰에 대한 연구가 나아가야 할 방향을 제시하였다.

기업의 SNS 노출과 주식 수익률간의 관계 분석 (The Analysis on the Relationship between Firms' Exposures to SNS and Stock Prices in Korea)

  • 김태환;정우진;이상용
    • Asia pacific journal of information systems
    • /
    • 제24권2호
    • /
    • pp.233-253
    • /
    • 2014
  • Can the stock market really be predicted? Stock market prediction has attracted much attention from many fields including business, economics, statistics, and mathematics. Early research on stock market prediction was based on random walk theory (RWT) and the efficient market hypothesis (EMH). According to the EMH, stock market are largely driven by new information rather than present and past prices. Since it is unpredictable, stock market will follow a random walk. Even though these theories, Schumaker [2010] asserted that people keep trying to predict the stock market by using artificial intelligence, statistical estimates, and mathematical models. Mathematical approaches include Percolation Methods, Log-Periodic Oscillations and Wavelet Transforms to model future prices. Examples of artificial intelligence approaches that deals with optimization and machine learning are Genetic Algorithms, Support Vector Machines (SVM) and Neural Networks. Statistical approaches typically predicts the future by using past stock market data. Recently, financial engineers have started to predict the stock prices movement pattern by using the SNS data. SNS is the place where peoples opinions and ideas are freely flow and affect others' beliefs on certain things. Through word-of-mouth in SNS, people share product usage experiences, subjective feelings, and commonly accompanying sentiment or mood with others. An increasing number of empirical analyses of sentiment and mood are based on textual collections of public user generated data on the web. The Opinion mining is one domain of the data mining fields extracting public opinions exposed in SNS by utilizing data mining. There have been many studies on the issues of opinion mining from Web sources such as product reviews, forum posts and blogs. In relation to this literatures, we are trying to understand the effects of SNS exposures of firms on stock prices in Korea. Similarly to Bollen et al. [2011], we empirically analyze the impact of SNS exposures on stock return rates. We use Social Metrics by Daum Soft, an SNS big data analysis company in Korea. Social Metrics provides trends and public opinions in Twitter and blogs by using natural language process and analysis tools. It collects the sentences circulated in the Twitter in real time, and breaks down these sentences into the word units and then extracts keywords. In this study, we classify firms' exposures in SNS into two groups: positive and negative. To test the correlation and causation relationship between SNS exposures and stock price returns, we first collect 252 firms' stock prices and KRX100 index in the Korea Stock Exchange (KRX) from May 25, 2012 to September 1, 2012. We also gather the public attitudes (positive, negative) about these firms from Social Metrics over the same period of time. We conduct regression analysis between stock prices and the number of SNS exposures. Having checked the correlation between the two variables, we perform Granger causality test to see the causation direction between the two variables. The research result is that the number of total SNS exposures is positively related with stock market returns. The number of positive mentions of has also positive relationship with stock market returns. Contrarily, the number of negative mentions has negative relationship with stock market returns, but this relationship is statistically not significant. This means that the impact of positive mentions is statistically bigger than the impact of negative mentions. We also investigate whether the impacts are moderated by industry type and firm's size. We find that the SNS exposures impacts are bigger for IT firms than for non-IT firms, and bigger for small sized firms than for large sized firms. The results of Granger causality test shows change of stock price return is caused by SNS exposures, while the causation of the other way round is not significant. Therefore the correlation relationship between SNS exposures and stock prices has uni-direction causality. The more a firm is exposed in SNS, the more is the stock price likely to increase, while stock price changes may not cause more SNS mentions.