• 제목/요약/키워드: Social Media Mining

검색결과 246건 처리시간 0.036초

텍스트 마이닝을 활용한 노인장기요양보험에서의 작업치료: 2007-2018년 (Occupational Therapy in Long-Term Care Insurance For the Elderly Using Text Mining)

  • 조민석;백순형;박엄지;박수희
    • 고령자・치매작업치료학회지
    • /
    • 제12권2호
    • /
    • pp.67-74
    • /
    • 2018
  • 목적 본 연구의 목적은 텍스트 마이닝이라는 빅데이터 분석 기법 중 하나를 활용하여 노인장기요양보험에서 작업치료의 역할을 정량적으로 분석하는 것이다. 연구방법 신문기사 분석을 위해 2007~208년까지 기간 설정 후 "노인장기요양보험+작업치료"를 주제어로 수집하였다. Textom이라는 웹 크롤링(Web Crawling)을 활용해 국내 검색엔진 네이버에서 <네이버뉴스>의 데이터베이스를 활용하였다. 수집결과 노인장기요양보험+작업치료 검색에서 510편의 뉴스 데이터의 기사제목과 원문을 수집한 후 연도별 기사 빈도, 핵심어분석을 시행하였다. 연구결과 연도별 기사 발행 빈도를 살펴보면 2015년과 2017년 발행한 기사 수가 70편(13.7%)으로 가장 많았고, 핵심어 분석 상위 10개의 용어는 '치매'(344)가 가장 많았으며, 작업과 핵심어의 관례를 알아보면, 치매, 치료, 병원, 건강, 서비스, 재활, 시설, 제도, 등급, 어르신, 전문, 급여, 공단, 국민이 관련이 있는 것으로 나타났다. 결론 본 연구에서는 텍스트 마이닝 기법을 통해 11년간의 노인장기요양보험의 언론 보도 동향을 토대로 관련 핵심 키워드에서 치매와 재활에 대해 사회적 요구와 작업치료사의 역할을 보다 객관적으로 확인하였다는 점에서 의의가 있다. 이 결과를 바탕으로 다음 연구에서는 연도에 따른 다양한 분석방법을 통해 연구방법론을 보완하여야 할 것이다.

뉴스와 주가 : 빅데이터 감성분석을 통한 지능형 투자의사결정모형 (Stock-Index Invest Model Using News Big Data Opinion Mining)

  • 김유신;김남규;정승렬
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.143-156
    • /
    • 2012
  • 누구나 뉴스와 주가 사이에는 밀접한 관계를 있을 것이라 생각한다. 그래서 뉴스를 통해 투자기회를 찾고, 투자이익을 얻을 수 있을 것으로 기대한다. 그렇지만 너무나 많은 뉴스들이 실시간으로 생성 전파되며, 정작 어떤 뉴스가 중요한지, 뉴스가 주가에 미치는 영향은 얼마나 되는지를 알아내기는 쉽지 않다. 본 연구는 이러한 뉴스들을 수집 분석하여 주가와 어떠한 관련이 있는지 분석하였다. 뉴스는 그 속성상 특정한 양식을 갖지 않는 비정형 텍스트로 구성되어있다. 이러한 뉴스 컨텐츠를 분석하기 위해 오피니언 마이닝이라는 빅데이터 감성분석 기법을 적용하였고, 이를 통해 주가지수의 등락을 예측하는 지능형 투자의사결정 모형을 제시하였다. 그리고, 모형의 유효성을 검증하기 위하여 마이닝 결과와 주가지수 등락 간의 관계를 통계 분석하였다. 그 결과 뉴스 컨텐츠의 감성분석 결과값과 주가지수 등락과는 유의한 관계를 가지고 있었으며, 좀 더 세부적으로는 주식시장 개장 전 뉴스들과 주가지수의 등락과의 관계 또한 통계적으로 유의하여, 뉴스의 감성분석 결과를 이용해 주가지수의 변동성 예측이 가능할 것으로 판단되었다. 이렇게 도출된 투자의사결정 모형은 여러 유형의 뉴스 중에서 시황 전망 해외 뉴스가 주가지수 변동을 가장 잘 예측하는 것으로 나타났고 로지스틱 회귀분석결과 분류정확도는 주가하락 시 70.0%, 주가상승 시 78.8%이며 전체평균은 74.6%로 나타났다.

빅데이터와 사회연결망 기법을 이용한 '노인 이미지' 분석 ('Elderly image' Analysis Using Big Data and Social Networking Techniques)

  • 한선보;이현심
    • 한국콘텐츠학회논문지
    • /
    • 제16권11호
    • /
    • pp.253-263
    • /
    • 2016
  • 빅데이터와 사회연결망 분석기법을 이용하여 사회적 이슈인 '노인 이미지'를 분석 하였다. '노인' 키워드를 입력하여 텍스트마이닝 기법으로 추출된 단어를 분석한 결과 대중의 트렌드를 대표하는 카페, 블로그 등의 매체를 통해 본 노인 이미지는 '어르신'이라는 단어를 가장 많이 사용하고 있었다. 상위 10위 빈도수를 보인 단어를 이용하여 노인의 이미지를 표현하면, "노인은 사회의 존경을 받는 어르신이며 돈을 벌기위해 자격증을 따려고 하고 건강을 챙기며 고령에도 불구하고 100세까지 건강하게 일을 하기를 원하는 어르신"으로 정리되었다. 본 연구는 방대한 양의 데이터를 수집하여 이를 사회연결망 기법으로 분석함으로써 사회적 담론을 포함한 거시적 수준의 '노인 이미지' 분석을 통해 기존의 분석방법과 차별화하고자 하였다. 대중이 느끼는 노인에 대한 이미지가 '어르신'으로 긍정적으로 표현되는 것을 볼 때, 현재 추진하는 노인정책의 방향이 바람직한 방향으로 평가 받고 있다고 할 수 있으며, 한편으로는 그렇게 평가받기를 원하는 대중의 '욕구'를 느낄 수 있었다. 따라서 향후에 적용할 노인 정책 방향은, 노인들이 사회적 역할을 감당하여 사회에서 '필요한 존재'로 인식될 수 있도록 하는 정책이 우선되어야 한다. 또한 건강을 유지하고 활동할 수 있는 일자리 창출과 복지, 소외에 대한 대책 등의 우선순위가 반영된 노인 정책을 추진할 것을 제언하였다.

할랄 인증 화장품에 대한 소비자 인식: 트위터 텍스트 분석 (Consumer Perception of Halal Cosmetics : Insights from Twitter Text Mining)

  • 최영현;이규혜
    • 한국의류산업학회지
    • /
    • 제22권4호
    • /
    • pp.481-494
    • /
    • 2020
  • This study examined consumer perceptions and consumer responses of Halal cosmetics and compared them with vegan cosmetics, which is a term similarly used. Twitter API of Python 3.7 was used to collect the keywords '#halalcosmetics' and '#vegancosmetics'. First, the main perception of consumers on Halal cosmetics focused on the original concept, image, expected efficacy, and factors to consider before purchase, religious keywords, labels and packaging for Halal cosmetics. Second, the main consumer perception of vegan cosmetics was the product concept, expected efficacy, factors to consider before purchase, related vegan industry, image, and vegan cosmetic components. Third, the consumer perceptions of Halal cosmetics and vegan cosmetics were similar in multiple ways, and both concepts included the Cruelty-free concept. Fourth, consumer satisfaction factors included cosmetics color, brand's consumer service, efficacy, smell, packaging design, reasonable price, effects, and formulation of cosmetics as well as satisfaction with Halal certification, and satisfaction of Vegan consumers. Consumer dissatisfaction factors included smell, flavor, delay in shipping, dissatisfaction with formulation, discrepancy between actual color and computer screen, concern and distrust about the use of prohibited ingredients for Halal products. This study examined consumer perceptions and reactions to Halal and vegan cosmetics to create basic knowledge for niche markets that are emerging as an ethical beauty consumption trend.

문화권 클러스터링 기반 SNS 빅데이터 및 사용자 선호도 분석 (Cultural Region-based Clustering of SNS Big Data and Users Preferences Analysis)

  • 노승민
    • 한국항행학회논문지
    • /
    • 제22권6호
    • /
    • pp.670-674
    • /
    • 2018
  • 최근 댓글 / 텍스트, 이미지, 비디오, 블로그 및 사용자 경험을 포함한 소셜네트워크서비스(SNS) 데이터에는 다양한 고객의 추천 시스템을 구축하고 비즈니스 분석가에게 통찰력 있는 데이터 / 결과를 제공하는데 사용할 수 있는 많은 정보가 포함되어 있다. 멀티미디어 데이터, 특히 이미지 및 비디오와 같은 시각적 데이터는 SNS 데이터 중에서도 특정(문화권) 지역을 반영할 수 있는 가장 풍부한 데이터이며, 문화적 가치 및 관심사는 전반적으로 데이터의 많은 부분을 차지하고 있다. 이러한 방대한 데이터로부터 원하는 데이터를 지능적으로 추출하고, 엄청난 양의 데이터를 마이닝 하려면 보다 효율적이고 지능적인 데이터 분석 방법이 필요하다. 따라서 본 논문의 목적은 이러한 데이터를 모델링하고, 색인하고, 검색하는 방법에 대해 제안하고자 한다.

데이터 마이닝을 활용한 가짜뉴스의 선제적 대응을 위한 연구 : M 온라인 커뮤니티 게시물을 중심으로 (A Study on the Preemptive Measure for Fake News Eradication Using Data Mining Algorithms : Focused on the M Online Community Postings)

  • 임문영;박승범
    • 한국IT서비스학회지
    • /
    • 제18권1호
    • /
    • pp.219-234
    • /
    • 2019
  • Fake news threaten democratic elections and causes social conflicts, resulting in major damage. However, the concept of fake news is hard to define, as there is a saying, "News is not fake, fake is not news." Fake news, however, has irreversible characteristics that can not be recovered or reversed completely through post-punishment of economic and political benefits. It is also rapidly spreading in the early days. Therefore, it is very important to preemptively detect these types of articles and prevent their blind proliferation. The existing countermeasures are focused on reporting fake news, raising the level of punishment, and the media & academia to determine the authenticity of the news. Researchers are also trying to determine the authenticity by analyzing its contents. Apart from the contents of fake news, determining the behavioral characteristics of the promoters and its qualities can help identify the possibility of having fake news in advance. The online community has a fake news interception and response tradition through its long-standing community-based activities. As a result, I attempted to model the fake news by analyzing the affirmation-denial analysis and posting behavior by securing the web board crawl of the 'M community' bulletin board during the 2017 Korean presidential election period. Random forest algorithm deemed significant. The results of this research will help counteract fake news and focus on preemptive blocking through behavioral analysis rather than post-judgment after semantic analysis.

Quantitative Study of Soft Masculine Trends in Contemporary Menswear Using Semantic Network Analysis

  • Tin Chun Cheung;Sun Young Choi
    • 한국의류학회지
    • /
    • 제46권6호
    • /
    • pp.1058-1073
    • /
    • 2022
  • Big data analytics and social media have shifted the way fashion trends are dictated. Fashion as a medium for expressing gender has created new concepts of masculinity in popular culture, where men are increasingly depicted in a softer style. In this study, we analyzed 2,879 menswear collections over a 10-year period from Vogue US to uncover key menswear trends. Using Semantic Network Analysis (SNA) on Orange3, we were able to quantitatively analyze how contemporary menswear designers interpreted diversified trends of masculinity on the runway. Frequency and degree centrality were measured to weigh the significance of trend keywords. "Jacket (f = 3056; DC = 0.80), shirt (f = 1912; DC = 0.60) and pant (f = 1618; DC = 0.53)" were among the most prominent keywords. Our results showed that soft masculine keywords, e.g., "lace, floral, and pink" also appeared, but with the majority scoring DC = < 0.10. The findings provide an insight into key menswear trends through frequency, degree centrality measurements, time-series analysis, egocentric, and visual semantic networks. This also demonstrates the feasibility of using text analytics to visualize design trends, concepts, and patterns for application as an ideation tool for academic researchers, designers, and fashion retailers.

신뢰성있는 온라인 고객 리뷰 텍스트 마이닝 기반 식당 개별 음식 아이템 평가 (Rating Individual Food Items of Restaurant Menu based on Online Customer Reviews using Text Mining Technique)

  • 무자밀 후세인 사이드;정선태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.389-392
    • /
    • 2020
  • The growth in social media, blogs and restaurant listing directories have led to increasing customer reviews about restaurants, their quality of food items and services available on the internet. These user reviews offer a massive amount of valuable information that can be used for various decision-making purposes. Currently, most food recommendation sites provide recommendation scores about restaurants rather than food items of the restaurant and the provided recommendation scores may be biased since they are calculated only from user reviews listed only in their sites. Usually, people wants a reliable recommendation about foods, not restaurant. In this paper, we present a reliable Korean food items rating method; we first extract food items by applying NER technique to restaurant reviews collected from many Korean restaurant recommendation web sites, blogs and web data. Then, we apply lexicon-based sentiment analysis on collected user reviews and predict people's opinions as sentiment polarity scores (+1 for positive; -1 for negative; 0 for neutral). Finally, by taking average of all calculated polarity scores about a food item, we obtain a rating to individual menu items of the restaurant. The proposed food item rating is more reliable since it does not depend on reviews of only one site.

재해기상 언론기사 빅데이터를 활용한 피해정보 자동 분류기 개발 (Developing and Evaluating Damage Information Classifier of High Impact Weather by Using News Big Data)

  • 조수지;이기광
    • 산업경영시스템학회지
    • /
    • 제46권3호
    • /
    • pp.7-14
    • /
    • 2023
  • Recently, the importance of impact-based forecasting has increased along with the socio-economic impact of severe weather have emerged. As news articles contain unconstructed information closely related to the people's life, this study developed and evaluated a binary classification algorithm about snowfall damage information by using media articles text mining. We collected news articles during 2009 to 2021 which containing 'heavy snow' in its body context and labelled whether each article correspond to specific damage fields such as car accident. To develop a classifier, we proposed a probability-based classifier based on the ratio of the two conditional probabilities, which is defined as I/O Ratio in this study. During the construction process, we also adopted the n-gram approach to consider contextual meaning of each keyword. The accuracy of the classifier was 75%, supporting the possibility of application of news big data to the impact-based forecasting. We expect the performance of the classifier will be improve in the further research as the various training data is accumulated. The result of this study can be readily expanded by applying the same methodology to other disasters in the future. Furthermore, the result of this study can reduce social and economic damage of high impact weather by supporting the establishment of an integrated meteorological decision support system.

한국어 구문분석을 활용한 이유-감성 패턴 기반의 감성사전 구축 (Sentiment Dictionary Construction Based on Reason-Sentiment Pattern Using Korean Syntax Analysis)

  • 김우현;이희정
    • 산업경영시스템학회지
    • /
    • 제46권4호
    • /
    • pp.142-151
    • /
    • 2023
  • Sentiment analysis is a method used to comprehend feelings, opinions, and attitudes in text, and it is essential for evaluating consumer feedback and social media posts. However, creating sentiment dictionaries, which are necessary for this analysis, is complex and time-consuming because people express their emotions differently depending on the context and domain. In this study, we propose a new method for simplifying this procedure. We utilize syntax analysis of the Korean language to identify and extract sentiment words based on the Reason-Sentiment Pattern, which distinguishes between words expressing feelings and words explaining why those feelings are expressed, making it applicable in various contexts and domains. We also define sentiment words as those with clear polarity, even when used independently and exclude words whose polarity varies with context and domain. This approach enables the extraction of explicit sentiment expressions, enhancing the accuracy of sentiment analysis at the attribute level. Our methodology, validated using Korean cosmetics review datasets from Korean online shopping malls, demonstrates how a sentiment dictionary focused solely on clear polarity words can provide valuable insights for product planners. Understanding the polarity and reasons behind specific attributes enables improvement of product weaknesses and emphasis on strengths. This approach not only reduces dependency on extensive sentiment dictionaries but also offers high accuracy and applicability across various domains.