• Title/Summary/Keyword: 블로그 빅데이터

Search Result 64, Processing Time 0.057 seconds

A Classification of Medical and Advertising Blogs Using Machine Learning (머신러닝을 이용한 의료 및 광고 블로그 분류)

  • Lee, Gi-Sung;Lee, Jong-Chan
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.19 no.11
    • /
    • pp.730-737
    • /
    • 2018
  • With the increasing number of health consumers aiming for a happy quality of life, the O2O medical marketing market is activated by choosing reliable health care facilities and receiving high quality medical services based on the medical information distributed on web's blog. Because unstructured text data used on the Internet, mobile, and social networks directly or indirectly reflects authors' interests, preferences, and expectations in addition to their expertise, it is difficult to guarantee credibility of medical information. In this study, we propose a blog reading system that provides users with a higher quality medical information service by classifying medical information blogs (medical blog, ad blog) using bigdata and MLP processing. We collect and analyze many domestic medical information blogs on the Internet based on the proposed big data and machine learning technology, and develop a personalized health information recommendation system for each disease. It is expected that the user will be able to maintain his / her health condition by continuously checking his / her health problems and taking the most appropriate measures.

COVID-19 and Korean Family Life on Social Media: A Topic Model Approach (소셜 빅데이터로 알아본 코로나19와 가족생활: 토픽모델 접근)

  • Park, Sunyoung;Lee, Jaerim
    • The Journal of the Korea Contents Association
    • /
    • v.21 no.3
    • /
    • pp.282-300
    • /
    • 2021
  • The purpose of this study was to explore what social media posts tell us about family life during the COVID-19 pandemic by examining the keywords and topics underlying posts on blogs and online forums. Our criteria for web crawling were (a) blog and forum posts on Naver and Daum, the top portal sites in Korea, (b) posts between February 23 and April 19, 2020, the period of the first heightened social distancing orders, and (c) inclusion of "COVID" and "family" or "COVID" and "home." We analyzed 351,734 posts using TF-IDF values and topic modeling based on latent Dirichlet allocation. We identified and named 22 topics including COVID-19 prevention, family infection, family health, dietary life and changes, religious life, stuck at home, postponed school year, family events, travel and vacations, concerns about family and friends, anxiety and stress, disaster and damage, COVID-19 warning text messages, family support policies, Shin-cheon-ji and Daegu. The results show that COVID-19 impacted various domains of family life including health, food, housing, religion, child care, education, rituals, and leisure as well as relationships and emotions.

Development of Web Crawler and Network Analysis Technology for Occurrence and Prediction of Flooding (수난 발생 및 규모 예측을 위한 웹 크롤러 및 네트워크 분석기술 개발)

  • Seo, Dongmin;Kim, Hoyong;Lee, Jeongha;Hwang, Seokhwan
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2019.05a
    • /
    • pp.5-6
    • /
    • 2019
  • 빅데이터 분석을 위해 활용되는 데이터로는 뉴스, 블로그, SNS, 논문, 특허 그리고 센서로부터 수집된 데이터 등 매우 다양한 유형의 데이터가 있다. 특히, 신뢰성 있는 데이터를 실시간 제공하는 웹 데이터의 활용이 점차 확산되고 있다. 그리고 빅데이터의 활용이 다양한 분야로 점차 확산되고 웹 데이터가 매년 기하급수적으로 증가하면서, 최근 웹 데이터는 재난대응 미디어로써 매우 중요한 역할을 하고 있다. 또한, 빅데이터 분석에 활용되는 원천 데이터는 네트워크 형태이며, 최근 소셜 네트워크 분석을 통한 효과적인 상품 광고, 핵심 유전자 발굴, 신약 재창출 등 다양한 영역에서 네트워크 분석 기술이 사회와 인류에게 가치 있는 정보를 제공할 수 있는 가능성을 제시하면서 네트워크 분석 기술의 중요성이 부각되고 있다. 본 논문에서는 웹에서 제공하는 뉴스와 SNS 데이터를 이용해 수난 발생 및 규모 예측을 지원하는 웹 크롤러 및 네트워크 분석기술을 제안한다.

  • PDF

A Study on Hotel CRM(Customer Relationship Management) using Big Data (빅 데이터를 이용한 호텔 CRM에 관한 연구)

  • Kong, Hyo-soon;Song, Eun-jee
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2013.05a
    • /
    • pp.706-707
    • /
    • 2013
  • 최근 스마트 폰 출현에 따른 모바일 환경의 발달과 지속적인 IT 발달로 인해 새롭게 창출, 유통되는 정보가 기하급수적으로 증가하여 실시간으로 소비자의 니즈를 파악할 수 있는 가장 효율적인 방법은 블로그나 SNS 등과 같은 빅 데이터를 이용하는 것이다. 따라서 기업이 효율적인 고객관계관리(CRM:Customer Relationship Management)를 실행하기 위해서 빅 데이터는 매우 필요한 자원이다. 그러나 고객에 대한 서비스와 관리가 매우 중요한 호텔기업에 있어 현재 우리나라에서는 빅 데이터를 이용한 CRM 은 매우 부족한 상황이다. 본 연구에서는 빅 데이터를 이용한 CRM에 대한 고찰을 하고 빅 데이터를 이용한 호텔 CRM을 제안한다.

  • PDF

Implementation and Comparison of Atypical Big-Data Collecting Modules (비정형 빅데이터 수집 모듈의 구현 및 비교)

  • Kim, JungKi;Cheon, YoSeop;Kim, WooSaeng
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2014.04a
    • /
    • pp.631-634
    • /
    • 2014
  • 최근 스마트폰의 보급으로 블로그, SNS 등에서 방대한 양의 데이터가 발생함에 따라 이를 수집하고 분석하는 작업의 중요성이 커지고 있다. 이러한 데이터는 크게 정형 데이터와 비정형 데이터로 나눌 수 있는데, 특히 비정형 데이터는 전체 데이터의 약 80%를 차지할 정도로 그 양과 가치가 매우 크다. 이 논문에서는 빅데이터 환경에서 발생하는 이러한 비정형 데이터를 수집하는 모듈 중 가장 널리 알려진 Chukwa와 Flume에 대한 개발 및 비교 분석을 시도 하였다.

A Remote Blog Posting Tool With Meta Weblog API (MetaWeblog API를 이용한 원격 블로그 포스팅 도구)

  • Kim, Sang-Yun;Kim, Eun-Min;Lee, Chung-Hoon;Lee, Sang-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2014.11a
    • /
    • pp.1149-1152
    • /
    • 2014
  • 빅데이터 정보화 시대에 들어 많은 정보들이 개인 블로그에 포스팅 되고 있다. 하지만 각각의 블로그들은 다른 UI, API를 제공하고 편집에 있어 불편한 부분이 많다. 따라서 공통된 하나의 도구를 이용해 추가, 편집 할 수 있는 프로그램을 제작해 작성자의 편리함을 도모하고자 한다.

Prediction of Onion Purchase Using Structured and Unstructured Big Data (정형 및 비정형 빅데이터를 이용한 양파 소비 예측)

  • Rah, HyungChul;Oh, Eunhwa;Yoo, Do-il;Cho, Wan-Sup;Nasridinov, Aziz;Park, Sungho;Cho, Youngbeen;Yoo, Kwan-Hee
    • The Journal of the Korea Contents Association
    • /
    • v.18 no.11
    • /
    • pp.30-37
    • /
    • 2018
  • The social media data and the broadcasting data related to onion as well as agri-food consumer panel data were collected and investigated if the amount of money spent to purchase onion in year 2014 when onion price plunged latest were correlated with the frequencies of onion-related keywords in the social media data and the broadcasting programs because onion price in year 2018 is expected to plunge due to overproduction and there has been needs to analyze impacts of social media and broadcasting program on onion purchase in the previous similar events, and identify potential factors that can promote onion consumption in advance. What we identified from our study include a) broadcasting news programs mentioning words "onion," were correlated with onion purchase with 3 - 6 weeks in advance; b) broadcasting entertainment programs mentioning words "onion and health," were correlated with onion purchase with 11 weeks in advance; c) blog mentioning words "onion and efficacy," were correlated with onion purchase with 5 weeks in advance. Our study provided a case on how social media and broadcasting programs could be analyzed for their effects on consumer purchase behavior using big data collection and analysis in the field of agriculture. We propose to use the findings from the study may be applied to promote onion consumption.

Logistic Regression Ensemble Method for Extracting Significant Information from Social Texts (소셜 텍스트의 주요 정보 추출을 위한 로지스틱 회귀 앙상블 기법)

  • Kim, So Hyeon;Kim, Han Joon
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.6 no.5
    • /
    • pp.279-284
    • /
    • 2017
  • Currenty, in the era of big data, text mining and opinion mining have been used in many domains, and one of their most important research issues is to extract significant information from social media. Thus in this paper, we propose a logistic regression ensemble method of finding the main body text from blog HTML. First, we extract structural features and text features from blog HTML tags. Then we construct a classification model with logistic regression and ensemble that can decide whether any given tags involve main body text or not. One of our important findings is that the main body text can be found through 'depth' features extracted from HTML tags. In our experiment using diverse topics of blog data collected from the web, our tag classification model achieved 99% in terms of accuracy, and it recalled 80.5% of documents that have tags involving the main body text.

A Study on the Integrated Analysis System on Internal and External Heterogeneous Data of Enterprise (기업의 내/외부 이기종 데이터 통합 분석 시스템에 관한 연구)

  • Song, Eun-Jee;Kang, Min-Shik
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2014.10a
    • /
    • pp.643-644
    • /
    • 2014
  • 정보기술의 발달과 인터넷의 확산 등의 사회적인 변화에 따라 고객을 효과적으로 만족시킬 수 있도록 기업은 고객과의 장기적인 관계를 구축하는 고객관계관리(CRM: Customer Relationship Management)을 사용하고 있다. 최근에는 블로그나 SNS등에 기업이 상품이나 서비스를 팔고자 하는 소비자들이 가득 모여 있기 때문에 실시간으로 소비자의 니즈를 파악할 수 있는 방법으로 트위터, 블로그, 카페 등 SNS 상의 빅 데이터를 분석하는 시스템을 이용한다. 본 논문에서는 고객의 보다 효율적인 피드백 수집분석을 위해 기존의 기업/기관에서 운영 및 관리하는 내부 CRM 데이터와 SNS 상의 외부 데이터를 연동하여 분석할 수 있는 이기종 데이터의 통합 분석엔진 시스템을 제안한다. 이를 의료서비스에 적용하여 내부 데이터인 매출, 방문자 수, 진료과 정보, 환자 정보, 고객 불만 유형 등을 분석하고 소셜데이터를 통해 해당 의료기관에 대한 소비자 경험 (진료, 시설 등) 정보를 수집한다.

  • PDF