• 제목/요약/키워드: 블로그 빅데이터

검색결과 66건 처리시간 0.032초

머신러닝을 이용한 의료 및 광고 블로그 분류 (A Classification of Medical and Advertising Blogs Using Machine Learning)

  • 이기성;이종찬
    • 한국산학기술학회논문지
    • /
    • 제19권11호
    • /
    • pp.730-737
    • /
    • 2018
  • 행복한 삶의 질을 목적으로 하는 의료소비자가 증가하면서 웹에 분산되어 있는 블로그의 의료 정보를 바탕으로 신뢰성 있는 의료 시설을 선택하고 고품질의 의료 서비스를 받음으로서, 시간과 비용을 절약할 수 있는 O2O 의료 마케팅 시장이 활성화 되고 있다. 인터넷, 모바일, SNS 등에서 증가하는 비정형 텍스트 데이터는 전문 의료 지식 이외에 작성자의 관심, 선호, 예상 등을 직간접적으로 반영하고 있기 때문에 의료정보의 신뢰성을 담보하기 어렵다. 본 연구에서는 빅데이터 및 MLP를 사용하여 의료정보 블로그를 분류 (의료블로그, 광고블로그)함으로서 사용자에게 보다 고품질의 의료정보 서비스를 제공하는 블로그 판단 시스템을 제안한다. 제안된 빅데이터 및 머신러닝 기술을 통해 인터넷상에 존재하는 국내의 다수 의료정보 블로그를 종합, 분석한 후 질환별 개인 맞춤형 건강정보 추천 시스템을 개발한다. 이를 통하여 사용자는 자신의 건강문제를 지속적으로 점검하고 가장 적절한 조치를 취함으로서 자신의 건강 상태를 유지하는 것이 가능할 것으로 기대된다.

가상화폐에 대한 빅데이터 분석 (The Analysis of Big-Data on Virtual Currency)

  • 김도관
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 춘계학술대회
    • /
    • pp.122-124
    • /
    • 2018
  • 가상화폐가 일반인들의 재테크 수단으로 발전하고 있는 상황에서 본 연구에서는 가상화폐에 대한 빅데이터 분석을 실시하고자 한다. 가상화폐에 대한 빅데이터 분석은 블로그와 트위터와 같은 SNS상에서 가상화폐에 대한 논의를 집중적으로 분석한다.

  • PDF

소셜 빅데이터로 알아본 코로나19와 가족생활: 토픽모델 접근 (COVID-19 and Korean Family Life on Social Media: A Topic Model Approach)

  • 박선영;이재림
    • 한국콘텐츠학회논문지
    • /
    • 제21권3호
    • /
    • pp.282-300
    • /
    • 2021
  • 본 연구의 목적은 코로나19 확산으로 가족생활에서 급격한 변화가 일어난 1차 확산기에 블로그와 온라인 카페에 게시된 소셜 빅데이터를 분석하여 키워드를 파악하고, 게시글에 잠재된 주요 토픽을 발견하는 것이다. 강화된 사회적 거리두기가 처음 시행되었던 2020년 2월 23일부터 4월 19일까지 네이버와 다음의 블로그 및 카페에 게시된 글 중 '코로나'와 '가족' 또는 '코로나'와 '가정'이 함께 언급된 문서 총 351,734건을 분석하였다. 수집된 데이터는 전처리를 거쳐 텍스트 마이닝 기법으로 분석하였다. TF-IDF 가중치 값을 바탕으로 상위 100개 단어를 살펴보았으며, 잠재디리클레할당 방식의 토픽모델 분석을 통해 총 22개 토픽을 도출하고 토픽명을 부여하였다. 연구결과, 코로나19가 가족의 일상생활에 미친 전방위적 영향이 나타났으며, 특히 식생활, 주거생활, 여가생활, 종교생활, 자녀돌봄, 자녀교육, 가족관계, 가족의례 등에서 변화가 두드러졌다. 더불어, 가족 관련 국내 문헌에서는 잘 논의되지 않던 건강공동체로서의 가족을 시사하는 토픽도 등장하였다.

수난 발생 및 규모 예측을 위한 웹 크롤러 및 네트워크 분석기술 개발 (Development of Web Crawler and Network Analysis Technology for Occurrence and Prediction of Flooding)

  • 서동민;김호용;이정하;황석환
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2019년도 춘계종합학술대회
    • /
    • pp.5-6
    • /
    • 2019
  • 빅데이터 분석을 위해 활용되는 데이터로는 뉴스, 블로그, SNS, 논문, 특허 그리고 센서로부터 수집된 데이터 등 매우 다양한 유형의 데이터가 있다. 특히, 신뢰성 있는 데이터를 실시간 제공하는 웹 데이터의 활용이 점차 확산되고 있다. 그리고 빅데이터의 활용이 다양한 분야로 점차 확산되고 웹 데이터가 매년 기하급수적으로 증가하면서, 최근 웹 데이터는 재난대응 미디어로써 매우 중요한 역할을 하고 있다. 또한, 빅데이터 분석에 활용되는 원천 데이터는 네트워크 형태이며, 최근 소셜 네트워크 분석을 통한 효과적인 상품 광고, 핵심 유전자 발굴, 신약 재창출 등 다양한 영역에서 네트워크 분석 기술이 사회와 인류에게 가치 있는 정보를 제공할 수 있는 가능성을 제시하면서 네트워크 분석 기술의 중요성이 부각되고 있다. 본 논문에서는 웹에서 제공하는 뉴스와 SNS 데이터를 이용해 수난 발생 및 규모 예측을 지원하는 웹 크롤러 및 네트워크 분석기술을 제안한다.

  • PDF

빅 데이터를 이용한 호텔 CRM에 관한 연구 (A Study on Hotel CRM(Customer Relationship Management) using Big Data)

  • 공효순;송은지
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 춘계학술대회
    • /
    • pp.706-707
    • /
    • 2013
  • 최근 스마트 폰 출현에 따른 모바일 환경의 발달과 지속적인 IT 발달로 인해 새롭게 창출, 유통되는 정보가 기하급수적으로 증가하여 실시간으로 소비자의 니즈를 파악할 수 있는 가장 효율적인 방법은 블로그나 SNS 등과 같은 빅 데이터를 이용하는 것이다. 따라서 기업이 효율적인 고객관계관리(CRM:Customer Relationship Management)를 실행하기 위해서 빅 데이터는 매우 필요한 자원이다. 그러나 고객에 대한 서비스와 관리가 매우 중요한 호텔기업에 있어 현재 우리나라에서는 빅 데이터를 이용한 CRM 은 매우 부족한 상황이다. 본 연구에서는 빅 데이터를 이용한 CRM에 대한 고찰을 하고 빅 데이터를 이용한 호텔 CRM을 제안한다.

  • PDF

비정형 빅데이터 수집 모듈의 구현 및 비교 (Implementation and Comparison of Atypical Big-Data Collecting Modules)

  • 김정기;천요섭;김우생
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.631-634
    • /
    • 2014
  • 최근 스마트폰의 보급으로 블로그, SNS 등에서 방대한 양의 데이터가 발생함에 따라 이를 수집하고 분석하는 작업의 중요성이 커지고 있다. 이러한 데이터는 크게 정형 데이터와 비정형 데이터로 나눌 수 있는데, 특히 비정형 데이터는 전체 데이터의 약 80%를 차지할 정도로 그 양과 가치가 매우 크다. 이 논문에서는 빅데이터 환경에서 발생하는 이러한 비정형 데이터를 수집하는 모듈 중 가장 널리 알려진 Chukwa와 Flume에 대한 개발 및 비교 분석을 시도 하였다.

MetaWeblog API를 이용한 원격 블로그 포스팅 도구 (A Remote Blog Posting Tool With Meta Weblog API)

  • 김상윤;김은민;이청훈;이상호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.1149-1152
    • /
    • 2014
  • 빅데이터 정보화 시대에 들어 많은 정보들이 개인 블로그에 포스팅 되고 있다. 하지만 각각의 블로그들은 다른 UI, API를 제공하고 편집에 있어 불편한 부분이 많다. 따라서 공통된 하나의 도구를 이용해 추가, 편집 할 수 있는 프로그램을 제작해 작성자의 편리함을 도모하고자 한다.

정형 및 비정형 빅데이터를 이용한 양파 소비 예측 (Prediction of Onion Purchase Using Structured and Unstructured Big Data)

  • 나형철;오은화;유도일;조완섭;아지즈 나스리디노프;박성호;조용빈;류관희
    • 한국콘텐츠학회논문지
    • /
    • 제18권11호
    • /
    • pp.30-37
    • /
    • 2018
  • 인터넷 시대를 살아가는 현대인의 식품 소비는 다양한 대충 매체 및 소셜 미디어를 통해 신속하고 방대한 정보 전달에 영향을 받는 것으로 알려져 있다. 2018년 4월 국내 언론 보도에 따르면, 양파 재배 면적이 증가하고 양파 생산량이 증가할 것으로 예상되며, 이후에 양파 가격은 폭락할 것으로 예상되었다. 이러한 상황을 고려하여 SNS, 인터넷 정보 검색, 방송 프로그램에서 언급된 양파 관련 정보를 분석하여, 실제 가격폭락이 발생하기 전에, 양파 소비를 촉진할 수 있는 요인을 파악할 필요가 있다. 2018년 양파 생산량 증가에 따른 양파 가격 폭락이 예상되는 상황에, 가장 최근 양파 생산량 증가에 따라 가격 폭락을 경험하였던 2014년의 방송 프로그램 및 SNS가 양파 소비와 연계되었는지 파악하고자, 양파 소비 촉진과 관련된 정형 및 비정형 빅데이터를 수집하여, 양파 소비 촉진과 관련된 변수를 찾아 양파 가격 하락이 예상되는 2018년에 소비 촉진에 활용하고자 본 연구를 수행하였다. 연구 결과, 방송 뉴스의 양파 언급 기사 수(3~6주), 양파와 건강을 언급하는 방송 프로그램 수(11주), 양파의 효능을 언급하는 블로그의 댓글 빈도(5주)가 양파 구매금액 증가에 시차를 두고 양의 상관관계를 갖는 것을 확인한 본 연구 결과를 근거로, 양파 생산량 증가에 따른 양파 가격 폭락 시, 양파 소비 촉진을 위한 홍보에, 뉴스, 먹방, 쿡방 등의 방송 프로그램 및 블로그 등의 매체를 활용하는 소비촉진에 기여할 것으로 여겨진다.

소셜 텍스트의 주요 정보 추출을 위한 로지스틱 회귀 앙상블 기법 (Logistic Regression Ensemble Method for Extracting Significant Information from Social Texts)

  • 김소현;김한준
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권5호
    • /
    • pp.279-284
    • /
    • 2017
  • 빅데이터 시대를 맞이하여 텍스트마이닝과 오피니언마이닝의 활용도가 커지고 있는 시점에서 소셜 네트워크 서비스로부터 유용한 정보를 추출하는 작업은 매우 중요한 연구 주제 중 하나이다. 이에 본 논문은 블로그 HTML 문서에서 주요 본문을 찾는 로지스틱 회귀 앙상블 기법을 제안한다. 먼저, 블로그 HTML 태그에서 구조적 특징, 텍스트 특징을 추출한다. 그 다음, 블로그 HTML 문서에서 추출한 태그 특징에 로지스틱 회귀 및 앙상블 기법을 적용하여 본문을 포함하는 태그를 분류하는 모델을 구성한다. 본 연구의 중요한 발견 중 하나는 태그의 깊이 특징을 이용하여 주요 본문을 찾을 수 있다는 점이다. 다양한 주제의 국내 블로그 데이터를 이용한 실험에서 태그 분류 정확도가 99%, 본문을 찾아낸 문서의 비율이 80.5%로 평가되었다.

기업의 내/외부 이기종 데이터 통합 분석 시스템에 관한 연구 (A Study on the Integrated Analysis System on Internal and External Heterogeneous Data of Enterprise)

  • 송은지;강민식
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 추계학술대회
    • /
    • pp.643-644
    • /
    • 2014
  • 정보기술의 발달과 인터넷의 확산 등의 사회적인 변화에 따라 고객을 효과적으로 만족시킬 수 있도록 기업은 고객과의 장기적인 관계를 구축하는 고객관계관리(CRM: Customer Relationship Management)을 사용하고 있다. 최근에는 블로그나 SNS등에 기업이 상품이나 서비스를 팔고자 하는 소비자들이 가득 모여 있기 때문에 실시간으로 소비자의 니즈를 파악할 수 있는 방법으로 트위터, 블로그, 카페 등 SNS 상의 빅 데이터를 분석하는 시스템을 이용한다. 본 논문에서는 고객의 보다 효율적인 피드백 수집분석을 위해 기존의 기업/기관에서 운영 및 관리하는 내부 CRM 데이터와 SNS 상의 외부 데이터를 연동하여 분석할 수 있는 이기종 데이터의 통합 분석엔진 시스템을 제안한다. 이를 의료서비스에 적용하여 내부 데이터인 매출, 방문자 수, 진료과 정보, 환자 정보, 고객 불만 유형 등을 분석하고 소셜데이터를 통해 해당 의료기관에 대한 소비자 경험 (진료, 시설 등) 정보를 수집한다.

  • PDF