• 제목/요약/키워드: social media big data

검색결과 287건 처리시간 0.026초

텍스트마이닝을 이용한 약물유해반응 보고자료 분석 (Analysis of Adverse Drug Reaction Reports using Text Mining)

  • 김현희;유기연
    • 한국임상약학회지
    • /
    • 제27권4호
    • /
    • pp.221-227
    • /
    • 2017
  • Background: As personalized healthcare industry has attracted much attention, big data analysis of healthcare data is essential. Lots of healthcare data such as product labeling, biomedical literature and social media data are unstructured, extracting meaningful information from the unstructured text data are becoming important. In particular, text mining for adverse drug reactions (ADRs) reports is able to provide signal information to predict and detect adverse drug reactions. There has been no study on text analysis of expert opinion on Korea Adverse Event Reporting System (KAERS) databases in Korea. Methods: Expert opinion text of KAERS database provided by Korea Institute of Drug Safety & Risk Management (KIDS-KD) are analyzed. To understand the whole text, word frequency analysis are performed, and to look for important keywords from the text TF-IDF weight analysis are performed. Also, related keywords with the important keywords are presented by calculating correlation coefficient. Results: Among total 90,522 reports, 120 insulin ADR report and 858 tramadol ADR report were analyzed. The ADRs such as dizziness, headache, vomiting, dyspepsia, and shock were ranked in order in the insulin data, while the ADR symptoms such as vomiting, 어지러움, dizziness, dyspepsia and constipation were ranked in order in the tramadol data as the most frequently used keywords. Conclusion: Using text mining of the expert opinion in KIDS-KD, frequently mentioned ADRs and medications are easily recovered. Text mining in ADRs research is able to play an important role in detecting signal information and prediction of ADRs.

트윗 데이터를 활용한 IT 트렌드 분석 (An Analysis of IT Trends Using Tweet Data)

  • 이진백;이충권;차경진
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.143-159
    • /
    • 2015
  • 불확실한 환경변화에 대처하고 장기적 전략수립을 위해 기업에게 있어서 IT 트렌드에 대한 예측은 오랫동안 중요한 주제였다. IT 트렌드에 대한 예측을 기반으로 새로운 시대에 대한 인식을 하고 예산을 배정하여 빠르게 변화하는 기술의 추세에 대비할 수 있기 때문이다. 해마다 유수의 컨설팅업체들과 조사기관에서 차년도 IT 트렌드에 대해서 발표되고는 있지만, 이러한 예측이 실제로 차년도 비즈니스 현실세계에서 나타났는지에 대한 연구는 거의 없었다. 본 연구는 현존하는 빅데이터 기술을 활용하여 서울지역을 중심으로 지난 8개월동안(2013년 5월1일부터 2013년12월31까지) 정보통신산업진흥원과 한국정보화진흥원에서 2012년 말에 발표한 IT 트렌드 토픽이 언급된 21,589개의 트윗 데이터를 수집하여 분석하였다. 또한 2013년에 나라장터에 올라온 프로젝트들이 IT트렌드 토픽과 관련이 있는지 상관관계분석을 실시하였다. 연구결과, 빅데이터, 클라우드, HTML5, 스마트홈, 테블릿PC, UI/UX와 같은 IT토픽은 시간이 지날수록 매우 빈번하게 언급되어졌으며, 이 같은 토픽들은 2013년 나라장터 공고 프로젝트 데이터와도 매우 유의한 상관관계를 가지고 있는 것을 확인할 수 있었다. 이는 전년도(2012년)에 예측한 트렌드들이 차년도(2013년)에 실제로 트위터와 한국정부의 공공조달사업에 반영되어 나타나고 있는 것을 의미한다. 본 연구는 최신 빅데이터툴을 사용하여, 유수기관의 IT트렌드 예측이 실제로 트위터와 같은 소셜미디에서 생성되는 트윗데이터에서 얼마나 언급되어 나타나는지 추적했다는 점에서 중요한 의의가 있고, 이를 통해 트위터가 사회적 트랜드의 변화를 효율적으로 추적하기에 유용한 도구임을 확인하고자 할 수 있었다.

문화권 클러스터링 기반 SNS 빅데이터 및 사용자 선호도 분석 (Cultural Region-based Clustering of SNS Big Data and Users Preferences Analysis)

  • 노승민
    • 한국항행학회논문지
    • /
    • 제22권6호
    • /
    • pp.670-674
    • /
    • 2018
  • 최근 댓글 / 텍스트, 이미지, 비디오, 블로그 및 사용자 경험을 포함한 소셜네트워크서비스(SNS) 데이터에는 다양한 고객의 추천 시스템을 구축하고 비즈니스 분석가에게 통찰력 있는 데이터 / 결과를 제공하는데 사용할 수 있는 많은 정보가 포함되어 있다. 멀티미디어 데이터, 특히 이미지 및 비디오와 같은 시각적 데이터는 SNS 데이터 중에서도 특정(문화권) 지역을 반영할 수 있는 가장 풍부한 데이터이며, 문화적 가치 및 관심사는 전반적으로 데이터의 많은 부분을 차지하고 있다. 이러한 방대한 데이터로부터 원하는 데이터를 지능적으로 추출하고, 엄청난 양의 데이터를 마이닝 하려면 보다 효율적이고 지능적인 데이터 분석 방법이 필요하다. 따라서 본 논문의 목적은 이러한 데이터를 모델링하고, 색인하고, 검색하는 방법에 대해 제안하고자 한다.

비정형 빅데이터의 실시간 복합 이벤트 탐지를 위한 기법 (The Method for Real-time Complex Event Detection of Unstructured Big data)

  • 이준희;백성하;이순조;배해영
    • Spatial Information Research
    • /
    • 제20권5호
    • /
    • pp.99-109
    • /
    • 2012
  • 최근 소셜 미디어의 발달과 스마트폰의 확산으로 SNS(Social Network Service)가 활성화가 되면서 데이터양이 폭발적으로 증가하였다. 이에 맞춰 빅데이터 개념이 새롭게 대두되었으며, 빅데이터를 활용하기 위한 많은 방안이 연구되고 있다. 여러 기업이 보유한 빅데이터의 가치창출을 극대화하기 위해 기존 데이터와의 융합이 필요하며, 물리적, 논리적 저장구조가 다른 이기종 데이터 소스를 통합하고 관리하기 위한 시스템이 필요하다. 빅데이터를 처리하기 위한 시스템인 맵리듀스는 분산처리를 활용하여 빠른게 데이터를 처리한다는 이점이 있으나 모든 키워드에 대해 시스템을 구축하여 저장 및 검색 등의 과정을 거치므로 실시간 처리에 어려움이 따른다. 또한, 이기종 데이터를 처리하는 구조가 없어 복합 이벤트를 처리하는데 추가 비용이 발생할 수 있다. 이를 해결하는 방안으로 기존에 연구된 복합 이벤트 처리 시스템을 활용하여 실시간 복합 이벤트 탐지를 위한 기법을 제안하고자 한다. 복합 이벤트 처리 시스템은 서로 다른 이기종 데이터 소스로부터 각각의 데이터들을 통합하고 이벤트들의 조합이 가능하며 스트림 데이터를 즉시 처리할 수 있어 실시간 처리에 유용하다. 그러나 SNS, 인터넷 기사 등 텍스트 기반의 비정형 데이터를 텍스트형으로 관리하고 있어 빅데이터에 대한 질의가 요청될 때마다 문자열 비교를 해야 하므로 성능저하가 발생할 여지가 있다. 따라서 복합 이벤트 처리 시스템에서 비정형 데이터를 관리하고 질의처리가 가능하도록 문자열의 논리적 스키마를 부여하고 데이터 통합 기능을 제안한다. 그리고 키워드 셋을 이용한 필터링 기능으로 문자열의 키워드를 정수형으로 변환함으로써 반복적인 비교 연산을 줄인다. 또한, 복합 이벤트 처리 시스템을 활용하면 인 메모리(In-memory)에서 실시간 스트림 데이터를 처리함으로써 디스크에 저장하고 불러들이는 시간을 줄여 성능 향상을 가져온다.

빅데이터와 AI를 활용한 교육용 자료의 분석에 대한 조사 (A Survey on Deep Learning-based Analysis for Education Data)

  • 노영욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.240-243
    • /
    • 2021
  • 최근에 빅 데이터와 AI 기술을 교육의 평가와 개별 학습에 적용하는 연구 성과가 있었다. 정보 기술의 혁신으로 소셜 미디어, MOOC, 지능형 개인지도 시스템, LMS, 센서 및 모바일 장치 등으로부터 학생들의 개인 기록, 생리학적 데이터, 학습 로그 및 활동, 학습 성과 및 결과를 포함하는 동적이고 복잡한 데이터를 수집 가능하였다. 또한 COVID-19 환경에서 e-러닝이 활성화 되어 많은 양의 학습 데이터가 생성되었다. 이 데이터로부터 학습 분석과 AI 기술을 적용하여 의미있는 패턴의 추출과 지식의 발견이 될 것으로 예상된다. 학습자 측면에서 학생의 학습 및 정서적 행동 패턴과 프로필을 식별하고, 평가 및 평가 방법을 개선하고, 개별 학생의 학습 성과 또는 중퇴를 예측하고, 개인화 된 지원을 위한 적응 시스템에 대한 연구는 필요하다. 본 연구에서는 교육용 데이터를 대상으로 이상탐지와 추천시스템에서 사용하는 기계학습 기술에 대한 조사와 분류를 하여 교육 분야의 연구에 기여하고자 한다.

  • PDF

A Study on the Classification of Unstructured Data through Morpheme Analysis

  • Kim, SungJin;Choi, NakJin;Lee, JunDong
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권4호
    • /
    • pp.105-112
    • /
    • 2021
  • 빅데이터 시대에 접어들며 데이터에 대한 관심이 폭발적으로 늘어나고 있다. 특히, 인터넷 및 소셜미디어의 발전은 새로운 데이터들의 생성으로 연결되어 빅데이터와 인공지능 시대의 실현과 융합 기술의 새로운 장을 열 수 있게 되었으며, 과거에는 프로그램으로 다루지 못하던 데이터에 대한 분석 요구가 많이 발생하고 있다. 본 논문에서는 빅데이터 시대에서 많이 요구되는 비정형 데이터에 대한 분류를 위하여 분석 모델을 설계하고 이를 검증하였다. 데이터는 디비피아의 논문 요약과 주제어, 그리고 부주제 어를 크롤링하였으며, 코엔엘피의 데이터 사전을 이용해 데이터베이스를 생성하고, 형태소 분석을 통하여 단어의 토큰화 과정을 수행하였다. 또한, 카이스트의 9 품사 분류 체계를 이용해 명사를 추출하고, TF-IDF 값을 생성하였으며, 학습 데이터와 Y 값을 결합하여 분석 데이터 셋을 생성하였다. 이와 같이 생성된 분석 데이터 셋에 랜덤 포레스트와 서포트 벡터 머신 그리고 의사결정트리, 이렇게 세 가지 분석 알고리즘을 적용하여 분류의 적정성을 측정하였다. 본 논문에서 제안한 분류 모델 기법은 논문 분류 외에도 민원 분류 분석 및 텍스트 관련 분석 등 다양한 분야에 유용하게 사용될 수 있다.

노인 인지능력 개선을 위한 헬스케어 서비스디자인 연구: 비정형 데이터 분석을 중심으로 (A Study on Health Care Service Design for the Improvement of Cognitive Abilities of the Senior Citizens: Focusing on Unstructured Data Analysis)

  • 김성호;김협
    • 지식경영연구
    • /
    • 제23권4호
    • /
    • pp.69-89
    • /
    • 2022
  • 초고령사회로 접어들면서 노인의 건강 문제는 의료분야를 포함해 경제, 사회, 문화 등 다양한 분야에 영향을 미치고 있다. 본 연구에서는 노인의 인지능력 개선을 위한 디지털 헬스케어 서비스디자인을 적용하기 위하여 텍스트마이닝, 사회연결망 분석 등 비정형 데이터를 분석하여 시사점을 도출하고자 한다. 본 연구의 연구 절차는 서비스디자인 방법론을 비정형 데이터 분석에 적합한 프로세스로 개선하여 6단계로 적용하였다. 소셜미디어에 존재하는 노인인지 개선, 헬스케어를 중심으로 관련 키워드를 수집 및 분석하였고, 이 결과를 바탕으로 노인 인지능력 개선을 위한 헬스케어 서비스디자인의 방향성을 도출하였다. 본 연구의 결과는 빅데이터 분석 방법의 활용 범위 확장 및 기존 헬스케어 서비스 개발 방법론 개선에 도움을 줄 수 있는 학술적, 실무적 시사점을 제공할 것으로 사료된다.

A self-portrait of the information society: An Arguments on the SNS users' Responsibilities

  • Seo, Ran-Sug
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권8호
    • /
    • pp.159-172
    • /
    • 2020
  • 소셜 네트워킹 서비스(SNS)가 인터넷, 스마트폰과 함께 크게 발전하고 있다. 친근한 SNS이지만 그 실체를 깊이 생각해 보면 정말 다양한 얼굴을 갖고 있다는 것을 알게 된다. 사용자간의 커뮤니케이션 툴이기도 하고, 정보를 전달하는 매체이기도 하며, 어플리케이션을 제공하는 인프라이기도 하고, 공통의 관심을 가진 사람들이 모이는 커뮤니티이기도 하다. 최근 몇 년간은 사업도구와 쇼핑, 결제수단도 삼키려 하고 있다. SNS의 확산이 현실 사회에 미치는 영향도 확대되고 있으며 사회학의 관점에서 다루어지는 일도 늘어나고 있다. 또한 SNS의 기술적인 측면에 주목하면, 대규모 액세스를 처리하는 인프라, 쾌적한 이용을 지지하는 유저 인터페이스, 사람들의 행동을 보다 깊게 이해하기 위한 빅데이터 분석인 아무래도, 여러 가지 기술요소로 구성되어 있다. 그러나 이렇게 평소에는 아무렇지 않게 이용하고 있다. 하지만 SNS를 통해 들여다보면 그 실태는 의외로 심오하고 다면적인 것을 알 수 있다. 본 연구는 SNS의 역사와 현황을 조감하는 것으로 시작하여 다른 매체와의 비교를 통해 그 위상을 찾고자 시도하였다. 사회와의 관계 관점에서는 악플이나 SNS를 이용한 범죄 등의 SNS 활용시의 리스크, 법적 문제가 될 수 있다. SNS상의 행위나 사업자가 제정하는 가이드라인에 대해 해설도 필요하다. 따라서 SNS에 대한 다양한 법적 문제를 논의하도록 할 것이다. 또, SNS의 활용 사례로서 재해대응에 있어서의 SNS 활용 사례를 소개하겠다. 더 기술적인 관점에서, SNS의 네트워크 기반 기술과 SNS의 정보활용에 대한 해설을 받고, 이런 기사들이 SNS를 이해하고 안전하게 이용하는데 도움을 주고 SNS를 더욱 활용하거나 발전시키는 데 도움이 될 것이다.

빅데이터와 스몰데이터로 본 선형공원 - 시카고 606 트레일과 서울 경춘선 숲길을 중심으로 - (Using Big Data and Small Data to Understand Linear Parks - Focused on the 606 Trail, USA and Gyeongchun Line Forest, Korea -)

  • 심지수;오창송
    • 한국조경학회지
    • /
    • 제48권5호
    • /
    • pp.28-41
    • /
    • 2020
  • 이 연구는 경관 인식 모델의 세 가지 요소(활동, 물리적 환경, 이용자)를 기본으로 하는 스몰데이터인 설문조사와 빅데이터인 소셜미디어 분석을 통해 문화가 다른 두 지역(미국, 한국)의 선형 공원 두 곳을 분석하고자 한다. 소셜 미디어의 사용이 증가하고 경관을 보는 새로운 매체로 부상했음에도 불구하고, 현재 소셜 미디어를 활용한 공원 연구는 제한적이다. 이에 본 연구는 소셜 미디어 분석과 설문 조사를 동시에 활용해서 비교함으로써 설문 조사가 갖는 한계를 보완함과 동시에 소셜 미디어 분석의 제한점을 보완하고자 한다. 미국 시카고의 606 트레일와 한국 서울의 경춘선 숲길은 버려진 길에 조성된 공원이다. 이 두 곳을 대상으로 총 505부의 설문조사를 시행했고, 그 결과는 통계 분석, 주성분 분석, 회귀 분석을 활용해서 분석하였다. 또한 각 선형 공원을 언급한 트위터를 총 20,000건 이상 수집했다. 이 트위터를 대상으로 군집 분석, 바이그램 네트워크 분석 등을 통해 각 공원이 갖는 장소적 특성 및 물리적 환경을 분석했다. 연구 결과는 공원 디자인이 다양해질수록 행동은 단순화 된다는 것을 발견할 수 있었다. 공원 이용자들의 절반은 선형 공원을 최종 목적지까지 도달하는 지름길로 이용했고, 공원의 특징에 따라 다양한 활동과 혜택을 확인할 수 있었다. 소셜 미디어 분석 결과, 606트레일은 경춘선 숲길 보다 주민들과 더욱 밀접한 관계를 갖고 있다는 것을 확인했다. 또한 경춘선은 606트레일보다 공원 내 이벤트와 연관이 깊음을 발견할 수 있었다.

텍스트마이닝을 활용한 대전시 공공도서관 이용자의 인식과 경험 연구 - SNS와 온라인 뉴스 기사를 중심으로 - (A Study on the Perception and Experience of Daejeon Public Library Users Using Text Mining: Focusing on SNS and Online News Articles)

  • 최지원;곽승진
    • 한국문헌정보학회지
    • /
    • 제58권2호
    • /
    • pp.363-384
    • /
    • 2024
  • 본 연구는 텍스트마이닝 기법을 중심으로 빅데이터 분석을 활용하여 대전시 공공도서관에 대한 이용자의 인식과 경험을 살펴보고자 수행되었다. 이를 위하여 첫째, 소셜미디어에 나타난 이용후기 데이터를 수집하여 대전시 공공도서관에 대한 이용자들의 전반적인 인식과 평가를 탐색하였다. 둘째, 온라인 뉴스 기사 분석을 통해 사회적으로 논의되고 있는 현안을 파악하였다. 분석 결과, 첫째로 어린이 동반 이용자 비중의 높다는 것과 다음으로 LDA 분석을 통한 토픽이 '문화행사/프로그램', '자료 이용', '물리적 환경 및 시설', '도서관 서비스'의 네 가지 분류로 나타난다는 것, 마지막으로 뉴스기사 데이터에 도서관 및 복합문화공간 추가 건립과 도서관 협력 체계 구축에 대한 키워드가 핵심적으로 등장한다는 것을 확인하였다. 이를 바탕으로 지역 균형을 고려한 공공도서관 건립과 육아 및 보육 기관과의 업무협약을 통한 사회적 육아공동체 네트워크 조성을 제안하였다. 본 연구를 활용하여 대전시 공공도서관의 정책적·사회적 흐름을 알아보고 지역사회 수요를 반영하는 공공도서관 운영을 데이터에 기반하여 실행할 수 있기를 기대한다.