• 제목/요약/키워드: SNS News

검색결과 127건 처리시간 0.027초

한국도로공사 VOC 데이터를 이용한 토픽 모형 적용 방안 (Application of a Topic Model on the Korea Expressway Corporation's VOC Data)

  • 김지원;박상민;박성호;정하림;윤일수
    • 한국IT서비스학회지
    • /
    • 제19권6호
    • /
    • pp.1-13
    • /
    • 2020
  • Recently, 80% of big data consists of unstructured text data. In particular, various types of documents are stored in the form of large-scale unstructured documents through social network services (SNS), blogs, news, etc., and the importance of unstructured data is highlighted. As the possibility of using unstructured data increases, various analysis techniques such as text mining have recently appeared. Therefore, in this study, topic modeling technique was applied to the Korea Highway Corporation's voice of customer (VOC) data that includes customer opinions and complaints. Currently, VOC data is divided into the business areas of Korea Expressway Corporation. However, the classified categories are often not accurate, and the ambiguous ones are classified as "other". Therefore, in order to use VOC data for efficient service improvement and the like, a more systematic and efficient classification method of VOC data is required. To this end, this study proposed two approaches, including method using only the latent dirichlet allocation (LDA), the most representative topic modeling technique, and a new method combining the LDA and the word embedding technique, Word2vec. As a result, it was confirmed that the categories of VOC data are relatively well classified when using the new method. Through these results, it is judged that it will be possible to derive the implications of the Korea Expressway Corporation and utilize it for service improvement.

혹스 과정의 개요 및 응용 (An overview of Hawkes processes and their applications)

  • 김미정
    • 응용통계연구
    • /
    • 제36권4호
    • /
    • pp.309-322
    • /
    • 2023
  • 혹스 과정은 자기 자극 특성을 가진 점 과정으로서, 지진 발생시 본진으로 인한 여진이 발생되는 현상을 설명하는 데 주로 쓰이는 확률 모형이다. 최근에는 전염병 확산, SNS에서의 소식 확산 등 자기 자극을 특성을 가진 다양한 현상을 설명하는 데 활용되고 있다. 혹스 과정은 다양한 형태의 자극 함수를 도입하여 발생하는 사건의 특성에 따라 유연하게 변형이 가능한데, 최대 우도 추정량을 구하는 것이 쉽지 않기 때문에 최근까지도 개선된 추정 방법이 제시되고 있다. 이 논문에서는 혹스 과정을 설명하기 위해 조건부 강도 함수와 자극 함수에 대해 설명하고, 지진, 전염병, 범죄 및 금융에서 활용되었던 예와 추정 방법을 알아보도록 한다. R-패키지 ETAS를 이용하여 2017년 11월부터 2022년 12월까지 한국 경상도에서 발생한 지진을 분석하도록 한다.

다중 웹 데이터와 LSTM을 사용한 전염병 예측 (Prediction of infectious diseases using multiple web data and LSTM)

  • 김영하;김인환;장백철
    • 인터넷정보학회논문지
    • /
    • 제21권5호
    • /
    • pp.139-148
    • /
    • 2020
  • 전염병은 오래전부터 인류를 괴롭혀 왔으며 이를 예측 하고 예방하는 것은 인류에게 있어 큰 과제였다. 이러한 이유로 지금까지도 전염병을 예측하기 위해 다양한 연구가 진행되고 있다. 초기의 연구 중 대부분은 CDC(Centers for Disease Control and Prevention)의 역학 데이터에 의존한 연구였으며, CDC에서 제공하는 데이터는 일주일에 한 번만 갱신돼 실시간 질병 발생 건수를 예측하기 어렵다는 문제점을 갖고 있었다. 하지만 최근 IT 기술의 발전으로 여러 인터넷 매체들이 등장하면서 웹 데이터를 통해 전염병의 발생을 예측하고자 하는 연구가 진행되었고 이 중 우리가 조사한 연구 중 대부분은 단일 웹 데이터를 사용하여 질병을 예측하는 연구였다. 하지만 단일 웹 데이터를 통한 질병 예측은 "COVID-19" 같이 최근에 등장한 전염병에 대해서는 많은 양의 학습 데이터를 수집하기 어려우며 이러한 모델을 통해 정확한 예측을 하기 어렵다는 단점을 가지고 있다. 이에 우리는 전염병 발생을 LSTM 모델을 통해 예측할 때 여러 개의 웹 데이터를 사용하는 모델이 단일 웹 데이터를 사용하는 모델보다 정확도가 더 높음을 실험을 통해 증명하고 전염병 예측에 적절한 모델을 제안하고자 한다. 본 실험에서는 단일 웹 데이터를 사용하는 모델과 우리가 제안하는 모델을 사용하여 "말라리아"와 "유행성이하선염"의 발생을 예측했다. 우리는 2017년 12월 31 일부터 2019년 12월 28일까지 총 104주 분량의 NEWS, SNS, 검색 쿼리 데이터를 수집했는데, 이 중 75주는 학습 데이터로, 29주는 검증 데이터로 사용됐다. 실험 결과 우리가 제안한 모델의 예측 결과와 단일 웹 데이터를 사용한 모델의 예측 결과를 비교했을 때 검증 데이터에 대해서 피어슨 상관계수가 0.94, 0.86로 가장 높았고 RMSE 또한 0.19, 0.07로 가장 낮은 오차를 보여주었다.

댓글 분석을 통한 19대 한국 대선 후보 이슈 파악 및 득표율 예측 (Issue tracking and voting rate prediction for 19th Korean president election candidates)

  • 서대호;김지호;김창기
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.199-219
    • /
    • 2018
  • 인터넷의 일상화와 각종 스마트 기기의 보급으로 이용자들로 하여금 실시간 의사소통이 가능하게 하여 기존의 커뮤니케이션 양식이 새롭게 변화되었다. 인터넷을 통한 정보주체의 변화로 인해 데이터는 더욱 방대해져서 빅데이터라 불리는 정보의 초대형화를 야기하였다. 이러한 빅데이터는 사회적 실제를 이해하기 위한 새로운 기회로 여겨지고 있다. 특히 텍스트 마이닝은 비정형 텍스트 데이터를 이용해 패턴을 탐구하여 의미있는 정보를 찾아낸다. 텍스트 데이터는 신문, 도서, 웹, SNS 등 다양한 곳에 존재하기 때문에 데이터의 양이 매우 다양하고 방대하여 사회적 실제를 이해하기 위한 데이터로 적합하다. 본 연구는 한국 최대 인터넷 포털사이트 뉴스의 댓글을 수집하여 2017년 19대 한국 대선을 대상으로 연구를 수행하였다. 대선 선거일 직전 여론조사 공표 금지기간이 포함된 2017년 4월 29일부터 2017년 5월 7일까지 226,447건의 댓글을 수집하여 빈도분석, 연관감성어 분석, 토픽 감성 분석, 후보자 득표율 예측을 수행하였다. 이를 통해 각 후보자들에 대한 이슈를 분석 및 해석하고 득표율을 예측하였다. 분석 결과 뉴스 댓글이 대선 후보들에 대한 이슈를 추적하고 득표율을 예측하기에 효과적인 도구임을 보여주었다. 대선 후보자들은 사회적 여론을 객관적으로 판단하여 선거유세 전략에 반영할 수 있고 유권자들은 각 후보자들에 대한 이슈를 파악하여 투표시 참조할 수 있다. 또한 후보자들이 빅데이터 분석을 참조하여 선거캠페인을 벌인다면 국민들은 자신들이 원하는 바가 후보자들에게 피력, 반영된다는 것을 인지하고 웹상에서 더욱 적극적인 활동을 할 것이다. 이는 국민의 정치 참여 행위로써 사회적 의의가 있다.

국내 주요 언론사 기자들의 소셜미디어 이용 가치체계 연구 -래더링 분석을 중심으로 (A Study on the Value System of Social Media Usage by Korean Journalists -Focusing on the Results of Laddering Method)

  • 방은주;김성태
    • 한국언론정보학보
    • /
    • 제67권
    • /
    • pp.209-240
    • /
    • 2014
  • 기자들은 소셜미디어에 접속하여 정보를 찾고 사실을 확인하기도 하며 정보원과 접촉한다. 기자들은 소셜미디어를 통해 정보 확인 및 정보원과 소통하면서 왜 소셜미디어를 이용하는지 그 이용에 관한 내재된 가치를 정확히 알기 어렵다. 본 연구는 기자들의 소셜미디어 활용의 중요한 원인을 이해하는 것이 필요하다고 생각되는 바, 기자들이 소셜미디어를 활용하는데 내재하는 핵심 가치를 체계적으로 밝히고자 한다. 이를 통해 기자들이 소셜미디어 활용을 하게 되는 숨겨진 요인을 찾을 수 있고 기자 집단들의 소셜미디어 이용과 관련된 특정 가치와의 관계를 설명 할 수 있다. 소셜미디어 활용의 주요한 요인이 되는 가치를 밝히기 위해 수단-목적 사슬 이론을 기반으로 한 래더링 기법을 이용하였다. 분석을 위해, 기자 46명을 대상으로 심층 인터뷰함으로써 기자들이 소셜미디어를 활용하는 과정에서 중요한 속성, 결과, 가치 연결을 밝힌다. 그 결과, 소셜미디어 활용은 동질감/동화/공감, 균형적 지식, 알고자 하는 가치에 기여하고 있었다. 이는 소셜미디어를 활용하는 기자들이 트위터와 페이스북 활용을 통해 사람들과 동질감을 얻고 정보에 접근하여 균형적 지식 및 알고자 하는 욕구를 추구하고 있음을 검증 할 수 있었다. 래더링 기법을 통해 기자들이 소셜미디어를 활용하는데는 소셜미디어 활용으로 얻게 되는 가치가 중요하다는 점을 확인하였다. 이는 소셜미디어를 활용하는 기자들의 행위를 이해하기 위해 소셜미디어를 이용하는 동기로서 내재된 가치를 밝힐 필요가 있음을 보여준다.

  • PDF

인터넷과 스마트폰 환경에서의 개인화된 광고 방법론의 비교 분석 (Comparison of Personalized Ad Methods on the Internet and Smart Phone Platforms)

  • 김준산;이재규
    • Asia pacific journal of information systems
    • /
    • 제22권4호
    • /
    • pp.125-149
    • /
    • 2012
  • As the smart phone is propagating rapidly, the importance of mobile advertisement has also grown. One of the main characteristics of the Internet and smart phone advertising is that they can deliver personalized advertisements to each customer. The smart phone enables the identification of additional personalized information such as the customer's location and the accessibility to the site at any place any time. As the Internet platform becomes richer, firms that offer the ad services via the wired PC Internet and wireless smart phone are seeking various types of personalized ads. However, their service platform and Information and Communication Technology (ICT) platform should be suitable to the characteristics of personalized ads. This research explores various types of personalized ad methods and evaluates their adequacy encompassing four types of ad service platforms (such as search portal, news portal, e-mall servers, and SNS) and two types of ICT platforms (PC Internet and smart phone). To this end, we classified the personalized ads into seven types: three basic types and four composite types. The basic types of ad methods are identified by considering the current activity that the customer is engaged, the individual profile and log history, and the customer's current location or planning location. Four composite types of ad methods are constructed as the combination of these basic types. For those types of ad methods, we evaluate whether each ad method adequately maps with four types of ad service platforms and two types of ICT platforms. We proposed a metric of evaluation and demonstrated the concept with illustrative numbers. Specifically, we analyze and compare personalized ad methods in three ways. Firstly, the possibility of implementing a personalized ad method on the platform is analyzed to confirm the degree of suitability. Secondly, the value of personalized ad method is analyzed based on the customer accessibility. Lastly, expected effectiveness for each personalized ad method is computed by multiplying the possibility and the value. Through this kind of analysis, the ad service providers as well as advertising companies can evaluate what kinds of personalized ad methods and platforms are possible and suitable to maximize their ad effectiveness on the Internet and smart phone platforms.

  • PDF

소셜 빅데이터와 Google 검색트렌드를 활용한 한국과 미국의 사이버불링 검색에 영향을 미치는 요인 분석 (Social Factors Affecting Internet Searches on Cyber Bullying in Korea and America Using Social Big Data and Google Search Trends)

  • 송태민;송주영;천미경
    • 한국빅데이터학회지
    • /
    • 제1권1호
    • /
    • pp.67-75
    • /
    • 2016
  • 본 연구의 목적은 소셜 빅데이터와 Google 검색 트렌드를 활용하여 한국과 미국의 사이버불링 검색에 영향을 미치는 요인을 분석하는 것이다. 한국의 사이버불링 요인 분석은 2011년 1월 1일부터 2013년 3월 31일까지 총 227개 소셜미디어에서 수집된 검색통계를 활용하였고, 미국은 2004년 1월 1일부터 2013년 12월 22일까지 구글 검색트렌드에서 검색된 검색량을 분석대상으로 하였다. 첫째 위계적 회귀분석결과 스트레스가 사이버불링에 미치는 영향은 한국이 미국보다 많은 것으로 나타났다. 둘째 다중집단 구조모형 분석결과 한국과 미국 모두 스트레스에서 운동, 음주, 사이버불링으로 가는 경로가 정적(+)으로 유의한 영향을 미치는 것으로 나타났다. 셋째, 한국과 미국은 모든 경로에서 집단 간 유의미한 차이를 보이고 있으며, '스트레스 ${\rightarrow}$ 운동', '스트레스 ${\rightarrow}$ 음주', '음주 ${\rightarrow}$ 사이버불링', '스트레스 ${\rightarrow}$ 사이버불링' 경로가 한국이 미국보다 더 유의하게 강하게 나타났다. 한국의 청소년과 성인은 사이버불링과 관련한 담론을 주고받으며, 이러한 언급이 실제적인 사이버불링과 관련된 심리적 행동적 특성으로 노출이 될 수 있기 때문에 SNS상에 사이버불링 행위에 대한 위험징후가 예측되면 실시간으로 개입할 수 있는 온라인 애플리케이션이 개발되어야 할 것이다.

  • PDF

정형 및 비정형 빅데이터를 이용한 양파 소비 예측 (Prediction of Onion Purchase Using Structured and Unstructured Big Data)

  • 나형철;오은화;유도일;조완섭;아지즈 나스리디노프;박성호;조용빈;류관희
    • 한국콘텐츠학회논문지
    • /
    • 제18권11호
    • /
    • pp.30-37
    • /
    • 2018
  • 인터넷 시대를 살아가는 현대인의 식품 소비는 다양한 대충 매체 및 소셜 미디어를 통해 신속하고 방대한 정보 전달에 영향을 받는 것으로 알려져 있다. 2018년 4월 국내 언론 보도에 따르면, 양파 재배 면적이 증가하고 양파 생산량이 증가할 것으로 예상되며, 이후에 양파 가격은 폭락할 것으로 예상되었다. 이러한 상황을 고려하여 SNS, 인터넷 정보 검색, 방송 프로그램에서 언급된 양파 관련 정보를 분석하여, 실제 가격폭락이 발생하기 전에, 양파 소비를 촉진할 수 있는 요인을 파악할 필요가 있다. 2018년 양파 생산량 증가에 따른 양파 가격 폭락이 예상되는 상황에, 가장 최근 양파 생산량 증가에 따라 가격 폭락을 경험하였던 2014년의 방송 프로그램 및 SNS가 양파 소비와 연계되었는지 파악하고자, 양파 소비 촉진과 관련된 정형 및 비정형 빅데이터를 수집하여, 양파 소비 촉진과 관련된 변수를 찾아 양파 가격 하락이 예상되는 2018년에 소비 촉진에 활용하고자 본 연구를 수행하였다. 연구 결과, 방송 뉴스의 양파 언급 기사 수(3~6주), 양파와 건강을 언급하는 방송 프로그램 수(11주), 양파의 효능을 언급하는 블로그의 댓글 빈도(5주)가 양파 구매금액 증가에 시차를 두고 양의 상관관계를 갖는 것을 확인한 본 연구 결과를 근거로, 양파 생산량 증가에 따른 양파 가격 폭락 시, 양파 소비 촉진을 위한 홍보에, 뉴스, 먹방, 쿡방 등의 방송 프로그램 및 블로그 등의 매체를 활용하는 소비촉진에 기여할 것으로 여겨진다.

메이커스(Makers)를 위한 크라우드 펀딩 디자인 진단 가이드라인에 관한 연구 (A Study on the Design Diagnostic Guideline in Crowdfunding for Makers)

  • 오인균;이장우
    • 한국과학예술포럼
    • /
    • 제35권
    • /
    • pp.281-292
    • /
    • 2018
  • 크라우드 펀딩은 소셜 펀딩으로도 불리며, 예비 창업자, 메이커스들이 사업자금과 생산자금을 모을 수 있는 창구이다. 최근에 와서 크라우드 펀딩은 높은 성장률을 기록하고 있으며, 정부에서도 각종 관련 지원 정책을 내놓고 있다. 본 연구는 이와 같은 시대적 상황을 배경으로 제품 디자인 중심의 메이커스들을 대상으로 크라우드 펀딩 디자인 진단 가이드라인을 도출하는 것을 그 목적으로 하며, 이를 위해서 문헌 조사 방법, 전문가 인터뷰 방법과 같은 복합적 연구방법을 적용하였다. 문헌조사는 관련 뉴스와 선행연구를 중심으로 조사하였으며, 인터뷰의 경우 관련 전문가 10명을 대상으로 1차와 2차로 나누어서 진행하였다. 문헌 조사 결과 크라우드 펀딩에서 사용 중인 진단 가이드라인에는 디자인과 관련된 내용이 부족하고 세부적이지 못했다. 그 결과 디자인 카피와 제품 사기 문제가 있는 것으로 조사되었다. 그리고 선행연구를 통해서 펀딩 성공을 위해서는 정보전달 글과 이미지가 중요한 요소임을 알게 되었다. 전문가 인터뷰의 경우 1차 인터뷰에서 7명의 전문가가 참여하였으며, 2단계 프로세스의 9개 진단 주제의 가이드라인 초안을 도출하였다. 이후 2차 인터뷰에서는 3명의 진단 경험을 가진 전문가가 참여하여 가이드라인 초안에 대한 검증과 보완과정을 거쳐서 3단계 프로세스의 8개 진단 주제의 최종 크라우드 펀딩 디자인 진단 가이드라인을 만들었다. 본 연구결과는 메이커들 외에 관리자들도 활용할 수 있도록 하였으며, 이를 통해 문제점을 사전에 예방하고 건전한 메이커스 크라우드 펀딩 생태계 조성에 도움이 되기를 기대한다.

비정형 텍스트 분석을 활용한 이슈의 동적 변이과정 고찰 (Investigating Dynamic Mutation Process of Issues Using Unstructured Text Analysis)

  • 임명수;김남규
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.1-18
    • /
    • 2016
  • 최근 가용한 텍스트 데이터 자원이 증가함에 따라 방대한 텍스트 분석을 통해 새로운 가치를 창출하고자 하는 수요가 증가하고 있다. 특히 뉴스, 민원, 블로그, SNS 등을 통해 유통되는 글로부터 다양한 이슈를 발굴해내고 이들 이슈의 추이를 분석하는 이슈 트래킹에 대한 연구가 활발하게 이루어지고 있다. 전통적인 이슈 트래킹은 토픽 모델링을 통해 오랜 기간에 걸쳐 지속된 주요 이슈를 발굴한 후, 각 이슈를 구성하는 문서 수의 세부 기간별 분포를 분석하는 방식으로 이루어진다. 하지만 전통적 이슈 트래킹은 각 이슈를 구성하는 내용이 전체 기간에 걸쳐 변화 없이 유지된다는 가정 하에 수행되기 때문에, 다양한 세부 이슈가 서로 영향을 주며 생성, 병합, 분화, 소멸하는 이슈의 동적 변이과정을 나타내지 못한다. 또한 전체 기간에 걸쳐 지속적으로 출현한 키워드만이 이슈 키워드로 도출되기 때문에, 핵실험, 이산가족 등 세부 기간의 분석에서는 매우 상이한 맥락으로 파악되는 구체적인 이슈가 오랜 기간의 분석에서는 북한이라는 큰 이슈에 함몰되어 가려지는 현상이 발생할 수 있다. 본 연구에서는 이러한 한계를 극복하기 위해 각 세부 기간의 문서에 대한 독립적인 분석을 통해 세부 기간별 주요 이슈를 도출한 후, 각 이슈의 유사도에 기반하여 이슈 흐름도를 도출하고자 한다. 또한 각 문서의 카테고리 정보를 활용하여 카테고리간의 이슈 전이 패턴을 분석하고자 한다. 본 논문에서는 총 53,739건의 신문 기사에 제안 방법론을 적용한 실험을 수행하였으며, 이를 통해 전통적인 이슈 트래킹을 통해 발굴한 주요 이슈의 세부 기간별 구성 내용을 살펴볼 수 있을 뿐 아니라, 특정 이슈의 선행 이슈와 후행 이슈를 파악할 수 있음을 확인하였다. 또한 카테고리간 분석을 통해 단방향 전이와 양방향 전이의 흥미로운 패턴을 발견하였다.