• 제목/요약/키워드: News Volume

검색결과 40건 처리시간 0.023초

용어 사전의 특성이 문서 분류 정확도에 미치는 영향 연구 (Analyzing the Effect of Characteristics of Dictionary on the Accuracy of Document Classifiers)

  • 정해강;김남규
    • 경영과정보연구
    • /
    • 제37권4호
    • /
    • pp.41-62
    • /
    • 2018
  • 다양한 소셜 미디어 활동과 인터넷 뉴스 기사, 블로그 등을 통해 유통되는 비정형 데이터의 양이 급증함에 따라 비정형 데이터를 분석하고 활용하기 위한 연구가 활발히 진행되고 있다. 텍스트 분석은 주로 특정 도메인 또는 특정 주제에 대해 수행되므로, 도메인별 용어 사전의 구축과 적용에 대한 중요성이 더욱 강조되고 있다. 용어 사전의 품질은 비정형 데이터 분석 결과의 품질에 직접적인 영향을 미치게 되며, 분석 과정에서 정제의 역할을 수행함으로써 분석의 관점을 정의한다는 측면에서 그 중요성이 더욱 강조된다. 이렇듯 용어 사전의 중요성은 기존의 많은 연구에서도 강조되어 왔으나, 용어 사전이 분석 결과의 품질에 어떤 방식으로 어떤 영향을 미치는지에 대한 엄밀한 분석은 충분히 이루어지지 않았다. 따라서 본 연구에서는 전체 문서에서의 용어 빈도수에 기반을 두어 사전을 구축하는 일괄 구축 방식, 카테고리별 주요 용어를 추출하여 통합하는 용어 통합 방식, 그리고 카테고리별 주요 특질(Feature)을 추출하여 통합하는 특질 통합 방식의 세 가지 방식으로 사전을 구축하고 각 사전의 품질을 비교한다. 품질을 간접적으로 평가하기 위해 각 사전을 적용한 문서 분류의 정확도를 비교하고, 각 사전에 고유율의 개념을 도입하여 정확도의 차이가 나타나는 원인을 심층 분석한다. 본 연구의 실험에서는 5개 카테고리의 뉴스 기사 총 39,800건을 분석하였다. 실험 결과를 심층 분석한 결과 문서 분류의 정확도가 높게 나타나는 사전의 고유율이 높게 나타남을 확인하였으며, 이를 통해 사전의 고유율을 높임으로써 분류의 정확도를 더욱 향상시킬 수 있는 가능성을 발견하였다.

KOSPI 200지수종목의 변경에 따른 시장반응 : 규모와 시장요인에 따른 그룹간 비교분석 (The Market Effect of Additions or Deletions for KOSPI 200 Index : Comparison between Groups by Size and Market Condition)

  • 박영석;이재현;김대식
    • 재무관리연구
    • /
    • 제26권1호
    • /
    • pp.65-94
    • /
    • 2009
  • 본 연구는 KOSPI 200주가지수의 구성종목 변경 사건에 대한 시장반응을 재검증하는 데 초점을 두었다. 국내에서 두 차례 이루어진 과거 실증연구들에서는 KOSPI 200지수종목의 변경이 정보력이 없는 사건으로 분석되었으며, 일부 표본에 대해서만 가격압박가설을 지지하는 것으로 나타났다. 본 연구는 이러한 실증적 결과가 변경기업의 속성과 주식시장의 장세에 따라 다르게 나타날 수 있다고 판단하여 기업규모와 시장상황에 따라서 샘플을 구분하여 분석하였다. 실증분석의 결과 지수종목에 신규로 포함되는 기업의 경우 평균적으로 가격압박가설을 지지하는 것으로 나타났다. 또한 종목들을 기업규모와 시장상황에 따라 나누어서 분석해보면 주가반응이 크게 나타났던 년도의 표본수가 많지 않았기 때문에 시장의 평균적 반응을 살펴보면 정보력이 없거나 가격압박가설을 지지하는 것처럼 나타난 것으로 분석되었다. 이러한 연구결과는 거래량분석을 통해서도 지지되었는데, 시가총액이 큰 기업은 공시일 전에 새로운 지수종목으로 진입될 것을 예상되기 때문에 공시일 이전에 거래량이 크게 증가하는 것으로 나타났다. 그러나 지수종목에서 탈락되는 기업의 경우에서는 장기적인 주가반응이 뚜렷하게 나타났지만 거래량에 의한 추가적 설명은 부족한 것으로 분석되었다.

  • PDF

A Study on Stock Trend Determination in Stock Trend Prediction

  • Lim, Chungsoo
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권12호
    • /
    • pp.35-44
    • /
    • 2020
  • 본 연구에서는 주가 결정 방법이 주가 경향 예측에 미치는 영향을 확인하기 위한 분석을 수행한다. 주식시장에서 성공적인 투자를 위해서는 주가의 상승과 하락을 정확하게 예측하는 것이 큰 도움이 되므로 주가 경향 예측에 관해 많은 연구가 진행되고 있다. 예를 들어 근래에는 SNS나 뉴스의 내용을 텍스트 마이닝을 이용하여 분석하고, 이를 이용한 주가 등락의 예측 방법이 제안되었으며 다양한 기계학습 기법들이 활용되고 있다. 그러나 주가의 경향을 '상승' 또는 '하락'으로 결정하는 방법은 제대로 분석된 적 없으며 일반적으로 쓰던 방법을 답습하고 있다. 이에 본 논문에서는 주가 경향 결정 방법을 이동평균을 이용해 일반화하고 주가 경향 결정 방법이 예측 정확도에 미치는 영향을 분석한다. 분석 결과, 다음 날의 주가 경향을 예측하는 경우, 주가 경향 결정방법에 따라 예측 정확도가 47%까지 차이가 남을 발견하였다. 또한 경향 결정에 사용되는 기준값 윈도우의 크기와 예측의 정확도는 비례 관계이며, 대상값 윈도우의 크기와 정확도는 반비례 관례임을 알 수 있었다.

교통정보 언론제공 연계시스템 구축에 관한 연구 (A Study of Integrated Press System Implementation for Traffic Information)

  • 정성학;박회용
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권9호
    • /
    • pp.147-156
    • /
    • 2009
  • 본 연구의 목적은 언론매체 특성에 따른 요구정보 제공과 첨단교통정보의 효율적 활용, 사용자 중심의 편리한 교통정보 제공, 교통정보 유통 활성화에 기여하고자 교통정보 언론제공 연계시스템의 구축 방안을 제시하는데 있다. 이러한 목적을 달성하기 위하여 국내 외 교통정보 언론제공시스템 현황을 분석하고, 언론매체별 요구사항을 검토하여, 시스템 구축방안과 연계 제공체계를 구현함으로서 언론제공 통합연계시스템 구축방안을 제시하였다. 본 연구에서 제안된 설계는 정보이용자와 정보공급자의 필요충분조건을 중재하여 보다 다양한 교통정보를 활용 가능하게 하는 것으로 광역교통수단을 이용하는 사용자가 효율적인 공간이동 및 경제적인 이용가치를 높이도록 하였다. 언론매체를 통한 교통정보의 제공은 도로운전자에게 유용한 정보가 되며, 교통정보 언론제공으로 인한 교통량의 분산 및 교통 혼잡완화가 예상된다.

자동 트렌드 탐지를 위한 속성의 정의 및 트렌드 순위 결정 방법 (Trend Properties and a Ranking Method for Automatic Trend Analysis)

  • 오흥선;최윤정;신욱현;정윤재;맹성현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권3호
    • /
    • pp.236-243
    • /
    • 2009
  • 특허, 뉴스, 블로그와 같이 시간 정보가 있는 문서들로부터의 자동적인 트렌드 분석(trend analysis)은 토픽탐지 및 추적 기술(TDT: Topic Detection and Tracking)과 더불어 중요한 연구 분야로 대두되고 있다. 과거 연구들은 대부분 트렌드과 관련된 단어의 출현 빈도 정보를 이용하여 주어진 개념의 중요도를 측정하고 이 개념의 시간에 따른 트렌드 라인을 보여주는 것에 초점을 맞췄다. 신출 트렌드 (emerging trend)를 탐지하기 위해서는 주어진 개념의 출현 빈도수 변화와 같은 간단한 방법이나 학습 데이타와 비교하여 차이를 탐지하여 제시하는 방법이 사용되었다. 그러나 여러 트렌드 중에서 특징적인 트렌드를 찾아서 사용자에게 제공하기 위해서는 트렌드 순위 결정 함수가 필요하다. 본 논문은 트렌드의 다양한 측면을 정량화하기 위하여 출현 빈도로 구성된 트렌드 곡선으로부터 네 가지 속성 (변동성, 지속성, 안정성, 누적량) 을 정의하고 이를 활용한 트렌드 순위 결정 방법을 제안한다. 일련의 실험을 통하여 각 속성의 유용성을 검증하고 속성들의 조합이 순위 결정에 어떤 영향을 미치는지 분석하였다. 실험결과로부터 네 가지 속성을 모두 조합할 경우 특징적인 트렌드 탐지에 더욱 기여하는 것을 알 수 있다.

디지털 뉴딜 정책에 대한 언론 보도량과 주식 시장의 동태적 관계 분석: 4차산업혁명 관련 기업을 중심으로 (An Analysis of the Dynamics between Media Coverage and Stock Market on Digital New Deal Policy: Focusing on Companies Related to the Fourth Industrial Revolution)

  • 손권상;권오병
    • 한국전자거래학회지
    • /
    • 제26권3호
    • /
    • pp.33-53
    • /
    • 2021
  • 제4차 산업혁명의 확산과 코로나 19의 장기화로 인한 사회적 변화의 기로에서 한국 정부는 2020년 7월 디지털 뉴딜 정책을 발표했다. 디지털 뉴딜 정책은 데이터, 네트워크, 인공지능 기술을 중심으로 공공분야 및 산업의 디지털 전환을 가속화함으로써 새로운 비즈니스를 창출하는 것을 주요 과제로 삼고 있다. 그러나 급변하는 사회환경에서 기술의 미래 이익에 대한 정보비대칭은 정책의 방향과 효과에 대한 대중의 분석 능력의 차이를 야기할 수 있으며, 이로 인해 정책의 실질적 효과에 대한 불확실성이 발생하게 된다. 한편, 언론은 정부 정책을 대중에 전파하는 전달자 역할을 통해 담론 형성을 주도하며, 보도를 통해 특정 이슈에 대한 제반 지식을 대중에게 제공하는 역할을 한다. 즉, 특정 정책에 대한 언론의 보도량이 증가할수록 이슈 집중도는 높아지며, 이를 통해 대중의 의사결정에도 영향을 미치게 된다. 따라서 본 연구의 목적은 한국 정부의 디지털 뉴딜 정책에 대한 언론 보도량과 주식 시장의 동태적 관계를 그랜저 인과관계(Granger causality), 충격반응함수, 분산분해분석을 이용하여 검증하는 것이다. 이를 위해 디지털 뉴딜 정책에 대한 언론 보도량, 키워드 검색량과 KOSDAQ 상장 기업 중 디지털 뉴딜 정책과 관련이 있는 디지털 기술 기반 기업들의 일일주식회전율, 일일주가수익률, EWMA 변동성을 변수로 설정하였으며, 정책발표 시점 전후 60 거래일, 총 120 거래일 간의 데이터를 이용했다. 분석 결과, 언론 보도량은 키워드 검색량, 일일주식회전율, EWMA 변동성과 양방향 그랜저 인과관계가 존재하였으며, 언론 보도량의 증가는 디지털 뉴딜 정책에 대한 키워드 검색량에 높은 영향을 미치는 것으로 나타났다. 또한 언론 보도량에 대한 충격반응분석 결과 EWMA 변동성을 큰 폭으로 하락시키는 양상을 보였으며, 시간이 지날수록 영향력이 점차 증가하며 주식 시장의 변동성을 완화시키는 역할을 하는 것으로 나타났다. 본 연구의 분석 결과를 토대로 디지털 뉴딜에 대한 언론 보도량은 주식 시장과 유의한 동태적 관계가 있음을 확인할 수 있었다.

소셜미디어 콘텐츠의 오피니언 마이닝결과 시각화: N라면 사례 분석 연구 (Visualizing the Results of Opinion Mining from Social Media Contents: Case Study of a Noodle Company)

  • 김유신;권도영;정승렬
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.89-105
    • /
    • 2014
  • Web2.0의 등장과 함께 급속히 발전해온 온라인 포럼, 블로그, 트위터, 페이스북과 같은 소셜 미디어 서비스는 소비자와 소비자간의 의사소통을 넘어 이제 기업과 소비자 사이의 새로운 커뮤니케이션 매체로도 인식되고 있다. 때문에 기업뿐만 아니라 수많은 기관, 조직 등에서도 소셜미디어를 활용하여 소비자와 적극적인 의사소통을 전개하고 있으며, 나아가 소셜 미디어 콘텐츠에 담겨있는 소비자 고객들의 의견, 관심, 불만, 평판 등을 분석하고 이해하며 비즈니스에 적용하기 위해 이를 적극 분석하는 단계로 진화하고 있다. 이러한 연구의 한 분야로서 비정형 텍스트 콘텐츠와 같은 빅 데이터에서 저자의 감성이나 의견 등을 추출하는 오피니언 마이닝과 감성분석 기법이 소셜미디어 콘텐츠 분석에도 활발히 이용되고 있으며, 이미 여러 연구에서 이를 위한 방법론, 테크닉, 툴 등을 제시하고 있다. 그러나 아직 대량의 소셜미디어 데이터를 수집하여 언어처리를 거치고 의미를 해석하여 비즈니스 인사이트를 도출하는 전반의 과정을 제시한 연구가 많지 않으며, 그 결과를 의사결정자들이 쉽게 이해할 수 있는 시각화 기법으로 풀어내는 것 또한 드문 실정이다. 그러므로 본 연구에서는 소셜미디어 콘텐츠의 오피니언 마이닝을 위한 실무적인 분석방법을 제시하고 이를 통해 기업의사결정을 지원할 수 있는 시각화된 결과물을 제시하고자 하였다. 이를 위해 한국 인스턴트 식품 1위 기업의 대표 상품인 N-라면을 사례 연구의 대상으로 실제 블로그 데이터와 뉴스를 수집/분석하고 결과를 도출하였다. 또한 이런 과정에서 프리웨어 오픈 소스 R을 이용함으로써 비용부담 없이 어떤 조직에서도 적용할 수 있는 레퍼런스를 구현하였다. 그러므로 저자들은 본 연구의 분석방법과 결과물들이 식품산업뿐만 아니라 타 산업에서도 바로 적용 가능한 실용적 가이드와 참조자료가 될 것으로 기대한다.

댓글 분석을 통한 19대 한국 대선 후보 이슈 파악 및 득표율 예측 (Issue tracking and voting rate prediction for 19th Korean president election candidates)

  • 서대호;김지호;김창기
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.199-219
    • /
    • 2018
  • 인터넷의 일상화와 각종 스마트 기기의 보급으로 이용자들로 하여금 실시간 의사소통이 가능하게 하여 기존의 커뮤니케이션 양식이 새롭게 변화되었다. 인터넷을 통한 정보주체의 변화로 인해 데이터는 더욱 방대해져서 빅데이터라 불리는 정보의 초대형화를 야기하였다. 이러한 빅데이터는 사회적 실제를 이해하기 위한 새로운 기회로 여겨지고 있다. 특히 텍스트 마이닝은 비정형 텍스트 데이터를 이용해 패턴을 탐구하여 의미있는 정보를 찾아낸다. 텍스트 데이터는 신문, 도서, 웹, SNS 등 다양한 곳에 존재하기 때문에 데이터의 양이 매우 다양하고 방대하여 사회적 실제를 이해하기 위한 데이터로 적합하다. 본 연구는 한국 최대 인터넷 포털사이트 뉴스의 댓글을 수집하여 2017년 19대 한국 대선을 대상으로 연구를 수행하였다. 대선 선거일 직전 여론조사 공표 금지기간이 포함된 2017년 4월 29일부터 2017년 5월 7일까지 226,447건의 댓글을 수집하여 빈도분석, 연관감성어 분석, 토픽 감성 분석, 후보자 득표율 예측을 수행하였다. 이를 통해 각 후보자들에 대한 이슈를 분석 및 해석하고 득표율을 예측하였다. 분석 결과 뉴스 댓글이 대선 후보들에 대한 이슈를 추적하고 득표율을 예측하기에 효과적인 도구임을 보여주었다. 대선 후보자들은 사회적 여론을 객관적으로 판단하여 선거유세 전략에 반영할 수 있고 유권자들은 각 후보자들에 대한 이슈를 파악하여 투표시 참조할 수 있다. 또한 후보자들이 빅데이터 분석을 참조하여 선거캠페인을 벌인다면 국민들은 자신들이 원하는 바가 후보자들에게 피력, 반영된다는 것을 인지하고 웹상에서 더욱 적극적인 활동을 할 것이다. 이는 국민의 정치 참여 행위로써 사회적 의의가 있다.

기업의 빅데이터 투자가 기업가치에 미치는 영향 연구 (The effect of Big-data investment on the Market value of Firm)

  • 권영진;정우진
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.99-122
    • /
    • 2019
  • IDC(International Data Corporation) 사(社)의 최근 보고서에 따르면, 2025년에는 2016년에 생성된 데이터의 10배에 달하는 163제타바이트의 데이터가 생성될 것이고 그 주체의 비중은 소비자에서 기업으로 이동하고 있다고 한다. 이러한 소위 '빅데이터의 물결'은 도래하고 있고 그 파장은 산업 전반적으로 영향을 미칠 것이다. 따라서, 방대한 데이터를 효과적으로 관리하는 것은 기업의 관점에서 그 어느 때보다 더 중요하다. 하지만, IT 투자에 대한 효과를 측정한 선행 연구는 다수 존재함에도 불구하고 빅데이터 투자 효과를 측정한 선행 연구는 거의 전무한 실정이다. 따라서, 해당 투자 효과를 정량적으로 분석한다면 기업의 의사 결정을 도울 수 있을 것이다. 본 연구는 효율적 시장 가설을 이론적 바탕으로 둔 사건연구방법론(Event Study Methodology)을 적용하여, 기업의 빅데이터 투자가 시장 투자자들의 반응에 미치는 영향을 측정하였다. 또한, 보다 심층적으로 이 효과를 분석하기 위해서 5가지 하위 변수를 설정했고 그 내용은 기업 크기 구분, 산업 구분(Finance와 ICT), 투자 구축 완료 구분, 벤더 유무 구분이다. 분석 결과, 91개 기업은 빅데이터 투자 공시 이후 시장 가치가 평균 0.92% 상승한다는 사실을 확인하였다. 특히 Finance 기업, non-ICT 기업, 시가 총액이 작은 기업, 빅데이터 전문 벤더 기업을 통해 투자한 기업, 그리고 빅데이터 시스템이 구축 완료됐다는 공시에 해당하는 기업의 시장 가치가 두드러지게 상승한다는 사실을 알 수 있었다. 본 연구는 빅데이터 투자 효과를 측정한 선행 연구가 거의 전무하다는 점에서 학문적인 의의를 지니고, 빅데이터 투자를 고려 중인 기업 의사 결정자들에게 실질적인 참고 자료가 될 수 있다는 점에서 실무적인 시사점을 갖는다.

토픽 모델링을 이용한 트위터 이슈 트래킹 시스템 (Twitter Issue Tracking System by Topic Modeling Techniques)

  • 배정환;한남기;송민
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.109-122
    • /
    • 2014
  • 현재 우리는 소셜 네트워크 서비스(Social Network Service, 이하 SNS) 상에서 수많은 데이터를 만들어 내고 있다. 특히, 모바일 기기와 SNS의 결합은 과거와는 비교할 수 없는 대량의 데이터를 생성하면서 사회적으로도 큰 영향을 미치고 있다. 이렇게 방대한 SNS 데이터 안에서 사람들이 많이 이야기하는 이슈를 찾아낼 수 있다면 이 정보는 사회 전반에 걸쳐 새로운 가치 창출을 위한 중요한 원천으로 활용될 수 있다. 본 연구는 이러한 SNS 빅데이터 분석에 대한 요구에 부응하기 위해, 트위터 데이터를 활용하여 트위터 상에서 어떤 이슈가 있었는지 추출하고 이를 웹 상에서 시각화 하는 트위터이슈 트래킹 시스템 TITS(Twitter Issue Tracking System)를 설계하고 구축 하였다. TITS는 1) 일별 순위에 따른 토픽 키워드 집합 제공 2) 토픽의 한달 간 일별 시계열 그래프 시각화 3) 토픽으로서의 중요도를 점수와 빈도수에 따라 Treemap으로 제공 4) 키워드 검색을 통한 키워드의 한달 간 일별 시계열 그래프 시각화의 기능을 갖는다. 본 연구는 SNS 상에서 실시간으로 발생하는 빅데이터를 Open Source인 Hadoop과 MongoDB를 활용하여 분석하였고, 이는 빅데이터의 실시간 처리가 점점 중요해지고 있는 현재 매우 주요한 방법론을 제시한다. 둘째, 문헌정보학 분야뿐만 아니라 다양한 연구 영역에서 사용하고 있는 토픽 모델링 기법을 실제 트위터 데이터에 적용하여 스토리텔링과 시계열 분석 측면에서 유용성을 확인할 수 있었다. 셋째, 연구 실험을 바탕으로 시각화와 웹 시스템 구축을 통해 실제 사용 가능한 시스템으로 구현하였다. 이를 통해 소셜미디어에서 생성되는 사회적 트렌드를 마이닝하여 데이터 분석을 통한 의미 있는 정보를 제공하는 실제적인 방법을 제시할 수 있었다는 점에서 주요한 의의를 갖는다. 본 연구는 JSON(JavaScript Object Notation) 파일 포맷의 1억 5천만개 가량의 2013년 3월 한국어 트위터 데이터를 실험 대상으로 한다.