• 제목/요약/키워드: 뉴스빅데이터

검색결과 206건 처리시간 0.026초

SNS 데이터 분석을 통한 스마트 충북관광 구축 (Implementation of smart chungbuk tourism based on SNS data analysis)

  • 조완섭;조아;권가은;류관희
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권2호
    • /
    • pp.409-418
    • /
    • 2015
  • SNS 등 온라인에 쏟아지는 고객의 감성분석을 활용하여 마케팅 등 다양한 분야에서 성과를 내고 있다. 고객의 제품사용 후기 데이터를 수집하여 신제품의 마케팅 전략과 제품개선 방안을 도출하고 있으며, 선거철에는 유권자들의 마음을 실시간으로 읽어서 선거 전략을 수립하고 있다. 본 연구에서는 온라인 상에서 충북관광에 관한 글들을 수집하여 텍스트 마이닝 기법을 활용하여 분석함으로써 충북관광을 위한 홍보전략과 관광진흥 정책을 수립하는 방안을 제시한다. 사용된 데이터는 주요 블로그, 뉴스, 관광관련 공공 데이터 등이며, 충북전역의 관광지를 대상으로 한다. 분석결과 충청북도 북부지역의 관광지들이 주요 이슈 관광지로 나타났으며, 관광지별로 연관 관광지와 연관 키워드들이 분석되었다. 또한, 주요 관광지별 감성분석을 통하여 긍/부정 현황과 그 원인을 파악할 수 있도록 하였다. 특히 이들 분석에 다차원 분석 기법을 연계함으로써 관광관련 텍스트 정보를 다각도로 분석하여 전략을 수립하는데 활용할 수 있도록 하였다.

빅데이터 분석을 통한 발명 교육 센터에 대한 사회적 인식 (Social Perception of the Invention Education Center as seen in Big Data)

  • 이은상
    • 한국융합학회논문지
    • /
    • 제13권1호
    • /
    • pp.71-80
    • /
    • 2022
  • 이 연구의 목적은 빅데이터 분석 방법을 이용하여 발명 교육 센터에 대한 사회적 인식을 확인해 보는 데 있다. 이를 위해 TEXTOM 사이트를 이용하여 네이버와 다음 사이트의 블로그, 카페, 뉴스 채널에서 '발명+교육+센터'를 검색 키워드로 2014년 1월부터 2021년 9월까지의 데이터를 수집하였다. 수집된 데이터는 TEXTOM 사이트에서 정제하였으며, 텍스트 마이닝 분석과 의미 연결망 분석을 위해 TEXTOM 사이트, Ucinet 6, Netdraw 프로그램을 이용하였다. 수집된 데이터는 1차와 2차의 정제 과정을 거쳐 단어빈도를 바탕으로 주요 키워드 60개를 선정하였으며, 선정된 주요 키워드는 매트릭스 데이터로 변환하여 의미 연결망 분석을 실시하였다. 이 연구의 텍스트 마이닝 분석 결과 '학생', '운영', '한국발명진흥회', '특허청' 등이 의미 있는 키워드임을 확인하였다. 의미 연결망 분석 결과 발명 교육 센터와 관련된 '교육 운영', '발명 대회', '교육 과정 및 진행', '사업 모집 및 지원', '주관 및 선정 기관' 등 5개의 군집을 확인할 수 있었다. 이 연구의 결과는 발명 교육 센터에 대한 연구를 수행하는 연구자나 정책 입안자의 학술 연구에 활용될 수 있을 것이다.

서비스워커 기반의 캐싱 시스템을 이용한 웹 콘텐츠 로딩 속도 향상 기법 (Web Content Loading Speed Enhancement Method using Service Walker-based Caching System)

  • 김현국;박진태;최문혁;문일영
    • 한국항행학회논문지
    • /
    • 제23권1호
    • /
    • pp.55-60
    • /
    • 2019
  • contents and big data웹은 사람들의 일상생활에 있어 가장 밀접한 기술 중 하나로 오늘날 대부분의 사람들은 웹을 통해 데이터를 공유하고 있다. 단순 메신저, 뉴스, 영상뿐만 아니라 다양한 데이터가 현재 웹을 통하여 전파되고 있는 셈이다. 또한 웹 어셈블리 기술이 등장하면서 기존 네이티브 환경에서 구동되던 프로그램들이 웹의 영역에 진입하기 시작하면서 웹이 공유하는 데이터는 이제 VR/AR 콘텐츠, 빅데이터 등 그 범주가 점차 넓어지고, 크기가 거대해지고 있다. 따라서 본 논문에서는 브라우저에 종속적이지 않고 독립적으로 동작이 가능한 서비스워커와 웹 브라우저 내에 데이터를 효과적으로 저장할 수 있는 캐시 API를 활용하여 웹 서비스를 사용하는 사용자들에게 웹 콘텐츠를 효과적으로 전달할 수 있는 방법을 제시하였다.

산업군 내 동질성을 고려한 온라인 뉴스 기반 주가예측 (Online news-based stock price forecasting considering homogeneity in the industrial sector)

  • 성노윤;남기환
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.1-19
    • /
    • 2018
  • 주가 예측은 학문적으로나 실용적으로나 중요한 문제이기에, 주가 예측에 관련된 연구가 활발히 진행되었다. 빅 데이터 시대에 도입하면서, 빅 데이터를 결합한 주가 예측 연구도 활발히 진행되고 있다. 다수의 데이터를 기반으로 기계 학습을 이용한 연구가 주를 이룬다. 특히 언론의 효과를 접목한 연구 방법들이 주목을 받고 있는데, 그중 온라인 뉴스를 분석하여 주가 예측에 활용하는 연구가 주를 이루고 있다. 기존 연구들은 온라인 뉴스가 개별 회사에 대한 미치는 영향을 주로 살펴보았다. 또한, 관련성이 높은 기업끼리 서로 영향을 주는 것을 고려하는 방법도 최근에 연구되고 있다. 이는 동질성을 가지는 산업군에 대한 효과를 살펴본 것인데, 기존 연구에서 동질성을 가지는 산업군은 국제 산업 분류 표준에 따른다. 즉, 기존 연구들은 국제 산업 분류 표준으로 나뉜 산업군이 동질성을 가진다는 가정하에서 분석을 시행하였다. 하지만 기존 연구들은 영향력을 가지는 회사를 고려하지 못한 채 예측하였거나 산업군 내에서 이질성이 존재하는 점을 반영하지 못했다는 한계점을 가진다. 본 연구는 산업군 내에 이질성이 존재함을 밝히고, 이질성을 반영하지 못한 기존 연구의 한계점을 K-평균 군집 분석을 적용하여, 주가에 영향을 미치는 산업군의 동질적인 효과를 반영할 수 있는 방법론을 제안하였다. 방법론이 적합하다는 것을 증명하기 위해 3년간의 온라인 뉴스와 주가를 통해 실험한 결과, 다수의 경우에서 본 논문에서 제시한 방법이 좋은 결과를 나타냄을 확인할 수 있었으며, 국제 산업 분류 표준 산업군 내에서 이질성이 클수록 본 논문에서 제시한 방법이 좋은 효과를 보인다는 것을 확인할 수 있었다. 본 연구는 국제 산업 분류 표준으로 나누어진 기업들이 높은 동질성을 가지지 않는 다는것을 밝히고 이를 반영한 예측 모형의 효율성을 입증하였다는 점에서 의의를 가진다.

뉴스기사 빅데이터의 키워드분석을 활용한 창업 트렌드 분석:2013~2022 (Analysis entrepreneurship trends using keyword analysis of news article Big Data :2013~2022)

  • 김재억;전병훈
    • Journal of Platform Technology
    • /
    • 제11권3호
    • /
    • pp.83-97
    • /
    • 2023
  • 본 연구는 시멘틱 네트워크 분석을 통해 방대한 뉴스 기사를 분석하여 창업 트렌드를 파악하고자 하였다. 한국언론진흥재단에서 제공하는 빅카인즈 기사 분석 서비스를 이용해 2013년 1월부터 2022년 12월까지 19개 신문사의 뉴스 기사 330,628건을 종합적으로 분석하였다. 이 연구는 사회적 환경과 글로벌 경제 트렌드가 창업에 미치는 영향을 고려하여 최근 10년 동안 주요 이슈의 변화를 탐구하는 데 중점을 두었다. 또한 코로나-19 팬데믹 전후의 뉴스 기사 수와 이슈 변화를 비교하여 빈도 분석, 관계 분석, 연관어 분석을 통해 창업 트렌드를 시각화 하여 제시하였다. 연구 결과, 창업 연관어의 상위 키워드는 창업의 활성화, 사업화 등이고, 코로나-19와 창업 키워드 간의 상관관계는 선형적인 의미에서 거의 무시할 수 있는 수준이었으나, 팬데믹 기간동안 뉴스 기사 수는 감소하여 영향을 미치는 것으로 나타났다. 특히 가장 많이 언급된 키워드는 중소벤처기업부, 장소는 미국, 인물은 한정화. 기관은 중소벤처기업부로 나타났으며 창업분야는 어떤 분야보다 사회적 이슈에 다각적인 영향을 받고,시기적 접근 빈도가 증가하는 중요한 특징이 나타났다. 본 연구결과는 창업 관련 이슈 및 사건에 대한 이해와 탐구에 필수적인 기초자료를 제공하여 향후 해당 분야 연구주제를 제안할 연구로서의 의미가 있다.

  • PDF

사용자 관심 이슈 분석을 통한 추천시스템 성능 향상 방안 (Improving Performance of Recommendation Systems Using Topic Modeling)

  • 최성이;현윤진;김남규
    • 지능정보연구
    • /
    • 제21권3호
    • /
    • pp.101-116
    • /
    • 2015
  • 많은 기관들이 데이터에 기반을 둔 의사결정을 수행해 왔으며, 특히 수치자료를 비롯한 정형 데이터가 이러한 목적으로 널리 활용되어 왔다. 하지만 최근에는 스마트기기와 소셜미디어의 발달로 인해 다양한 형태를 가진 방대한 양의 정보가 생성, 공유, 저장되면서, 전통적인 정형 데이터 기반 의사결정으로부터 비정형 빅데이터 기반 의사결정으로 관심의 전환이 이루어지고 있다. 데이터 기반 의사결정의 대표적 분야인 추천시스템 분야에서도 성능 향상을 위해 비정형 데이터를 활용해야 한다는 필요성이 최근 꾸준히 제기되고 있다. 특히 사용자의 성향이나 선호도는 고객의 니즈와 직결되기 때문에, 비정형 데이터 분석을 통해 사용자의 성향을 파악하고 이를 통해 상품 추천 및 구매 예측의 정확도를 향상시키기 위한 노력이 매우 시급하게 이루어질 필요가 있다. 따라서 본 연구에서는 사용자의 성향을 측정하여 재구매 예측 정확도, 특히 카테고리별 재구매 예측 정확도를 높임으로써, 궁극적으로 추천시스템의 성능을 향상시킬 수 있는 방안을 제시한다. 구체적으로는 사용자의 일상적인 인터넷 사용 기록을 분석하여 고객이 조회하는 뉴스 기사의 이슈를 식별하고 다양한 이슈에 대한 고객의 관심을 계량화한 후, 이를 활용하여 고객의 카테고리별 재구매 여부를 예측하는 모델을 제안하고자 한다. 실제 웹 트랜잭션으로부터 도출된 인터넷 뉴스 조회 기록 및 쇼핑몰 구매 기록을 대상으로 실험을 수행한 결과, 고객의 과거 구매이력만을 활용한 카테고리 재구매 예측 모형에 비해 본 연구에서 제안한 모형, 즉 고객의 과거 구매이력과 관심 이슈를 모두 활용한 예측 모형의 정확도가 다소 우수한 것으로 나타났다.

빅데이터를 통한 내국인의 '한식' 인식 연구 : 텍스트마이닝과 의미연결망 중심으로 (A study on the Domestic Consumer's Perception of "Hansik" with Big Data Analysis : Using Text Mining and Semantic Network Analysis)

  • 박경원;윤희경
    • 한국융합학회논문지
    • /
    • 제11권6호
    • /
    • pp.145-151
    • /
    • 2020
  • 한국의 국가 브랜드 중 하나인 '한식'에 대한 내국인 소비자 인식 파악을 위해 검색어 '한식'으로 데이터 수집을 진행하였다. 분석 프로그램 텍스톰(Textom3.5)을 사용하여 2018년 11월 1일부터 2019년 10월 31일까지의 네이버 블로그와 뉴스 데이터를 수집하였다. 빈도 분석과 TF-IDF 분석 결과, 한식의 인식에서 '뷔페'가 가장 중요한 부분을 차지했다. 스타 셰프의 방송 콘텐츠가 한식의 인식에 영향을 미치고 있었으며, '퓨전화'와 '고급화' 등 한식에 대한 인식이 비단 전통성에 머무르고 있지만은 않음을 알 수 있었다. UCINET6와 NetDraw를 활용한 CONCOR 분석 결과, 다양한 식문화의 클러스터, 방송에 출연한 고급 레스토랑의 클러스터, 한식 브랜드 클러스터, 한식 뷔페의 클러스터가 형성되었다. 한식의 연상 이미지 강화를 위한 방안으로 뷔페 메뉴의 다양성을 차용한 한식 개발, 고급화된 한식 홍보를 위한 미디어 노출, 간편식 수요에 대한 마케팅적 시각과 콘텐츠 개발을 제안하는 바이다.

Natural Language Processing(NLP)를 활용한 법원의 판결과 온라인상 대중 인식간 괴리에 관한 실증 연구 (Examining the Disparity between Court's Assessment of Cognitive Impairment and Online Public Perception through Natural Language Processing (NLP): An Empirical Investigation)

  • 노승국
    • 한국빅데이터학회지
    • /
    • 제8권1호
    • /
    • pp.11-22
    • /
    • 2023
  • 본 연구는 대중들이 '심신장애를 사유로 하는 형량 감경 비율'에 대해 어떻게 생각하고 있는지 분석하고, 여론의 방향과 실제 법원의 판단이 합치되는지 확인하기 위해 수행되었다. 이를 위해, 대법원 코트넷 판결문 검색시스템과 기관별 정신감정 의뢰 건수, 네이버 뉴스에서 '심신장애'를 키워드로 하는 기사의 개수와 댓글 개수, 댓글 내용을 크롤링한 결과를 활용하였다. 데이터 분석 결과, 여론은 심신장애에 따른 형량 감경에 대해 부정적이었으며 그 기준의 모호성에 대해 불만을 나타냈다. 그러나 실제 판결문 분석과 기관별 정신감정 의뢰 건수 분석 결과 법원은 「형법」제10조(심신장애)에 규정된 정신장애인의 책임 조각 및 책임 감경에 대해 엄격하게 판단하고 있음을 확인할 수 있었다. 즉, 가해자의 정신장애에 대한 인정 사례는 줄어들고 있지만 여론은 이를 인지하지 못하고 있다. 공권력이 국민 수호의 의무를 충분히 수행하고 있지 못하다는 여론의 형성은 국가기관에 대한 국민의 신뢰를 떨어뜨리는 부정적 효과를 갖고 있다. 따라서 국민의 안전을 보장하는 경찰과 검찰은 국민의 신뢰를 얻기 위해 명확한 기준에 따라 법집행을 할 필요가 있으며 사법부도 심신장애에 대한 감형 기준에 대해 엄중한 판단은 물론 그 적용 결과를 국민들에게 인식시켜줄 필요가 있다.

한국 사행산업 관련 뉴스의 빅데이터 분석을 통한 인식 연구 (Study on Perceptions through Big data Analysis on Gambling related News in Korea)

  • 문혜정;김성경
    • 방송공학회논문지
    • /
    • 제22권4호
    • /
    • pp.438-447
    • /
    • 2017
  • 이 연구는 사행산업의 분야인 복권, 체육진흥투표권, 경마, 카지노에 대해 언론에서는 어떻게 다루어지고 있는지를 1990년부터 2015년까지의 뉴스데이터를 의미연결망 분석을 통해 밝혀보고자 하는 연구이다. 기사의 빈도와 연결성을 프레이밍과 시민관심 정도로 재조명 하여 기사에 대한 언론보도자의 의도와 시민의 인식차이를 밝히고, 이를 통해 정책적 특성과 개혁과제를 탐색하였다. 분석결과 복권의 경우 당첨번호, 당첨금, 조작의혹 등 당첨에 대한 부분이 주제인 '사회문제' 형태였으며, 체육진흥투표권의 경우에는 사업입찰, 불법사이트, 발매대상 등 주로 사업추진과 불법사이트에 대한 '의무정보' 종류였고, 경마의 경우 사업장, 홍보, 기사 등으로 사업홍보나 광고 관련 뉴스이었고, 마지막으로 카지노의 경우에는 불법, 도박장, 외국인 등 '주요정보'에 해당하는 논문이었다. 시대에 따라 1990년대에는 카지노, 2000년대에는 복권, 2010년대에는 경마에 대한 기사보도가 많아졌으며, 이에 대한 시민의 반응도 사업비리, 당첨, 시민운동 등의 차이가 있었다. 마지막으로 기사의 빈도와 연결성이 나타내는 프레이밍 정도와 시민의 관심은 '1. 홍보광고(경마), 2. 의무정보(스포츠베팅), 3. 사회이슈(복권), 4. 주요정보(카지노)' 네 가지로 구분되었으며 이 중 사고, 비리 등 주요기사로 구분되는 사회문제가 주요 공공의제로 형성되는 것을 확인할 수 있었다.

미래신호 탐지 기법을 활용한 위성산업 시장의 진입 전략 수립 연구 (A Study on Establishing a Market Entry Strategy for the Satellite Industry Using Future Signal Detection Techniques)

  • 김세형;박재형;이한솔;강주영
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.249-265
    • /
    • 2023
  • 우주 산업은 세계적으로 잠재력이 높은 산업 분야로 여겨지지만, 국내에서는 아직 글로벌 시장에 비해 비교적 관심이 저조한 실정이다. 국내에서도 최근 위성산업은 전통적인 정부 주도의 산업에서 벗어난 민간 주도의 '뉴스페이스(New Space)' 패러다임에 관심을 기울이고 있다. 따라서, 본 연구의 목적은 국내 위성산업 관련 민간 기업의 시장 진입 전략을 결정하는 데 도움이 될 수 있는 미래의 신호를 탐색하는 것이다. 이를 위해 본 연구에서는 미래신호 이론과 Keyword Portfolio Map 등의 이론적 배경을 활용하여, 키워드 성장률과 키워드 등장 빈도 등을 바탕으로 특허 문서 데이터 내 키워드 잠재력을 분석한다. 또한, 뉴스 데이터를 추가로 수집하여 미래신호를 각각 first symptom, early information으로 구분하였다. 이는 해당 키워드가 특허문서 이외에 어떻게 실질적인 잠재력을 드러내는지에 대한 해석적 지표로 활용된다. 본 연구는 미래신호 탐색을 위한 데이터 수집과 분석 과정을 수록하였고, 키워드 맵의 시각화 자료를 통해 어떤 형태로 활용될 수 있는지 구체적으로 시각화함으로써 수집된 문서의 각각의 키워드가 약신호에서 강신호로 발전하는 과정을 추적하는 일련의 과정을 수록하였다. 본 연구의 과정은 기존 미래신호에 관한 연구의 방법론적인 기여와 활용 범위의 확장에 기여할 수 있고, 결과물은 위성 산업에서의 신산업 기획 및 연구 방향성 수립에 기여할 수 있다.