• 제목/요약/키워드: 뉴스빅데이터

검색결과 207건 처리시간 0.025초

신뢰성을 고려한 빅데이터 기반 실시간 증권정보 분석 기법 (Real Time Stock Information Analysis Method Based on Big Data considering Reliability)

  • 김윤기;조창우;정창성
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.146-147
    • /
    • 2013
  • 소셜 미디어와 스마트폰의 확산으로 인터넷상의 사용자간 교류되는 정보의 양이 대폭 늘어남에 따라 대규모의 데이터를 처리해야할 필요성이 높아졌다. 이러한 빅데이터는 뉴스, 소셜미디어, 웹사이트 등의 다양한 분산 서버에서 발생한다. 증권정보를 분석하기 위해서도 실시간으로 발생되는 거래량, 시가와 더불어 상장회사의 공시 정보 등의 데이터를 여러 분산된 서버에서 데이터를 가져와야 한다. 기존의 빅데이터 분석기법은 각 분산된 서버로부터 가져온 데이터가 동일한 신뢰성을 가지고 있다고 가정하고 분석을 한다. 이는 부문별한 정보를 포함한 데이터를 효율적으로 분석하지 못하는 한계를 지니고 있다. 본 논문에서는 가져오는 데이터에 신뢰성 가중치를 부여하여 신뢰성 있는 증권정보 분석을 가능하게 한다.

소비자의 항공사 선호도에 대한 빅데이터 융합 기반 마케팅 전략 (For airline preferences of consumers Big Data Convergence Based Marketing Strategy)

  • 천용호;이승준;박수현
    • 산업융합연구
    • /
    • 제17권3호
    • /
    • pp.17-22
    • /
    • 2019
  • 빅데이터의 가치가 중요하게 인식되면서 기존의 방대한 데이터들과 비정형 데이터들을 분석할 수 있는 JAVA 및 R 프로그램들이 개발되고 활용도가 높아짐에 따라 정부를 비롯한 공공기관, 민간기업 등에 실질적으로 도입 및 개선 할 수 있어 의사결정의 고도화가 가능하게 되었다. 본 연구에서는 소비자의 항공사 선호도에 따른 마케팅 전략을 수립하기 위해 뉴스 데이터를 클롤링하고 이를 텍스트 마이닝 기법을 통해 분석을 수행하였다. 본 연구는 과거 빅데이터에서 얻기 어려웠던 데이터들을 고도의 빅데이터 활용 프로그램 기법으로 소비자의 항공사 선호도를 분석하여 분석 결과에 따른 마케팅 전략을 수립하는데 의의가 있다.

소셜 빅데이터 마이닝 기반 실시간 랜섬웨어 전파 감지 시스템 (Real-Time Ransomware Infection Detection System Based on Social Big Data Mining)

  • 김미희;윤준혁
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제7권10호
    • /
    • pp.251-258
    • /
    • 2018
  • 파일을 암호화시켜 몸값을 요구하는 악성 소프트웨어인 랜섬웨어는 빠른 전파력과 지능화로 더욱 위협적이 되고 있다. 이에 빠른 탐지 및 위험 분석이 요구되고 있지만, 실시간 분석 및 보고가 미비한 상태이다. 본 논문에서는 실시간 분석이 가능하도록 소셜 빅데이터 마이닝 기술을 활용하여 랜섬웨어 전파 감지 시스템을 제안한다. 본 시스템에서는 트위터 스트림을 실시간 분석하여 랜섬웨어와 관련된 키워드를 가진 트윗을 크롤링한다. 또한 뉴스피드 분석기를 통해 뉴스서버를 크롤링하여 랜섬웨어 관련 키워드를 추출하고, 보안업체의 서버나 탐색 엔진을 통해 뉴스나 통계데이터를 추출한다. 수집된 데이터는 데이터 마이닝 알고리즘으로 랜섬웨어 감염 정도를 분석한다. 2017년 전파가 많이 되었던 워너크라이와 록키 랜섬웨어 감염전파 시 관련 트윗의 수와 구글 트렌드(통계 정보) 정보, 관련 기사를 비교하여 트윗을 이용한 본 시스템의 랜섬웨어 감염 탐지 가능성을 보이고, 엔트로피와 카이-스퀘어 분석을 통해 제안 시스템 성능을 보인다.

인문학적 관점으로 본 빅데이터 활용을 위한 당면 문제 (Current Issues with the Big Data Utilization from a Humanities Perspective)

  • 박은하;전진우
    • 한국콘텐츠학회논문지
    • /
    • 제22권6호
    • /
    • pp.125-134
    • /
    • 2022
  • 이 연구는 인문학적 관점에서 빅데이터를 활용하기 위해 현재 해결해야 할 과제는 무엇인지를 비판적으로 고찰하고자 하였다. 이를 위해 빅데이터를 활용함에 있어서 빅데이터를 수집할 때, 처리할 때, 그리고 사용할 때 발생할 수 있는 문제를 세 가지로 제시하고 논의하였다. 그 첫 번째로 데이터 자체의 문제점을 지닐 것으로 보이는 가짜 정보를 지적하고 기사형 광고와 정치 관련 가짜 뉴스를 살펴보았다. 두 번째는 빅데이터 처리과정과 그 결과의 문제점으로 알고리즘에 의한 차별을 들었다. 포털 사이트에서 엔지니어를 검색한 결과를 분석함으로써 알고리즘에 의한 차별이 존재함을 확인하였다. 마지막으로 사람과 관련한 개인 정보를 사용함에 있어서, 이에 대한 문제점을 프라이버시권, 정보자기결정권, 잊힐 권리 세 가지로 나누어 논의하였다. 이 연구는 빅데이터 시대에 인문학적 관점에서 빅데이터 활용 측면의 당면한 문제를 지적한 점과 빅데이터의 활용 과정인 수집, 처리, 사용에서 일어날 수 있는 문제점을 각각 논의한 점에서 의미가 있다고 본다.

빅데이터 분석을 통한 피자 판매량 예측 (Pizza Sales Prediction by Using Big Data Analysis.)

  • 이대범;김경섭;이영수;김하나한;변동삼;박성철;전화성;김준태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.890-893
    • /
    • 2014
  • IT산업의 새로운 패러다임으로 빅데이터 분석이 주요한 기술로 부각되고 있다. 본 논문에서는 빅데이터를 수집, 분석하여 이를 통해 피자 판매량을 예측하는 모델을 제안한다. 판매량 예측을 위하여 과거 판매 데이터와 함께 공휴일, 날씨, 뉴스기사, 경제지표, 트렌드, 스포츠 이벤트 등의 데이터를 수집하여 이용하였으며, 판매량 예측 방법으로는 회기분석과 인공신경망 학습 등을 사용하여 빅데이터를 사용하지 않은 경우와 정확도를 비교하였다. 실험 결과 빅데이터를 이용함으로써 예측 오차율이 5%이상 향상됨을 확인하였다.

제주시의 지속가능한 여행 활성화를 위한 지역화폐 '탐나는전' 가맹점의 리뷰 데이터 분석 (Analysis of Review Data of 'Tamna' Franchisees to Promote Sustainable Travel in Jeju City)

  • 백세희;김세형;배미란;강주영
    • 한국빅데이터학회지
    • /
    • 제7권2호
    • /
    • pp.113-128
    • /
    • 2022
  • 코로나19 이후 '지속가능한 관광'에 대한 관심이 커지면서 '지속가능한 관광'을 하고자 하는 관광객 또한 증가하였다. 그러나, '지속가능한 관광'을 할 수 있는 프로그램과 방법 등이 구체적이지 않다는 문제점이 있다. 또한, 대부분의 '지속가능한 관광'의 관심사가 '환경' 및 '탄소중립' 등에 초점을 맞추고 있어 지역사회에 공헌할 수 있는 프로그램이나 정책들이 많지 않다. 따라서 본 연구에서는 '지속가능한 관광'을 활성화하기 위하여 뉴스 데이터와 리뷰 데이터를 분석하였다. 우선, 본 연구에서는 뉴스 빅데이터 분석을 통해 지속가능한 여행의 주요한 주제들을 도출하였다. 이를 통해 지속가능한 여행의 정책적 주제 및 사건들을 분석한다. 지속가능한 여행과 관련된 뉴스 빅데이터를 분석하여 아직까지 한국에서 지속가능한 여행이 활성화되지 못한 이유들을 분석하고 이를 해결할 수 있는 방안으로 지역사회가 직접 혜택을 볼 수 있는 방안을 도출하고자 한다. 최종적으로, 제주시의 지속가능한 여행 활성화를 위하여 제주 지역화폐인 '탐나는전' 가맹점의 이용자 리뷰 데이터를 분석하고 지역사회와 공생할 수 있는 방안을 제안한다.

토픽 모델링을 활용한 '수돗물 유충' 뉴스 빅데이터 분석 (News Big Data Analysis of 'Tap Water Larvae' Using Topic Modeling Analysis)

  • 이수연;김태종
    • 한국콘텐츠학회논문지
    • /
    • 제20권11호
    • /
    • pp.28-37
    • /
    • 2020
  • 본 연구는 '수돗물 유충' 사태의 뉴스 빅데이터를 분석함으로써, '수돗물 유충'과 관련된 주요 키워드와 토픽을 파악하여, 환경문제에 대한 위기 대응력 제고방안을 제안하기 위해 수행되었다. 2020년 7월 13일부터 8월 31일까지 보도된 1,975건의 '수돗물 유충' 뉴스를 토픽 모델링 기법으로 분석하였다. 그 결과 언론에서 나타난 '수돗물 유충' 사태가 발생기, 확산기, 수습기로 구분되며, 각 5개의 토픽을 선정하여, 환경문제의 발생과 추진 과정을 확인할 수 있었다. 분석 결과를 바탕으로 환경문제에 대한 위기 대응 방안을 다음과 같이 제언하였다. 첫째, '수돗물 유충' 사건을 중심으로 얽혀있는 다양한 맥락을 탐구하고 통합적인 안목을 형성하는 교육으로 환경문제에 대한 대응력을 기를 수 있도록 해야 한다. 둘째, 인터넷 커뮤니티를 활용한 시민참여의 환경정보 공유와 환경감시 역할 부여가 필요하다. 셋째, 신속하고 정확한 환경정보 제공과 소통을 담당하는 환경 커뮤니케이터의 양성 및 배치가 필요하다. 본 연구는 '수돗물 유충' 관련 뉴스 빅데이터를 기반으로 국내에서 처음으로 토픽 모델링 분석기법을 활용하여 분석한 연구로서, 비정형 데이터로 나타나는 환경 관련 이슈를 실증적이고 체계적으로 분석했다는 학술적 의의와 환경교육 및 커뮤니케이션 개선 방안을 제시했다는 정책적 의의를 지닌다.

빅데이터 분석기법을 활용한 아파트 가격 관련 뉴스 기사의 극성 분석 (A Study on the Polarity of Apartment Price News Using Big Data Analysis Method)

  • 조상연;홍은표
    • 디지털융복합연구
    • /
    • 제17권9호
    • /
    • pp.47-54
    • /
    • 2019
  • 본 연구는 빅데이터 분석 방법인 오피니언 마이닝을 사용하여 아파트 가격 관련 뉴스 기사의 극성을 확인하는 연구로 자료는 2012년, 2018년 2년간 네이버에 게시된 인터넷 뉴스 기사를 사용하였다. 감성분석 모형을 모델링하고 주제 지향형 감성사전 구축 방법을 제안하였다. 제안한 감성분석 모형을 통해 분석한 결과, 아파트 가격이 상승하는 시기에는 사회적 이슈 선정에 있어서 언론사의 성향에 따라 차이가 있는 것을 확인하였고 정부와 동일한 성향의 언론사에서 긍정 기사가 많은 것을 확인하였다. 부동산 분야에서 사용할 수 있는 감성분석 모형을 제시하고 부동산 관련 비정형 데이터의 극성을 분석하였다는 것에 의의가 있다. 향후 다양한 분야에 접목하기 위해서는 주제별 감성사전을 구축해야 하며 다양한 비정형 데이터를 수집하고 수집 기간을 확장하는 것이 필요하다.

빅데이터를 이용한 폭염과 하천수질의 공간적 영향 평가 (Spatial Impact Assessment of Heat Wave on River Water Quality using Big Data)

  • 이지완;임혁진;신형진;김성준
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.87-87
    • /
    • 2021
  • 이상기후 현상으로 기후변화가 사회와 경제에 미치는 영향이 뚜렷한 추세로 변화되고 있다. 현재 기후변화에 관련된 연구는 사회 시스템에서 위험관리를 위해 기온과 강수량에 따라 다양한 분야에 미치는 영향에 대한 연구를 중점으로 이뤄지고 있다. 본 연구는 여름철 폭염에 의한 기후변화가 하천수질에 미치는 영향을 평가하기 위한 것으로, 우리나라 기상청 91개의 기상관측소에서 일일온도 33℃ 이상의 이벤트를 대상으로 환경부 수질관측망 918개에 대한 14개의 하천수질인자인 DO, BOD, COD, TOC, DOC, TN, DTN, NH4-N, NO2-N, NO3-N, TP, DTP, PO4-P, Chl-a를 분석하였다. 이를 우리나라 117개 중권역별 하천수질과 폭염강도와 지속시간을 나타내는 폭염 지수를 산정하여 분석하였다. 폭염 관련 뉴스 데이터는 2013년부터 2019년까지 Python 기반 뉴스 크롤러를 이용해 폭염 취약지수(Heat Wave Vulnerability Index, HWVI)를 기준으로 분류하여 키워드를 수집하였으며 HWVI 중 '기후노출' 키워드와 관련된 기사는 총 22,514건으로 69.9%로 수집되었다. 공간적 영향 평가를 위해 Getis-Ord Gi*를 이용하여 폭염지수와 하천수질인자간 핫스팟 분석을 실시하고 폭염관련 빅데이터가 하천수질에 미치는 영향을 평가하였다. 폭염지수는 낙동강유역 하류에 대해 Chl-a, TN, TP 항목에서 높은 밀도를 보였다. 분석대상지역 내 폭염이 발생한 확률과 반경 밖에서 발생할 확률의 우도비를 분석하기 위해 SaTScan을 이용한 공간검색통계분석을 실시하였다. 분석결과 폭염지수와 DO의 공간상관성이 높은 것으로 나타났다.

  • PDF