• 제목/요약/키워드: 뉴스빅데이터

검색결과 206건 처리시간 0.029초

빅데이터 분석을 통한 인터넷 뉴스 포털에서의 탈세 논란이 기업 가치에 미치는 영향 연구 (A study on the effect of tax evasion controversy on corporate values in internet news portals through big data analysis)

  • 이상민;박명호;김병준;박대근
    • 인터넷정보학회논문지
    • /
    • 제22권6호
    • /
    • pp.51-57
    • /
    • 2021
  • 기업의 세금을 절약 혹은 회피하는 행동은 과세관청에 의해 합법적 절세가 아닌 탈세로 판단될 경우 기업은 조세적 비용뿐 아니라 일련의 탈세관련 보도 기사로 인해 기업이미지 손상 및 주가하락과 같은 비조세적 비용까지 부담하게 된다. 이에 본 연구는 인터넷 뉴스 포털에 나타난 탈세 논란 키워드들의 출현빈도를 해당 사건의 심각성을 측정하는 요인으로 정하고 이러한 출현빈도가 기업가치에 미치는 영향을 분석한다. 우리나라 유가증권시장에서 시가총액기준 상위 업체들을 대상으로 탈세 논란 키워드들을 활용하여 인터넷 뉴스 포털로부터 관련 기사를 크롤링하고, 기업별로 탈세 논란 키워드들의 출현빈도에 대한 시계열을 생성하여 출현빈도가 장부가 대비 시가총액에 미치는 영향을 분석한다. 패널회귀분석과 충격반응분석을 통해 분석한 결과 출현빈도는 기업가치에 부정적인 영향을 미치며 12개월까지 점진적으로 효과가 감소되는 것으로 분석된다. 이 연구는 한국기업들을 대상으로 탈세 논란 사안이 기업가치에 영향을 미치는지를 실증적으로 분석한 연구로서, 경영자는 절세전략을 수립 시 이러한 영향력을 고려하는 것이 필요하다는 것을 시사한다.

빅데이터 분석을 활용한 제5차 산림기본계획 주요 사업에 대한 평가 (Evaluation of Major Projects of the 5th Basic Forest Plan Utilizing Big Data Analysis)

  • 변승연;구자춘;석현덕
    • 한국산림과학회지
    • /
    • 제106권3호
    • /
    • pp.340-352
    • /
    • 2017
  • 제5차 산림기본계획은 2008년부터 2017년까지의 10년 단위 계획으로, 2013년에 대외환경 변화 등의 이유로 변경되었다. 본 연구에서는 산림기본계획에 대한 거시적 평가를 위해 빅데이터 분석을 활용하여 연도별 정책 수요와 공급의 간극을 파악하였다. 정책수요 부분은 당해 연도의 뉴스, SNS 등에서 언급된 사업과 관련된 키워드(명사 기준)를 기준으로 하고, 정책 공급 부문은 산림청이 발행한 문서를 기준으로 하여 비정형 데이터를 수집하였다. 수집한 자료는 사회연결망 분석(social network analysis)을 활용하여 네트워크 구조를 특정하고, 수요 측면의 네트워크와 공급 측면의 네트워크를 비교하여 산림청 정책 수요와 공급의 간극을 확인한다. 분석 결과, 공급부문의 네트워크 구조는 수요 부문보다 방사형이 약한 것으로 나타나 산림 이외에 다양한 주제어가 네트워크에서 상당한 영향력을 행사하고 있는 것으로 판단되었다. 또한 27대 대표사업들을 대응한 33개 주제어에 대해 수요부문과 공급부문의 기울기를 비교한 결과, 수요는 증가하지만 공급이 감소하는 주제어의 개수는 7개로 지속가능, 산림경영, 산림생물, 산림보호, 산림병해충, 도시숲, 북한이 해당되었다. 이들 주제어는 수요와 공급의 간극이 확인된 만큼, 제6차 기본계획에서는 이들 주제어에 대한 공급 강화가 필요하며, 자유게시판 분석을 통하여 신규 임업인에 대한 정보 제공 및 교육 강화도 포함되어야 할 것으로 나타났다.

배움공동체에 대한 탐색적 연구 : covid19 언택트시대를 중심으로 (An Exploratory Study on the Learning Community: Focusing on the Covid19 Untact Era)

  • 정수정;임홍남;박홍재
    • 융합정보논문지
    • /
    • 제12권5호
    • /
    • pp.237-245
    • /
    • 2022
  • 본 연구는 언택트시대의 배움공동체에 대한 사회적 담론이 어떠한지 살펴보고, 팬데믹이라는 사회적 상황 속에서 아동을 위한 배움공동체가 나아가야할 방향에 대해 논의해 보고자한다. 이를 위해 2020년 1월 20일부터 2021년 1월 20일까지 1년 동안의 빅데이터를 '언택트+배움공동체'라는 키워드로 인터넷 포털사이트(구글, 다음, 네이버 등의 뉴스)에서 데이터를 수집 및 분석하였다. 분석결과, 단어빈도 및 네트워크분석에서 '마을교육공동체', '운영', '활동', '코로나19', '지원', '온라인' 등의 단어가 언택트시대의 배움공동체와 관련이 높은 것으로 도출되었다. 이는 배움공동체 내에서 마을의 교육공동체가 주축이 되어 코로나19라는 상황 속에서도 마을 활동가와 주민협의회 등이 뜻을 모아 코로나19로 멈춰진 아동의 일상을 회복하고 관계 회복을 위한 노력을 온라인 매체를 활용하여 지원 해줄 수 있다는 것을 보여준다. 결론적으로 단어빈도 분석을 통해 배움공동체와 관련된 핵심키워드를 파악하고 배움공동체에 대한 사회적 경향을 살펴보았다는데 의의가 있으며, 코로나19의 장기화로 아동의 공적 돌봄·교육의 틈새와 한계에 대한 대안으로 배움공동체의 도입 및 활성화를 위한 기초자료로써 시사점을 가진다

빅데이터를 활용한 뉴노멀(New normal)시대의 관광행태 변화에 관한 연구 (A Study on Tourism Behavior in the New normal Era Using Big Data)

  • 유경미;강종천;최연희
    • 문화기술의 융합
    • /
    • 제9권3호
    • /
    • pp.167-181
    • /
    • 2023
  • 본 연구는 코로나 19 발생 후 여행 제재가 완화된 현재의 관광행태 변화를 분석하기 위해 소셜네트워크 분석프로그램인 TEXTOM을 활용하였다. 네이버, 구글, 다음이 제공하는 블로그, 카페, 뉴스 등을 대상으로 '국내여행', '해외여행' 키워드에 대한 데이터를 수집하였다. 사회적 거리두기가 해제된 2022년 4월~12월로 수집 기간을 정하였고, 코로나19 발생 이전인 2019년과 코로나19의 영향이 가장 심각했던 2020년은 각각 1년으로 하여 2022년과 비교 분석하였다. 텍스트 마이닝을 통하여 각각 총 80개의 핵심어를 추출하고 NetDraw를 사용하여 중심성분석을 하였다. 마지막으로 CONCOR분석을 통하여 상관관계가 있는 핵심어들을 4개로 군집화하였다. 연구결과, 2022년도의 관광행태는 코로나 발생 이전으로의 관광 회복, 각자가 선호하는 테마를 중심으로 여행의 세분화, 나라별 코로나 완화정책을 우선적으로 검색해 본 후 관광지를 선택하는 관광행태를 보인다. 코로나19 이후에 새롭게 도래하는 관광생태계에 대한 관광마케팅 전략과 관광상품 개발을 위한 기초자료를 제공할 것으로 기대한다.

소셜 빅데이터를 활용한 한국관광 트렌드에 관한연구 -감성분석을 중심으로- (A study on Korean tourism trends using social big data -Focusing on sentiment analysis-)

  • 최연희;유경미
    • 문화기술의 융합
    • /
    • 제10권3호
    • /
    • pp.97-109
    • /
    • 2024
  • 국내관광 영역에서 관광 소비 주체인 외래관광객과 내국인에 대한 관광 트렌드 분석은 한국 관광시장 뿐 만 아니라 지역 및 정부의 관광정책을 수립하는 관계자에게도 필수적이라 할 수 있다. 이에 소셜미디어 상의 핵심키워드와 감성분석을 알아보고 향후 관광소비자의 커뮤니케이션과 정보를 통해 마케팅 전략 계획을 수립하고 국내 관광산업을 활성화시키고자 한다. 한국관광의 트렌드를 분석하기 위해 텍스톰(TEXTOM) 6.0을 활용하였다. 구글, 네이버, 다음이 제공하는 카페, 블로그, 뉴스 등을 대상으로 '한국관광', '국내관광'을 키워드로 하여 2022년 9월31일부터 2023년 8월31일까지 데이터를 수집하였다. 텍스트마이닝을 통하여 빈도순으로 핵심 키워드와 TF-IDF를 각각 100개씩 추출한 후, CONCOR 분석, 감성분석을 실시하였다. 한국관광 핵심 키워드는 관광지, 여행동반 및 행태, 관광동기 및 체험, 숙박형태, 관광정보, 감성 관련 등에 관한 단어들이 상위권에 노출되었다. CONCOR분석 결과는 관광지, 관광정보, 관광활동/체험, 관광동기/콘텐츠, 인바운드 관련 등과 관련된 5개의 클러스터로 구분되었다. 마지막으로 감성분석 결과 긍정에 대한 문서와 어휘가 높게 나타났다. 이 연구는 한국관광에 대한 텍스트 마이닝을 통하여 급변하는 한국관광 트렌드를 분석하여 내국인 뿐 만 아니라 방한 외국인에 대한 국내관광 활성화에 의미 있는 기초자료를 제공할 것으로 기대한다.

웹 크롤링에 의한 네이버 뉴스에서의 한국농수산대학 - 키워드 분석과 의미연결망분석 - (Korea National College of Agriculture and Fisheries in Naver News by Web Crolling : Based on Keyword Analysis and Semantic Network Analysis)

  • 주진수;이소영;김승희;박노복
    • 현장농수산연구지
    • /
    • 제23권2호
    • /
    • pp.71-86
    • /
    • 2021
  • 빅데이터 분석기술인 웹 크롤링 기술을 이용하여 네이버 뉴스 데이터 내에 담겨 있는 '한농대' 에 대한 이미지 단어를 추출하였다. 뉴스 기사에서 언급된 빈도에 따라 중요한 단어로 평가는 단어빈도 분석에서는 청년농업인을 육성하는 한농대의 특성을 잘 설명하는 '농업', '교육', '지원', '농업인', '청년', '대학', '사업', '농촌', '대표' 등의 단어가 자주 사용되는 것으로 나타났다. 또한 '디지털', '스마트', '드론', '졸업생', '창업', '새만금', '교육과정' 등 디지털 농업 전문 인재를 육성하기 위한 학교의 교육, 지원, 비전 등과 관련한 단어들이 추출되었다. 모든 기사 데이터의 단어 빈도(TF) 및 역 문서 빈도(IDF)를 이용한 TF-IDF 가중치의 전체 순위는 '농업인', '드론', '농림축산식품부', '전북', '청년농업인', '농업', '전주', '대학', '장치', '파종' 등의 단어가 한농대와 관련된 뉴스 기사에서 중요한 핵심어 역할을 하는 것으로 나타났다. 단어 빈도에서 '드론', '농림축산식품부', '전북', '청년농업인', '전주', '장치, '파종' 등은 순위가 매우 낮았으나 TF-IDF 가중치 순위에서는 한농대를 표현하는 핵심어로 나타났다. TF-IDF 평가에서 '교육', '지원', '청년', '사업', '농촌' 등의 키워드는 단어빈도가 높으면서 많은 문서에서 자주 등장하는 키워드로서 핵심어 역할은 크지 않은 것으로 나타났다. 단어 간 연계성을 파악하기 위한 의미연결망 분석에서 추출한 바이그램은 '청년'-'농업인', '디지털'-'농업', '영농'-'정착', '농업'-'농촌', '디지털'-'전환' 등의 순으로 빈도가 높게 나타났다. 중심성 지표로 키워드의 영향력을 평가한 결과 모든 지표에서 '농업'이 1위로 나타났으며, 2위에는 '농업인'(근접 중심성, 매개 중심성), '교육'(연결 중심성, 페이지랭크 중심성) 및 '미래'(고유벡터 중심성)으로 나타났다. 스피어먼 순위 상관계수에 의한 중심성 지표별 키워드의 순위의 유사성은 연결 중심성과 페이지랭크 중심성이 0.89 전후의 가장 높은 상관관계를 보였다. 이상으로 네이버 뉴스의 한농대 관련 기사에서 단어 빈도로 보면 '농업', '교육', '지원', '농업인', '청년', '대학', '사업', '농촌', '대표' 등이 중요한 단어로 평가되었으나, 문서빈도를 함께 고려한 평가에서는 '농업인', '드론', '농림축산식품부', '전북', '청년농업인', '농업', '전주', '대학', '장치', '파종' 등의 단어가 핵심어 역할을 하는 것으로 나타났다. 한편 단어나 문서의 빈도가 아니라 단어 간 네트워크 연계성을 고려한 중심성 분석에서는 연결 중심성과 페이지랭크 중심성에 의한 평가가 적합한 것으로 나타났으며, '농업', '교육', '미래', '농업인', '디지털', '지원', '활용' 등이 중심성이 강한 단어로 나타났다.

머신러닝 기반의 기업가치 예측 모형: 온라인 기업리뷰를 활용하여 (Machine Learning based Firm Value Prediction Model: using Online Firm Reviews)

  • 이한준;신동원;김희은
    • 인터넷정보학회논문지
    • /
    • 제22권5호
    • /
    • pp.79-86
    • /
    • 2021
  • 빅데이터 분석의 유용성이 주목을 받으면서 경영학 분야에서도 이를 활용하여 기업의 성과를 예측하고자 하는 다양한 연구들이 진행되고 있다. 이러한 선행연구들은 주로 뉴스 기사나 SNS 등 기업 외부의 자료에 의존하고 있다. 직원의 만족도나 기업에 대한 직원의 인식, 장단점 평가와 같은 기업 내부의 목소리는 기업가치에 대한 잠재적인 영향력에도 불구하고 상대적으로 확보가 어려워 관련 연구가 아직 충분치 못하다. 이에 본 연구에서는 국내 유가증권시장 상장 기업을 대상으로 임직원의 기업리뷰가 기업가치에 미치는 영향을 살펴보고, 이를 기반으로 기업가치를 예측하는 모형을 구축하고자 한다. 이를 위해 온라인 기업리뷰 사이트인 잡플래닛(Jobplanet)에 2014년부터 2019년까지 전·현직원이 남긴 97,216건의 기업리뷰를 수집하고 동 데이터에 근거하여 머신러닝 기반의 예측 모형을 제안하였다. 제안한 모형 중 LSTM 기반 모형의 정확도가 73.2%로 가장 높았고 MAE 또한 0.359로 가장 낮은 오차를 보였다. 본 연구는 국내에서 머신러닝을 활용한 기업가치 연구 분야에 유용한 사례가 될 것으로 기대한다.

식중독 사고 발생과 식품 안전 관련 검색어 빈도와의 상관성 분석 연구 (Correlation Analysis between Key Word Search Frequencies Related to Food Safety Issue and Foodborne Illness Outbreaks)

  • 이희영;조희경;김경미;윤혜원;윤요한
    • 한국식품위생안전성학회지
    • /
    • 제32권2호
    • /
    • pp.96-100
    • /
    • 2017
  • 인터넷과 스마트폰의 보급과 함께 사람들은 관심 있는 정보를 포털사이트에서 실시간으로 검색할 수 있게 되었다. 그에 따라 빅데이터가 비정형적으로 형성되고 이를 이용하기 위한 연구 분야가 발전하고 있다. 최근 식품분야에서도 빅데이터를 활용한 연구의 필요성이 꾸준히 제기되고 있다. 본 연구는 국내 최대 규모의 포털 사이트인 네이버의 검색 통계를 활용하여, 사람들의 연관 검색어 빈도에 따른 식품안전 사고 원인 식품과 식중독 원인 병원체들의 관계를 분석하였다. 특히 식중독과 관련된 식품과 식중독 원인 병원체의 포털사이트 키워드 검색 건수와 해당 원인 식품 및 병원체의 뉴스검색 건수를 분석하였으며, 최종적으로 키워드 검색 건수와 실제 식중독 발생 시기의 상관관계를 분석하였다. 분석결과, 일반적으로 식중독 발생 직후 관련 키워드 검색 건수가 증가하는 것으로 나타났으며, 특별하게 굴과 같은 계절성 식품의 경우 키워드 검색 건수 증가 이후에 식중독 사고가 발생한 것으로 나타났다. 따라서 본 연구결과를 통해 검색 건수가 증가하는 식중독 세균이나 식품들을 식중독 사전 예방적 차원의 정보로 활용할 수 있다면 식중독 사고 발생 가능성을 낮출 수 있을 것으로 사료된다.

뉴스 빅데이터를 통해 검토한 대학교육의 토픽 분석 (A Topic Analysis of College Education Using Big Data of News Articles)

  • 양지연;구정호
    • 디지털융복합연구
    • /
    • 제19권12호
    • /
    • pp.11-20
    • /
    • 2021
  • 본 연구는 신문기사 빅데이터를 통해 대학교육 관련 보도의 토픽을 추출하고, 토픽별 특징 및 신문사별 보도양상을 분석한다. 2016년-2021년 상반기 주요 중앙지와 지역지의 기사를 빅카인즈를 통해 추출하였고, 잠재디리슐레할당을 이용하여 총 9개의 토픽을 발견하였다. 토픽1과 토픽3은 교육에 대한 대학지원사업에 관련된 것이나 토픽3은 지역대학에 초점이 맞추어져 있다. 토픽2는 코로나19 이후 대학교육, 토픽4는 교수-학습법, 토픽5는 정부정책, 토픽6은 고교교육기여대학 지원사업, 토픽7은 대학교육 비전, 토픽8은 국제화, 토픽9는 입시 등을 논하고 있다. 조선일보, 경향신문, 한겨레는 코로나19 이후 강의, 정부정책 관련, 대학교육에 대한 기사와 논평을 많이 보도한 반면 동아일보, 중앙일보, 한라일보, 부산일보, 대전일보, 경인일보는 대학지원사업, 고교교육기여대학 지원사업 등 광고·홍보성 기사가 상대적으로 많았다. 2016년부터의 관련기사를 신문사별 뿐 아니라, COVID-19 발생 전후로도 분석하여 관련 보도의 토픽 차이를 살펴볼 수 있었다. 사회적으로 주요 관심 사항인 대학교육이 언론에 어떻게 보도되고 있는지 확인함으로써 미래의 대학교육 정책 방향과 미디어의 순기능과 역기능 등 언론의 역할에 대해 고찰할 필요가 있음을 시사한다.

텍스트 마이닝을 이용한 시대별 유리천장 연구동향 분석 (Analysis of the Study Trend of Glass Ceiling by Period Using Text Mining)

  • 김영만;이진구
    • 한국콘텐츠학회논문지
    • /
    • 제21권8호
    • /
    • pp.376-387
    • /
    • 2021
  • 본 연구의 목적은 빅데이터 분석방법을 이용하여 유리천장 현상 관련 연구 동향을 분석하고 사회적 시사점을 제언하고자 하는 것이다. 유리천장의 연구 동향을 분석하기 위해 유리천장을 깬 역사적 사건인 '박근혜대통령 취임'을 중요 이슈로 설정하고 1기를 박대통령 재임 전, 2기는 재임 중, 3기는 재임 후로 구분하여 키워드를 수집하였다. 빈도분석 결과, 1기에는 주요 키워드로 선정된 '공무원'을 중심으로 연구가 이루어졌으며, 2기에는 '여성의 일가정 양립'이 주요 키워드군으로 선정되었다. 3기에는 여성 직업군의 키워드가 다양화되고 있었다. 일가정 양립 지원제도 이외에도 유리천장 요인 해소를 위한 제도개선에 관한 연구 및 연구대상 직종의 확대와 실생활에서의 이슈에 대한 해결책 제시를 위한 연구가 필요함을 사회적 시사점으로 제시하였으며, 추후 SNS나 뉴스기사에 나타난 일반대중의 '유리천장' 인식에 대한 연구가 필요함을 제언하였다.