• 제목/요약/키워드: news topic

검색결과 234건 처리시간 0.032초

북한이탈주민 창업에 관한 뉴스 데이터 토픽 모델링 분석: 2013~2021년까지 정부 정책 비교를 중심으로 (News data LDA on North Korean defector entrepreneurship: Focusing on the comparison of government policies from 2013 to 2021)

  • 문준환
    • 디지털융복합연구
    • /
    • 제20권3호
    • /
    • pp.145-155
    • /
    • 2022
  • 코로나19의 장기화로 인해 북한이탈주민이 경제적으로 어려움을 겪고 있는 문제를 해결하고자 창업에 관한 관심이 고조되고 있다. 이에, 본 연구는 정권의 기조에 따른 창업지원 정책을 살펴보기 위해 최근 정권과 직전 정권기간을 연구대상으로, 북한이탈주민 창업에 대한 뉴스 데이터 텍스트마이닝을 통해 주요 토픽을 발굴하고자 하였다. 추가로 창업경험이 있는 북한이탈주민과의 인터뷰를 통해 성공적인 창업을 위한 주요요인을 도출하였다. 분석결과 북한이탈주민의 창업과 관련된 정책은 여성 및 청년을 대상으로 집중하고, 전문화된 창업교육과 금융 및 자금지원을 적극적으로 확대하는 것이 필요하며, 실질적이고 지속적인 창업 교육 프로그램이 필요하다는 것을 확인하였다.

온라인 과학 기사 텍스트 마이닝을 통해 분석한 에너지 용어 사용의 맥락 (Analyzing Different Contexts for Energy Terms through Text Mining of Online Science News Articles)

  • 오치영;강남화
    • 과학교육연구지
    • /
    • 제45권3호
    • /
    • pp.292-303
    • /
    • 2021
  • 본 연구에서는 일상생활에서 에너지 용어가 사용되는 맥락을 알아보기 위하여 온라인 과학 기사를 수집하여 언어 네트워크, 토픽 모델링 분석 기법을 활용해 에너지 관련 기사에 사용된 용어의 빈도, 용어 네트워크, 기사의 주제를 분석하였다. 분석에 사용된 자료는 2018.3.1.부터 1년간의 온라인 과학 분야의 기사 중 에너지를 검색어로 하여 10개의 국내 중앙지에서 검색 및 선정된 2,171편이다. 이 기사들을 자연어 처리하여 51,224개의 문장과 507,901개의 단어로 데이터를 구성하였다. R 프로그램을 활용하여 용어 빈도수 분석 및 언어 네트워크 분석을 실시하였고, 에너지 용어 사용의 맥락 탐색을 위해 구조적 토픽 모델링 분석을 적용해 기사의 주제를 도출하였다. 기사에 사용된 용어 중 빈도수가 유난히 높은 용어는 기술, 연구, 개발로 새로운 소식을 알리는 기사의 특성을 반영한 것으로 나타났다. 한편, 기사 2편당 한 번 이상의 빈도로 사용되는 용어에는 산업 관련 용어(산업, 제품, 시스템, 생산, 시장)와 '전기', '환경'과 같이 에너지 관련 용어로 충분히 기대되는 용어들이 있었다. 한편, 에너지 관련 과학 수업에서 자주 사용되는 '태양', '열', '온도', '발전'도 빈도수 상위에 속하는 용어로 드러났다. 용어 네트워크 분석에서는 산업 및 기술과 관련된 용어와 기초과학 및 연구 관련 용어들이 약한 강도이지만 서로 군집을 이루는 것을 확인하였다. 한편, 에너지와 쌍을 이루는 용어의 분석에서는 '에너지 효율'을 비롯해 '에너지 절감', '에너지 소비' 등과 같이 에너지의 사용에 관한 용어들이 다수를 이루고 그 사용 빈도가 가장 높았다. 에너지 용어가 사용되는 맥락은 16개의 주제를 분류한 4가지 영역으로 '첨단산업', '산업', '기초과학', '환경 및 건강'으로 나타났다. 에너지 사용 관련 용어가 상당히 많이 사용된다는 결과는 에너지 수업의 시작점으로 에너지 저급화 개념의 도입이 효과적일 수 있음을 시사한다. 또한, 첨단산업이나 환경 및 건강의 맥락을 에너지 학습에 도입할 필요성도 보여준다. 본 연구에서 드러난 16개 주제에서 보이는 다양한 에너지 용어가 사용되는 맥락을 재구성해 에너지 관련 수업에 활용한다면 학생들이 학교에서의 에너지 학습과 일상적 상황을 통합적으로 인식하는 데 도움이 될 것이다.

기간별 이슈 매핑을 통한 이슈 생명주기 분석 방법론 (Analyzing the Issue Life Cycle by Mapping Inter-Period Issues)

  • 임명수;김남규
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.25-41
    • /
    • 2014
  • 최근 스마트 기기를 통해 소셜미디어에 참여하는 사용자가 급격히 증가하고 있다. 이에 따라 빅데이터 분석에 대한 관심이 높아지고 있으며 최근 포털 사이트에서 검색어로 자주 입력되거나 다양한 소셜미디어에서 자주 언급되는 단어에 대한 분석을 통해 사회적 이슈를 파악하기 위한 시도가 이루어 지고 있다. 이처럼 다량의 텍스트를 통해 도출된 사회적 이슈의 기간별 추이를 비교하는 분석을 이슈 트래킹이라 한다. 하지만 기존의 이슈 트래킹은 두 가지 한계를 가지고 있다. 첫째, 전통적 방식의 이슈 트래킹은 전체 기간의 문서에 대해 일괄 토픽 분석을 실시하고 각 토픽의 기간별 분포를 파악하는 방식으로 이루어지므로, 새로운 기간의 문서가 추가되었을 때 추가된 문서에 대해서만 분석을 추가 실시하는 것이 아니라 전체 기간의 문서에 대한 분석을 다시 실시해야 한다는 실용성 측면의 한계를 갖고 있다. 둘째, 이슈는 끊임 없이 생성되고 소멸될 뿐 아니라, 때로는 하나의 이슈가 둘 이상의 이슈로 분화하고 둘 이상의 이슈가 하나로 통합되기도 한다. 즉, 이슈는 생성, 변화(병합, 분화), 그리고 소멸의 생명주기를 갖게 되는데, 전통적 이슈 트래킹은 이러한 이슈의 가변성을 다루지 않았다는 한계를 갖는다. 본 연구에서는 이러한 한계를 극복하기 위해 대상 기간 전체의 문서를 한꺼번에 분석하는 방식이 아닌 세부 기간별 문서에 대해 독립적인 분석을 수행하고 이를 통합할 수 있는 방안을 제시하였으며, 이를 통해 새로운 이슈가 생성되고 변화하며 소멸되는 전체 과정을 규명하였다. 또한 실제 인터넷 뉴스에 대해 제안 방법론을 적용함으로써, 제안 방법론의 실무 적용 가능성을 분석하였다.

텍스트마이닝 기법을 활용한 허위·과장광고 관련 기사의 트렌드 분석(1990-2019) (Analyzing the Trend of False·Exaggerated Advertisement Keywords Using Text-mining Methodology (1990-2019))

  • 김도희;김민정
    • 한국콘텐츠학회논문지
    • /
    • 제21권4호
    • /
    • pp.38-49
    • /
    • 2021
  • 본 연구는 텍스트마이닝 기법을 사용하여 1990년부터 2019년까지 5,141건의 신문기사에서 '허위·과장광고' 용어의 트렌드를 분석하였다. 우선 전체 신문기사를 대상으로 빈도 분석을 통해 허위·과장광고의 최빈 키워드와 추출된 키워드 간의 맥락을 확인하고자 하였다. 다음으로 허위·과장광고가 어떻게 변화해왔는지에 대해 고찰하기 위해 10년 단위로 기사를 분리하여 빈도 분석을 수행하였고, 연도별 최빈 키워드를 주제로 한학술논문 수와 비교하여 해당 시기에 이슈가 된 키워드가 연구로까지 이어진 경향성을 파악하였다. 마지막으로 토픽모델링 분석을 통해 토픽 내 세부 키워드를 바탕으로 허위·과장광고의 동향을 제시하였다. 연구 결과, 특정 시점에 이슈가 되었던 주제가 최빈 키워드로 추출되었고 시대별 키워드 트렌드는 사회적, 환경적 요인과 연관되어 변화함을 확인하였다. 본 연구는 소비자들이 부당광고에 대한 배경지식을 함양함으로써 현명한 소비를 이어 나갈 수 있도록 도움을 주는 데 의의가 있다. 더욱이 핵심 키워드 추출을 통해 위법행위를 저지른 기업 및 관련 종사자들에게 광고의 참된 목적을 제시하고, 시사점을 전달할 수 있을 것이라 기대한다.

모바일 간편 결제 서비스 활성화 전략 : 토픽 모델링과 PEST - SWOT 분석 방법론을 기반으로 (Proposal of Promotion Strategy of Mobile Easy Payment Service Using Topic Modeling and PEST-SWOT Analysis)

  • 박성우;김세형;강주영
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.365-385
    • /
    • 2022
  • 간편 결제 서비스는 간편 인증 수단을 이용한 결제 및 송금 서비스이다. 코로나 19로 인해 온라인 거래가 증가하면서 간편 결제 서비스 이용이 증가하고 있다. 이와 함께 네이버페이, 카카오페이, 토스와 같은 전자금융업이 간편 결제 시장의 경쟁 구도를 다각화하고 있다. 해외의 핀테크 기업인 PayPal과 Alibaba는 자국 내 독보적인 점유율을 보유하고 있지만, 국내 간편 결제 시장은 독보적인 점유율을 차지하고 있는 업체가 없어 경쟁이 심화되고 있다. 본 연구에서는 간편 결제 시장 참여자를 전자금융업자, 휴대폰 제조업자, 금융회사로 분류하고, 각 업종의 대표적인 서비스들에 대해 SWOT 분석을 진행하였다. 구글 플레이스토어 실 사용자 후기를 토픽모델링 기법을 사용하여 분석하였고, 긍정 토픽을 강점으로 부정 토픽을 약점으로 활용하였다. 또한, 뉴스 기사를 P(정치), E(경제), S(사회), T(기술)로 나누어 토픽모델링을 진행하여 간편 결제 서비스에 대한 기회와 위협을 도출하였다. 본 연구를 통해 간편 결제 시장 참여자가 자사의 서비스 역량을 확인할 수 있도록 하고, 서비스별로 간편 결제 시장에서 우위를 점할 수 있는 서비스 활성화 전략을 제안하고자 한다.

토픽 모델링 기반 한국 노인의 행복과 불행 이슈 분석 (A Topic Modeling Approach to the Analysis of Seniors' Happiness and Unhappiness in Korea)

  • 문동지;연다인;김희웅
    • 경영정보학연구
    • /
    • 제20권2호
    • /
    • pp.139-161
    • /
    • 2018
  • 한국이 빠르게 고령화 사회에서 고령사회로 진입함에 따라 성공적인 노화, 노후 생활이 개인뿐만 아니라 사회적으로도 관심을 받고 있다. 이에 본 연구는 노인의 행복과 불행 관련된 신문 기사를 통해 전체적인 이해와 더불어 제안을 하기 위한 목적으로 연구를 진행했다. 노인의 행복과 불행에 관련된 기존 연구는 연구대상의 특성상 인터뷰 혹은 인터뷰를 동반한 설문조사의 방법론을 사용해 영향요인을 재확인하거나, 단일효과를 검증하는데 머물렀다. 또한 노인의 행복과 불행에 영향을 미치는 중요한 요인 파악과 더불어 정부, 기업, 가정 및 기타 사회 복지기관으로 분류하여 실증적인 행복 증진, 불행 경감 방안을 제시한 연구가 이루어지지 않았다. 따라서 본 연구는 Alderfer의 ERG 이론을 기반으로 검색어를 선정해 18년간(수집 기간: 2001. 08~2018. 02) 온라인 신문기사를 총 211,309건(행복: 200,246건, 불행: 11,063건)을 수집하여 연구를 진행했다. 분석결과 행복 관련 토픽은 연금, 사회 인프라, 건강, 공동체, 복지, 문화생활, 성공적인 노후, 봉사, 종교, 귀농으로 도출되었고, 불행 관련 토픽은 노인 우울, 복지 부족, 종교 의지, 질병, 은퇴 후 소득, 문화, 봉사, 역사적 사건, 예술, 가족 단절로 나타났다. 추가로 토픽 네트워크 분석을 통하여 각 토픽의 키워드 사이의 네트워크를 시각화했다. 따라서 본 연구는 결과를 통한 실현 가능한 제안을 했다는 점을 시사한다.

토픽 모델링 기반 뉴스기사 분석을 통한 서울시 이슈 도출 (Identifying Seoul city issues based on topic modeling of news article)

  • 권민지
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 추계학술대회
    • /
    • pp.11-13
    • /
    • 2019
  • 대중들에게 정보를 빠르고 정확하게 제공하는 대표 매체인 뉴스 기사는 일 평균 1만 5천 건 이상이 보도되고 있다. 특정 주제 또는 분야에 대한 전반적인 동향을 파악하고자 대량의 텍스트 데이터를 수집하여 텍스트 마이닝(Text mining)과 머신러닝 등을 적용하는 연구들이 활발하게 수행되고 있다. 본 연구에서는 서울시의 이슈 및 문제를 파악하고자 약 5년간 뉴스 기사를 수집하여 키워드 분석 및 토픽 모델링을 적용하였다. 분석 결과 5년간의 뉴스 기사에서 빈번하게 출현하는 키워드들을 도출하였고 연도별로 도출된 키워드들을 비교분석하였다. 또한 토픽 모델링 적용 결과 뉴스 기사를 구성하는 20개의 주제를 도출하였으며 이를 기반으로 서울시의 주요 이슈들을 파악할 수 있다. 본 연구는 연도별, 분야별 세부 내용 및 시계열 분석, 다른 도시들의 이슈 및 문제를 도출하는데 활용될 것으로 기대된다.

  • PDF

베이지안 분류기를 이용한 문서 필터링 (A Study on Document Filtering Using Naive Bayesian Classifier)

  • 임수연;손기준
    • 한국콘텐츠학회논문지
    • /
    • 제5권3호
    • /
    • pp.227-235
    • /
    • 2005
  • 문서 필터링은 어떤 문서가 특정한 주제에 속하는지의 여부를 판별하는 문제이다. 인터넷과 웹이 널리 퍼지고 이메일로 전송되는 문서의 양이 폭발적으로 증가함에 따라 문서 여과의 중요성도 증가하고 있는 추세이다. 본 논문은 문서 필터링 문제를 이진 문서 분류 문제로 보고, 베이지안 분류기를 필터링 목적으로 사용하였다. 그리고 사용자가 관련성 있는 문서를 제대로 필터링 받기 위해서 학습 대상으로 삼아야 할 문서의 범위나 수, 최소한 체크해야 하는 관련성 있는 문서의 수에 대한 값을 구하는 실험을 수행하였다.

  • PDF

규조토 및 실리카겔을 혼입한 시멘트 경화체의 열전도율 특성 (Thermal conductivity properties of cement matrix utilizing diatomite and silica gel)

  • 김기훈;편수정;이상수;송하영
    • 한국건축시공학회:학술대회논문집
    • /
    • 한국건축시공학회 2018년도 춘계 학술논문 발표대회
    • /
    • pp.230-231
    • /
    • 2018
  • Recently, the danger for radioactive materials has become a hot topic. Beginning with the Chernobyl nuclear accident in 1996, in 2011, the Fukushima nuclear power plant in Japan suffered major damage such as large-scale casualties and radioactive dangerous area selection. Concerns about leakage of radioactive materials due to recent earthquakes have been deepening in Korea, such as Wolsong Nuclear Power Plant in Gyeongju, and there is a growing interest in the safety of radioactive materials through the media and the media. However, the route to exposure to radioactive materials is not limited to these large-scale nuclear accidents. Typical examples of this are radioactive substances exposed in daily life. In the case of radon gas, the danger is being revealed through current events programs and news, and natural radiation exposure is attracting attention.

  • PDF

대학 BI 분석을 위한 주제분류기의 구현 (Implementation of Topic Classifier for University News-based BI Analysis)

  • 장서윤;장현영;차채원
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제63차 동계학술대회논문집 29권1호
    • /
    • pp.23-25
    • /
    • 2021
  • 본 논문에서는 대학별 홍보 전략, 발전에 기여하기 위한 서비스를 제안한다. 이 서비스는 데이터 수집에는 크롤링을 사용하고 사이킷 런을 사용하여 정확도를 최대화하고, 각 분류된 카테고리의 오류을 최소화한다. 이 서비스는 각 카테고리별로 특성이 높은 키워드를 사용하여 카테고리 별 학습 데이터셋을 생성한 후 이러한 학습 데이터셋을 바탕으로 각 기사들을 최적의 카테고리로 분류해주는 분류기를 구현한다. 이러한 분류기를 사용하여 분류된 기사들을 분석하여 막대 그래프 등의 시각화된 자료들로 볼 수 있도록 하여 기존의 대학 홍보 자료에 비해 누구든 쉽고 간단하게 접근이 가능하도록 한다.

  • PDF