• 제목/요약/키워드: 뉴스 토픽

검색결과 221건 처리시간 0.029초

토픽 모델링을 활용한 '수돗물 유충' 뉴스 빅데이터 분석 (News Big Data Analysis of 'Tap Water Larvae' Using Topic Modeling Analysis)

  • 이수연;김태종
    • 한국콘텐츠학회논문지
    • /
    • 제20권11호
    • /
    • pp.28-37
    • /
    • 2020
  • 본 연구는 '수돗물 유충' 사태의 뉴스 빅데이터를 분석함으로써, '수돗물 유충'과 관련된 주요 키워드와 토픽을 파악하여, 환경문제에 대한 위기 대응력 제고방안을 제안하기 위해 수행되었다. 2020년 7월 13일부터 8월 31일까지 보도된 1,975건의 '수돗물 유충' 뉴스를 토픽 모델링 기법으로 분석하였다. 그 결과 언론에서 나타난 '수돗물 유충' 사태가 발생기, 확산기, 수습기로 구분되며, 각 5개의 토픽을 선정하여, 환경문제의 발생과 추진 과정을 확인할 수 있었다. 분석 결과를 바탕으로 환경문제에 대한 위기 대응 방안을 다음과 같이 제언하였다. 첫째, '수돗물 유충' 사건을 중심으로 얽혀있는 다양한 맥락을 탐구하고 통합적인 안목을 형성하는 교육으로 환경문제에 대한 대응력을 기를 수 있도록 해야 한다. 둘째, 인터넷 커뮤니티를 활용한 시민참여의 환경정보 공유와 환경감시 역할 부여가 필요하다. 셋째, 신속하고 정확한 환경정보 제공과 소통을 담당하는 환경 커뮤니케이터의 양성 및 배치가 필요하다. 본 연구는 '수돗물 유충' 관련 뉴스 빅데이터를 기반으로 국내에서 처음으로 토픽 모델링 분석기법을 활용하여 분석한 연구로서, 비정형 데이터로 나타나는 환경 관련 이슈를 실증적이고 체계적으로 분석했다는 학술적 의의와 환경교육 및 커뮤니케이션 개선 방안을 제시했다는 정책적 의의를 지닌다.

비정형 텍스트 기반의 토픽 모델링을 이용한 건설 안전사고 동향 분석 (A Study on the Trends of Construction Safety Accident in Unstructured Text Using Topic Modeling)

  • 이상규
    • 한국산학기술학회논문지
    • /
    • 제19권10호
    • /
    • pp.176-182
    • /
    • 2018
  • 본 연구는 건설 안전사고에 대한 트랜드 분석을 위해 LDA(Latent Dirichlet Allocation) 기반의 토픽모델링(Topic Modeling)을 제시하여 분석하고자 한다. 특히, 건설산업의 안전사고를 예방하기 위해 제시되고 있는 기존의 다양한 정형데이터 분석에서 벗어난 비정형 데이터 분석 기반의 토픽 모델링을 통해 건설 안전사고 주요 핵심 키워드의 흐름에 대해 파악이 가능하다. 본 방법론을 적용하기 위해 540개의 건설 안전사고 관련 뉴스데이터를 수집하였다. 이를 기반으로, 10가지 토픽과 각 토픽 내의 10가지 키워드를 통해 주요 이슈를 도출하였고 각 토픽에 대한 2017년 1월부터 2018년 2월까지의 뉴스 데이터를 월별 시계열 분석을 통해 향후 토픽에 관한 이슈를 예측한다. 본 연구를 바탕으로 향후 건설 안전사고의 다양한 이슈를 선제적으로 예측하고 이를 기반으로 건설 안전사고 정책과 연구에 좋은 방향을 제시할 것으로 판단한다.

트윗의 타임 시퀀스를 활용한 DTM 분석 : 2019 남북미정상회동 이벤트를 중심으로 (Tweets analysis using a Dynamic Topic Modeling : Focusing on the 2019 Koreas-US DMZ Summit)

  • 고은지;최선영
    • 한국정보통신학회논문지
    • /
    • 제25권2호
    • /
    • pp.308-313
    • /
    • 2021
  • 이 연구는 2019년 판문점 남북미 정상 회동 트윗을 타임 시퀀스와 함께 수집하여 시퀀셜 토픽모델링인 DTM으로 분석하였다. 트위터와 같은 마이크로 블로깅 서비스는 단일 이벤트에 뉴스와 오피니언이 혼재된 비정형 데이터가 대규모로 동시에 발생하고, 정보와 반응이 동일 메시지 형식으로 생산된다. 때문에 토픽 트렌드를 파악하려면 시퀀셜 데이터의 특성을 반영하여 패턴 분석을 해야 맥락적 의미를 알 수 있다. 토픽 일관성 점수를 구해 LDA를 평가한 후 DTM을 계산한 결과, 뉴스 보도와 오피니언 관련 토픽 30개가 도출되었고, 각 토픽과 키워드는 시간에 따라 발생 확률이 역동적으로 진화하고 있었다. 결론적으로 DTM은 특정 이벤트에 대한 사회 전반에 나타난 통합적 토픽 추이를 시간에 따라 분석하는데 적합한 모델임을 밝혔다.

토픽모델링을 활용한 부산항 항만안전성 이슈 동향에 관한 연구

  • 이정민;하도연;김율성
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2023년도 추계학술대회
    • /
    • pp.66-67
    • /
    • 2023
  • 최근 들어, 현대사회는 예측이 불가능한 다양한 위험성들이 존재하여 글로벌 의존도가 높은 항만물류산업의 위험부담이 증가하고 있다. 이에 본 연구에서는 항만산업의 안전성에 영향을 미치는 요인을 알아보기 위해 과거부터 현재까지 국내 항만 안전성에 영향을 미친 이슈들을 시계열적으로 살펴보고자 하였다. 이를 위하여 국내를 대표하는 부산항의 항만 안전성과 관련된 뉴스 기사 텍스트 데이터를 활용하여 LDA 토픽모델링 분석을 진행하여 부산항 항만안전 주요 이슈들의 동향을 살펴보고자 하였다.

  • PDF

단어 유사도를 이용한 뉴스 토픽 추출 (News Topic Extraction based on Word Similarity)

  • 김동욱;이수원
    • 정보과학회 논문지
    • /
    • 제44권11호
    • /
    • pp.1138-1148
    • /
    • 2017
  • 토픽 추출은 문서 집합으로부터 그 문서 집합을 대표하는 토픽을 자동 추출하는 기술이며 자연어 처리의 중요한 연구 분야이다. 대표적인 토픽 추출 방법으로는 잠재 디리클레 할당과 단어 군집화 기반 토픽 추출방법이 있다. 그러나 이러한 방법의 문제점으로는 토픽 중복 문제와 토픽 혼재 문제가 있다. 토픽 중복 문제는 특정 토픽이 여러 개의 토픽으로 추출되는 문제이며, 토픽 혼재 문제는 추출된 하나의 토픽 내에 여러 토픽이 혼재되어 있는 문제이다. 이러한 문제를 해결하기 위하여 본 연구에서는 토픽 중복 문제에 대해 강건한 잠재 디리클레 할당으로 토픽을 추출하고 단어 간 유사도를 이용하여 토픽 분리 및 토픽 병합의 단계를 거쳐 최종적으로 토픽을 보정하는 방법을 제안한다. 실험 결과 제안 방법이 잠재 디리클레 할당 방법에 비해 좋은 성능을 보였다.

토픽모델링과 시계열 회귀분석을 활용한 헬스케어 분야의 뉴스 빅데이터 분석 연구 (Big Data News Analysis in Healthcare Using Topic Modeling and Time Series Regression Analysis)

  • 김은정;장석권;이상용
    • 경영정보학연구
    • /
    • 제25권3호
    • /
    • pp.163-177
    • /
    • 2023
  • 본 연구는 디지털 헬스케어 산업 활성화를 위한 정책적 접근으로서, 주요 의제 도출 및 정책적 시사점을 제시하는데 목적이 있다. 본 연구에서는 10년(2013년~2022년) 간의 헬스케어와 관련된 뉴스 빅데이터 총 91,873건을 수집하여 토픽모델링 분석, 다차원척도 분석 및 시계열 회귀분석을 수행하였다. 토픽모델링 분석 및 다차원척도법을 통해 총 20개의 토픽을 도출하여 2차원선상에 토픽들의 군집 형태를 파악하였고, 시계열 회귀분석을 통해, 상승 추세를 나타내는 4개의 Hot topic(건강관리, 바이오제약, 기업매출·전망, 정부·정책)과 하향 추세를 나타내는 3개의 Cold topic(스마트기기, 주식·투자, 도시·건설)을 도출되었다. 본 연구의 결과는 우리나라 정책을 수립하는 정부 기관에 중요한 기초 자료로 활용될 수 있을 것이다.

R을 활용한 SW교육 텍스트데이터 토픽분석 (A Topic Analysis of SW Education Textdata Using R)

  • 박선주
    • 정보교육학회논문지
    • /
    • 제19권4호
    • /
    • pp.517-524
    • /
    • 2015
  • 본 논문에서는 사람들의 SW 교육과 관련된 관심방향을 알아보기 위해 SW 교육 관련 뉴스데이터를 수집하여 그 내용을 분석하였다. 이를 위해 2013년 7월 23일~2015년 10월 19일의 SW 교육관련 뉴스데이터의 토픽분석을 실시하였다. R을 사용하여 웹크롤링 후 가장 자주 언급된 상위 20개 단어들 간의 관련성을 분석한 결과, SW 교육 단어를 중심으로 20개 단어의 노드 크기와 연결선의 두께가 비교적 균형을 이루고 있어 서로의 관련성이 밀접하게 유지되는 데이터임을 알 수 있었다, 또한, 분석대상 데이터는 주로 SW 인재양성, SW 지원 프로그램, SW 교육 의무화, SW 캠프, SW 산업, 일자리 창출과 관련된 토픽들임을 알 수 있었다. 이는 SW 교육에 관한 사람들의 생각 및 관심분야 등을 알아보는 빅데이터 분석 자료에 활용될 수 있을 것이다.

'우주 위험' 관련 뉴스 기사의 텍스트 마이닝 분석 연구 (Text Mining Analysis of News Articles Related to 'Space Hazard')

  • 조훈;손정주
    • 한국지구과학회지
    • /
    • 제43권1호
    • /
    • pp.224-235
    • /
    • 2022
  • 본 연구는 지난 12년간의 우주위험 관련 언론기사의 토픽모델링 분석을 통해 우주위험별 언론 보도 현황을 알아보기 위한 목적으로 수행되었다. 빅카인즈(BIGKinds)의 뉴스 플랫폼에서 2010년부터 2021년까지의 태양폭풍, 인공우주물체, 자연우주물체에 대한 우주위험 기사를 각각 1200여건 이상 수집하였으며, 키워드 분석, 잠재적 디리클레 할당모형(LDA) 분석을 수행하였다. 그 결과 태양폭풍 관련 기사는 3개의 토픽인 태양폭발이 인공위성에 미치는 영향, 우주전파센터를 중심으로 태양폭발이 우리나라 전파 통신에 미치는 영향, 항공종사자와 우주방사선의 관계로 요약되었다. 인공우주물체 관련 기사의 경우 3개의 토픽으로 인공위성과 우주정거장이 우주쓰레기로부터 위협을 받거나 그 자체가 우주쓰레기가 될 수 있다는 토픽, 영화를 통한 우주쓰레기와 인류의 관계에 대한 토픽, 우주쓰레기 추적·감시 및 처리를 위한 우주강국들의 노력이라는 토픽으로 요약되었다. 자연우주물체 관련 기사는 2개의 토픽으로 국제 우주기관의 근지구소행성에 대한 추적·감시와 충돌 대책과 소행성과 혜성 충돌을 중심으로 공룡과 포유류의 진화 및 멸종 원인으로 요약되었다. 이로부터 2010년부터 현재까지 국내 언론은 우주위험을 사회, 문화 등 다양한 영역에서 총 8개의 주제로 대중들에게 그 위험성과 경각심을 전하는 역할을 하고 있음을 확인하였으며, 이러한 결과를 기반으로 우주위험에 대한 교육방법과 교육정책의 필요성을 제언하였다.

뉴스와 토픽

  • 한국과학기술단체총연합회
    • 과학과기술
    • /
    • 제31권12호통권355호
    • /
    • pp.8-11
    • /
    • 1998
  • PDF

뉴스와 토픽

  • 한국과학기술단체총연합회
    • 과학과기술
    • /
    • 제31권9호통권352호
    • /
    • pp.8-11
    • /
    • 1998
  • PDF