• Title/Summary/Keyword: 연관어

Search Result 370, Processing Time 0.025 seconds

News Article Big Data Analysis based on Machine Learning in Distributed Processing Environments (분산 처리 환경에서의 기계학습 기반의 뉴스 기사 빅 데이터 분석)

  • Oh, Hee-bin;Lee, Jeong-cheol;Kim, Kyungsup
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.11a
    • /
    • pp.59-62
    • /
    • 2017
  • 본 논문에서는 텍스트 형태의 빅 데이터를 분산처리 환경에서 기계학습을 이용하여 분석하고 유의미한 데이터를 만들어내는 시스템에 대해 다루었다. 빅 데이터의 한 종류인 뉴스 기사 빅 데이터를 분산 시스템 환경(Spark) 내에서 기계 학습(Word2Vec)을 이용하여 뉴스 기사의 키워드 간의 연관도를 분석하는 분산 처리 시스템을 설계 및 구현하였고, 사용자가 입력한 검색어와 연관된 키워드들을 한눈에 파악하기 쉽게 만드는 시각화 시스템을 설계하였다.

The Document Clustering using LSI of IR (LSI를 이용한 문서 클러스터링)

  • 고지현;최영란;유준현;박순철
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 2002.06a
    • /
    • pp.330-335
    • /
    • 2002
  • The most critical issue in information retrieval system is to have adequate results corresponding to user requests. When all documents related with user inquiry retrieve, it is not easy not only to find correct document what user wants but is limited. Therefore, clustering method that grouped by corresponding documents has widely used so far. In this paper, we cluster on the basis of the meaning rather than the index term in the existing document and a LSI method is applied by this reason. Furthermore, we distinguish and analyze differences from the clustering using widely-used K-Means algorithm for the document clustering.

  • PDF

The Analysis of Clustering Result with Weight Change using LSI (LSI 를 이용한 가중치 변화에 따른 클러스터링 결과 분석)

  • Goh, Ji-Hyun;Oh, Hyung-Jin;Park, Soon-Cheol
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04b
    • /
    • pp.1009-1012
    • /
    • 2002
  • 정보검색시스템에서 가장 중요한 것은 사용자의 요구에 부합하는 결과를 도출하는 것이다. 이를 위하여 사용자의 질의와 연관된 모든 문서들을 추출하게 되는데, 이 많은 결과 문서들 중에서 사용자가 원하는 문서는 소수이고, 원하는 문서를 찾는 것도 쉽지 않다. 따라서 적절한 결과 문서 도출을 위하여 연관된 문서들끼리 그룹화 시키는 클러스터링 방법이 많이 이용된다. 본 논문에서는 클러스터링에 영향을 끼치는 요소 중 문서별 색인어의 가중치가 클러스터링에 끼치는 영향을 알아보았다. 이를 위해 가중치의 변화에 따른 클러스터링 된 결과를 LSI 를 이용하여 도식화하고 그 결과를 분석하였다.

  • PDF

Compare Three Method for Keyword Summary (키워드 요약의 세 가지 방법론 비교)

  • Kang, Jong-Reul;Nam, Ji-Seong;Park, Gi-na;Kim, Woongsup
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.10a
    • /
    • pp.852-854
    • /
    • 2019
  • 본 논문은 정확한 연관검색어를 보여주지 못하는 기존의 검색에서 벗어나기 위해 이미지와 PDF에서 텍스트를 추출하고 키워드 요약하는 방법을 사용하였다. 텍스트를 키워드로 요약하는 알고리즘으로는 TextRank, LSA, MMR을 사용하였고, 세 가지 방법으로 키워드를 요약하고 키워드 요약 결과와 Query의 코사인 유사도를 이용하여 추출한 문서와 Query와의 연관성을 확인하여 세 가지 알고리즘을 비교하였다.

News Big Data Analysis on Disaster Warning Text Message (재난문자에 대한 뉴스 빅데이터 분석)

  • Lee, Hyun-Ji;Byun, Yoon-Kwan;Choi, Seong-Jong
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2019.06a
    • /
    • pp.194-196
    • /
    • 2019
  • 본 연구에서는 재난문자에 대한 뉴스양과 주요 이슈에 대해 알아보았다. 뉴스 빅데이터 서비스인 빅카인즈를 통해 분석을 실시한 결과, '재난문자' 관련 뉴스가 2016년에 186건으로 전년대비 약 18.6배 증가하는 급격한 성장세를 보였다. 이후 '재난문자' 관련 뉴스는 높은 수치를 유지하는 것으로 나타났다. 지진이 다른 재난에 비해 많은 비중을 차지하였지만 지진이 다수를 차지한 2016년 대비 2017년과 2018년은 지진 외에 다양한 재난에 대해 다루어졌다. 그리고 '재난문자' 연관어 중 행정안전부(국가안전처, 행안부 용어 포함)가 가장 비중 있게 다루어졌고, 기상청과 국민도 비중 있게 다루어진 용어로 나타났다.

  • PDF

Emergency Disaster Support Fund of Korea in 2020 confirmed through News Articles of Major Newspaper (주요 신문사 뉴스 기사를 통해 살펴본 2020년도 대한민국의 긴급재난지원금)

  • Kwon, Choong-hoon;Lee, Hyoung-Ha
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2020.07a
    • /
    • pp.169-170
    • /
    • 2020
  • 본 연구는 코로나19 상황에서 대한민국 긴급재난지원금의 모습을 주요 신문사 뉴스 기사들을 통해 분석하고 그 결과를 제시하고자 한다. 분석대상은 2020년 3월 22일부터(긴급재난지원금 첫 보도) 5월 31일까지, 중앙일간지(11개 신문사)의 '긴급재난지원금' 관련 신문기사들이다. 신문기사 분석방법론은 관련 연구주제가 선행연구가 축적되지 않는 상황에서 나름 가치 있는 연구접근법이다. 본 연구에서는 뉴스기사 빅데이터 분석 서비스인 빅카인즈를 활용하여, 관련기사의 뉴스 트렌드, 연관어, 관계도 등을 분석하여 제시하였다. 본 연구는 향후 해당 분석대상을 가지고, 보다 밀도 있고 깊이 있는 언어네트워크(의미망) 분석으로 확장해 나갈 계획이다.

  • PDF

News Big Data Analysis of Media Companies related to Lifelong Education for the Disabled (장애인 평생교육 관련 언론사 뉴스 빅데이터 분석)

  • Kwon, Choong-Hoon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.01a
    • /
    • pp.183-184
    • /
    • 2022
  • 본 연구는 장애인 평생교육 관련 언론사 뉴스 빅데이터를 한국언론재단의 빅카인즈(BIGKinds) 시스템을 이용하여 분석하였다. 본 연구에서는 2000년 1월 1일부터 2020년 12월 31일까지 20년간, 총 54개 언론사에서 보도한 '장애인 평생교육' 관련 뉴스 기사들을 추출하였다. 그 분석대상 뉴스 빅데이터를 대상으로 키워드 트렌드 분석, 언어 네트워크 지도 구현, 연관어 분석(워드클라우드 제시) 등을 진행하였다. 본 연구 결과는 장애인 평생교육 관련 정책 입안 연구 및 실증적인 연구(평생교육 참여 요인 및 효과 등)의 기초자료로 활용될 수 있을 것으로 기대된다.

  • PDF

『Superintendent's Direct Election System』 shown in Media News Big Data (언론사 뉴스 빅데이터를 통해 살펴본 『교육감 직선제』)

  • Kwon, Choong-Hoon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.351-354
    • /
    • 2022
  • 본 연구는 최근 2022년 6월 1일에 실시된 전국 시도교육청 교육감 선거를 계기로 진행된 연구이다. 본 연구의 목적은 2010년 1월 1일부터 2022년 6월 10일까지 '교육감 직선제'를 다룬 언론사 기사들을 분석하여 그 결과를 객관적으로 제시하는 것이다. 분석 대상은 2010년 1월 1일부터 2022년 6월 10일까지 기간을 설정한 후, '교육감'과 '직선제' 2개의 용어가 모두 포함된 국내 54개 주요 언론사 뉴스 기사들(5,610건)이다. 본 연구에서는 뉴스 빅데이터 분석시스템인 빅카인즈(BIGKinds) 서비스를 적극적으로 이용하여 뉴스 트렌드 분석, 네트워크(관계도) 분석, 연관어 분석 등을 진행하였다. 본 연구자료는 관련 학문 연구자와 교육 현장 종사자들에게 시사점을 줄 수 객관적인 자료로 활용될 것이다. 본 연구는 향후 지방교육자치와 교육감 선거의 발전적 모델 탐색을 위한 다양한 연구 과정으로 확대 전개하고자 한다.

  • PDF

Changes in Media Perspectives on Autism and Developmental Disorders (자폐와 발달장애를 바라보는 언론사 시각 변화 -이상한 변호사 우영우 드라마 전후 비교-)

  • Choong-Hoon Kwon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.01a
    • /
    • pp.183-184
    • /
    • 2023
  • 본 연구는 2022년 여름 인기리에 반영된 '이상한 변호사 우영우'라는 드라마가 '자폐'와 '발달장애' 관련 언론사의 보도형태에 어떤 영향을 미쳤는지 분석하였다. 본 연구에서는 2018년 1월 1일부터 2022년 12월 14일까지(약 5년간) 총 54개 언론사에서 보도한 '자폐'와 '발달장애'라는 용어가 포함된 관련 뉴스 기사들을 분석하였다. 그 분석대상 뉴스 빅데이터를 대상으로 키워드 트렌드 분석, 연관어 분석(워드클라우드 제시) 등을 진행하였다. 본 연구결과는 일반 시민 대상 장애인식 개선 프로그램의 개발 등에 활용될 수 있을 것으로 기대된다. 또한 본 연구를 확대하여, 장애인 관련 언론사의 보도태도(긍정-중립-부정 등)를 체계적으로 분석하고자 한다.

  • PDF

Patterns of National Media Reports related to 'Artificial Intelligence and School' ('인공지능과 학교' 관련 전국 단위 언론사 보도형태)

  • Choong-Hoon Kwon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.07a
    • /
    • pp.331-332
    • /
    • 2023
  • 최근 ChatGPT, 코딩교육, 디지털교과서 등의 새로운 용어와 산물들이 전국 단위 언론사를 통해, 교육 전문가(교사 등)와 일반 국민들에게 어떤 형태의 보도가 진행되는지 확인하는 것이 중요한 연구 출발점이다. 본 연구는 오늘날 학교교육, 교육방법(매체론) 등에 큰 변화를 줄 '인공지능'에 대한 전국 단위 언론사(일간지-11개사, 방송사-5개사)의 최근(2020-2023년) 보도형태를 분석하고 제시하였다. 본 연구에서는 2020년 1월부터 2023년 5월까지(3년 5개월간) 총 16개 언론사(일간지와 방송사)에서 보도한 '인공지능'와 '학교' 용어가 모두 포함된 관련 뉴스 기사들을 분석하였다. 분석대상 뉴스 빅데이터들을 대상으로 연도별 보도기사 건수 분석, 키워드 트렌드 분석, 연관어 분석(워드클라우드 제시) 등을 진행하였다.

  • PDF