• 제목/요약/키워드: 뉴스기사 분석

검색결과 360건 처리시간 0.028초

온라인 뉴스에 대한 한국 대중의 감정 예측 (Inference of Korean Public Sentiment from Online News)

  • ;최순영;임희석
    • 한국융합학회논문지
    • /
    • 제9권7호
    • /
    • pp.25-31
    • /
    • 2018
  • 온라인 뉴스는 기존의 신문을 대체하였고, 우리가 정보에 접근하고 공유하는 방법에 큰 변화를 가져왔다. 뉴스 웹사이트들은 사용자가 댓글을 남길 수 있는 기능을 오랜 시간동안 제공하였고, 그 중 몇몇 뉴스 웹사이트에서는 뉴스 기사들에 대한 사용자의 반응들을 크라우드소싱(crowdsource)하기 시작했다. 감정분석 분야에서는 텍스트에 반영된 감정과 반응들을 컴퓨팅적으로 모델링하기 위한 시도를 하고 있다. 본 연구에서는 뉴스 기사에 대한 반응들이 뉴스 본문과 수학적인 상관관계를 갖는지 밝히기 위해, 사용자로부터 생성된 다섯 가지의 감정 라벨(label)을 사용하여 10가지 카테고리(category)에 해당하는 100,000개 이상의 뉴스 기사들을 분석한다. 본 연구에서는 전처리과정이 최소한으로 필요하고 기계학습이 적용하지 않아도 되는 간단한 감정 분석 알고리즘(algorithm)을 제안한다. 우리는 이 모델이 한국어와 같은 형태론적으로 복잡한 언어에도 효과적이라는 것을 증명한다.

지능형 온라인 뉴스 추천시스템 개발을 위한 체계적 속성간 상대적 중요성 분석: PWYW 지불모델을 중심으로 (An Analysis of the Comparative Importance of Systematic Attributes for Developing an Intelligent Online News Recommendation System: Focusing on the PWYW Payment Model)

  • 이형주;정누리;양성병
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.75-100
    • /
    • 2018
  • 최근 웹툰, 음원, 동영상, 게임, 교육, 앱 등 많은 콘텐츠 기업에서 콘텐츠 유료화 정책을 추진하고 있으나, 무료 콘텐츠에 익숙한 독자들의 문화적 관성이 온라인 콘텐츠의 유료화 전환에 많은 어려움을 주고 있다. 특히 온라인 뉴스 콘텐츠는 포털 사이트를 통해 무료로 배포되고 있어 유료화에 대한 독자들의 거부감이 다른 온라인 콘텐츠 보다 더욱 심한 실정이다. 이러한 문제 해결을 위해 학계 및 산업계에서 온라인 콘텐츠의 유료화 방안에 대한 연구가 다양한 차원에서 진행되었다. 최근에는 일부 온라인 뉴스 매체를 중심으로 독자들이 자발적으로 마음에 드는 뉴스 콘텐츠에 대해 원하는 만큼의 구독료를 지불하게 하는 Pay-What-You-Want (PWYW) 지불모델을 적용하는 시도가 이뤄지고 있다. 이에 본 연구는 PWYW 모델의 성공적인 정착을 위한 선결요인으로 독자의 자발적 독자구독료 지불행위에 영향을 미치는 온라인 뉴스 콘텐츠의 체계적 속성을 도출하고, 각 속성 및 하위 속성의 상대적 중요도를 비교 분석하였다. 좀 더 구체적으로, 선행연구 분석을 통해 기사제목 유형, 기사 이미지 자극성, 기사 가독성, 기사 유형, 기사 지배적 정서, 기사 내용-이미지 유사성 등 총 여섯 가지의 온라인 뉴스 콘텐츠의 체계적 속성을 도출하였으며, 내용분석(content analysis)을 통해 각 기사의 속성값을 측정하고 이를 기반으로 컨조인트 분석(conjoint analysis)을 실시하여 속성 간 상대적 중요도를 계산 및 검증하였다. PWYW 모델이 적용된 온라인 뉴스 콘텐츠 379개에 대한 컨조인트 분석 결과, 기사 가독성, 기사 내용-이미지 유사성, 기사제목 유형 등의 순으로 자발적 독자구독료에 큰 영향을 주는 것으로 분석된 반면, 기사 유형, 기사 지배적 정서, 기사 이미지 자극성 등은 상대적으로 낮은 중요도를 보이는 것으로 조사되었다. 본 연구는 내용분석과 컨조인트 분석을 동시에 실시하여 온라인 뉴스 콘텐츠에 대한 자발적 지불의도에 영향을 미치는 체계적 요인을 도출하고, 그 상대적 중요도까지 살펴보았다는 점에서 학술적 의의가 있으며, 온라인 뉴스 콘텐츠 제작자 및 사이트 운영자들로 하여금 독자들의 자발적 지불을 유도할 수 있는 가이드라인을 제시하였다는 점에서 그 실무적 의의가 있다.

인터넷 뉴스 인용을 이용한 국내 경제연구기관 영향력에 관한 연구 (A Study on the Impact of Economic Research Institutes in Korea using Citation Analysis of the Internet News)

  • 김혜민;최윤경
    • 정보관리연구
    • /
    • 제41권2호
    • /
    • pp.161-181
    • /
    • 2010
  • 본 연구는 국내 주요 10개 경제연구기관의 보고서를 대상으로 인터넷 뉴스에서의 인용 행태를 분석하고 각 기관의 영향력을 h-지수와 다양한 변형 지수(g-지수, $h_s$-지수, $g_s$-지수)로 제시하였다. 이를 위해 네이버 뉴스에서 기사를 검색하여 총 878건에 대한 기사의 내용 분석을 실시하였다. 먼저, 보고서 인용 기사 수, 뉴스매체, 주제 섹션, 신속성, 정확성, 중심성, 기사 길이 등을 중심으로 인용행태를 분석하였다. 다음으로 인용 건수로 영향력을 산출하여 기관 순위를 비교하였다. 분석 결과 인용 지수 순위가 상위권에 속한 기관들은 지수 간의 순위 차이가 거의 없었고, 전문가가 제시한 순위와도 유사한 반면, 중 하위권의 기관들은 상대적으로 지수에 따라 차이가 나고, 전문가 순위와 다른 양상을 보였다.

20세기 하반기의 미 신문 1면 보도에 대한 다양성 분석: 뉴스 토픽과 정보원의 분포를 중심으로 (Topic and Source Diversity of the Front Page in the New York Times, Chicago Tribune and the Los Angeles Times from 1950 to 2000)

  • 심훈
    • 한국언론정보학보
    • /
    • 제30권
    • /
    • pp.175-201
    • /
    • 2005
  • 본 논문은 '다양성'이라는 규범적 가치에 입각해 뉴스 기사 선별 및 취재 경로와 관련한 미 신문의 뉴스 제작 방식에는 어떤 변화가 진행돼 왔는지를 통시적으로 살펴보고 있다. 이에 따라 본고에서는 '뉴스 토픽'과 '정보원' 등 두 가지 분야에서 지난 50년간 뉴욕 타임스와 시카고 트리뷴, 로스앤젤레스 타임스 등 3대 유력 일간지의 1면 기사를 분석, 연대기적인 가치 변화를 추적해 보았다. 데이터 분석 결과, 지난 반세기 동안 미 신문에서 정부 및 정치권에 대한 정보원의 의존도는 지속적으로 줄어들고 있는 반면, 기업/산업체발 정보원의 등장은 점차 빈번해 지고 있는 것으로 나타났다. 이와 함께, 뉴스 주제의 분포에 있어서는 사건, 사고 기사의 감소와 군사, 안보기사의 퇴조 속에, 경제, 건강, 교육 등과 같은 주제가 점차 활발하게 다뤄지고 있는 것으로 조사됐다. 그러나 전통적인 비인기 주제였던 빈곤, 노동, 소수자, 사회 갈등 등과 같은 토픽들은 시대를 거듭해도 제자리를 맴돌거나 오히려 줄어들고 있는 것으로 나타났다.

  • PDF

4차 산업혁명의 시사적 교육을 위한 e-NIE 및 Edmodo 콘텐츠 활용 (Contents Application of e-NIE and Edmodo for Industry 4.0 Education)

  • 장희선
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2018년도 춘계 종합학술대회 논문집
    • /
    • pp.369-370
    • /
    • 2018
  • 본 논문에서는 대학의 교양 및 전공 수업에서 4차 산업혁명의 시사적 내용을 이해하기 위하여 최신 ICT 기술, 서비스, 산업 등과 관련된 뉴스 및 신문 기사를 활용한 교육 모델을 제시한다. 교육 모델에서는 다양한 뉴스 신문 기사를 서로 비교하면서 보기 위하여 e-NIE(electronic news in education)와 전 세계 교육용 SNS인 Edmodo 콘텐츠 활용 방법을 소개한다. 수강생들을 실험집단으로 설정하여 수강 전과 후의 정성적 효과를 분석한 결과, 대학에서의 뉴스 신문 활용 강좌의 필요성에 대하여 크게 동감하였다(5점 척도의 점수가 14.9% 향상).

  • PDF

빅데이터 분석을 이용한 뉴스 기사 시각화 시스템 설계 (Design of news visualization system with Big Data analysis)

  • 고병수;장한별;최혁준;김경섭
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.242-244
    • /
    • 2015
  • 정보통신기술이 발전함에 따라 인터넷 뉴스 기사의 수와 구독률이 지속적으로 상승하고 있다. 하지만 주로 텍스트로 구성된 인터넷 기사를 통해 전체적인 이슈의 현황을 파악하는 데는 한계가 있다. 이에 본 논문에서는 분산 시스템 환경 내에서 기계 학습을 통하여 대량의 뉴스를 분석하고, 주요 이슈와 이슈간의 연관성을 추출하여 시각화하는 시스템 설계에 대해 제안하고자 한다.

우울증에 관한 언론 보도 분석: 온라인 뉴스 미디어를 중심으로 (Analyzing Online News Media Coverage of Depression)

  • 노수진;윤영민
    • 한국언론정보학보
    • /
    • 제61권
    • /
    • pp.5-27
    • /
    • 2013
  • 유명인의 자살이 잇달아 발생하고 그 원인으로 우울증이 지목되면서 언론보도 전반에서 우울증에 대한 보도량이 늘고 있다. 그러나 선행연구의 부족으로 이러한 보도들이 질적인 측면에서 우울증을 건강행동이 필요한 질병으로 심층적으로 다루고 있는지는 불분명하다. 본 연구는 이를 알아보기 위해 2007년부터 약 5년간 온라인 전문 뉴스 미디어의 우울증 보도를 살펴보았다. 정신질환에 대한 선행연구들이 신문과 텔레비전 같은 전통적인 미디어에 초점을 맞춘데 반해, 본 연구는 최근 이용 빈도와 사회적 영향력 측면에서 중요한 온라인 보도를 분석했다. 연구 결과, 우울증 보도에 가장 많이 등장하는 정보원은 연예인, 스포츠스타, 정/재계 인사를 비롯한 유명인 환자였고, 일반인 환자와 비교해 4배 정도 많이 나타났다. 심지어 환자가 아닌 유명인도 일반인 환자보다 2배 이상 많이 등장했고, 의사를 비롯한 전문가도 유명인 환자의 절반 수준 밖에 등장하지 않았다. 또한 분석대상 기사의 약 3분의 1이 우울증의 원인에 대해 전혀 언급하지 않았고, 불우한 환경이나 소심한 성격 등 사회 심리 환경적 원인을 언급한 기사가 전체의 절반이 넘었으며 소수의 기사만이 뇌신경 손상, 호르몬 변화와 같은 신경생물학적 원인을 언급했다. 우울증의 치료방식 역시 분석 대상 기사의 절반 이상에서 전혀 언급되지 않았고, 의사 상담과 약물치료 같은 적극적 치료방식을 제시한 기사가 식이요법, 운동 및 주변 사람들과의 대화와 같은 소극적 치료방식을 제시한 기사에 비해 2배 이상 많았다. 전반적으로 우울증의 원인과 치료방식에 관해 언급하는 정도는 유명인 환자 중심의 기사에서 보다 일반인 환자 중심의 기사에서 높게 나타났다. 원인과 치료방식이 제시되는 정도 간 관계를 분석한 결과, 기사 내에서 우울증의 원인으로 신경생물학적 원인이 많이 제시될수록 적극적 치료방식과 소극적 치료방식 모두 제시되는 정도가 높게 나타났다. 한편 우울증 보도에 가장 많이 나타난 뉴스 프레임은 개인이 겪은 일화를 소개하는 인간적 흥미 프레임이었고, 사건, 사고, 분쟁을 다룬 갈등 프레임과 홍보 및 프로모션을 목적으로 한 상업적 프레임이 그 뒤를 따랐다. 또한 우울증 관련 보도에 한때 우울증을 겪었던 사람들이 회복한 후 이룬 긍정적인 업적이나 성취와 같은 내용이 나타나는 경우는 매우 적었다.

  • PDF

상수도시스템 수질사고의 전개양상을 고려한 비정형정보 의미분석 (Semantic analysis of unstructured information considering the step in progress of water quality accidents in the water supply systems)

  • 홍성진;문기훈;양성훈;유도근
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.378-378
    • /
    • 2022
  • 상수도시스템의 과정 중 최종 단계인 급수단계에서 지역전반에 수질문제가 발생할 경우, 직간접적인 피해의 해결은 장기간 지속될 수 있다. 본 연구에서는 실시간 비정형정보의 빅데이터 분석을 통해 상수도시스템에서 수질사고 문제의 파급력과 2차 피해 등의 연결 관계 변화 추적을 위한 기초적 분석을 수행하였다. 과거 대규모 수질사고가 발생된 바 있는 인천광역시 유충발생 사고를 대상으로 뉴스 기사 웹크롤링 절차를 정립하고, 그 결과를 분석하였다. '인천 유충'이 최초 보도되었던 2020년 7월 13일 부터 이후 1년을 대상으로 네이버 통합검색에 의해 표출되는 뉴스기사를 웹크롤링하였으며, 프로그래밍을 통한 불용어 제거 및 관련성 검토를 통해 총 920건의 기사를 분석하였다. 수질사고의 전개양상에 따라 사고발생, 확산, 수습, 그리고 보상의 4단계로 임의 구분하여 분석하였다. 의미분석을 위한 토픽모델링 기법은 잠재 디리클레 할당(Latent Dirichlet Allocation, LDA) 방법을 적용하였으며, 긍부정 감정분석은 KNU 한국어 감성사전(KNU sentiment lexicon)을 활용하여 수행하였다. 토픽 모델링 결과, 사고 발생에서부터 확산, 수습, 보상의 단계에 맞춰 적절한 주제어의 조합에 따른 기사들이 도출되었으며, 단계별 긍부정 기사 비율역시 사고의 전개단계에 따라 적절히 나타남을 확인하였다. 제시된 수질사고 관련 비정형정보 분석 방법론과 결과는 과거 사고 사례 분석을 통한 검색 및 긍부정 키워드 확정, 키워드 발생 비율 변동(사고전과 후)에 따른 상황판단 기준설정 등에 활용이 가능하다.

  • PDF

공적 이슈에 대한 미디어 보도 분석: 수돗물 관련 기사를 중심으로 (A Study on the Media Coverage of Public Issue: Focusing on Drinking-Water Issues)

  • 김성태;이창호
    • 한국언론정보학보
    • /
    • 제39권
    • /
    • pp.40-68
    • /
    • 2007
  • 수질개선과 아리수 홍보 노력에도 불구하고 일반 국민들의 수돗물에 대한 불신은 여전히 계속되고 있다. 본 연구는 국내의 주요 신문, 텔레비전, 인터넷 신문에 보도된 수돗물 관련 뉴스를 기사 유형 및 내용, 기사 작성자, 취재원, 그리고 뉴스 가치라는 분석 유목을 통해 그 보도 경향을 살펴보았다. 언론에서 다뤄진 주제는 식용수로서의 적합성 논의가 가장 많았고 수돗물 이물질 발견, 수돗물 관련 정부정책, 수도 관련 보도, 수질 검사 결과 순이었다. 기사 본문 내용의 논조를 분석한 결과 인터넷이 가장 부정적인 보도태도를 나타냈다. 기사 작성자의 경우, 일반 취재기자가 작성한 뉴스가 압도적이었고 전문기자가 쓴 경우는 전체 기사의 1% 미만이었다. 결론적으로 수돗물과 같은 공적 이슈를 제대로 보도하기 위해서는 전문기자의 육성이 시급하고 취재원을 다양화시키는 노력이 필요하며 흥미위주의 보도보다 심층적인 접근을 통한 기사 작성이 요구된다고 하겠다.

  • PDF

멀티모달 방법론과 텍스트 마이닝 기반의 뉴스 비디오 마이닝 (A News Video Mining based on Multi-modal Approach and Text Mining)

  • 이한성;임영희;유재학;오승근;박대희
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권3호
    • /
    • pp.127-136
    • /
    • 2010
  • 정보 통신기술이 발전함에 따라 멀티미디어 데이터를 포함하는 디지털 기록물의 양은 기하급수적으로 증가하고 있다. 특히 뉴스 비디오는 시대상을 반영하는 풍부한 정보를 내포하고 있으므로, 이를 효과적으로 관리하고 분석하기 위한 뉴스 비디오 데이터베이스 및 뉴스 비디오 마이닝은 광범위하게 연구되어왔다. 그러나 현재까지의 뉴스 비디오 관련 연구들은 뉴스 기사에 대한 브라우징, 검색, 요약에 치중되어 있으며, 뉴스 비디오에 내재되어 있는 풍부한 잠재적 지식을 탐사하는 고수준의 의미 분석 단계에는 이르지 못하고 있다. 본 논문에서는 뉴스 비디오 클립과 스크립트를 동시에 이용하는, 멀티모달 방법론과 텍스트 마이닝 기반의 뉴스 비디오 마이닝 시스템을 제안한다. 제안된 시스템은 텍스트 마이닝의 군집분석을 통해 뉴스 기사들을 자동 분류하고, 분류 결과에 대해 기간별 군집 추이그래프, 군집성장도 분석 및 네트워크 분석을 수행함으로써, 뉴스 비디오의 기사별 주제와 관련한 다각적 분석을 수행한다. 제안된 시스템의 타당성 검증을 위하여 "2007년 제2차 남북 정상회담" 관련 뉴스 비디오를 대상으로 뉴스 비디오 분석을 수행하였다.