• 제목/요약/키워드: 기사 길이

검색결과 46건 처리시간 0.024초

융복합 시대에서 스포츠기사의 문장길이에 관한 연구 (A Study on the Sentence Length of Sports News in the Era of the Convergency)

  • 유병철;이종영
    • 디지털융복합연구
    • /
    • 제15권6호
    • /
    • pp.505-511
    • /
    • 2017
  • 이 연구의 목적은 스포츠기사의 문장길이 특성을 다른 취재 영역별, 일간종합지 매체별 그리고 스포츠종목별에 따라 파악하는 것이다. 연구 목적을 달성하기 위해 조선일보, 동아일보, 경향신문 그리고 스포츠전문매체인 MK스포츠가 배포한 기사를 수집하여 문장의 길이를 분석하였으며, 일원변량분석과 사후검증으로써 scheffe 분석을 실시하였다. 이러한 분석을 통해 다음의 3가지 결론이 도출됐다. 첫째, 신문기사의 문장길이는 취재영역별에 따라 유의미한 차이가 있었다. 구체적으로 정치기사의 문장길이가 가장 길었으며, 다음으로 경제, 사설 순이었고, 스포츠 기사가 가장 짧다. 둘째, 스포츠기사의 문장길이는 언론매체별 차이가 있다. 구체적으로 스포츠전문매체인 MK스포츠가 다른 종합일간지인 조선일보, 동아일보 그리고 경향신문보다 스포츠기사의 문장길이가 짧다. 셋째, 스포츠기사의 문장길이는 스포츠종목에 따라 차이가 있다. 구체적으로 골프가 가장 길며, 농구, 축구 순으로 길며 야구가 가장 짧다.

모바일 시대의 기사 길이에 관한 탐색적 연구 (An Exploratory Study on the Proper Length of Article in Mobile Era)

  • 정연구;정예현;곽아기;이푸름
    • 한국언론정보학보
    • /
    • 제79권
    • /
    • pp.140-164
    • /
    • 2016
  • 컴퓨팅과 이동통신이 결합되면서 완전히 새로운 취향의 콘텐츠가 만들어지고 있는 모바일 시대에 맞는 기사 길이는 어느 정도일까? 지금까지 고급 저널리즘의 기준으로 인식되기도 한 긴 기사가 여전히 모바일 시대에도 적절할까? 인터랙티브와 검색 기능을 이용한 짧은 기사의 조합이 가독성과 정보량이라는 가치를 만족시켜줄 수 있지 않을까? 이런 문제에 대한 해답을 찾고자 하는 것이 이 연구의 목표다. 연구 방법으로는 현장 실험(field experiment)을 채택했다. 사전 조사를 통해 모바일 기기에서 '손을 쓰지 않고 한 눈에 볼 수 있는' 346자의 기사부터 신문과 방송 뉴스에서 자주 쓰이는 633자, 1033자, 1368자의 기사를 만들었다. 자극물은 길이만 다를 뿐 주요취지는 똑같아지도록 처치했다. 이를 성별, 계열, 학년을 동수로 할당한 대학생 샘플 384명을 대상으로 조사했다. 신문대판 혹은 모바일 페이지를 통해 자신에게 주어진 네 종류 중 하나의 기사를 접촉하고 선호도, 기사질 평가, 기억회상에 관련한 답을 하도록 했다. 분석결과 신문에서는 1033자와 346자의 기사가 고르게 좋은 평가를 받았다. 모바일에서는 손을 거의 움직이지 않고 볼 수 있는 346자와 633자가 고르게 좋은 평가를 받았다. 앞으로 점차 모바일 기계에 의존해 뉴스를 읽는 수용자가 늘어날 경우를 대비한다면 신문 지면의 기사도 346~633자를 기본으로 하는 다양한 전략을 고려해볼 필요가 있을 것으로 보인다.

  • PDF

준 지도 학습과 커리큘럼 학습을 이용한 유사 기사 추천 모델 (Semi-supervised GPT2 for News Article Recommendation with Curriculum Learning)

  • 서재형;오동석;어수경;박성진;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.495-500
    • /
    • 2020
  • 뉴스 기사는 반드시 객관적이고 넓은 시각으로 정보를 전달하지 않는다. 따라서 뉴스 기사를 기존의 추천 시스템과 같이 개인의 관심사나 사적 정보를 바탕으로 선별적으로 추천하는 것은 바람직하지 않다. 본 논문에서는 최대한 객관적으로 다양한 시각에서 비슷한 사건과 인물에 대해서 판단할 수 있도록 유사도 기반의 기사 추천 모델을 제시한다. 길이가 긴 문서 사이의 유사도를 측정하기 위해 GPT2 [1]언어 모델을 활용했다. 이 과정에서 단방향 디코더 모델인 GPT2 [1]의 단점을 추가 학습으로 개선했으며, 저장 공간의 효율과 핵심 문단 추출을 위해 BM25 [2]함수를 사용했다. 그리고 준 지도 학습 [3]을 통해 유사도 레이블링이 되어있지 않은 최신 뉴스 기사에 대해서도 자가 학습을 진행했으며, 이와 함께 길이가 긴 문단에 대해서도 효과적으로 학습할 수 있도록 문장 길이를 기준으로 3개의 단계로 나누어진 커리큘럼 학습 [4]방식을 적용했다.

  • PDF

문장 클러스터링에 기반한 자동요약 모형 (A Text Summarization Model Based on Sentence Clustering)

  • 정영미;최상희
    • 정보관리학회지
    • /
    • 제18권3호
    • /
    • pp.159-178
    • /
    • 2001
  • 본 연구에서는 문장 클러스터로부터 대표문장을 선정하여 요약문을 생성하는 자동요약 모형을 제시하고. 학습문서 집단을 미용하여 최적의 요약 환경을 구축한 후 요약 실험을 수행하였다. 학습 과정에서 문장의 클러스터링 기법으로는 7개의 계층적 기법들을 비교한 결과 클러스터를 구성하는 문장 수의 편차가 가장 적고 단일 문장 클러스터를 가장 적게 생성하는 센트로이드 기법이 선택되었다. 또한 각 클러스터를 대표하는 문장의 선정을 위해 용어 및 문장 가중치를 합산한 문장값과 클러스터-문장 벡터간 유사도의 두 기준을 비교한 결과 문장값 기준이 선택되었다. 용어 가중치로는 역문장빈도와 표제어 가중치, 그리고 문장의 위치 가중치가 자동요약 성능을 개선시키는 것으로 나타났으며, 적절한 요약문의 길이는 전체 문서의 1/3인 것으로 나타났다. 실험문서 집단으로는 문서의 길이와 특성이 다른 신문기사와 잡지기사의 두 집단을 이용하였다. 요약 모형의 검증 실험 결과 요약 정확률은 신문기사 집단에서는 53%, 잡지기사 집단에서는 47%인 것으로 나타났다. 두 실험 모두 랜덤하게 생성한 베이스라인 요악문보다 성능이 우수하였으나, 리드문장들로 구성된 베이스라인 요약문과의 비교에서는 짧은 길이의 신문기사의 경우 요약 모형의 성능이 오히려 떨어지는 것으로 나타났다.

  • PDF

신문기사에서 육하원칙 중심의 정보 추출 (Information Extraction form newspaper article by recognizing 5W1H elements)

  • 이현주;김계성;구상옥;이상조
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.361-363
    • /
    • 2001
  • 본 논문은 신문 기사문에 특정적인 정보 추출의 내용과 방법을 제안한다. 신문 기사에서 이용자가 원하는 정보 추출의 내용으로 육하원칙을 중심으로 한 다섯 가지 정보를 제시하였으며, 이를 추출하기 위해 통계적인 기법을 주로 이용하고 부분적으로 언어적 지식을 이용하였다. 본 논문에서는 비교적 문서의 길이가 짧은 신문기사문을 요약 대상으로 하므로 단락이나 문장이 아닐 절 이하 단위로 추출하며, 중심절을 추출한 뒤 그 절과의 관계를 통해 나머지 정보들을 추출함으로써 추출되는 내용이 유사하거나 산만하지 않기 때문에 이 추출 정보로 요약문을 생성할 경우에 긴밀한 요약문을 생성할 수 있다.

  • PDF

온라인 뉴스 기사 헤드라인의 논조에 따른 댓글 양상 (Comments Complexion by Argument's Tone of Online News Headline)

  • 서기열;권가진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.869-872
    • /
    • 2018
  • 온라인 뉴스 소비의 확산과 함께 댓글은 여론 형성에 큰 역할을 담당한다. 그러나 아직 댓글에 영향을 미치는 형식 요소에 대한 실증 데이터 기반의 연구는 미흡하다. 본 연구는 이의 시작으로 온라인 뉴스 기사 소비의 두 가지 중요 요소 즉, 헤드라인과 댓글의 관계에 대해 다루고자 한다. 이를 위해, 헤드라인의 논조 유무에 따른 댓글의 논쟁 활성화 정도 차를 확인하고자 댓글의 수와 길이를 분석하였다. '이세돌, 알파고 바둑대결', '최저임금', '북미회담' 기사로 총 537건의 해드라인과 약 85만개의 댓글을 수집하였다. 그 결과 논쟁 활성화 측면에서 논조가 있는 헤드라인일때 댓글의 수가 많고 길이가 길어 논쟁이 더 활발한 것을 할 수 있었다. 또, 댓글의 논쟁 주제도 차이가 있어 헤드라인의 논조가 있는 경우에 의견이나 감정을 표출하는 토픽이 더 많았다. 본 연구는 실증 데이터를 통해, 헤드라인의 논조 유무가 댓글의 논쟁의 활성화 정도와 주제에 영향을 주는 요소임을 밝힘으로써 댓글 소비에 대한 새로운 관점을 제시하고, 헤드라인의 형식 요소의 연구의 중요성을 확인한 데 그 의의가 있다.

육하원칙 활성화도를 이용한 신문기사 자동추출요약 (Automatic Extractive Summarization of Newspaper Articles using Activation Degree of 5W1H)

  • 윤재민;정유진;이종혁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권4호
    • /
    • pp.505-515
    • /
    • 2004
  • 육하원칙은 신문기사를 기술하는데 있어서 가장 기본적인 요소로서 기사 내용 파악에 핵심적인 역할을 수행한다. 본 논문은 이러한 육하원칙에 기반 하여 기술되는 신문기사의 특성에 주목하여, 육하원칙 활성화도를 이용한 신문기사 요약 방법론을 제안한다. 제안하는 방법론은 기존의 요약 기법 중 가장 우수한 방법으로 알려진 두문 기반 기법(lead-based method)과 제목 기반 기법(title-based method)의 문제점을 극복하기 위해, 제목과 두문의 정보를 결합시켜 충분한 어휘정보를 확보하도록 하였다. 특히 육하원칙 활성화도, 육하원칙 범주 개수, 문장 길이, 문장의 위치 둥과 같은 다양한 요소들을 문장 중요도 계산에 반영함으로써 보다 중요한 정보를 포함하면서도 가독성이 높은 문장들이 요약문으로 선택될 수 있도록 고려하였다. 제안된 방법론의 정확률은 74.7%로서 기존의 두문 기반 기법보다 우수한 성능을 보였으며, 신문기사를 자동 요약하는데 있어서 충분히 효과적으로 사용될 수 있는 방법론임을 실험을 통해 입증하였다.

국내 인터넷신문의 유명인 SNS 활용 기사의 현황과 문제점 (Current Conditions and Problems of Entertainers and Politicians' SNS-based News Reports on Internet Newspapers)

  • 곽선혜;유홍식;이정배
    • 한국콘텐츠학회논문지
    • /
    • 제22권4호
    • /
    • pp.159-171
    • /
    • 2022
  • 본 연구는 2010년 이후 매년 평균 745개씩 증가해 2021년 약 1만 개에 이르고 있는 인터넷신문을 대상으로, 유명인 SNS를 활용해 기사화하는 문제를 살펴보았다. 인터넷신문사 40개를 선정해 2021년 7월 생산된 202,730개 기사를 분석하였다. 분석 결과, 전체 기사의 1.27%(2,582개)가 유명인 SNS 활용기사였다. 이는 평균적으로 1개 인터넷신문이 하루에 2.08개, 한 달에 64.7개의 유명인 SNS 활용기사를 생산하고 있음을 나타낸다. 정치인(39.8%), 인플루언서(6.5%)의 SNS보다 연예인 SNS(53.7%)가 많이 사용되고 있었다. 연예인과 인플루언서 SNS 활용기사의 경우, 인스타그램(69.1%, 57.1%)의 활용도가 높았고, 대부분은 근황/동정, 일상/여행/음식 등 신변잡기와 관련된 내용이었다. 정치인 SNS 활용기사의 경우에는 페이스북(70.4%)의 활용도가 높았고, 사회/정치 문제에 대한 견해, 폭로/비방/설전 등의 내용이 주를 이루었다. SNS 활용기사의 평균 길이는 536자로, 국내 종합지 1면 기사의 평균(952자) 보다는 짧고, 모바일기기 화면에 들어가는 350자 보다는 약간 긴 것으로 파악되었다. 이러한 SNS 활용기사의 문제점은 추가적인 취재 없이 이미 SNS에 공개된 내용만으로 작성되는 것이 대부분(88.4%)이며, SNS를 활용한 기사임에도 정확한 출처를 밝히지 않은 경우가 14%에 달한다는 것이다. 40개사 분석 결과를 인터넷신문 1만 개 시대에 적용해 그 함의점을 제시하였다.

작은 화면 기기에서의 출력을 위한 신문기사 헤드라인 형식의 문장 축약 시스템 (Sentence Compression of Headline-style Abstract for Displaying in Small Devices)

  • 이공주
    • 정보처리학회논문지B
    • /
    • 제12B권6호
    • /
    • pp.691-696
    • /
    • 2005
  • 모바일 디바이스와 같이 작은 필기의 화면을 갖는 기기에서는 긴 문장의 내용을 한눈에 파악하기가 쉽지 않다. 본 논문에서는 신문기사와 그 헤드라인으로부터 추출한 정보로부터 문장을 자동으로 축약할 수 있는 시스템을 제안하고자 한다. 축약된 문장은 문장 내의 필수적이지 않은 요소들을 제거함으로써 그 기본 의미는 그대로 전달하되 문장의 길이를 축소시킨 것이다. 신문기사의 헤드라인으로부터 문장 축약 방법을 학습하였기 때문에 매우 간결한 형태로 문장을 축약할 수 있다 예비 실험을 통해 본 논문에서 제안하고 있는 시스템이 생성해 내는 축약문장이 유용함을 보이고자 한다.