• 제목/요약/키워드: 육하원칙

검색결과 28건 처리시간 0.024초

육하원칙 활성화도를 이용한 신문기사 자동추출요약 (Automatic Extractive Summarization of Newspaper Articles using Activation Degree of 5W1H)

  • 윤재민;정유진;이종혁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권4호
    • /
    • pp.505-515
    • /
    • 2004
  • 육하원칙은 신문기사를 기술하는데 있어서 가장 기본적인 요소로서 기사 내용 파악에 핵심적인 역할을 수행한다. 본 논문은 이러한 육하원칙에 기반 하여 기술되는 신문기사의 특성에 주목하여, 육하원칙 활성화도를 이용한 신문기사 요약 방법론을 제안한다. 제안하는 방법론은 기존의 요약 기법 중 가장 우수한 방법으로 알려진 두문 기반 기법(lead-based method)과 제목 기반 기법(title-based method)의 문제점을 극복하기 위해, 제목과 두문의 정보를 결합시켜 충분한 어휘정보를 확보하도록 하였다. 특히 육하원칙 활성화도, 육하원칙 범주 개수, 문장 길이, 문장의 위치 둥과 같은 다양한 요소들을 문장 중요도 계산에 반영함으로써 보다 중요한 정보를 포함하면서도 가독성이 높은 문장들이 요약문으로 선택될 수 있도록 고려하였다. 제안된 방법론의 정확률은 74.7%로서 기존의 두문 기반 기법보다 우수한 성능을 보였으며, 신문기사를 자동 요약하는데 있어서 충분히 효과적으로 사용될 수 있는 방법론임을 실험을 통해 입증하였다.

육하원칙 활성화도를 이용한 신문기사 자동요약 (An automatic extraction of newspaper articles using activation degree of 5W1H)

  • 윤재민;강인수;권오욱;배재학;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.277-284
    • /
    • 2002
  • 본 논문은 신문기사에서 중요한 문장을 추출(Extract)하는데 있어서, 기존에 기장 우수한 방법인 전문기반 방법(Lead-based method)과 제목을 이용한 유사도 측정방법(Title-based method)의 문제점을 해결하기 위해서, 육하원칙 활성화도를 이용하여 신문기사를 효과적으로 요약할 수 있는 방법과 알고리즘을 제안하였다. 본 연구에서는 먼저, 제목(Title)과 전문(Lead)에서 중복출현하지 않는 육하원칙 구성성분을 결합하고, 본문은 각 문장에서 육하원칙 구성성분의 재사용성과 육하원칙 구성성분의 범주 증감을 파악하여 육하원칙 활성화도를 구하고, 전문기반 방법을 응용하여 각 문장의 상대적인 중요도에 따라 최종적인 가중치를 부여함으로써, 신문기사에서 중요한 문장을 효과적으로 추출할 수 있는 가중치 계산식을 제안하였다. 실험문서는 조선일보 웹사이트에서 제공하는 신문기사 100건을 대상으로 하였으며, 요약율이 30%일 경우 제안한 방법의 정확률은 74.7%로 기존의 전문기반(Lead-based method)방법보다 6.7% 향상되었다.

  • PDF

신문기사에서 육하원칙 중심의 정보 추출 (Information Extraction form newspaper article by recognizing 5W1H elements)

  • 이현주;김계성;구상옥;이상조
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.361-363
    • /
    • 2001
  • 본 논문은 신문 기사문에 특정적인 정보 추출의 내용과 방법을 제안한다. 신문 기사에서 이용자가 원하는 정보 추출의 내용으로 육하원칙을 중심으로 한 다섯 가지 정보를 제시하였으며, 이를 추출하기 위해 통계적인 기법을 주로 이용하고 부분적으로 언어적 지식을 이용하였다. 본 논문에서는 비교적 문서의 길이가 짧은 신문기사문을 요약 대상으로 하므로 단락이나 문장이 아닐 절 이하 단위로 추출하며, 중심절을 추출한 뒤 그 절과의 관계를 통해 나머지 정보들을 추출함으로써 추출되는 내용이 유사하거나 산만하지 않기 때문에 이 추출 정보로 요약문을 생성할 경우에 긴밀한 요약문을 생성할 수 있다.

  • PDF

육하원칙 정보에 기반한 홈비디오 키프레임 추출 (Keyframe Extraction from Home Videos Using 5W and 1H Information)

  • 장철훈;조성현;이승용
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제19권2호
    • /
    • pp.9-18
    • /
    • 2013
  • 본 논문에서는 육하원칙 정보를 기반으로 홈비디오에서 키프레임을 추출하는 방법을 제시한다. 키프레임 추출방법이란 비디오에서 중요하다고 생각되는 특정 프레임만을 선출하여 비디오를 요약하는 방법이다. 홈비디오의 경우 그 주제가 다양하여 특별한 가정을 통한 정보 추출이 어렵고, 주로 인물이 비디오의 중심이 되기 때문에 인물의 행동을 중심으로 요약을 수행하여야 한다. 본 논문에서는 인물의 얼굴, 인물의 행동, 전체 배경 정보를 분석하여 인물 중심의 보편적인 요약 기준인 육하원칙의 주요 정보를 추출한다. 추가적으로 비디오의 매 프레임의 블러 크기를 측정하여 이용함으로써 프레임별로 얼마나 많은 정보를 포함하고 있는지 측정하고, 가장 많은 정보를 포함한 프레임을 키프레임으로 선출한다. 사용자 실험을 통해 사용자가 홈비디오에서 여러 개의 키프레임을 선택할 경우, 기존의 방법보다 사용자의 선택과 유사함을 확인할 수 있다.

온톨로지 기반의 컨택스트 정보 모델링 기법 (Context Information Modeling Method based on Ontology)

  • 김진형;황명권;정한민
    • 디지털콘텐츠학회 논문지
    • /
    • 제12권4호
    • /
    • pp.437-447
    • /
    • 2011
  • 유비쿼터스 컴퓨팅 환경에서는 주변 환경에 의해 발생하는 방대한 컨택스트 정보에 대한 모델 정의와 컨택스트 인지를 통한 지능적인 서비스 제공을 위하여 컨택스트 정보 처리, 관리 및 추론과 관련한 연구가 필수적으로 요구된다. 그러나 현재 컨택스트 인지 분야에서는 고수준의 서비스 지원을 위한 온톨로지 특성을 효과적으로 반영한 모델링 기법이 부재하며, 지능적인 추론(응용, 조합)을 지원하는 기법 부재 및 컨택스트 정보간 상호운용성 지원의 한계를 가지고 있다. 따라서 본 연구의 최종 목표는 실세계에 존재하는 실체(entity)에 대한 상태를 특징화하고 정의하기 위한 방법으로 육하원칙을 적용한 온톨로지 기반의 컨택스트 인지 모델링 기법 컨택스트 인지를 위한 육하원칙 온톨로지를 개발하고 보다 양질의 지능화된 컨택스트 인지 서비스를 제공하기 위해 컨택스트 정보에 대한 관리 및 컨택스트 추론을 지원하는 프레임워크를 개발함에 있다.

『세계사의 구조』와 『안티 오이디푸스』에 나타난 사건적 교육의 해석적 비교 (An interpretive comparison of the education as event in The Structure of World History and Anti-Oedipus)

  • 김영철
    • 한국교육논총
    • /
    • 제42권1호
    • /
    • pp.1-34
    • /
    • 2021
  • 이 논문은 세계사적 단계들과 그 구분 원리를 제시하는 柄谷行人(가라타니 고진)의 『세계사의 구조』와 Deleuze와 Guattari의 『안티 오이디푸스』를, 사건을 보고하는 육하원칙이라는 공통항에 입각하여 해석하고 비교한다. 평가적 비교의 전 단계로서의 해석적 비교는 두 저서의 텍스트적 해석과 비교, 그리고 교육적 측면에서의 해석과 비교로 반복하여 두 번 시행된다. 이 논문에서 사용한 사건적 교육은 본성적 교육과 대비된다. 텍스트적 비교에 있어서, 1) 육하원칙의 What은 Kant와 Nietzsche적 Marx 활용, 2) Who는 교환하는 인간과 생산적 기계라는 현실적 주체, 3) When/Where는 교환양식과 기입양식이라는 사회, 4) How는 세계동시혁명과 분열증적 과정이라는 혁명의 방도, 5) Why는 연합적 인간과 욕망해방적 비인간이라는 이상적 주체이다. 교육적 비교에 있어서, 1) 교육의 경로로서의 What은 자율적 윤리성과 능동적 힘, 2) 교육의 현실적 주체의 긍정성으로서의 Who는 이념적 긍정성과 실재적인 힘의 긍정성, 3) 교육의 사이-시공간으로서의 When/Where는 개체들 사이의 공약불가능한 소통적 시공간과 기계들 사이의 갈등적 시공간, 4) 이미-있음의 이상에 도달하는 교육의 방법으로서의 How는 과거에 이미 있던 이상의 비자발적 회복과 현재에 이미 있는 과정의 완성과 돌파, 5) 교육의 목적으로서의 Why는 코스모폴리턴과 위버멘쉬이다.

  • PDF

객체행위모델을 통한 지형정보 프로세스 관리 (Supporting Geo-Workflow Management through Object Activity Model)

  • 류재익;류근호
    • 한국지리정보학회지
    • /
    • 제4권2호
    • /
    • pp.1-16
    • /
    • 2001
  • 지형정보 작업관리(워크플로) 연구는 중요한 관심이 되는 분야 중에 하나로 시간변화에 따라 발생하는 사건, 행위 그리고 프로세스들의 상호작용 및 변경 등을 처리할 수 있는 방법 및 모델이 요구된다. 기존의 많은 워크플로 프로세스 모델이 있지만, 육하원칙에 의거하여 행위자의 시간과 공간적 행위 또는 사건을 해석하려는 시도가 많지 않은 듯하다. 이 연구는 6가지의 조건을 조사하고 객체지향적인 헥사드 행위 모델을 제시하여 지형정보 프로세스 및 행위를 분석하고자 하였다. 행위자의 다양한 행위의 원인과 결과를 시공간 개념과 연계하면, 육하원칙의 자세한 분석은 공간의 변화나 공간정보 흐름을 파악하는데 상당한 도움이 된다.

  • PDF

육하원칙 온톨로지 기반의 뉴스 필터링 방법 (A News Filtering Method based on 5W1H Ontology)

  • 이석훈;이종현;김장원;정동원;백두권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.370-375
    • /
    • 2010
  • 인터넷의 영역이 확대됨에 따라 인터넷에서 다양하고 많은 정보를 제공받게 되었다. 뉴스의 영역도 그중 하나로 신문사, 방송사 등의 많은 언론사들이 인터넷으로 서비스를 확대함에 따라 뉴스 정보의 과다현상이 일어나게 되었다. 이 때문에 사용자는 방대한 뉴스들 중에서 원하는 뉴스만 걸러서 보기를 원하게 되었고 이를 위한 뉴스 필터링 방법이 연구되었다. 뉴스 필터링 기술들은 주로 사용자의 관심 사항을 예측하여 제공해 주는 뉴스 추천 시스템을 위한 기술 개발에 초점을 두었다. 그러나 기존의 뉴스 필터링 기술들은 사용자의 관심 있어할 만한 뉴스를 추천할 뿐, 관심 없는 뉴스를 제외시키지는 못한다. 예를들어, 어떤 특종 사건이 생기면 이 사건을 보도하기 위한 뉴스들이 각 언론사 마다 생성되고, 뉴스 추천서비스를 사용하는 사용자는 기존의 뉴스 필터링 방법에 의해 사용자가 관심 있다고 예측되는 이 사건에 대한 뉴스를 제공받게 된다. 그러나 사용자가 이미 추천된 뉴스 중 하나의 뉴스 혹은 그와 동일한 내용의 다른 언론사에서 제공되는 뉴스를 읽었다면 추천된 뉴스는 이미 알고 있는 정보이므로 사용자는 이 뉴스에 대하여 관심이 없을 것이다. 기존의 뉴스 필터링 방법은 추천 시 중복된 뉴스를 제거하지 못하는 문제점을 지닌다. 이 논문은 이러한 문제점을 해결하기 위해 육하원칙 기반의 필터링 방법을 제시하고, 실험을 통해 이 논문이 제시한 방법의 장단점을 보인다.

  • PDF

자동 요약을 위한 웹 기사들의 유형 구분과 주연문맥 추출에 관한 연구 (A Study on Classifying and Analyzing the News Form in the Web for Automatic Summarization)

  • 이태영
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2006년도 제13회 학술대회 논문집
    • /
    • pp.169-174
    • /
    • 2006
  • 웹 상의 기사들의 종류를 보도, 기획/해설, 인터뷰/대담, 논설, 신변잡기로 나누어 자동요약을 위한 프레임을 작성하였다. 각 기사 프레임들은 글 구조적으로 분석되어 '사건, 상황, 연관, 과정, 원인, 결과, 결론, 전망, 방안, 평가 등'과 같은 문단 슬롯이 부여되었고 문단 슬롯은 다시 문장 슬롯으로 세분되었다. 'if-needed' 패싯으로 육하원칙인 '주체, 객체, 시간, 장소, 원인, 방법'을 택하였다. 슬롯이나 패싯의 실제값들을 추출 표현하는 과정에서 문구의 수사적 역할과 단어 최상위 범주 및 줄거리 단위를 참조하였다. 기사의 유형과 문단 및 문장 슬롯을 판별하기 위해서 유형 판별 규칙과 슬롯 판별 규칙을 구비하였다.

  • PDF