• Title/Summary/Keyword: 육하원칙

Search Result 26, Processing Time 0.026 seconds

Automatic Extractive Summarization of Newspaper Articles using Activation Degree of 5W1H (육하원칙 활성화도를 이용한 신문기사 자동추출요약)

  • 윤재민;정유진;이종혁
    • Journal of KIISE:Software and Applications
    • /
    • v.31 no.4
    • /
    • pp.505-515
    • /
    • 2004
  • In a newspaper, 5W1H information is the most fundamental and important element for writing and understanding articles. Focusing on such a relation between a newspaper article and the 5W1H, we propose a summarization method based on the activation degree of 5W1H. To overcome problems of the lead-based and the title-based methods, both of which are known to be the most effective in newspaper summarization, sufficient 5W1H information is extracted from both a title and a lead sentence. Moreover, for each sentence, its weight is computed by considering various factors, such as activation degree of 5W1H, the number of 5W1H categories, and its length and position. These factors make a great contribution to the selection of more important sentences, and thus to the improvement of readability of the summarized texts. In an experimental evaluation, the proposed method achieved a precision of 74.7% outperforming the lead-based method. In sum, our 5W1H approach was shown to be promising for automatic summarization of newspaper articles.

An automatic extraction of newspaper articles using activation degree of 5W1H (육하원칙 활성화도를 이용한 신문기사 자동요약)

  • Yoon, Jae-Min;Kang, In-Su;Kwon, Oh-Woog;Bae, Jae-Hak;Lee, Jong-Hyeok
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.277-284
    • /
    • 2002
  • 본 논문은 신문기사에서 중요한 문장을 추출(Extract)하는데 있어서, 기존에 기장 우수한 방법인 전문기반 방법(Lead-based method)과 제목을 이용한 유사도 측정방법(Title-based method)의 문제점을 해결하기 위해서, 육하원칙 활성화도를 이용하여 신문기사를 효과적으로 요약할 수 있는 방법과 알고리즘을 제안하였다. 본 연구에서는 먼저, 제목(Title)과 전문(Lead)에서 중복출현하지 않는 육하원칙 구성성분을 결합하고, 본문은 각 문장에서 육하원칙 구성성분의 재사용성과 육하원칙 구성성분의 범주 증감을 파악하여 육하원칙 활성화도를 구하고, 전문기반 방법을 응용하여 각 문장의 상대적인 중요도에 따라 최종적인 가중치를 부여함으로써, 신문기사에서 중요한 문장을 효과적으로 추출할 수 있는 가중치 계산식을 제안하였다. 실험문서는 조선일보 웹사이트에서 제공하는 신문기사 100건을 대상으로 하였으며, 요약율이 30%일 경우 제안한 방법의 정확률은 74.7%로 기존의 전문기반(Lead-based method)방법보다 6.7% 향상되었다.

  • PDF

Information Extraction form newspaper article by recognizing 5W1H elements (신문기사에서 육하원칙 중심의 정보 추출)

  • 이현주;김계성;구상옥;이상조
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.361-363
    • /
    • 2001
  • 본 논문은 신문 기사문에 특정적인 정보 추출의 내용과 방법을 제안한다. 신문 기사에서 이용자가 원하는 정보 추출의 내용으로 육하원칙을 중심으로 한 다섯 가지 정보를 제시하였으며, 이를 추출하기 위해 통계적인 기법을 주로 이용하고 부분적으로 언어적 지식을 이용하였다. 본 논문에서는 비교적 문서의 길이가 짧은 신문기사문을 요약 대상으로 하므로 단락이나 문장이 아닐 절 이하 단위로 추출하며, 중심절을 추출한 뒤 그 절과의 관계를 통해 나머지 정보들을 추출함으로써 추출되는 내용이 유사하거나 산만하지 않기 때문에 이 추출 정보로 요약문을 생성할 경우에 긴밀한 요약문을 생성할 수 있다.

  • PDF

Keyframe Extraction from Home Videos Using 5W and 1H Information (육하원칙 정보에 기반한 홈비디오 키프레임 추출)

  • Jang, Cheolhun;Cho, Sunghyun;Lee, Seungyong
    • Journal of the Korea Computer Graphics Society
    • /
    • v.19 no.2
    • /
    • pp.9-18
    • /
    • 2013
  • We propose a novel method to extract keyframes from home videos based on the 5W and 1H information. Keyframe extraction is a kind of video summarization which selects only specific frames containing important information of a video. As a home video may have content with a variety of topics, we cannot make specific assumptions for information extraction. In addition, to summarize a home video we must analyze human behaviors, because people are important subjects in home videos. In this paper, we extract 5W and 1H information by analyzing human faces, human behaviors, and the global information of background. Experimental results demonstrate that our technique extract more similar keyframes to human selections than previous methods.

Context Information Modeling Method based on Ontology (온톨로지 기반의 컨택스트 정보 모델링 기법)

  • Kim, Jin-Hyung;Hwang, Myung-Gwon;Jung, Han-Min
    • Journal of Digital Contents Society
    • /
    • v.12 no.4
    • /
    • pp.437-447
    • /
    • 2011
  • Ubiquitous Computing is required to define models for broad context information occurrence by surrounding environment and to study how to model a mechanism for selectively collecting useful pieces of context information and providing relevant intelligent services. Further, studies are also required as to process of context information, and its maintenance and reasoning. However, current context-aware research area still lacks modeling technique that reflects the characteristics of ontology effectively for providing relevant intelligent services. It has also limitation about context reasoning and interoperability among context information. Therefore, this paper proposes ontology-based context-aware modeling technique and framework enabling efficient specification of context information for providing intelligent context-aware services that support context management and reasoning.

An interpretive comparison of the education as event in The Structure of World History and Anti-Oedipus (『세계사의 구조』와 『안티 오이디푸스』에 나타난 사건적 교육의 해석적 비교)

  • Kim, Young-chul
    • Korean Educational Research Journal
    • /
    • v.42 no.1
    • /
    • pp.1-34
    • /
    • 2021
  • The thesis tries to compare The Structure of World History with Anti-Oedipus in the textual context, and to re-compare in the educational context. I mean by the education an event which contrasts starkly with an essence. It adopts 5W1H, a general reporting form of an accident or event, as the distinctive features at twice comparisons. The purpose of the thesis is not evaluative but interpretive comparison. In the textual context, the thesis discusses, 1) as WHAT, the use of Marx from Kant vs. Nietzsche's point of view, 2) as WHO, the actual subjects of the exchanging human vs. the productive machine, 3) as WHEN/WHERE, the society of the modes of exchange vs. the modes of inscription, 4) as HOW, the revolutionay means of the simultaneous revolution of the world vs. the schizophrenic process, 5) as WHY, the ideal subjects of the associative human vs. the non-human of liberation of desire. In the educational context, the thesis discusses, 1) in the WHAT as educational way, autonomous morality vs. active power, 2) in the WHO as the affirmity of actual subjects, that of the ideal idea vs. that of real power, 3) in the WHEN/WHERE, as the in-between time-space of education, the incommensurable communicative situation of humans vs. the conflictive of machines, 4) in the HOW, as the educational method of achieving the ideal, the involuntary restoration of the already-had ideal vs. the now-have completion and break-through of the schizophrenic process, 5) in the WHY, as the aim of education, cosmopolitan vs. overman.

  • PDF

Supporting Geo-Workflow Management through Object Activity Model (객체행위모델을 통한 지형정보 프로세스 관리)

  • Liou, Jaeik;Ryu, Keun Ho
    • Journal of the Korean Association of Geographic Information Studies
    • /
    • v.4 no.2
    • /
    • pp.1-16
    • /
    • 2001
  • Management of geo-workflow's changes is one of growing issues and requires more advanced ways and methods to deal with heterogeneous modifications and interactions of process, activity and event over time. A few dominant workflow models have coped with these subjects. There is, however, little consensus for explanation of six dimensions with regard to actor, activity, space, time, reason and effect. This study begins with examining environments of six dimensions and the Hexad model is proposed to elucidate the causes and results of a wide variety of geo-processes and activities. In this paper, we will introduce Hexad Object Activity Model making it possible to interpret manifest motivations, conditions and actions. Full descriptions of six dimensions are often useful for applying to the handling of diverse activities particularly requiring to clarify actor's goal and role at a specific time and space.

  • PDF

A News Filtering Method based on 5W1H Ontology (육하원칙 온톨로지 기반의 뉴스 필터링 방법)

  • Lee, Suk-Hoon;Lee, Chong-Hyeon;Kim, Jang-Won;Jeong, Dong-Won;Baik, Doo-Kwon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2010.06c
    • /
    • pp.370-375
    • /
    • 2010
  • 인터넷의 영역이 확대됨에 따라 인터넷에서 다양하고 많은 정보를 제공받게 되었다. 뉴스의 영역도 그중 하나로 신문사, 방송사 등의 많은 언론사들이 인터넷으로 서비스를 확대함에 따라 뉴스 정보의 과다현상이 일어나게 되었다. 이 때문에 사용자는 방대한 뉴스들 중에서 원하는 뉴스만 걸러서 보기를 원하게 되었고 이를 위한 뉴스 필터링 방법이 연구되었다. 뉴스 필터링 기술들은 주로 사용자의 관심 사항을 예측하여 제공해 주는 뉴스 추천 시스템을 위한 기술 개발에 초점을 두었다. 그러나 기존의 뉴스 필터링 기술들은 사용자의 관심 있어할 만한 뉴스를 추천할 뿐, 관심 없는 뉴스를 제외시키지는 못한다. 예를들어, 어떤 특종 사건이 생기면 이 사건을 보도하기 위한 뉴스들이 각 언론사 마다 생성되고, 뉴스 추천서비스를 사용하는 사용자는 기존의 뉴스 필터링 방법에 의해 사용자가 관심 있다고 예측되는 이 사건에 대한 뉴스를 제공받게 된다. 그러나 사용자가 이미 추천된 뉴스 중 하나의 뉴스 혹은 그와 동일한 내용의 다른 언론사에서 제공되는 뉴스를 읽었다면 추천된 뉴스는 이미 알고 있는 정보이므로 사용자는 이 뉴스에 대하여 관심이 없을 것이다. 기존의 뉴스 필터링 방법은 추천 시 중복된 뉴스를 제거하지 못하는 문제점을 지닌다. 이 논문은 이러한 문제점을 해결하기 위해 육하원칙 기반의 필터링 방법을 제시하고, 실험을 통해 이 논문이 제시한 방법의 장단점을 보인다.

  • PDF

A Study on Classifying and Analyzing the News Form in the Web for Automatic Summarization (자동 요약을 위한 웹 기사들의 유형 구분과 주연문맥 추출에 관한 연구)

  • Lee Tae-Young
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2006.08a
    • /
    • pp.169-174
    • /
    • 2006
  • 웹 상의 기사들의 종류를 보도, 기획/해설, 인터뷰/대담, 논설, 신변잡기로 나누어 자동요약을 위한 프레임을 작성하였다. 각 기사 프레임들은 글 구조적으로 분석되어 '사건, 상황, 연관, 과정, 원인, 결과, 결론, 전망, 방안, 평가 등'과 같은 문단 슬롯이 부여되었고 문단 슬롯은 다시 문장 슬롯으로 세분되었다. 'if-needed' 패싯으로 육하원칙인 '주체, 객체, 시간, 장소, 원인, 방법'을 택하였다. 슬롯이나 패싯의 실제값들을 추출 표현하는 과정에서 문구의 수사적 역할과 단어 최상위 범주 및 줄거리 단위를 참조하였다. 기사의 유형과 문단 및 문장 슬롯을 판별하기 위해서 유형 판별 규칙과 슬롯 판별 규칙을 구비하였다.

  • PDF