• 제목/요약/키워드: extractive approach

검색결과 8건 처리시간 0.014초

Joint Hierarchical Semantic Clipping and Sentence Extraction for Document Summarization

  • Yan, Wanying;Guo, Junjun
    • Journal of Information Processing Systems
    • /
    • 제16권4호
    • /
    • pp.820-831
    • /
    • 2020
  • Extractive document summarization aims to select a few sentences while preserving its main information on a given document, but the current extractive methods do not consider the sentence-information repeat problem especially for news document summarization. In view of the importance and redundancy of news text information, in this paper, we propose a neural extractive summarization approach with joint sentence semantic clipping and selection, which can effectively solve the problem of news text summary sentence repetition. Specifically, a hierarchical selective encoding network is constructed for both sentence-level and document-level document representations, and data containing important information is extracted on news text; a sentence extractor strategy is then adopted for joint scoring and redundant information clipping. This way, our model strikes a balance between important information extraction and redundant information filtering. Experimental results on both CNN/Daily Mail dataset and Court Public Opinion News dataset we built are presented to show the effectiveness of our proposed approach in terms of ROUGE metrics, especially for redundant information filtering.

An adaptive method of multi-scale edge detection for underwater image

  • Bo, Liu
    • Ocean Systems Engineering
    • /
    • 제6권3호
    • /
    • pp.217-231
    • /
    • 2016
  • This paper presents a new approach for underwater image analysis using the bi-dimensional empirical mode decomposition (BEMD) technique and the phase congruency information. The BEMD algorithm, fully unsupervised, it is mainly applied to texture extraction and image filtering, which are widely recognized as a difficult and challenging machine vision problem. The phase information is the very stability feature of image. Recent developments in analysis methods on the phase congruency information have received large attention by the image researchers. In this paper, the proposed method is called the EP model that inherits the advantages of the first two algorithms, so this model is suitable for processing underwater image. Moreover, the receiver operating characteristic (ROC) curve is presented in this paper to solve the problem that the threshold is greatly affected by personal experience when underwater image edge detection is performed using the EP model. The EP images are computed using combinations of the Canny detector parameters, and the binaryzation image results are generated accordingly. The ideal EP edge feature extractive maps are estimated using correspondence threshold which is optimized by ROC analysis. The experimental results show that the proposed algorithm is able to avoid the operation error caused by manual setting of the detection threshold, and to adaptively set the image feature detection threshold. The proposed method has been proved to be accuracy and effectiveness by the underwater image processing examples.

레거시 어플리케이션 제품군으로부터 제품라인 자산을 추출하는 휘처 기반의 방법 (A Feature-Oriented Method for Extracting a Product Line Asset from a Family of Legacy Applications)

  • 이혜선;이강복
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권7호
    • /
    • pp.337-352
    • /
    • 2017
  • 복제 및 소유(Clone-and-own) 재사용은 기존의 소프트웨어 제품을 복사하고 수정하여 새로운 소프트웨어를 개발하는 방법이다. 복제 및 소유 재사용으로 개발된 레거시 소프트웨어 제품군은 일반적으로 리팩토링 없이 패치 업 되고 구조적으로 저하되기 때문에 높은 유지보수 비용을 필요로 하고 오류가 발생하기 쉬운 경향이 있다. 기존에 복제 및 소유 재사용 방법을 사용했던 많은 회사들이 이러한 문제를 해결하고 소프트웨어 자산을 더 체계적으로 재사용하고 관리하기 위하여 레거시 제품들을 소프트웨어 제품라인으로 전환하려고 하고 있다. 하지만 대부분의 기존 방법들은 가변점(Variation points)을 디자인과 코드로부터 분리해서 모델링하고 관리하지 않고 디자인과 코드에 바로 임베드시킨다. 즉, 가변점이 가변성 모델을 기반으로 체계적으로 생성되고 관리되지 않는다. 이러한 기존 방법들은 다음의 문제를 야기한다. 기존 방법에서는 가변점 간 관계를 이해하기가 어렵기 때문에 가변점이 임베드 된 코드를 유지보수하기가 어렵고 코드가 변경 및 진화될 때 오류가 생기기 쉽다. 또한 소프트웨어 제품라인이 진화할 때 디자인/코드 자산이 적합한 리팩토링을 적용하여 체계적으로 변경되는 것이 아니라, 애드 혹(Ad-hoc) 방식으로 직접적으로 변경되는 경향이 있다. 본 논문에서는 이러한 문제를 해결하기 위하여 레거시 어플리케이션 제품군으로부터 소프트웨어 제품라인 자산을 구축하는 휘처 기반의 방법을 제안한다. 제안하는 방법에서는 가변점과 가변점 간 관계를 식별하고 이들을 구현으로부터 분리하여 휘처 모델로 모델링한다. 그리고 휘처 모델을 기반으로 레거시 어플리케이션으로부터 소프트웨어 제품라인 자산을 추출하고 관리한다. 제안하는 방법을 레거시 Notepad++ 제품군에 적용을 하여 방법의 실행가능성을 검증하였다.

Digestate residues analysis under elevated heat regime by using DNS method

  • Hanif, Mohamad Haziq;Kamaruddin, Mohamad Anuar;Norashiddin, Faris Aiman;Zawawi, Mohd Hafiz
    • Advances in environmental research
    • /
    • 제9권1호
    • /
    • pp.55-64
    • /
    • 2020
  • The problems with unsorted municipal waste are always associated with disposal issues as it requires a large area for landfilling or high energy used for incineration. In recent years, an autoclaving technique has been considered a promising approach which could minimize the volume of organic waste from being directly disposed or incinerated. In this work, an attempt was done to study the saccharification potential of organic residues under elevated temperature Thermal treatment involving hot water bath was applied to treat the organic residue ranging from 60℃ to 100℃ for 30 and 60 minutes. The result obtained showed an increasing trend for the concentration of glucose and carbohydrate. However, the result for lignocellulose content which contains various component includes extractive, holocellulose, hemicellulose, cellulose and lignin show variation. Based on the thermal treatment carried out, the result indicated that the trend of glucose and carbohydrate content. The highest percentage of glucose that can be obtained 978.602 ㎍/ml which could be obtained at 90℃ at 60 minutes. The carbohydrate also shows an increasing trend with 0.234 mg/ml as the highest peak achieved at 80℃ for 30 minutes treatment. However, it was found that the lignocellulose content varies with temperature and time. The statistical analysis was carried out using two-ways ANOVA shows an interaction effect between the independent variables (temperature and contact time) and the saccharification effects on the food wastes. The result shows a variation in the significant effect of independent variables on the changes in the composition of food waste.

기존 시스템 기반의 소프트웨어 제품라인 공학기법: 케이블 셋톱박스 소프트웨어 사례 (Legacy System-Based Software Product Line Engineering: A Case Study on Cable Set-Top Box Software)

  • 최현식;이혜선;조윤호;강교철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권7호
    • /
    • pp.539-547
    • /
    • 2009
  • 산업 및 가전 제품에서 소프트웨어의 중요성이 커지면서 소프트웨어 재사용과 제품라인 방법론에 대한 관심이 높아지고 있다. 그러나 대부분의 제품라인 방법론은 초기 비용과 시간이 많이 들고 구체적인 절차나 성공 사례가 부족하여 산업체에서 적용하기에는 어려운 한계가 있다. 본 논문에서는 산업체에서 제품라인 기법을 쉽게 적용할 수 있도록, 기존에 개발된 소프트웨어 자산과 해당 도메인의 휘처모델을 활용하여 제품라인을 쉽게 구축할 수 있는 추출식 접근법의 구체적인 방법을 제시하고 이를 케이블 셋톱박스 소프트웨어에 적용한 사례를 소개한다. 또한, 제품라인으로의 전환 효과를 확인할 수 있는 평가 기준을 제안하고, 사례 연구를 통해 얻은 교훈을 정리하여 다른 산업 및 가전 제품의 소프트웨어에 적용할 수 있는 지침을 제공한다.

육하원칙 활성화도를 이용한 신문기사 자동추출요약 (Automatic Extractive Summarization of Newspaper Articles using Activation Degree of 5W1H)

  • 윤재민;정유진;이종혁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권4호
    • /
    • pp.505-515
    • /
    • 2004
  • 육하원칙은 신문기사를 기술하는데 있어서 가장 기본적인 요소로서 기사 내용 파악에 핵심적인 역할을 수행한다. 본 논문은 이러한 육하원칙에 기반 하여 기술되는 신문기사의 특성에 주목하여, 육하원칙 활성화도를 이용한 신문기사 요약 방법론을 제안한다. 제안하는 방법론은 기존의 요약 기법 중 가장 우수한 방법으로 알려진 두문 기반 기법(lead-based method)과 제목 기반 기법(title-based method)의 문제점을 극복하기 위해, 제목과 두문의 정보를 결합시켜 충분한 어휘정보를 확보하도록 하였다. 특히 육하원칙 활성화도, 육하원칙 범주 개수, 문장 길이, 문장의 위치 둥과 같은 다양한 요소들을 문장 중요도 계산에 반영함으로써 보다 중요한 정보를 포함하면서도 가독성이 높은 문장들이 요약문으로 선택될 수 있도록 고려하였다. 제안된 방법론의 정확률은 74.7%로서 기존의 두문 기반 기법보다 우수한 성능을 보였으며, 신문기사를 자동 요약하는데 있어서 충분히 효과적으로 사용될 수 있는 방법론임을 실험을 통해 입증하였다.

문장 정보량 기반 문서 추출 요약의 효과성 제고 (Improving the effectiveness of document extraction summary based on the amount of sentence information)

  • 김은희;임명진;신주현
    • 스마트미디어저널
    • /
    • 제11권3호
    • /
    • pp.31-38
    • /
    • 2022
  • 문서 추출 요약 연구에서는 문장 간 관계를 기반으로 중요한 문장을 선택하는 다양한 방법들이 제안되었다. 문장의 도합유사도를 이용한 한국어 문서 요약에서는 문장의 도합유사도를 문장 정보량으로 보고, 이를 기준으로 중요한 문장을 선택하여 요약문을 추출하였다. 그러나 이는 각 문장이 전체 문서에 기여하는 다양한 중요도를 고려하지 못한다는 문제가 있다. 이에 본 연구에서는 문장의 정량적 정보량과 의미적 정보량을 기반으로 중요한 문장을 선택하여 요약문을 제공하는 문서 추출 요약 방법을 제안한다. 실험 결과, 추출 문장 일치도는 58.56%, ROUGE 점수가 34로 비교 연구보다 우수한 성능을 보였으며, 딥러닝 기반 방법과 비교해 추출 방법은 가볍지만 성능은 유사하였다. 이를 통해 문장 간 의미적 유사성을 기반으로 정보를 압축해 나가는 방식이 문서 추출 요약에서 중요한 접근 방법임을 확인하였다. 또한 빠르게 추출된 요약문을 기반으로 문서 생성요약단계를 효과적으로 수행할 수 있으리라 기대한다.

금이 함유된 왕수용액으로부터 TBP(tributyl phosphate) 용매추출에 의한 질산과 금의 분리 (Separation of Nitric Acid and Gold from Gold Bearing Aqua Regia Solution by Solvent Extraction with TBP(tributyl phosphate))

  • 배무기;;김수경;이재천
    • 자원리싸이클링
    • /
    • 제26권1호
    • /
    • pp.51-58
    • /
    • 2017
  • TBP(tributyl phosphate)를 사용하여 왕수 침출액으로부터 질산과 금을 추출하여 회수하는 공정을 개발하기 위한 기초연구가 수행되었다. 순수한 왕수용액으로부터 추출제의 농도, 질산과 염산의 농도 비에 따른 질산의 추출거동을 조사하였으며, 금을 함유하는 왕수용액으로부터 질산과 금의 추출율을 구하였다. McCabe-Thiele 도로부터 얻어진 조업단수와 상비로 역류추출을 행하여 이론적인 추출단수를 검증하였다. 유기상에 장진된 질산과 금의 연속적인 회수를 위한 탈거실험을 수행하였다. 질산과 금의 추출과 염산의 영향을 고려하여 O/A = 1:0.85의 조건으로 역류추출을 통해 2단에 의해 $103.0mg{\cdot}L^{-1}$의 금은 99.9% 추출되었으며, 3단에 의해 $151.2g{\cdot}L^{-1}$의 질산은 98.0% 추출되었다. 질산과 금의 탈거제로는 증류수와 티오황산나트륨이 사용되었으며 탈거율은 각각 99.5%, 92.0%이었다. 이와 같은 연구결과로 왕수용액에 함유되어 있던 금과 질산을 동시에 추출하고 연속적인 탈거공정에 의해서 질산과 금을 회수하는 것이 가능함을 확인하였다.