Document Summarization via Convex-Concave Programming

  Kim, Minyoung
    International Journal of Fuzzy Logic and Intelligent Systems
    • /
    제16권4호
    • /
    pp.293-298
    • /
    2016
  • Document summarization is an important task in various areas where the goal is to select a few the most descriptive sentences from a given document as a succinct summary. Even without training data of human labeled summaries, there has been several interesting existing work in the literature that yields reasonable performance. In this paper, within the same unsupervised learning setup, we propose a more principled learning framework for the document summarization task. Specifically we formulate an optimization problem that expresses the requirements of both faithful preservation of the document contents and the summary length constraint. We circumvent the difficult integer programming originating from binary sentence selection via continuous relaxation and the low entropy penalization. We also suggest an efficient convex-concave optimization solver algorithm that guarantees to improve the original objective at every iteration. For several document datasets, we demonstrate that the proposed learning algorithm significantly outperforms the existing approaches.

한국 한의학 논문의 몇 가지 문제점 -학술논문작성법과 비교를 중심으로- (Problems of Traditional Medicine Research Papers in Korea)

  이선동;이용범
    대한예방한의학회지
    • /
    제7권2호
    • /
    pp.35-44
    • /
    2003
  • Research papers must be expression given by letter that had fixed types, rules and universal sentence languages to inform many persons about study results until present when these research paper was considered review, oriental medical papers had some problems, as like difficult contents not to inform absolutely, usage of past language, not considerable in logic history and continuity, and have used not fixed types and rules, error of statistical analysis and research construction. Also centered clinic that had trends important treat tools by drugs ,acupuncture and moxa studies. In briefly, papers of korea traditional medicine had some several problems. Oriental medicine has very concerns not only korean but other countries in present and then it will increases much more study in future. For the purpose cope with this concerns korea traditional medicine researchers need much educations of relation department and must recognized much concerns.

An Intelligent Search Modeling using Avatar Agent

  Kim, Dae Su
    International Journal of Fuzzy Logic and Intelligent Systems
    • /
    제4권3호
    • /
    pp.288-291
    • /
    2004
  • This paper proposes an intelligent search modeling using avatar agent. This system consists of some modules such as agent interface, agent management, preprocessor, interface machine. Core-Symbol Database and Spell Checker are related to the preprocessor module and Interface Machine is connected with Best Aggregate Designer. Our avatar agent system does the indexing work that converts user's natural language type sentence to the proper words that is suitable for the specific branch information retrieval. Indexing is one of the preprocessing steps that make it possible to guarantee the specialty of user's input and increases the reliability of the result. It references a database that consists of synonym and specific branch dictionary. The resulting symbol after indexing is used for draft search by the internet search engine. The retrieval page position and link information are stored in the database. We experimented our system with the stock market keyword SAMSUNG_SDI, IBM, and SONY and compared the result with that of Altavista and Google search engine. It showed quite excellent results.

Recognition of the Printed English Sentence by Using Japanese Puzzle

  Sohn, Young-Sun
    International Journal of Fuzzy Logic and Intelligent Systems
    • /
    제8권3호
    • /
    pp.225-230
    • /
    2008
  • In this paper we embody a system that recognizes printed alphabet, numeral figures and symbols written on the keyboard for the recognition of English sentences. The image of the printed sentences is inputted and binarized, and the characters are separated by using histogram method that is the same as the existing character recognition method. During the abstraction of the individual characters, we classify one group that has not numerical information by the projection of the vertical center of the character. In case of another group that has the longer width than the height, we assort them by normalizing the width. The other group normalizes the height of the images. With the reverse application of the basic principle of the Japanese Puzzle to a normalized character image, the proposed system classifies and recognizes the printed numeral figures, symbols and characters, consequently we meet with good result.

sent2dl : 기술논리 SROIQ 기반 기호적 문장 의미 표상에 분산 표상 더하기 (sent2dl : Augmenting Distributional Semantics to Symbolic Sentence Meaning Representation based on Description Logic SROIQ)

  신승우;오주민;노형종;이연수
    한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    pp.199-204
    • /
    2020
  • 기존의 자연어 의미 표상 방법은 크게 나눠보았을 때 두 가지가 있다. 첫 번째로, 전통적인 기호 기반 의미 표상 방법론이다. 이 방법론들은 논리적이고 해석가능하다는 장점이 있으나, 구축에 시간이 많이 들고 정작 기호 자체의 의미를 더욱 미시적으로 파악하기 어렵다는 단점이 있었다. 반면, 최근 대두된 분산 표상의 경우 단어 하나하나의 의미는 상대적으로 잘 파악하는 반면, 문장 등의 복잡한 구조의 의미를 나타내는 데 있어 상대적으로 약한 측면을 보이며 해석가능하지 않다는 단점이 있다. 본 논문에서는 이 둘의 장점을 섞어서 서로의 단점을 보완하는 새로운 의미 표상을 제안하였으며, 이 표상이 유의미하게 문장의 의미를 담고 있음을 비지도 문장 군집화 문제를 통해 간접적으로 보였다.

소렌센의 더미와 '모호함'의 모호함 (Sorensen's Sorites and the Vagueness of 'Vague')

  이진희
    논리연구
    • /
    제13권2호
    • /
    pp.117-134
    • /
    2010
  • '모호함'의 모호성을 정당화하는 소렌센의 논증은, '모호함'에 대한 직관적 이해를 체계적으로 정당화한다는 측면에서 매우 중요한 의미를 갖는다. 그러나 필자는 이러한 소렌센의 논증이 성립하지 않음을 보이고자 한다. 소렌센의 논증에 대한 가장 일반적인 비판은, 'n-작음'이라는 용어에 기초하는 그의 논증은 '모호함'의 모호함이 아니라 '작음'의 모호함을 입증할 뿐이라는 것이다. 그런데 이러한 비판에 근거한 디즈와 헐의 논의는, 소렌센의 더미를 구성하는 "'n-작음'은 모호하다."의 주어는 언급된 정확한 용어라는 바르찌의 주장에 의해 반박된다. 그러나 필자는 "'n-작음'은 모호하다."의 진리값 결정에 술어 '모호함'이 아무런 역할을 수행하지 못함을 보임으로써 바르찌의 주장을 반박하고, 소렌센의 논증으로부터 정당화되는 것은 '작음'의 모호성뿐임을 보이고자 한다. 물론 필자 역시 '모호함'이 모호하다는 것에는 동의한다. 본 논문을 통해 필자가 주장하는 것은 이러한 '모호함'의 특징에 대한 소렌센의 정당화가 성립하지 않는다는 것뿐이다.

이공계 Technical Writing 기본과정 내용에 대한 고찰 (A Study on the Contents of a Basic Technical Writing Course for Engineering Students)

  조진호
    공학교육연구
    • /
    제15권5호
    • /
    pp.131-139
    • /
    2012
  • This paper emphasizes writing education for engineering students should be communication driven writing education based on KEC2005. Communication driven writing for engineering students is essentially same as Technical Writing(TW) developed on the basis of ABET. Considering the current writing capability of engineering students and social need for various types of writing, TW education should be divided into two courses: basic and advanced. This paper deals with contents of a basic TW course in Myongji University, as a model case of a basic TW course for engineering students. It underlines various methods of prewriting that should be stressed and practiced in the TW class, because the prewriting step in the writing process determines the overall direction and structure of an essay. In particular, this paper introduces Power Writing(PW) which uses the structure of a paragraph as a means for providing building-blocks for the essay, employing logic, and ordering information arrangement in a paragraph. This paper also deals with important guidelines about sentence structure and word selection and proposes various applications of TW such as resume, interview, proposal, report, and presentation as a latter part of the basic course. Finally this paper highlights the etics of writing, such as plagiarism and the basic principles of quotation.

Sentiment Analysis of User-Generated Content on Drug Review Websites

  Na, Jin-Cheon;Kyaing, Wai Yan Min
    Journal of Information Science Theory and Practice
    • /
    제3권1호
    • /
    pp.6-23
    • /
    2015
  • This study develops an effective method for sentiment analysis of user-generated content on drug review websites, which has not been investigated extensively compared to other general domains, such as product reviews. A clause-level sentiment analysis algorithm is developed since each sentence can contain multiple clauses discussing multiple aspects of a drug. The method adopts a pure linguistic approach of computing the sentiment orientation (positive, negative, or neutral) of a clause from the prior sentiment scores assigned to words, taking into consideration the grammatical relations and semantic annotation (such as disorder terms) of words in the clause. Experiment results with 2,700 clauses show the effectiveness of the proposed approach, and it performed significantly better than the baseline approaches using a machine learning approach. Various challenging issues were identified and discussed through error analysis. The application of the proposed sentiment analysis approach will be useful not only for patients, but also for drug makers and clinicians to obtain valuable summaries of public opinion. Since sentiment analysis is domain specific, domain knowledge in drug reviews is incorporated into the sentiment analysis algorithm to provide more accurate analysis. In particular, MetaMap is used to map various health and medical terms (such as disease and drug names) to semantic types in the Unified Medical Language System (UMLS) Semantic Network.

배중률을 둘러싼 구성주의의 두 입장 비교 (A Comparing Study of Two Constructivisms on L.E.M.)

  오채환;강옥기;이상욱
    한국수학사학회지
    • /
    제24권4호
    • /
    pp.45-59
    • /
    2011
  • 20세기 초반에 등장한 수학기초론의 주류 세 학파 (직관주의 논리주의 형식주의)는 상호 대립관계를 보인다. 큰 틀에서 볼 때, 논리주의는 프레게를 계승하는 입장이다. 이와 대립관계의 기초론 중 하나인 직관주의는 구성주의 수학철학의 주축으로 평가된다. 그리고 직관주의가 터를 닦은 구성주의 수학철학을 후속 개진시킨 주역은 의미론적 반실 재론을 주창한 마이클 더밋이다. 따라서 외형상으로는 더밋이 직관주의를 계승하는 후계세대처럼 여겨질 수 있지만 그의 철학적 기반은 분명 프레게이다. 더밋이 논리주의가 아닌 직관주의 계열에 합류한 사실의 속내는 구성주의 내부의 두 입장 (즉, 직관주의와 반실재론) 이 보이는 배중률을 둘러싼 태도의 드러난 일치뿐만 아니라 가려진 차이까지 헤아려질 때 해명될 수 있다고 본다. 본고는 이런 해명을 통해 구성주의 수학철학에 대한 이해도 한층 더할 수 있다는 판단에 따른 제안적 노력이다.

ZFC와 열거불가능성 (ZFC and Non-Denumerability)

  안요한
    논리연구
    • /
    제22권1호
    • /
    pp.43-86
    • /
    2019
  • 1차 이론인 ZFC는 뢰벤하임-스콜렘 정리(이하 'LST')에 의해 그것이 일관적이라면(모형($M_1$)이 존재한다면) 그것은 이행적인 열거가능한 모형($M_2$)을 갖는다. 이러한 사실에 의해 '스콜렘 역설'이라 불리는 역설적 상황이 발생한다. 스콜렘의 전형적인 해소 방식에 따라, 이것은 어렵지 않게 해소될 수 있지만 그 과정에서 우리는 집합 개념에 대한 모형 상대성을 받아들여야 한다. 이것은 예를 들어 는 집합론적 개념의 의미가 모형에 따라 다르게 주어지는 상황을 발생시킨다. 문제는 다음이다. 이 경우에 PN이 열거불가능하다는 사실을 나타내는 ZFC의 문장 '¬denu(PN)'이 그 두 모형에서, 진리 값의 측면에서, 똑같이 참이 되기 때문에 ZFC에서는 <¬denu> 개념에 대한 차이를 구분할 수 없는 구분불가능성 문제가 발생한다. 혹은 어떤 것이 의도하는 의미인지 결정할 수 없는 미결정성 문제가 발생한다. 나는 먼저, 이러한 문제가 어떤 성격의 문제인지에 대한 구체적인 분석을 제시할 것이다. 그리고 이러한 문제에 대해서 ZFC를 지지하는 입장에서 할 수 있는 세 가지 방식의 대답을 제시할 것이다. 첫 째로, ZFC에서 모형론을 형식화할 수 있음을 이용하여 모형 상대적으로 다르게 주어질 수 있는 <¬denu> 개념이 ZFC에서도 '거의' 구분될 수 있다는 논변을 제시할 것이다. 두 번째로, <¬denu> 개념의 상대성(구분불가능성)에서 핵심적인 역할을 하는 양화사에 대한 의미론적 고려를 통해 <¬denu>이 본질적으로 혹은 자연스럽게 맥락 의존적으로 의미가 변할 수 있는 것임을 보일 것이다. 그래서 <¬denu> 개념의 모형 상대적인 의미 변화는 ZFC가 책임을 져야할 문제가 아니라 언어 외적인 자연스러운 현상이라는 논증을 제시할 것이다. 세 번째로, 문제의 출발점이었던 비표준 모형이 사실은 <¬denu> 개념의 구조적 내용을 예화 할 수 있어서 그것이 단지 문제적 요소가 아니라 의미론적으로 중요한 역할을 할 수 있음을 논증할 것이다. 이러한 논변들을 통해서 나는 비표준 모형과 관련하여 ZFC에 대해서 발생하는 것처럼 보이는 위의 구분불가능성(혹은 미결정성) 문제가 심각한 것이 아님을 논증할 것이다.