• 제목/요약/키워드: Paraphrase

검색결과 30건 처리시간 0.021초

술어-논항 튜플 기반 근사 정렬을 이용한 문장 단위 바꿔쓰기표현 유형 및 오류 분석 (Analysis of Sentential Paraphrase Patterns and Errors through Predicate-Argument Tuple-based Approximate Alignment)

  • 최성필;송사광;맹성현
    • 정보처리학회논문지B
    • /
    • 제19B권2호
    • /
    • pp.135-148
    • /
    • 2012
  • 본 논문에서는 Predicate-Argument Tuple (PAT)를 기반으로 텍스트 간 심층적 근사 정렬(Approximate Alignment)을 통한 문장 단위 바꿔쓰기표현(sentential paraphrase) 식별 모델을 제안한다. 두 문장 간의 PAT 기반 근사 정렬 결과를 바탕으로, 두 문장의 의미적 연관성을 효과적으로 표현하는 다양한 정렬 자질(alignment feature)들을 정의함으로써, 바꿔쓰기표현 식별 문제를 지도 학습(supervised learning) 기반의 자동 분류 모델로 접근하였다. 실험을 통해서 제안 모델의 가능성을 확인할 수 있었으며, 시스템의 오류 분석을 통해 제안 방법이 아직 해결하지 못하는 다양한 바꿔쓰기표현 유형들을 식별함으로써 향후 시스템의 성능 개선 방향을 도출하였다.

유명론적 번역에 대하여 (On Nominalist Paraphrase)

  • 주요한
    • 논리연구
    • /
    • 제14권1호
    • /
    • pp.77-102
    • /
    • 2011
  • 이 논문은 콰인의 존재론적 개입 기준이 유명론자에게 야기하는 문제에 관한 것이다. "존재한다는 것은 변항의 값이 된다는 것이다"는 것이 콰인의 분명한 존재론적 개입 기준이다. 이 기준에 의하면, 우리가 어떤 문장을 참이라고 여길 경우, 그 문장이 참이 되기 위해서 존재해야 하는 것들의 존재에 우리가 개입하게 된다. 그런데 이 기준은 유명론자에게 문제를 야기한다. "겸손은 미덕이다"라는 것을 참이라고 받아들이고 싶은 유명론자는, 겸손이라는 속성의 존재를 받아들여야 한다는 것이다. 그러나 유명론자는 "겸손은 미덕이다"라는 말이 의미하는 것은 받아들이고 싶지만, 겸손과 같은 속성의 존재를 받아들이고 싶어하지 않는다. 결국 유명론자는, 상식을 부정하든지, 속성의 존재를 받아들이든지 선택해야 하는 딜레마에 처해있는 것이다. 이러한 난국을 빠져나갈 수 있는 방법은, 속성에 대한 존재론적 개입을 피하면서도 원래 문장과 같은 뜻을 가지는 패러프레이즈를 제시하는 것이다. 그러나, 올바른 패러프레이즈를 제시하는 것은 항상 어려운 일이었다. 이와 같은 문장들에 대해서 패러프레이즈를 제시하려는 노력이 있었지만, 여러 어려움 때문에 모두 실패하고 말았다. 이 논문에서는, 기존의 문제점들을 모두 극복하는 성공적인 패러프레이즈가 제시될 것이다. 하지만 그전에 콰인의 기준에 관한 몇몇 주제들이 더 명확히 정리될 필요가 있다. 패러프레이즈가 아예 필요하지 않다는 루이스의 비판 역시 또한 다뤄질 것이다.

  • PDF

The Influence of English Proficiency and Text Types on Korean College Students' Paraphrasing for Plagiarism Prevention

  • Choe, Yoonhee
    • International Journal of Advanced Culture Technology
    • /
    • 제9권1호
    • /
    • pp.183-189
    • /
    • 2021
  • This study examines the effects of Korean college students' English proficiency and the English text types on their paraphrases. Korean college students with three groups of English proficiency (high, mid, and low) read two types of English texts, causal texts, and argumentative texts, and paraphrased them in English. Students' paraphrase text was evaluated in terms of content (idea exposition, idea development, and wrap up), organization (coherence and cohesion) and language use (grammatical accuracy), and analyzed by MANOVA. As a result, it was found that there was a significant difference in their paraphrase performance according to the participants' English proficiency levels rather than the types of English texts. The results of this study have educational implications for English paraphrase education to prevent plagiarism for Korean university students.

이중 언어 기반 패러프레이즈 추출을 위한 피봇 차별화 방법 (Pivot Discrimination Approach for Paraphrase Extraction from Bilingual Corpus)

  • 박에스더;이형규;김민정;임해창
    • 인지과학
    • /
    • 제22권1호
    • /
    • pp.57-78
    • /
    • 2011
  • 패러프레이즈는 같은 의미를 다른 단어를 사용하여 표현한 것을 말한다. 패러프레이즈는 일상적인 언어생활에서도 흔히 관측되며 자연어처리 분야에서 다양하게 활용할 수 있다. 특히 최근에는 통계적 기계 번역 분야에서 데이터 부족 문제를 보완하여 번역 성능을 향상시키기 위해 패러프레이즈를 활용한 연구가 많다. 이중 언어 병렬 말뭉치를 이용하는 패러프레이즈 추출 과정에서는 일반적으로 다른 언어를 피봇으로 사용하기 때문에 단어 정렬 및 구 정렬 과정을 두 번 거친다. 따라서 단어 정렬의 오류가 패러프레이즈로 전파될 수 있다. 특히 한국어와 영어와 같이 언어의 구조적인 차이가 큰 경우에는 단어 정렬 오류가 더 심각하기 때문에 피봇 프레이즈부터 잘못 추출되는 경우가 많아진다. 이러한 문제를 보완하기 위해 본 논문에서는 패러프레이즈 추출 과정에서 피봇 프레이즈를 차별화하는 방안으로서 어휘, 품사 정보를 이용해 올바른 피봇 프레이즈에 더 높은 가중치를 부여하는 방법을 제안한다. 실험 결과, 제안하는 피봇 가중치 부여 방법을 기존의 패러프레이즈 추출 방법에 추가했을 때 패러프레이즈 추출 정확률과 재현율이 모두 향상됨을 확인할 수 있었다. 또한, 제안하는 방법을 통해 추출한 패러프레이즈를 한영 기계 번역 시스템에서 활용하였을 때 번역률이 향상됨을 확인할 수 있었다.

  • PDF

랭킹 결합에 의한 기술용어 패러프레이즈 추출 (Terminological Paraphrase Extraction with Ranking Combination)

  • 최성필;조민희;정한민;맹성현
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.175-180
    • /
    • 2012
  • 기술용어 패러프레이즈 (Terminological Paraphrase, TP)는 학술 문헌 내에서 기술 용어의 개념 및 정의를 다른 형태로 풀어서 알기 쉽게 서술적 문구 (descriptive expression) 를 의미한다. 이러한 TP들에 대한 효율적인 식별과 추출은 학술 정보에 대한 개념적 접근이나 학술 정보 검색의 재현율 향상에 매우 중요하다. 본 논문은 생명 공학 분야의 논문에 나타나는 다양한 형태의 TP들을 효율적으로 추출하기 위한 정보 검색 기반의 추출 방법론을 제시하고 총 여섯 가지의 추출 랭킹 모델을 기반으로 이를 결합함으로써 TP추출의 확장 가능성에 대한 실험적 연구를 수행한다. 실험 결과, 활용된 랭킹 모델이 서로 상호 보완적인 관계에 있음을 알 수 있었으며, 랭킹 결합에 의한 성능 개선 효과를 얻을 수 있었다.

  • PDF

Quantifier/Variable-Binding: the Epsilon Account vs. the Conjunctive Paraphrase Account

  • Yoon, Young-Eun
    • 한국언어정보학회지:언어와정보
    • /
    • 제5권2호
    • /
    • pp.9-20
    • /
    • 2001
  • Barker (1997) has argued that all the three approaches to anaphora, namely, E-type theories, Discourse Representation Theory, and Dynamic Semantics, are faced with the so-called 'double-bind' problem in the quantifier/variable-binding model of anaphora. Recently, in the same journal, Slater (2000) has claimed that the so-called epsilon account (Slater 1991, 1993, 1994, 1997) handles the problem without any difficulty. However, it will be proposed in this paper that the epsilon account has its own problems in handling the quantifier/variable-binding, and that as argued in Yoon (1998), the so-called‘conjunctive paraphrase’account is the correct solution to the problem, which is intuitively supported as well.

  • PDF

패러프레이즈 문장 검출을 위한 양방향 트랜스포머 모델 구축 (Construction of a Bidirectional Transformer Model for Paraphrasing Detection)

  • 고보원;최호진
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.465-469
    • /
    • 2019
  • 자연어 처리를 위해서 두 문장의 의미 유사성을 분석하는 것은 아주 중요하다. 이 논문은 패러프레이즈 검출 태스크를 수행하기 위한 Paraphrase-BERT를 제안한다. 우선 구글이 제안한 사전 학습된 BERT를 그대로 이용해서 패러프레이즈 데이터 (MRPC)를 가지고 파인 튜닝하였고 추가적으로 최근에 구글에서 새로 발표한 Whole Word Masking 기술을 사용하여 사전 학습된 BERT 모델을 새롭게 파인 튜닝하였다. 그리고 마지막으로 다중 작업 학습을 수행하여 성능을 향상시켰다. 구체적으로 질의 응답 태스크와 패러프레이즈 검출 태스크를 동시에 학습하여 후자가 더 잘 수행될 수 있도록 하였다. 결과적으로 점점 더 성능이 개선되었고 (11.11%의 정확도 향상, 7.88%의 F1 점수 향상), 향후 작업으로 파인 튜닝하는 방법에 대해서 추가적으로 연구할 계획이다.

  • PDF

Automatic Acquisition of Paraphrases Using Bilingual Dependency Relations

  • Hwang, Young-Sook;Kim, Young-Kil
    • ETRI Journal
    • /
    • 제30권1호
    • /
    • pp.155-157
    • /
    • 2008
  • This letter introduces a new method to automatically acquire paraphrases using bilingual corpora. It utilizes the bilingual dependency relations obtained by projecting a monolingual dependency parse onto the other language's sentence based on statistical alignment techniques. Since the proposed paraphrasing method can clearly disambiguate the sense of the original phrases using the bilingual context of dependency relations, it would be possible to obtain interchangeable paraphrases under a given context. Through experiments with parallel corpora of Korean and English language pairs, we demonstrate that our method effectively extracts paraphrases with high precision, achieving success rates of 94.3% and 84.6%, respectively, for Korean and English.

  • PDF

From So Simple a Beginning, From So Simple a Theory

  • Choe, Jae-Chun
    • Journal of Ecology and Environment
    • /
    • 제32권4호
    • /
    • pp.217-220
    • /
    • 2009
  • The year of 2009 marks the $200^{th}$ anniversary of Charles Darwin's birth and the 150th anniversary of the publication of his book, On the Origin of Species. Having survived the 150 years of hardening and tempering, Darwin's theory of natural selection is now more comprehensive and powerful than ever. It casts its shadow over nearly all academic disciplines and societal sectors. It truly revolutionized the way we look at the world and ourselves. In the midst of Darwinian revolution, however, Korea remains as a backward country as far as the understanding of Darwin and his theory is concerned. A variety of intellectual activities organized to celebrate the Year of Darwin is helping to narrow the gap. This article summarizes the kinds of such activities held in Korea this year and explains how Darwin made all this possible. To paraphrase the famous quotation by Theodosius Dobzhansky, I now dare to say, "Nothing in life makes sense except in the light of evolution".

Semantic parsing 기반 지식 베이스 질의응답 시스템의 어휘-의미 패턴 질의 템플릿을 통한 보완 (Assisting semantic parsing-based QA system with lexico-semantic pattern query template)

  • 심효섭;박선영;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.255-258
    • /
    • 2014
  • 본 논문에서는 semantic parsing과 사전 정의된 어휘-의미 패턴 질의 템플릿 방법론을 결합하여 자연어 질의로부터 RDF 지식베이스에 질의하기 위한 SPARQL 쿼리를 생성하는 방법을 제안한다. semantic parsing 접근법은 문장의 표현과 분리된 형식적 의미표현만을 포착해내므로, paraphrase 혹은 의미 변화와 무관한 어순의 변화에 강인하지만, 일부 자연어 질의문장에는 단순한 의미 및 구조를 갖는 문장도 적합한 형식적 의미표현을 생성하지 못하는 단점이 있다. 따라서 이 연구에서는 이러한 단순한 문장에 있어서는 사전 정의된 질의 템플릿을 사용하여 적합한 쿼리를 생성하되, 적합한 템플릿을 선택하는데 있어 해당 질의문장의 어휘-의미적 유형을 포착하고 해당 정보를 이용하는 방법을 이용하였으며 이를 통해 주 방법론의 약점을 보완하는 제한적인 효과를 얻을 수 있었다.

  • PDF