• 제목/요약/키워드: Anaphora

검색결과 57건 처리시간 0.023초

On Presupposition Projection

  • Yeom, Jae-Il
    • 한국영어학회지:영어학
    • /
    • 제3권1호
    • /
    • pp.55-88
    • /
    • 2003
  • In this paper, I will review two main theories on presupposition projection and point out their problems, and suggest the directions of a better analysis. Satisfaction theory is based on the single idea that presuppositions must be satisfied in the local context for the interpretation of a sentence. Problems occur because the theory makes only a minimal requirement on the input context for interpretation. They include the problems of weak presuppositions, unmotivated local accommodation, and projection of satisfied presuppositions. Binding theory assumes that presuppositions are anaphoric elements which can be accommodated. I will show that the syntactic notion of binding is not motivated, and claim that presupposition projection is a matter of information. Finally, I suggest the directions for a better analysis.

  • PDF

한국어 생략어복원 가이드라인 (Korean Zero Anaphora Resolution Guidelines)

  • 류지희;임준호;임수종;김현기
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.213-219
    • /
    • 2017
  • 말과 글에서 유추가 가능한 정보에 대해서는 사람들이 일반적으로 생략해서 표현하는 경우를 볼 수 있다. 사람들은 생략된 정보를 문맥적으로 유추하여 이해하는 것이 어렵지 않지만, 컴퓨터의 경우 생략된 정보를 고려하지 못해 주어진 정보를 완전하게 이해하지 못하는 문제를 낳게 된다. 우리는 이러한 문제를 생략어복원을 통해 해결할 수 있다고 여기면서 본 논문을 통해 한국어 생략어복원에 대해 정의하고 기술 개발에 필요한 말뭉치 구축 시의 생략어복원 대상 및 태깅 사례를 포함하는 가이드라인을 제안한다. 또한 본 가이드라인에 의한 말뭉치 구축 및 기술 개발을 통해서 엑소브레인과 같은 한국어 질의응답 시스템의 품질 향상에 기여하는 것이 본 연구의 궁극적인 목적이다.

  • PDF

A Sketch of an Optimality Theoretic Account of Anaphora Resolution in Korean

  • Hong, Minpyo
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2002년도 학술대회 발표논문집
    • /
    • pp.10-38
    • /
    • 2002
  • 본고는 한국어 영형 대명사의 적절한 해석을 위해 개념적으로 전혀 새로운 이론을 제안한다. 일련의 다양한 제약들이 서로 연관되어 있음을 보인 후, 그러한 규칙의 다양성을 적절히 포착하기 위해 적절성 이론 (Optimality Theory)을 도입할 것을 제안하고, 그 토대 위에 다양한 제약들을 형식화한 후, 그 규칙들의 위계관계를 설정한다. 가장 우선순위를 갖는 제약으로 인접 요소간 어휘의미자질들이 일치해야 한다는 어휘의미제약(*Feature Mismatch)과 통사적 결속규칙을 의미론적으로 재해석한 결속원리 B(Principle B)를 선정한다. 그 다음 순위를 갖는 제약으로, 가능한 한 선행명사를 지칭하도록 요구하는 대용존중제약(DOAP: Don't Overlook Anaphoric Possibilities)과, 센터링 이론의 전이방식 개념을 도입하여 정의한 계속선호제약 (CONTINUE)을 제안한다

  • PDF

정보포장이론에서의 조응어 해석 (Anaphora Resolution in the Information Packaging Theory)

  • 정소우
    • 한국언어정보학회지:언어와정보
    • /
    • 제5권2호
    • /
    • pp.87-102
    • /
    • 2001
  • This paper deals with interpretation of pronouns in terms of Information Packaging Theory, proposed in Vallduvi(1994) and Engdahl and Vallduvi (1996), which depicts how discourse participants update new information, using three informational components: link, tail and focus. Based on empirical evidence, this paper argues that the information structure of an utterance is not enough for the hearer to process its information in accordance with the speaker's intention. It suggests that the hearer should be able to activate lexical file cards and frame file cards when necessary to designate the proper file card in which the information of the utterance should be recorded. It also proposes that, contrary to Vallduvi's claim, pronouns may create a new file card.

  • PDF

한국어 대화에서의 대명사의 선행사 탐색 -통제된 중심화이론적 접근 (On the Anaphora Resolution in Korean Dialogues -in the Framework of the Controlled Centering Theory)

  • 이익환;이민행
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.382-388
    • /
    • 1999
  • 이 논문은 두 가지 목적을 가진다. 첫째, 대명사의 선행사 탐색을 위한 이론으로 널리 알려진 중심화이론을 필자들이 수정확대한 통제된 중심화 이론(Controlled Centering Theory, 이하 CCT)을 소개한다. 둘째, 한국어의 대화에서 나타나는 대명사의 선행사 탐색문제에 대한 설명력있는 해답을 CCT의 틀안에서 제시한다. 이를 위해 제한된 영역 대화라 할 수 있는 호텔예약대화에 나타나는 영대명사의 특성에 대해 논의하고, 그 선행사 탐색과 관련하여, 정보구조적인 관점에서 슬롯연결성분이 영대명사의 선행사일 가능성이 높기 때문에 중심화이론의 주요 구성요소인 전향적 중심리스트 서열의 최상위에 슬롯성분이 위치해야 한다는 논지를 전개한다. 어떤 영대명사의 선행사가 될 수 있는 후보자가 여럿일 경우에 가장 적합한 선행사를 찾아내기 위해서는 별도로 '개념양립성제약을' 설정할 필요가 있다고 주장한다 광역대화에 나타나는 명시적인 대명사의 선행사 탐색과 관련하여서는 대명사의 선행사는 대명사를 담화통어할 수 있는 위치에 있어야 한다는 담화통어제약을 제안하고, 담화통어 개념을 정의한다.

  • PDF

실제 멀티모달 환경에서의 지시 대용어 처리 (Resolution of Deictic Anaphora in Real Multimodal Environments)

  • 최맹식;이세희;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.151-155
    • /
    • 2008
  • 언어기반 대화 시스템에서는 시스템과 사용자의 대화가 발화 자체만으로 이루어지기 때문에 사용자가 사람과 대화하는 것처럼 지시 대용어를 사용할 수 없어서 불편하다. 그리고 사용자의 발화 의미를 시스템이 정확하게 해석하기가 어렵다. 하지만 이런 언어기반 대화 시스템과는 달리 멀티모달 대화 시스템에서는 발화 자체의 정보뿐만이 아닌 제스처와 같은 발화 이외의 행위 정보들이 포함되는데 이 정보를 이용하면 지시 대용어의 처리가 가능해짐으로 시스템과의 대화가 좀 더 자연스러워진다. 본 논문에서는 군집화와 격틀을 이용하여 여러 사물들 중에서 지시 대용어가 될 가능성이 있는 지시 후보 선정을 한다. 그리고 특출성 점수와 엔트로피를 이용하여 후보 사물들 중에서 지시 대용어가 될 수 있는 대상을 선택하는 알고리즘을 제안한다. 시뮬레이션 환경에서의 실험결과 평균 2.8번의 상호작용으로 지시 대용어를 처리할 수 있었다.

  • PDF

생략복원을 위한 ELECTRA 기반 모델 최적화 연구 (Optimizing ELECTRA-based model for Zero Anaphora Resolution)

  • 박진솔;최맹식;;이충희
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.329-334
    • /
    • 2021
  • 한국어에서는 문장 내의 주어나 목적어가 자주 생략된다. 자연어 처리에서 이러한 문장을 그대로 사용하는 것은 정보 부족으로 인한 문제 난이도 상승으로 귀결된다. 생략복원은 텍스트에서 생략된 부분을 이전 문구에서 찾아서 복원해 주는 기술이며, 본 논문은 생략된 주어를 복원하는 방법에 대한 연구이다. 본 논문에서는 기존에 생략복원에 사용되지 않았던 다양한 입력 형태를 시도한다. 또한, 출력 레이어로는 finetuning layer(Linear, Bi-LSTM, MultiHeadAttention)와 생략복원 태스크 형태(BIO tagging, span prediction)의 다양한 조합을 실험한다. 국립국어원 무형 대용어 복원 말뭉치를 기반으로 생략복원이 불필요한 네거티브 샘플을 추가하여 ELECTRA 기반의 딥러닝 생략복원 모델을 학습시키고, 생략복원에 최적화된 조합을 검토한다.

  • PDF

Structural SVM을 이용한 백과사전 문서 내 생략 문장성분 복원 (Restoring Omitted Sentence Constituents in Encyclopedia Documents Using Structural SVM)

  • 황민국;김영태;나동열;임수종;김현기
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.131-150
    • /
    • 2015
  • 영어와 달리 한국어나 일본어 문장의 경우 용언의 필수격을 채우는 명사구가 생략되는 무형대용어 현상이 빈번하다. 특히 백과사전이나 위키피디아의 문서에서 표제어로 채울 수 있는 격의 경우 그 격이 문장에서 더 쉽게 생략된다. 정보검색, 질의응답 시스템 등 주요 지능형 응용시스템들은 백과사전류의 문서에서 주요한 정보를 추출하여 수집하여야 한다. 그러나 이러한 명사구 생략 현상으로 인해 양질의 정보추출이 어렵다. 본 논문에서는 백과사전 종류 문서에서 생략된 명사구 즉 무형대용어를 복원하는 시스템의 개발을 다루었다. 우리 시스템이 다루는 문제는 자연어처리의 무형대용어 해결 문제와 거의 유사하나, 우리 문제의 경우 문서의 일부가 아닌 표제어도 복원에 이용할 수 있다는 점이 다르다. 무형대용어 복원을 위해서는 먼저 무형대용어의 탐지 즉 문서 내에서 명사구 생략이 일어난 곳을 찾는 작업을 수행한다. 그 다음 무형대용어의 선행어 탐색 즉 무형대용어의 복원에 사용될 명사구를 문서 내에서 찾는 작업을 수행한다. 문서 내에서 선행어를 발견하지 못하면 표제어를 이용한 복원을 시도해 본다. 우리 방법의 특징은 복원에 사용된 문장성분을 찾기 위해 Structural SVM을 사용하는 것이다. 문서 내에서 생략이 일어난 위치보다 앞에 나온 명사구들에 대해 Structural SVM에 의한 시퀀스 레이블링(sequence labeling) 작업을 시행하여 복원에 이용 가능한 명사구인 선행어를 찾아내어 이를 이용하여 복원 작업을 수행한다. 우리 시스템의 성능은 F1 = 68.58로 측정되었으며 이는 의미정보의 이용 없이 달성한 점을 감안하면 높은 수준으로 평가된다.

노산 이은상 시조의 병치 기법 연구 - 노산 시조집을 중심으로 - (A Study on the Juxtaposition Technique in Nosan Lee Eun-sang's Sijo - Focusing on the Nosan Sijojip(時調集) -)

  • 이순희
    • 한국시조학회지:시조학논총
    • /
    • 제44권
    • /
    • pp.75-103
    • /
    • 2016
  • 본 연구는 노산시조집에 실린 작품에서 발견되는 병치에 주목하여, 이은상 시조의 주된 창작 태도가 병치 기법에 있으며 이러한 창작 태도는 독자들에게 이해의 수월성을 제공한다는 것을 논증하는 데 그 목적이 있다. 병치기법은 독자들에게 전달하고자 하는 텍스트의 의미를 명료화하고 확장시키는 역할을 한다. 따라서 병치 기법을 주로 사용하고 있는 이은상의 창작태도는 독자와의 소통을 원활하게 한다. 또한 병치기법으로 인한 의미의 확장은 시조의 정체성이라 할 수 있는 간결미와 정제미의 생성을 가능하게 한다. 나아가 이러한 창작태도는 '시조 정체성의 혼란과 난해성으로 독자들에게 외면을 받고 있는, 오늘날 현대시조가 나아갈 방향을 찾는 데도 도움이 될 것이다. 이은상이 "노산시조집"을 발간한 시기는 한국 시조가 노래 장르에서 문학 장르로 그 발판을 굳건히 다지는 때였다. 문학 장르의 발판을 굳히기 위한 도구로 영미의 이미지즘을 수입하여 전통시가의 근대화를 꾀했다. 1920년대 창작된 시조 작품에는 이미지즘 시 이론이 공통적으로 내재되어 있었지만 "노산시조집"에는 개성적인 면도 있었다. 이은상의 시조에는 병치 기법이 많이 발견된다는 것이다. 이는 이은상 시인이 추구한 시작태도라고 할 수 있다. 로스, 피네간, 유협, 속요에 서술된 병치 이론을 참조하여 "노산시조집"에 나타난 병치 기법의 유형을 의미의 조응과 의미의 대립 차원에서 살펴보았다. 의미의 조응에서는 동의적 병치, 종합적 병치, 구체적 병치, 통사적 병치로 나누었으며 의미의 대립은 대립적 병치에서 살펴보았다. 이은상 작품 대부분이 이러한 병치 기법을 적용하고 있다. 또한 병치에 의해 나타나는 이미지의 역동성은 영미 이미지즘에서 영향 받은 것이다. 오늘날까지 독자들이 이은상 시조 작품을 널리 애송하고 있는 까닭은 병치 기법과 이미지의 역동성으로 그의 작품이 쉬우면서 감동적으로 다가오기 때문이다. 이은상이 추구했던 병치 기법은 독자의 이해를 돕는 수월성을 제공하고 리듬 창출을 용이하게 한다는 점에서 매우 긍정적이다. 따라서 오늘날, 현대시조의 정체성 혼란으로 어려움을 겪고 있는 시인들이 시조의 색깔을 드러낼 수 있는 병치 기법이나 역동적 이미지를 잘 살려낸다면 현대 시조가 지닌 문제점들을 어느 정도 해소할 수 있을 것이며 시조의 정체성을 획득하는 데도 도움이 될 것이다.

  • PDF

Coreference Resolution을 위한 3인칭 대명사의 선행사 결정 규칙 (Antecedent Decision Rules of Personal Pronouns for Coreference Resolution)

  • 강승식;윤보현;우종우
    • 정보처리학회논문지B
    • /
    • 제11B권2호
    • /
    • pp.227-232
    • /
    • 2004
  • 정보 검색 시스템에서 문서의 내용을 대표하는 용어를 추출하거나 정보 추출 및 텍스트 마이닝에서 특정 정보만을 추출하려면 고유명사에 대한 대용어 문제가 해결되어야 한다. 대용어 해소 문제는 인칭 명사에 대한 대명사의 선행사 결정 문제가 대표적이다. 본 논문에서는 한국어에서 문서의 내용을 보다 정확히 분석하기 위해 3인칭 대명사 “그/그녀/그들/그녀들”의 선행사를 결정하는 방법을 제안한다. 일반적으로 3인칭 대명사의 선행사는 현재 문장 또는 이전 문장의 주어인 경우가 많고, 또한 3인칭 대명사가 2회 이상 반복되는 경우가 자주 발생한다. 이러한 특성을 이용하여 현재 문장과 이전 문장에 출현한 인칭 명사들 중에서 선행사로 사용되는 경우를 조사하여 선행사 결정 규칙을 발견하였다. 이 경험 규칙은 3인칭 대명사의 격에 따라 조금씩 달라지기 때문에 대명사의 격에 따라 주격, 목적격, 소유격으로 구분하여 기술하였다. 제안한 방법의 타당성을 검증하기 위하여 신문 기사의 정치 관련 문서에서 대명사의 격에 따라 100개씩 총 300개의 실험 대상을 선정하였으며, 실험 결과로 3인칭 대명사의 선행사 결정 정확도는 재현율이 79.0%, 정확률이 86.8%로 나타났다.