• 제목/요약/키워드: anaphora

검색결과 57건 처리시간 0.013초

Syntactic Structured Framework for Resolving Reflexive Anaphora in Urdu Discourse Using Multilingual NLP

  • Nasir, Jamal A.;Din, Zia Ud.
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권4호
    • /
    • pp.1409-1425
    • /
    • 2021
  • In wide-ranging information society, fast and easy access to information in language of one's choice is indispensable, which may be provided by using various multilingual Natural Language Processing (NLP) applications. Natural language text contains references among different language elements, called anaphoric links. Resolving anaphoric links is a key problem in NLP. Anaphora resolution is an essential part of NLP applications. Anaphoric links need to be properly interpreted for clear understanding of natural languages. For this purpose, a mechanism is desirable for the identification and resolution of these naturally occurring anaphoric links. In this paper, a framework based on Hobbs syntactic approach and a system developed by Lappin & Leass is proposed for resolution of reflexive anaphoric links, present in Urdu text documents. Generally, anaphora resolution process takes three main steps: identification of the anaphor, location of the candidate antecedent(s) and selection of the appropriate antecedent. The proposed framework is based on exploring the syntactic structure of reflexive anaphors to find out various features for constructing heuristic rules to develop an algorithm for resolving these anaphoric references. System takes Urdu text containing reflexive anaphors as input, and outputs Urdu text with resolved reflexive anaphoric links. Despite having scarcity of Urdu resources, our results are encouraging. The proposed framework can be utilized in multilingual NLP (m-NLP) applications.

Cross-speaker anaphora in dynamic semantics

  • Yeom, Jae-Il
    • 한국언어정보학회지:언어와정보
    • /
    • 제14권2호
    • /
    • pp.103-129
    • /
    • 2010
  • In this paper, I show that anaphora across speakers shows both dynamic and static sides. To capture them all formally, I will adopt semantics based on the assumption that variables range over individual concepts that connect epistemic alternatives. As information increases, a variable can take a different range of possible individual concepts. This is captured by the notion of virtual individual (= vi), a set of individual concepts which are indistinguishable in an information state. The use of a pronoun involves two information states, one for the antecedent, which is always part of the common ground, and the other for the pronoun. Information increase changes vis for variables in the common ground. A pronoun can be used felicitously if there is a unique virtual individual in the information state for the antecedent which does not split in two or more distinctive virtual individuals in the information state for the pronoun. The felicity condition for cross-speaker anaphora can be satisfied in declaratives involving modality, interrogatives and imperatives in a rather less demanding way, because in these cases the utterance does not necessarily require non-trivial personal information for proper use of a pronoun.

  • PDF

Optimality Theory in Semantics and the Anaphora Resolution in Korean: An Adumbration

  • Hong, Min-Pyo
    • 한국언어정보학회지:언어와정보
    • /
    • 제6권2호
    • /
    • pp.129-152
    • /
    • 2002
  • This paper argues for a need to adopt a conceptually radical approach to zero anaphora resolution in Korean. It is shown that a number of apparently conflicting constraints, mostly motivated by lexical, syntactic, semantic, and pragmatic factors, are involved in determining the referential identity of zero pronouns in Korean. It is also argued that some of the major concepts of Optimality Theory can provide a good theoretical framework to predict the antecedents to zero pronouns in general. A partial formalization of 07-based constraints at the morpho-syntactic and lexico-semantical level is provided. It is argued that the lexico-semantic restrictions on adjacent expressions play the most important role in the anaphora resolution process along with a variant of the binding principle, formulated in semantic terms. Other pragmatically motivated constraints that incorporate some important intuitions of Centering Theory are proposed too.

  • PDF

강건한 음성 대화 시스템을 위한 담화분석 기술 (Discourse Analysis for Robust Spoken Dialogue System)

  • 이충희;오효정;장명길;서영훈
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권10호
    • /
    • pp.1005-1009
    • /
    • 2010
  • 지시대명사와 같은 조응어(anaphora)의 본래 단어나 구를 선행사라고 지칭하며, 음성 대화 중에는 선행사에 대한 생략과 대용어 사용이 빈번히 발생한다. 또한 언어 현상들은 문맥을 보지 않으면 이해될 수 없는 것들이 많다는 것이 담화분석의 기본 가정이므로, 생략 및 대용어 복원은 담화분석에서 매우 중요한 역할을 한다. 본 논문에서는 대용어와 생략어 복원에 기반해서 대화 레벨에서의 강건성을 향상시킨 음성 기반 대화 시스템을 제안한다. 제안된 항법의 적절성과 효과는 TV 도메인에서 평가되었다.

문장의 머리방향 매개변수(headedness parameter)와 공조응사(null anaphor)습득 (Headedness Parameter and the Acquisition of Null Anaphor)

  • 조숙환
    • 인지과학
    • /
    • 제1권1호
    • /
    • pp.145-164
    • /
    • 1989
  • 본 논문은 언어습득 초기단계의 아동이 모국어의 주요분기방향(principal branching direction)에따라 종응사규칙을 습득한다는 최근의 연구결과에 의거한다(Lust,1986).이 연구에 의하면,가령 한국어는 좌행 분기어임을 한국아동은 죄행생략형을 선호할 것이라고 한다.이가설을 시험하기 위해 서울에 거주하는 4:1-9:7의 96명의 아동을 모방유도실험으로 개별연구하였다.문장유형으로는 중복형,우행생략형 및 좌행생략형 등이 이용되었다.실험결과,Lust의 예측과는 달리 좌행분기어인 한국어 습득아동도 우행분기어인 영어습득아동처럼 우행 생략형을 좌행생략형보다 용이하게 일찍 습득하고 있음을 발견하였다.이것은 인간에게 분기방향과 같은 문법적 요소에 상관없이 선행사가 공조응사보다 앞서 언급되는 형태(우행생략형) 를 선호하는 인지적기재가 있음을 시사한다고 사려된다.

설명문의 대용어 참조해결과정: 대용어와 지시사 생략 효과 (Anaphoric Reference Resolution in Expository Text: The Effects of Ellipsis)

  • 이재호
    • 인지과학
    • /
    • 제21권2호
    • /
    • pp.253-282
    • /
    • 2010
  • 이 연구는 대용어나 지시사가 생략된 조건에서 선행어의 전형성과 언급순서가 참조해결에 작용하는 효과를 살펴보기 위해서 2개의 실험을 실시하였다. 실험 1은 대용어 생략과 대명사 조건을 비교하였다. 대용어 생략은 전형성과 언급순서가 읽기과제에 반영되었고, 언급순서 효과가 탐사재인과제에 반영되었다. 반면에 대명사는 전형성과 언급순서 효과가 탐사재인과제에만 반영되었다. 실험 2에서는 지시사가 생략된 명사반복과 대명사 조건을 비교하였다. 명사반복이 대명사에 비해서 읽기시간이 길었으며, 언급순서 효과가 탐사재인과제에 반영되었다. 반면에 대명사는 전형성과 언급순서가 탐사재인과제에서 반영되었다. 이는 선행어와 대용어의 참조해결이 직선적이기보다는 역동적일 가능성을 시사하였다.

  • PDF

Backward Anaphora

  • Lee, Hyeran
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2002년도 Language, Information, and Computation Proceedings of The 16th Pacific Asia Conference
    • /
    • pp.281-289
    • /
    • 2002
  • This paper aims to account for the backward anaphora that seem to be against the c-command requirements in the anaphor-antecedent relations. It was claimed that the binding conditions should apply at LF fur the backward binding cases involving phych-verbs and causatives. Under the recent development of minimalism where the concept of levels disappears to adopt a cyclic derivation, the data that show the backward binding phenomena have not been discussed in the area of the binding theory. In this paper, I argue that the backward binding cases can be incorporated into the core binding phenomena with the general assumptions on the thematic prominence. It is discussed how the dependency between NPs involving backward anaphora is determined by the thematic prominency. The Agree operation takes place between the probe T and the goal with the uninterpretable u[a] and [prominent] feature, by which an anaphor is valued, producing a proper interpretation.

  • PDF

무형대용어 해결 기술을 이용한 백과사전 표제어 복원 (Restoring Encyclopedia Title Words Using a Zero Anaphora Resolution Technique)

  • 황민국;김영태;나동열;임수종
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.65-69
    • /
    • 2014
  • 한국어 문장의 경우 문맥상 추론이 가능하다면 용언의 격이 생략되는 현상 즉 무형대용어 (zero anaphora) 현상이 흔히 발생한다. 무형대용어를 채울 수 있는 선행어 (명사구)를 찾는 문제는 대용어 해결 (anaphora resolution) 문제와 같은 성격의 문제이다. 이러한 생략현상은 백과사전이나 위키피디아 등 백과사전류 문서에서도 자주 발생한다. 특히 선행어로 표제어가 가능한 경우 무형대용어 현상이 빈번히 발생한다. 백과사전류 문서는 질의응답 (QA) 시스템의 정답 추출 정보원으로 많이 이용되는데 생략된 표제어의 복원이 없다면 유용한 정보를 제공하기 어렵다. 본 논문에서는 생략된 표제어 복원을 위해 무형대용어의 해결을 기반으로 하는 시스템을 제안한다.

  • PDF

한국어 복합문에서의 제로 대용어 처리를 위한 분해 알고리즘과 복원규칙 (Splitting Algorithms and Recovery Rules for Zero Anaphora Resolution in Korean Complex Sentences)

  • 김미진;박미성;구상옥;강보영;이상조
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권10호
    • /
    • pp.736-746
    • /
    • 2002
  • 한국어에는 복합문에서 영 대용이 빈번하게 발생하여 해석을 어렵게 한다. 따라서 본 논문에서는 한국어 영 대용어 처리를 위해 복합문 분해 알고리즘과 복합문 영 대용어 복원 규칙을 제안하고, 해결방법을 제시한다. 본 논문은 신문 기사의 복합문 중에서 보조용언 내포문을 제외한 인용문, 접속문, 내포문을 처리 대상으로 한다. 복합문 분해를 위해서는 복합문 구성에 관여하는 어미들의 어미 분류표를 이용하고, 영 대용어 복원을 위해서는 생략될 때 적용된 통사규칙을 역으로 이용한다. 인용문은 주어 인칭제약에 따른 동일 명사구 탈락규칙을, 명사화 내포문은 동일 명사구 탈락규칙을, 관형화 내포문은 관계 명사구 탈락규칙을 그리고 접속문은 접속 삭감규칙을 역으로 이용하여 처리한다. 제안한 방법을 이용한 결과 전체 영 대용어 중 83.53%가 해결 가능하며 11.52%는 부분적으로 해결 가능하다.