• 제목/요약/키워드: 관계대명사

검색결과 21건 처리시간 0.028초

구문분석 말뭉치를 이용한 문법 관계의 선호 체언 어휘와 의미 유형 연구 (A Treebank-Based Approach to Preferred Nominal Words in Grammatical Relations and their Semantic Types)

  • 홍정하
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.35-41
    • /
    • 2008
  • 이 논문은 각 문법 관계(grammatical relation)에서 선호되는 체언 어휘를 파악하고, 이 어휘들의 의미적 유형 및 그 위계를 파악하는 것이 목적이다. 이를 위해 80만 어절의 21세기 세종계획 구문분석 말뭉치에서 그 분포를 추출하고, 통계적 검증을 통해 각 문법 관계에서 선호되는 체언 어휘를 선별한다. 이 연구에서 관찰하는 문법 관계는 주어, 목적어, 용언수식어로 하며, 이들 문법 관계에서 선호되는 어휘 추출 대상 품사는 대명사, 고유명사, 일반명사로 한다. 한정성의 강도에 따라 주어 분포 경향이 나타나며, 이에 따라 대명사 > 고유명사 > 일반명사 순으로 주어 분포 경향이 나타난다. 그러나 일반적 예측과 다르게 한정성의 강도가 더 강한 것으로 알려진 대명사가 고유명사보다 목적어와 용언수식어에서 분포 경향이 더 강하여, 일반명사 > 대명사 > 고유명사의 순으로 분포 경향이 나타난다. 대명사, 고유명사, 일반명사는 공통적으로 주어에서는 사람 지시어, 목적어에서는 사물과 장소 지시어, 그리고 용언수식어에서는 시공간 표현이 선호되어 분포한다. 특히 대명사는 각 문법기능에서 인칭대명사의 경우 인칭에 따라, 그리고 지시대명사의 경우 원근칭에 따라 선호도의 차이를 보인다. 이러한 체언 어휘의 의미적 분포 특성은 문법 관계에 통사적 기능 외에도 의미적 경향이 반영된 것으로 고려될 수 있다.

  • PDF

언어 유형학적 견지에서 본 독일어 관계 대명사와 한국어의 대응구조 (Relativpronomen im Deutschen und deren Entsprechung im Koreanischen - Aus der sprachtypologischen Perspektive -)

  • 박진길
    • 한국독어학회지:독어학
    • /
    • 제5집
    • /
    • pp.53-65
    • /
    • 2002
  • 독일어의 관계대명사는, 선행사의 반복과 그에 결부된 일치 규정을 철저하게 따름으로써 가능한 한, 언어의 모호성을 배제하려 한다. 이에 반해 한국어에서는 그런 것이 전혀 필요하지 않다. 독일어의 관계대명사에 해당하는 부가어 문장이 항상 그의 관계어/선행사 앞에 위치하기 때문이다. 이 때문에 양측의 (모국어)화자는 심각한 언어간섭 현상에 빠지기 마련이다 그들의 차이가 서로에게 너무 큰 까닭이다. 이러한 대립적인 어려운 문제들은, 일면에서는 전치성과 후치성이란 언어 특성을 익히고, 다른 일면에서는 한국인이 번역에서 독일어의 관계대명사에 결부된 구조를 완전히 생략함으로써 극복될 수 있다. 독일어나 한국어처럼 상호 대립적으로 발달한 언어를 정복하기 위해서, 가장 좋은 방법으로는 문장 자체를 한 단어처럼 익히는 것이다. 이것은 또한 서술을 위한 표현능력을 신장하는데도 효과적이다. 이에 따른 문법을 따로 배워야 한다는 생각은 전혀 필요하지 않다. 왜냐하면 언어습득장치는 모든 것을 언제나 문법적/체계적/분석적으로 수용하기 때문이다.

  • PDF

매개변항, 부분집합원리, 재귀대명사습득 (Parameter. Subset Principle, and the Acquisition of Korean Reflexive Anaphora)

  • 조숙환
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.296-301
    • /
    • 1989
  • 본 논문의 목적은 매개변항(parameter)과 부분집합원리(subset principle)를 재귀대명사 구조분석 및 습득에 적용하여 보편문법(Universal Grammar)과 언어습득의 상호관계를 검토하는 데에 있다. 본 논문은 첫째, 재귀대명사 '자기'를 매개변항이론에 근거하여 분석하고, 둘째, 재귀사의 구조를 부분집합원리에 적용하여 '자기'의 습득과정을 관찰한다. 본 논문의 목적을 위해 두 가지 가설을 세워 실험적으로 검증하였다. 실험결과, 선행사자격 습득단계의 가설이 확증되었으며, 지배변항 습득단계의 가설은 결정적 증거가 미비해 앞으로의 과제로 남아 있다.

  • PDF

대명사 해결에 미치는 통사단서 및 맥락의 역할

  • 방희정
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1990년도 제2회 한글 및 한국어정보처리 학술대회
    • /
    • pp.112-119
    • /
    • 1990
  • 본 연구에서는 글이해시의 참조관계 처리과정에서 맥락이 어떤 역할을 하며 다른 통사단서와는 어떤 관계를 갖는지를 대명사 해결을 중심으로 조사했다. 실험 1에서는 대용어 문장의 국소적 맥락에 의한 촉진효과가 관찰되었다. 그러나 맥락과 통사단서간의 상호작용으로 맥락 촉진효과는 통사적 명료조건에서보다는 애매조건에서 더 강하게 나타났다. 실험 2에서는 국소적 맥락정보가 없더라도 선행글의 전체주제적 맥락정보가 촉진제 역할을 하는 것으로 밝혀졌다. 또한 전체주의적 맥락이 주어지는 경우 글의 표면구조적 특성에 따른 위치효과가 나타나지 않았다. 즉 두 개의 실험을 통해 대명사 해결에 미치는 통사단서의 효과가 일부 지지되었으며, 특히 맥락효과는 국소적, 총체적 수준에서 모두 일관되게 입증되었다.

  • PDF

조응성 정보와 중심화 이론에 기반한 영형 주어의 선행사 식별 (Antecedent Identification of Zero Subjects using Anaphoricity Information and Centering Theory)

  • 김계성;박성배;이상조
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권12호
    • /
    • pp.873-880
    • /
    • 2013
  • 본 논문은 지역적 응집성을 모델링하는 중심화 이론을 이용하여 한국어 영형대명사의 지시해결에 접근한다. 중심화 이론은 영어 대명사의 해결을 위해 널리 사용되고 있지만, 일본어, 한국어 등의 언어에서 나타나는 영형대명사 해결에 중심화의 프레임워크를 적용하는 데에는 많은 어려움이 따른다. Grosz et al.의 중심화 이론은 지시적 표현들의 비조응적 사용을 고려하지 않으므로, 문서에 나타나는 비조응적 기능의 영형 대명사가 중심화 이론을 이용한 영형대명사의 선행사 식별에 중요한 영향을 미친다. 본 논문은 이를 위해 먼저 절 간의 결속 관계를 이용하여 영형대명사, 특히 영형주어의 문장 내 조응성을 결정하고, 다음으로 중심화의 순위를 이용하여 그 영형의 선행사를 식별하는 방법을 제안한다. 실험을 통해 조응성 결정을 이용하는 제안한 방법이 이를 이용하지 않는 베이스라인 시스템보다 우수함을 알 수 있었다.

포인터 네트워크를 이용한 한국어 대명사 상호참조해결 (Coreference Resolution for Korean Pronouns using Pointer Networks)

  • 박천음;이창기
    • 정보과학회 논문지
    • /
    • 제44권5호
    • /
    • pp.496-502
    • /
    • 2017
  • 포인터 네트워크(Pointer Networks)는 Recurrent Neural Network (RNN)를 기반으로 어텐션 메커니즘(Attention mechanism)을 이용하여 입력 시퀀스에 대응되는 위치들의 리스트를 출력하는 딥 러닝 모델이다. 대명사 상호참조해결은 문서 내에 등장하는 대명사와 이에 대응되는 선행사를 찾아 하나의 엔티티로 정의하는 자연어처리 문제이다. 본 논문에서는 포인터 네트워크를 이용하여 대명사와 선행사의 참조관계를 밝히는 대명사 상호참조해결 방법과 포인터 네트워크의 입력 연결순서(chaining order) 여섯가지를 제안한다. 실험 결과, 본 논문에서 제안한 방법 중 연결순서 coref2 가 MUC F1 81.40%로 가장 좋은 성능을 보였다. 이는 기존 한국어 대명사 상호참조해결의 규칙 기반(50.40%)보다 31.00%p, 통계 기반(62.12%) 보다 19.28%p 우수한 성능임을 나타낸다.

상호참조 정보와 대화 그래프를 활용한 대화 관계추출 모델 (Dialogue Relation Extraction using Dialogue Graph)

  • 임정우;손준영;김진성;허윤아;서재형;장윤나;박정배;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.385-390
    • /
    • 2022
  • 관계추출은 문서 혹은 문장에서 자동으로 엔티티들간의 관계를 추출하는 기술로, 비정형 데이터를 정형데이터로 변환하기에 자연어 처리 중에서도 중요한 분야중 하나이다. 그 중에서도 대화 관계추출은 기존의 문장 단위의 관계추출과는 다르게 긴 길이에 비해 적은 정보의 양, 빈번하게 등장하는 지시대명사 등의 특징을 가지고 있어 주어와 목적어 사이의 관계를 예측하기에 어려움이 있었다. 본 연구에서는 이러한 어려움을 극복하기 위해 대화의 특성을 고려한 대화 그래프를 구축하고 이를 이용한 모델을 제안한다. 제안하는 모델은 상호참조 정보와 문맥정보를 더 반영한 그래프를 통해 산발적으로 퍼져있는 정보를 효율적으로 수집하고, 지시대명사로 인해 어려워진 중요 발화 파악 능력을 증진시켰다. 또한 이를 실험적으로 보이기 위하여 대화 관계추출 데이터셋에 실험해본 결과, 기존 베이스라인 보다 약 10 % 이상의 높은 F1점수를 달성하였다.

  • PDF

대명사의 참조관계 처리시의 맥락의 역할 (The Contextual Effects on Pronoun Reaolution)

  • 방희정
    • 인지과학
    • /
    • 제2권2호
    • /
    • pp.279-307
    • /
    • 1990
  • 본 연구에서는 글이해시의 참조관계 처리 과정에서 맥락이 어떤 영향을 미치며 다른 통사 정보와는 어떤 관계를 갖는지를 대명사 해결 패러다임을 중심으로 검토하였다.실험1에서는 무관단어 어휘판단 과제 및 선행참조어 강제선택 과제를 사용하여 글이해시 대용어 문장에서 제공되는 하위 수준의 국소적 맥락편중에 의한 촉진 효과를 입증했다.그러나 맥락 편중에 의한 촉진 효과는 통사적으로 명료한 조건에서는 보다는 애매 조건에서 더욱 강하여,맥락과 통사 간의 상호작용을 나타냈다.실험 2 에서는 대용어 문장 수준에서는 국소적 맥락 정보가 주어지지 않더라도 선행글로 부터 제공된 상위 수준의 전체주제와 관련된 총체적 맥락 정보가 참조관계 해결을 촉진시키는 것으로 밝혀졌다.실험 3 에서는 전체 덩이글 에서의 선행된 총체적 맥락과 후행하는 국소적 맥락간의 일관성 변인이 대명사 해결시에 촉진적 역할을 하는것으로 나타났다.즉 세개의 실험을 통해 글이해에 미치는 맥락 촉진 효과가 다양한 수준에서 일관되게 관찰되었다.

한국 설화문에서 주제표현의 연속성 (Topic Continuity in Korean Narrative)

  • 정희자
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.288-295
    • /
    • 1989
  • 언어사용 목적이 효율적인 정보교환에 있다. 정보교환에 필요한 의미는 하나의 문에서보다는 담화에서 전달되기 때문에 담화분석을 토대로 의미, 형식, 기능의 관계를 검토하여 언어의 한 현상을 기술하는 것이 보다 중요하다. 본 연구는 자료분석을 토대로 한국 설화문에서 주제표현의 방식과 연속성의 정도를 살펴보았다. 측정된 구문들은 영조응, 인칭대명사, 지시대명사, 지시사 뒤에 오는 명사, 소유격을 따르는 명사, 한정적 명사. 비한정적 명사, 조건절, 모두 8개 구조들이다. 이들은 주제표현의 연속성 정도의 차이를 보여 준다. 이는 이들의 통사적 특징이외에 다른 화용상의 요인들이 작용함으로 생기는 현상이다.

  • PDF

세종 의존명사/대명사/수사 전자사전의 정보표상 구조 (The Representational Structure of Lexical Informations of Korean non-autonomous nouns in the Sejong Electronic Dictionary)

  • 방성원;호정은;김종인
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.341-347
    • /
    • 2001
  • 세종전자사전이 궁극적으로 범용전자사전을 지향한다는 점에 비추어 볼 때, 텍스트 자동 분석과 생성, 정보 검색 및 자동 번역 등에 활용될 데이터베이스로서의 전자사전은 자연 언어 어휘의 내적 구조와 기능방식에 관한 정보들, 가령 음운 통사 의미 화용적 가치와 실현 조건 등에 관한 정보들을 체계적이고도 정교하게 담고 있어야만 한다. 의존명사, 대명사, 수사 범주에 속하는 언어 단위들은 단일 명사와 구별되는 어휘 통사적 속성들을 지니며, 사전의 기술 구조에는 그 정보 값들을 체계적으로 명시화할 수 있는 정보 항목과 표상 구조가 설정되어야 한다. 가령 의존명사처럼 통사 의미적 자율성을 지니지 않는 언어 요소의 경우, 어휘 관계 정보보다는 인접하는 여타 언어 단위들과의 호응관계나 결합제약 조건들이 더 중요한 정보일 수 있다. 본 사전이 체언사전의 하위사전으로 별도로 구축되는 것은 단일어 사전에서 그러한 정보들을 효과적으로 표상하기 어렵기 때문이다. 그러나 본 사전은 실제적으로는 체언사전에 통합되어 운영된다는 점에서 이중적 지위를 누린다고 하겠다.

  • PDF