• 제목/요약/키워드: 영어 대명사

검색결과 16건 처리시간 0.021초

CRF를 이용한 대명사 참조해소 시스템 (Automated Pronoun Resolution Using CRF)

  • 김형철;서형원;김재훈;최윤수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.197-201
    • /
    • 2009
  • 이 논문은 영어 문장에서 대명사의 참조해소 시스템을 구현한다. 대명사는 문장에서 반복되는 말 대신에 사용하는 단어이다. 반복되는 말을 선행어라고 하며 대명사는 선행어보다 간결한 형식으로 사용된다. 정보검색이나 정보추출에서 대명사를 그대로 색인하여 검색하면 정확한 정보를 추출할 수 없다. 따라서 대용어가 가리키는 개체를 정확히 파악해서 이 정보를 색인하고 검색하면 정보검색, 정보추출, 질의응답의 성능을 크게 개선할 수 있다. 이 논문에서는 CRF모델을 이용해서 이용하여 영어 문서에서 대명사 참조해결 방법을 제안하고 이를 구현한다.

  • PDF

한국어-영어 대화체 번역시스템을 위한 영형 대명사 해소 (Zero Pronoun Resolution for Korean-English Spoken Language MT)

  • 박아름;지은별;홍문표
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2011년도 제23회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.98-101
    • /
    • 2011
  • 이 논문은 한-영 대화체 번역 시스템에서 영형 대명사 해소를 위한 새로운 방법론을 제시하였다. 영형 대명사는 문맥, 상황, 세상 지식으로부터 추론될 수 있는 문장에서 생략된 요소이다. 이 논문은 특히 주어-대명사 생략 현상에 대해 다루고 있는데, 그 이유는 드라마 대본이나 인스턴트 메신저 채팅과 같은 한국어 대화체에서는 매우 일반적인 현상이기 때문이다. 이 논문에서 우리는 많은 양의 지식을 요구하지 않는 간단한 방법론을 제시하였다. 평가결과 우리의 방법은 0.79의 F-measure 스코어를 달성하였고, 전체번역률의 측면에서는 약 4.1% 정도의 향상효과가 있었다.

  • PDF

조응성 정보와 중심화 이론에 기반한 영형 주어의 선행사 식별 (Antecedent Identification of Zero Subjects using Anaphoricity Information and Centering Theory)

  • 김계성;박성배;이상조
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권12호
    • /
    • pp.873-880
    • /
    • 2013
  • 본 논문은 지역적 응집성을 모델링하는 중심화 이론을 이용하여 한국어 영형대명사의 지시해결에 접근한다. 중심화 이론은 영어 대명사의 해결을 위해 널리 사용되고 있지만, 일본어, 한국어 등의 언어에서 나타나는 영형대명사 해결에 중심화의 프레임워크를 적용하는 데에는 많은 어려움이 따른다. Grosz et al.의 중심화 이론은 지시적 표현들의 비조응적 사용을 고려하지 않으므로, 문서에 나타나는 비조응적 기능의 영형 대명사가 중심화 이론을 이용한 영형대명사의 선행사 식별에 중요한 영향을 미친다. 본 논문은 이를 위해 먼저 절 간의 결속 관계를 이용하여 영형대명사, 특히 영형주어의 문장 내 조응성을 결정하고, 다음으로 중심화의 순위를 이용하여 그 영형의 선행사를 식별하는 방법을 제안한다. 실험을 통해 조응성 결정을 이용하는 제안한 방법이 이를 이용하지 않는 베이스라인 시스템보다 우수함을 알 수 있었다.

영어의 수의적 주어 현상의 인지적 양상 (A Cognitive Aspect of Optional Subjecthood in English)

  • 송홍기;문승철
    • 인지과학
    • /
    • 제18권1호
    • /
    • pp.35-56
    • /
    • 2007
  • 이 논문의 목표는 첫째, 고대, 중세, 현대 영어에 나타나는 수의적 주어 현상을 다양한 문헌에 기초하여 기술적으로 자세히 고찰하고 역사적 변화에 대한 동기를 살펴보며, 둘째, 최근 영어사 연구에서 큰 역할을 하고 있는 인지적 제약(constraints)에 기반하여 수의적 주어 현상의 역사적 변화에 대한 원리적인 설명을 하는 것이다. 영어사에서 두 유형의 주어 생략-영 주어(pro) 탈락과 등위절 주어-이 고대, 중세, 및 현대 영어에 나타났는데, 고대 영어는 풍부한 굴절 체계의 영향으로 영주어 탈락과 등위절 주어 생략이 다 같이 나타났고, 굴절이 많이 약화된 중세영어에는 여전히 이 두 현상이 나타났으나 발생정도가 점점 감소 추세였으며, 따라서 소유격과 대명사를 제외하고는 굴절이 상실된 현대 영어에서는 영주어 탈락과 등위절 주어 생략 그 자체가 거의 사라지게 되었다. 이 논문에서는 영어발달사적 관점에서 고대, 중세, 현대 영어의 주어 생략현상이 문법적 측면에서 세 가지 제약들의 위계(hierarchy) 변화로 발생하였고, 형태적 측면에서는 굴절체계의 변화로 발생하였음을 보였다.

  • PDF

양화사 구문에서의 예외적 주어-동사 수 일치 규칙 소거 (Eliminating Exceptional Subject-Verb Agreement rules in English Quantificational structure)

  • 이재일
    • 디지털융복합연구
    • /
    • 제12권12호
    • /
    • pp.529-535
    • /
    • 2014
  • 본 연구는 일반적인 영어교재에서 주어-동사 수 일치를 설명함에 있어서 예외적 규칙들과 다소간의 모호성이 존재하는 양화사 구조 구문에서 수 일치의 일관성을 설립하기 위함이다. 일관성의 부재는 문법성에 치명적 오류를 산출할 수 있다. 영어의 양화사 수 일치 구조에 있어서 일반적인 교재들에서 다루고 있는 예외적 규칙들은 불필요하다고 여겨지고 보편적인 주어-동사 수 일치 문법만으로 충분히 문제를 해결 할 수 있으며 예외적 규칙을 더하는 것은 영어의 문법성을 더욱 복잡하고 어렵게 만드는 것이다. 양화사들에 각기 내재되어 있는 양화사 고유특성들이 양화사가 대명사적으로 사용될 때에도 고유의 특성을 유지하게 되고 그 결과 양화사 구문의 주어-동사 수 일치와 연결되어 있다고 볼 수 있다. 본 연구를 통해서 양화사 구문에서의 주어-동사 수 일치와 명사-대명사의 수 일치 규칙을 접목하여 양화사 구문의 수 일치 규칙을 단순화하여 문법성을 체계화할 수 있다는 것을 확인할 수 있다.

한국어 상호 표현(Reciprocal Expressions)의 의미 상호성 술어와 배분적 양화사의 의미 기여를 중심으로 (The semantic of Korean Reiprocal Expressions)

  • 조지은;남승호;이정민
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 춘계 학술대회
    • /
    • pp.121-127
    • /
    • 2000
  • 지금까지 상호 표현(reciprocal expressions)이나 상호성(reciprocity)의 개념에 대한 연구는 영어의 'each other'를 중심으로 이뤄졌다. 그런데 한국어의 상호 대명사 '서로'는 'each other'와 달리, 그 자체로 배분성(distributivity)을 갖지 않는다. 오히려 다양한 배분 표현들과 공기함으로써 상호성을 구체화한다. 특히, 배분적 양화사는 상호 표현이 쓰인 문장에 강한 상호성(strong reciprocity)을 부여한다. 이외에도 한국어의 상호성 실현에는 함께 쓰인 술어가 중요한 역할을 한다. 우선, 술어가 대칭적(symmetric)이거나, 상호 대명사(reciprocal)'서로'를 논항으로 취하면, 문장은 일차적으로 상호성을 갖게된다. 또한, 술어가 반가법(anti-additive)함수로서의 의미 특성을 갖는 경우는, 논항이 복수 연접 명사구로 구성되었을 때, 논항을 그룹(group)으로 해석하는 것을 선호한다. 본고는 상호성 술어(reciprocated predicates)와 배분적 양화사의 의미 기여를 중심으로, 한국어 상호 표현의 다양한 의미·통사적 특징을 밝히는 것을 목표로 하며, 이를 통해 상호성의 개념이 고정적이거나 문맥에 따라, 임의로 정해지는 무질서한 것이 아니라, 함께 쓰인 배분적 양화사나 술어의 의미 특성에 따라 합성적으로(compositionally) 실현되는 것임을 보이고자 하였다.

  • PDF

문학 텍스트의 머신러닝 활용방안 연구 - 화자 지시어 분석을 위한 규칙 선별을 중심으로 - (A Study on the Application of Machine Learning in Literary Texts - Focusing on Rule Selection for Speaker Directive Analysis -)

  • 권경아;고일주;이인성
    • 문화기술의 융합
    • /
    • 제7권4호
    • /
    • pp.313-323
    • /
    • 2021
  • 본 연구는 문학 텍스트를 활용한 머신러닝 기반 가상 캐릭터(virtual character) 구현을 위해 텍스트 내의 화자 지시어가 지시하는 화자를 판별할 수 있는 규칙을 제안하는 것을 목적한다. 선행 연구에서, 본 연구자는 문학 텍스트를 기계 학습에 적용할 때, 별칭, 별명, 대명사와 같은 화자 지시어들이 특정한 분석 규칙 없이는 기계가 화자를 제대로 파악하지 못하여 학습을 제대로 수행할 수 없다는 점을 발견하였다. 본 연구는 이를 해결하는 방법으로 '화자 지시어(대명사 포함)가 지시하는 화자를 찾는 9가지 규칙'을 소개한다: 위치, 거리, 대명사, 가주어/진주어, 인용문, 화자수, 등장인물 외 지시, 복합 단어 지시, 화자명 분산이 그것이다. 문학 텍스트 내의 등장인물을 가상 캐릭터로 활용하기 위해서는 기계가 이해할 수 있는 방식으로 학습 텍스트를 제공해야 한다. 본 연구자는 본 논문을 통해 제안한 화자 찾기 규칙이 문학 텍스트를 머신러닝에 활용할 때 발생할 수 있는 시행착오를 줄이고, 원활한 학습을 수행하게 하여 질적으로 우수한 학습 결과를 산출할 수 있게 해 줄 것으로 기대한다.

영어 조응표현의 개념구조 (Conceptual Structures of Anaphoric Expressions in English)

  • 정미애
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1995년도 제7회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.300-309
    • /
    • 1995
  • 언어표현에 대한 해석은 그 구성요소들의 통사적-어휘적 구조에 덧붙여 대명사의 동일지시를 살펴야 할 필요가 있다. 조응의 분석과 조응적 선행사를 찾기 위한 효과적인 방법을 발견하는 것이 컴퓨터 언어학(computational linguistics), 특히 자연언어 이해체계(Natural Language understanding system)에 관한 연구의 중심적인 문제라고 할 수 있다. 이 논문의 목적은 영어 조응표현을 개념구조 이론(Conceptual Structure Theory)의 개념도식(conceptual graph)에 의하여 기술함으로써 단문에서뿐만 아니라 복문, 양화구문, 그리고 담화에 이르기까지 언어 전반에 걸쳐 나타나는 동일지시성(coreferenciality)을 간단하고 일관성 있게 설명하는 것이다. 이러한 조응현상을 설명하기 위하여 필자는 개념도식상의 개념을 중심개념, 직접개념, 간접개념으로 구분하고 이들이 문맥깊이 등과 더불어 동일지시성을 설명하는데 중심적 역할을 함을 보이고자 한다.

  • PDF

영어 관계대명사 That 연구 (A study of English relative pronoun That)

  • 최종욱
    • 영어어문교육
    • /
    • 제6호
    • /
    • pp.199-217
    • /
    • 2000
  • Relative pronoun that is one of the important relative pronouns but we have an impression that its scope of use has been somewhat narrowed. In the light of history of relative pronouns relative pronoun toot has the longest history of all relative pronouns and it was widely used even in Middle English and early Modem English. On The other hand, we can see that the relative use of that has been gradually weakened as the relative pronouns who and which has expanded their scope of use. It is quite natural that the scope of use of toot as a relative pronoun has been narrowed as who is mainly used in referring to person and which is mainly used in referring to things. And we can note that that is used only in restrictive clauses, not in nonrestrictive clauses, for that has a strong characteristics of relative conjunction in comparing with who and which. That as a relative pronoun still has its own weight because it can take an antecedent referring to person and thing. In particular, it is general tendency that who is used more frequently than that in the case of referring that it is not adequate for that to refer to things. In contrast, who has an advantage over that because the former originally refers only to person.

  • PDF

수능 영어 문항 유형간 응집력과 어휘정보 분석 (An Analysis of Cohesion and Word Information among English CSAT Question Types)

  • 최민주;김정렬
    • 한국콘텐츠학회논문지
    • /
    • 제17권12호
    • /
    • pp.378-385
    • /
    • 2017
  • 본 연구는 대학수학능력시험 영어영역 읽기지문의 문항 유형별 응집력과 어휘정보를 파악하기 위해 코퍼스 기반 분석을 실시하였다. 본 연구에서는 한국교육과정평가원에서 제시하는 여섯 가지의 문항유형을 세가지의 범주, 즉 맥락읽기, 세부읽기, 간접쓰기로 나누어 분석하였다. 이를 위해 처음 수능이 실시된 1994학년도부터 2017학년도까지의 수능 영어영역의 읽기지문의 코퍼스를 구축한 후, 코메트릭스 3.0을 활용하여 해당 코퍼스를 분석하여 각 문항들의 응집력과 어휘정보의 차이를 살펴보았다. 연구 결과 표층응집성 지표에서는 명사중복 측정치와 어간중복 측정치에서 통계적으로 유의미한 차이를 보였다. 연결사 지표에서는 역접의 연결사와 추가의 연결사에서 통계적으로 유의미한 차이를 보였다. 어휘정보 지표의 결과에서는 대명사의 발생정도, 습득나이 측정치, 내용어의 구체성 측정치, 심상성 측정치, 유의미성 측정치에서 통계적으로 유의미한 차이를 보였다. 이러한 문항유형간 응집력과 어휘정보 분석에 대한 정보는 교과서 집필 및 수능시험 출제에 활용될 수 있을 것이며, 학생들이 직접적으로 활용할 수 있는 읽기전략으로 활용 될 것으로 기대된다.