• 제목/요약/키워드: 문법적 규칙

검색결과 120건 처리시간 0.032초

양화사 구문에서의 예외적 주어-동사 수 일치 규칙 소거 (Eliminating Exceptional Subject-Verb Agreement rules in English Quantificational structure)

  • 이재일
    • 디지털융복합연구
    • /
    • 제12권12호
    • /
    • pp.529-535
    • /
    • 2014
  • 본 연구는 일반적인 영어교재에서 주어-동사 수 일치를 설명함에 있어서 예외적 규칙들과 다소간의 모호성이 존재하는 양화사 구조 구문에서 수 일치의 일관성을 설립하기 위함이다. 일관성의 부재는 문법성에 치명적 오류를 산출할 수 있다. 영어의 양화사 수 일치 구조에 있어서 일반적인 교재들에서 다루고 있는 예외적 규칙들은 불필요하다고 여겨지고 보편적인 주어-동사 수 일치 문법만으로 충분히 문제를 해결 할 수 있으며 예외적 규칙을 더하는 것은 영어의 문법성을 더욱 복잡하고 어렵게 만드는 것이다. 양화사들에 각기 내재되어 있는 양화사 고유특성들이 양화사가 대명사적으로 사용될 때에도 고유의 특성을 유지하게 되고 그 결과 양화사 구문의 주어-동사 수 일치와 연결되어 있다고 볼 수 있다. 본 연구를 통해서 양화사 구문에서의 주어-동사 수 일치와 명사-대명사의 수 일치 규칙을 접목하여 양화사 구문의 수 일치 규칙을 단순화하여 문법성을 체계화할 수 있다는 것을 확인할 수 있다.

규칙 기반 학습에 의한 한국어의 기반 명사구 인식 (Base Noun Phrase Recognition in Korean using Rule-based Learning)

  • 양재형
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권10호
    • /
    • pp.1062-1071
    • /
    • 2000
  • 한국어의 기반 명사구, 즉 비재귀적인 단순 명사구를 인식하는 비통계적인 규칙 기반 학습 기법을 제안한다. 학습 말뭉치에 기반 명사구에 대한 초기 예측이 표시되어 있고 목표 말뭉치에는 올바른 기반 명사구가 태그(tag)의 형식으로 표시되어 있다면, 규칙 기반 학습은 먼저 인접한 주위 형태소들의 다양한 문법적 정보를 나타내는 규칙 템플릿을 이용하여 기반 명사구 태그를 수정하는 규칙 후보들을 생성해 내고, 이 후보들 가운데 학습 말뭉치를 목표 말뭉치에 가장 가깝게 변환하는 일련의 규칙들을 차례로 얻어낸다. 국어정보베이스의 15만 단어 규모의 트리 태그 부착 말뭉치를 이용한 실험 결과 386개의 변환 규칙을 얻었으며, 이를 이용하여 90% 이상의 높은 기반 명사구 인식 정확도를 얻을 수 있다.

  • PDF

코퍼스로부터 구문 분석을 위한 사전 구성 (A Dictionary Composition for Syntactic Analyzer from Corpus)

  • 정민수;정규철;박기홍
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.159-161
    • /
    • 1998
  • 한글은 중심어 후행성과 어순의 자유성, 격을 결정하는 조사의 생략 등으로 인해 영어권에서 연구되어진 변형 생성 문법이나 어휘 함수 문법, 구구조문법류 등이 적용되기 어려운 문제점을 가지고 있고 관형적인 표현이 많아 구문 규칙 만으론 분석하기 쉽지 않기 때문에 사전에 의존해야 하는 경우가 많으므로 이에 적합한, 사전을 구성하고자 한다. 그러나 기존의 태그와 키워드만으로 구성된 사전만으로 어려운 점이 많고, 이 때문에 문법 규칙을 같이 적용하게 되는데 이 규칙을 보통 알고리즘을 이나 수작업을 통해 사전으로 구성하므로 정확성도 떨어진다. 저자는 이 과정을 코퍼스를 통해 구성하여 시간을 줄이고 결합 정보 또한 보다 견고하게 구성하기 위해 통계 정보-코퍼스 내에서 결합이 사용된 빈도-에 따라 순위를 결정할 수 있도록 구성하였다. 이를 보다 확장하여 구문분석 시에도 활용할 수 있도록 분석된 단어간의 결합 정보와 그 결합이 사용된 빈도를 포함하여 구문 결합 정보 사전을 구성하고자 한다. 이는 기존의 의존 문법이나 구문 관계를 이용하여 구문분석을 할 경우 올바른 트리의 결합 관계를 검색할 때 쓰여질 수 있다.

  • PDF

기계 번역을 위한 문법 기술 언어의 확장 (An Extension of Grammar Writing Language for Machine Translation)

  • 심철민;최승권;여상화
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.171-173
    • /
    • 1998
  • 변환 방식의 기계 번역 시스템에서 구조 변환은 번역의 품질을 결정하는 중요한 요소이다. 각 번역 시스템들은 이러한 구조 변환을 수행하기 위해 특별한 기법을 사용한다. 구조 변환을 수행하는 방안으로는 어휘 사전에 기술된 구조 변환 정보를 이용하는 방법, 변환 엔진에 언어 현상별 구조 변환 규칙을 프로그래밍하는 방법, 스크립트 언어를 이용하여 구조 변환 규칙을 기술하는 방법이 있다. 이 논문에서는 스크립트 형식의 범용 문법 기술 언어(Grammar Writing Language)를 제안한다. 이 논문에서 제안하는 문법 기술 언어는 규칙 기술을 용이하게 하기 위해 다양한 연산자와 기본 함수를 제공하며, 그 적용 대상에 따라 컴파일러 버전과 인터프리터 버전을 선택적으로 사용할 수 있다. 문법 기술 언어는 영한 기계번역의 변환 모듈뿐만 아니라 한영 변환 등의 트리 구조 변환을 요하는 다양한 응용 분야에 활용할 수 있다.

  • PDF

수식 속성 문법 단순화에 대한 연구 (A Research on the Simplification of the Expression Attribute Grammar)

  • 정용주
    • 한국멀티미디어학회논문지
    • /
    • 제14권2호
    • /
    • pp.282-287
    • /
    • 2011
  • 속성문법은 각 구문규칙에 의미론을 추가한 문법체계이다. 그러나 이 속성문법은 그 추가적인 규칙들 때문에 구성과 이해의 어려움이 있다. 대부분 속성 문법에서 그 규모가 크고 복잡하기 때문에 규모의 수가 작고 단순하면 좋을 것이다. 그래서 본 논문에서는 LR 파싱을 할 때 수식을 위한 속성문법의 규모를 줄일 수 있는 방법을 연구하였다. 이것은 수식의 종류를 고려한 방식이다. 즉 수식의 종류들 사이의 의미적 포함관계를 성립시키면 보다 단순하고 작은 규모의 속성 문법으로 구성될 수 있음을 보여준다.

확장한 어휘적 중의성 제거 규칙에 따른 부분 문장 분석에 기반한 한국어 문법 검사기 (A Korean Grammar Chacker Founded on Expanded Lexical Disambiguation Rule and Partial Parsing)

  • 박수호;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.516-522
    • /
    • 2001
  • 본 논문에서는 한국어 형태소 분석기가 처리할 수 없는 어휘적 중의성 해결을 위한 방법으로 부분 문장 분석 기법을 연구한다. 부분 문장 분석 기법의 신뢰도를 높이기 위해서 말뭉치를 이용한 데이터를 통해 학습한 경험적 규칙을 이용한다. 학습한 경험적 규칙을 오류 유형에 따라 확장하고 전문화하여 축적된 연구결과를 지식 베이스로 삼아 한국어 맞춤법 및 문법 검사기에서 사용하는 부분 문장 분석기의 성능을 향상시킨다. 본 논문에서 사용한 확장하고 전문화한 지식 베이스는 말뭉치에서 얻은 경험적 규칙을 기반으로 한다. 이 경험적 규칙은 언어적 지식을 기반으로 한다.

  • PDF

인공 문법을 사용한 암묵 학습: EPAM IV를 사용한 모사 (Implicit Learning with Artificial Grammar : Simulations using EPAM IV)

  • 정혜선
    • 인지과학
    • /
    • 제14권1호
    • /
    • pp.1-9
    • /
    • 2003
  • 본 연구에서는 EPAM(Elementary Perceiver and Memorizer) Ⅳ를 사용하여 인공 문법이 사용된 암묵적 학습에서의 인간 수행을 모사하였다. 암묵 학습(implicit learning) 과제에서 참가자들은 인공 문법(rtificial grammar)을 사용해 만들어진 '문법적' 문자열과 무선적으로 만들어진 '비문법적' 문자열을 학습하였는데, 이 때 비문법적 문자열보다 문법적 문자열의 학습이 더 우수하였다. 또한 참가자들은 이전에 본 적이 없었던 새로운 문자열에 대해서도 그 문법성을 판단할 수 있었다. 단순 기억 시스템인 EPAM Ⅳ에 항목 내 군집화(within-item chunking) 기능을 추가하여 암묵 학습 과제에서의 인간수행을 모사한 결과, EPAM Ⅳ 또한 무선적인 문자열보다 문법적인 문자열을 보다 잘 학습하였고, 비문법적 문자열과 문법적 문자열을 구별할 수 있었다. 이러한 결과는 인공 문법을 사용한 암묵 학습 과제에서의 수행이 규칙 추상화보다는 군집화(chunking)에 근거한 재인 기억을 바탕으로 이루어짐을 시사한다.

  • PDF

공간 파서의 자동 생성 시스템에 대한 구현 (Implementation of a Spatial Parser generator)

  • 정석태;정성태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.202-204
    • /
    • 2001
  • 본 논문에서는 GUI(Graphical User Interface)를 사용하여 사용자가 상호 작용적으로 도형 언어(visual language)의 문법을 기술함으로서 자동으로 공간 파서를 생성하는 공간 파서 생성기 SPG(Spatial falser Generator)의 구현에 대하여 논한다. 본 시스템의 장점은 다음과 같다. (1) 사용자가 도형 언어의 문법을 정의하고 실제로 파싱하고 싶은 도형 언어를 입력하는데 사용되는 도형 에디터를 가지고 있다. (2) 사용자가 도형을 이용하여 대략적인 문법을 자동으로 생성한 뒤, 수정하여 최종적인 문법을 정의하도록 한다. (3) 제약 해소기(Constraint solver)를 가지고 있어서 파싱된 도형 언어들이 그 생성 규칙에 쓰여져 있는 제약을 유지한다.

  • PDF

선택 제약 명사의 의미 범주 정보를 이용한 용언의 문맥 의존 오류 검사 및 교정 (The Detection and Correction of Context Dependent Errors of The Predicate using Noun Classes of Selectional Restrictions)

  • 소길자;권혁철
    • 한국정보통신학회논문지
    • /
    • 제18권1호
    • /
    • pp.25-31
    • /
    • 2014
  • 현재 실용화된 국내 문법 검사기는 경험적으로 구축된 오류 결정 규칙을 이용해 주위의 문맥을 보고 문법 오류를 판단하는 문맥 의존 오류를 처리하고 있다. 그러나 기존 문법 검사기의 오류 결정 규칙은 어휘 수준으로 구축되어 있어 검사기의 재현율이 낮다. 따라서 어휘대신 어휘 범주 정보를 사용하여 오류 결정 규칙을 일반화할 필요가 있다. 본 논문에서는 검사단어가 용언일 때 선택 제약 명사의 의미 범주를 국내에서 개발된 어휘의미망 KorLex에서 TCM과 MDL을 이용해 추출하고 추출된 의미 범주를 이용해 용언의 오류 결정 규칙을 일반화하는 방법을 제안한다.

통사적 제약규칙에 기반을 둔 의존문법 구문 분석의 성능 향상 (Performance Improvement of Dependency Parser using Syntactic Constraint Rules)

  • 남웅;김혜미;권혁철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 춘계학술발표대회
    • /
    • pp.353-355
    • /
    • 2013
  • 한국어는 어근의 형태가 변하는 굴절어인 영어와 달리, 한 어절이 어근과 접사가 결합하여 각자 고유한 의미를 지닌다. 이 때문에 하나의 어절에 대한 형태소 분석 후보가 여러 개가 나올 수 있어 구문 분석을 더욱 어렵게 만든다. 본 논문에서는 한국어의 통사적 특성에 적합한 의존문법을 이용하여 구분 분석을 수행한다. 모든 형태소 분석 후보에 의존관계를 부여하고 통사적 제약규칙을 통해 의존관계를 줄여나간다. 특히, 기존의 통사적 제약규칙에 형용사의 결합정보와 논항정보를 이용한 통사적 제약규칙을 추가하여 생성 가능한 의존관계의 수를 줄인다.