• Title/Summary/Keyword: 구 구조 문법

Search Result 24, Processing Time 0.044 seconds

A Grammar Development Environment for Feature-based APSG (자질 기반 구 구조 문법을 위한 문법 개발 환경)

  • 심광섭;양재형
    • Journal of KIISE:Software and Applications
    • /
    • v.31 no.10
    • /
    • pp.1418-1429
    • /
    • 2004
  • This paper presents GrammE, a grammar development environment for feature-based APSG. At the stage of a grammar development, analysis are be done by interpreting the grammar under development, given in a text format, it is relatively easy to diagnose the grammar. Once developed, the grammar is compiled, by using the embedded grammar compiler, into a parser program written in $C^{++}$. The parser program can be used in various types of natural language processing systems requiring syntactic analysis. GrammE is language-independent, and so far has been used for the development of Korean and Chinese grammars.

A Higher-Order Liner Logical Translation of Relative Clause Gaps (고차선형 논리에서의 관계절 공간 번역)

  • 이소영;배민오;조문정
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10b
    • /
    • pp.404-406
    • /
    • 1998
  • 확정절 문법은 구 구조문법을 명시하는데 사용된 후 계산이론적 언어학자들이 많은 연구를 하는 분야이다. 확정절 문법은 혼절에 근거하고 있기 때문에 관계절 공간연결 파서를 구성할 때 메우개-공간 의존을 자연스럽게 설명할 수 없다. 본 논문에서는 메우개-공간 의존을 처리할 수 있는 일반 구 구조문법 GPSG의 특성에 대해서 논하고 일반 구 구조 문법을 논리 문법으로 확장할 수 있는 방법에 대해서 기술하였다. [7]에서는 메우개-공간 의존을 설명하기 위해서 직관적 논리를 이용하였다. 여기에서는[7]의 직관적 논리 문법의 한계에 대해서 논하였다. 또 [5]에서는 일차 선형 논리를 이용하였는데, 이는 공간연결 파서로 자연어 문장을 논리식으로 번역하는데 사용될 수 없다. 따라서 본 연구에서는 고차 선형 논리문법을 이용하여 자연어 파서를 구성하였다.

통합지식표현에 의한 자연언어처리기법 : 한글 구 구조문법

  • Jeong, Hui-Seong
    • ETRI Journal
    • /
    • v.11 no.1
    • /
    • pp.59-74
    • /
    • 1989
  • 컴퓨터에 의한 종래의 자연언어처리에서는 보통 생성과 인식과정에서 서로 다른 지식 표현과 프로그램을 쓰고, 음운처리, 형태처리, 통어처리, 의미처리로 분리되어 있는 것이 통례이다. 이것을 분할접근법(devide and conguer approach)이라 부른다. 분할접근법은 인간의 언어처리에 있어서의 생성, 인식간의 체계적 관계를 포착하지 못할 뿐 아니라 공학적으로도 갖가지의 문제를 안고 있다. 이 논문은 인간의 언어 생성과 인식과정의 관계를 설명하기 위하여 동일 심적 프로그램이 생성과정과 인식과정을 동시에 제어하고 있다는 가설에 선다. 이 가설을 취하는 것은 생성과 인식의 프로그램과 문법을 각각 통합하고 음운처리, 형태처리, 통어처리, 의미처리를 동시에 행해야 한다는 것을 의미한다. 이것을 통합접근법(unifying approach)이라 부른다. 통합 접근법은 예를 들어 구 구조문법 (Pharase Structure Grammar)과 단일화 (unification)에 의해서 실현할 수 있다. 구 구조 문법을 이용하여 음운정보, 형태정보, 구문정보, 의미정보를 동일의 구조중에 표현할 수 있고 그 위에 이들의 정보표현을 모두 단일화에 의해 동시에 처리할 수 있다. 단일화는 입출력의 방향을 제한하지 않으므로 생성.인식 양쪽의 문법을 얻을 수 있다. 또 단일화되는 패턴에 충족 가능한 조건을 부여함에 따라 패턴에 다양한 정보를 갖게 할 수 있으므로 처리상의 일반성을 파악할 수 있으며 처리 효율을 확보할 수 있다. 이 논문에서는 통합접근법을 도입한 한글기술문법 : KPSG(Korean Phrase Structure Grammer)의 선진성에 대해서 논의하고 있다.

  • PDF

Shallow Parsing on Grammatical Relations in Korean Sentences (한국어 문법관계에 대한 부분구문 분석)

  • Lee, Song-Wook;Seo, Jung-Yun
    • Journal of KIISE:Software and Applications
    • /
    • v.32 no.10
    • /
    • pp.984-989
    • /
    • 2005
  • This study aims to identify grammatical relations (GRs) in Korean sentences. The key task is to find the GRs in sentences in terms of such GR categories as subject, object, and adverbial. To overcome this problem, we are fared with the many ambiguities. We propose a statistical model, which resolves the grammatical relational ambiguity first, and then finds correct noun phrases (NPs) arguments of given verb phrases (VP) by using the probabilities of the GRs given NPs and VPs in sentences. The proposed model uses the characteristics of the Korean language such as distance, no-crossing and case property. We attempt to estimate the probabilities of GR given an NP and a VP with Support Vector Machines (SVM) classifiers. Through an experiment with a tree and GR tagged corpus for training the model, we achieved an overall accuracy of $84.8\%,\;94.1\%,\;and\;84.8\%$ in identifying subject, object, and adverbial relations in sentences, respectively.

The Language Faculty in Cognitive System (인지체계속의 언어기능)

  • Moon, Kyung-Hwan
    • Annual Conference on Human and Language Technology
    • /
    • 1989.10a
    • /
    • pp.61-64
    • /
    • 1989
  • 언어 연구에 관한 방법론은 단위구조적(modular) 접근방법과 총체론적(holistic) 접근방법으로 대별될 수 있다. 전자는 인지체계가 독자적 인지단위로 나뉘어져 있으며 그 중 하나가 언어기능임을 가정하고 있다. 즉 언어는 언어기능과 여타 인지단위로 상호작용함으로써 성립된다고 가정하는 것이다. 이에 비해 후자는 언어가 총체로서의 인지체계의 소산임을 가정하며, 따라서 언어기능이란 존재를 부정한다. 이러한 총체론적 언어이론에서는 신체의 구조가 보이는 단위구 조성과 심적 수조의 총체성 사이의 "불균형"을 어떻게 설명할 것인가의 의문이 제기된다. 이 글에서는 단위 구조설의 내용이 간략히 소개된다. 언어기능을 이루고 있는 보편문법 및 개별문법의 개념이 논의되는 가운데, 과거에도 그랬고 현재에도 계속 논란의 대상이 되고 있는 이른바 "문법성"의 개념이 중점적으로 다루어진다. 문법성과 허용성이 별개의 개념일진대, 문법적이면서도 허용되지 않은 문장이 있을 수 있고, 비문법적이면서도 허용되는 문장도 있을 수 있어야 한다. 이 후자의 경우도 실제로 존재함이 보여질 것이다.

  • PDF

A Clustering Method using Dependency Structure and Part-Of-Speech(POS) for Japanese-English Statistical Machine Translation (일영 통계기계번역에서 의존문법 문장 구조와 품사 정보를 사용한 클러스터링 기법)

  • Kim, Han-Kyong;Na, Hwi-Dong;Lee, Jin-Ji;Lee, Jong-Hyeok
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.15 no.12
    • /
    • pp.993-997
    • /
    • 2009
  • Clustering is well known method and that can be used in statistical machine translation. In this paper we propose a corpus clustering method using syntactic structure and POS information of dependency grammar. And using this cluster language model as additional feature to phrased-based statistical machine translation system to improve translation Quality.

한글 구 구조문법(KPSG):단일화 문법의 형식화에 의한 국어의 문법계산

  • Jeong, Hui-Seong
    • ETRI Journal
    • /
    • v.11 no.2
    • /
    • pp.150-176
    • /
    • 1989
  • 인간과 컴퓨터의 대화(interaction)에 있어서 가능하다면 인간이 쓰는 언어로 인간이 원하고자 하는 소정의 작업을 지시하고 그 출력을 제공받을 수 없을까하는 목표를 두고 세계각국이 모국어의 컴퓨터처리 이론 및 알고리즘개발에 열중하고 있다. 이 논문은 우리의 국어인 한글을 컴퓨터가 처리하는 지적처리를 목표로, 연구중인 한글 이해 시스팀의 구축을 위한 이론과 그 처리 알고리즘에 대해서 논하고 있다. 구체적으로는 최신의 이론언어학의 문법이론을 도입하여 국어의 언어현상에 대한 형식화 모델을 제시하고 있다. 우리의 모델은 각각의 이질적인 언어현상에 대한 지식을 통일적 지식표현과 그 이용법을 체계적으로 기술하고 있다. 그 결과 우리의 접근법이 세계 어느 언어권의 형식화 수준보다 선진하고 있음을 제시한다.

  • PDF

Korean Syntax Analysis Using Sentence Pattern Information (문형 정보를 이용한 한국어 구문 분석)

  • Han, Yong-Gi;Hwang, Yi-Gyu;Lee, Yong-Seok
    • Annual Conference on Human and Language Technology
    • /
    • 1995.10a
    • /
    • pp.23-29
    • /
    • 1995
  • 대부분의 한국어 구문 분석은 용언과 명사구 사이의 하위범주화 정보를 이용하여 용언에 대한 명사구의 문법적 역할을 밝히는 방향으로 구문 분석을 시도하였다. 여기에 이용된 용언의 하위 범주화 정보가 단지 자릿수 서술어나 형용사, 자동사, 타동사 등으로 분류하는 수준이었기 때문에 구문 모호성이 많이 발생하고 틀린 문장이 구문적으로 옳기 때문에 옳은 문장으로 인식되는 경우가 발생하였다. 이러한 문제점을 해결하기 위하여 본 논문에서는 한국어의 용언에 따른 문장 형태(문형)를 세분류하고 문장에 필수적으로 나타나는 명사구(NP[case])와 수의적으로 나타나는 명사구(NP[case])를 분류하여 분석을 시도하였다. 확장된 PATR II로 문법을 기술하여 동적인 파싱을 쉽게 제어할 수 있도록 하였다. 문형 정보는 한국어의 기본 구조를 자연스럽게 표현할 수 있기 때문에 그 자체를 기계번역을 위한 한국어 문법으로 설정하는 것이 타당하다고 생각된다.

  • PDF

An Unification Methodology in the Unification-based Grammar Formalisms (단일화중심 문법론에서의 단일화 방법)

  • 손덕진
    • Korean Journal of Cognitive Science
    • /
    • v.2 no.1
    • /
    • pp.15-32
    • /
    • 1990
  • In the area of natural language processing, a lot of unification-based grammar formalisms have been issued and are highlighted. The core of the formalisms is an unification of feature stutures. But few formal unification methodologies have been developed. Therfore, implementers of the formalisms could not help adopting an ad hoc design strategy for the unification module. In this paper, we suggest an efficient unification methodology using FUL, a programming language whic supports the unification. For the exeample, we will trace the unification processes in LFG and HPSG, the representative unification-based grammar formalisms, with FUL.

Combinatory Categorial Grammar and Parsing (결합범주문법과 구문분석)

  • Cho, Hyung-Joon;Park, Jong-C.
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.223-230
    • /
    • 1999
  • 본 논문에서는 결합범주문법으로 한국어를 처리할 때 구문분석과정에서 복잡도를 높이는 역할을 하는 spurious ambiguity와 구조적 모호성이 있는 명사구 접속에 대해서 논한다. 통사적 처리와 의미적 처리가 동시에 수행되는 결합범주문법의 특징을 사용해서 spurious ambiguity로 인해 발생하는 복잡도를 줄이는 방안을 제시하고 접속항에서 접속의 중심이 되는 명사들 간의 공기유사도를 이용해서 접속항 선정에서 발생하는 복잡도와 오분석을 줄이는 방안을 제시한 뒤 이의 개선방안을 논의한다.

  • PDF