• Title/Summary/Keyword: 문법적 규칙

Search Result 120, Processing Time 0.034 seconds

Dynamic Syntax-Directed SGML Document Editor (동적 구문지향 SGML 문서편집기)

  • 강춘길;신경희;유재우
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04a
    • /
    • pp.71-73
    • /
    • 2000
  • 본 논문에서 다루는 SGML 문서편집기는 파서를 내포하는 구조로서, 문서편집을 위하여 DTD 가 입력되고, 입력된 DTD 는 DTD 파서에 의해 적합성을 점검하게 된다. DTD 파서는 표준규칙에 따라 DTD를 파싱하고, 결과를 편집처리에 적합한 BNF-스타일 형태로 변환된 문법 테이블을 생성한다. SGML 문서 편집은 문법테이블 정보에 따라 처리된다. 문법 테이블의 크기는 엘리먼트 선언내용 중 컨텐트 모델의 표현에 따라 결정된다. 그 중 and(&) 접속자는 엘리먼트 개수에 따라 문법수가 기하급수적으로 증가하므로 DTD 파서에 의해 처리된다면 속도나 비용면에서 비효율적이다. 이에 본 논문에서는 고정된 문법테이블을 이용하는 SGML 편집기에 and 접속자로 표현된 엘리먼트 문법을 동적으로 확정 처리할 수 있는 기능이 추가 향상된 구문지향적 SGML 문서편집기를 제시한다. 그러므로 향상된 구문지향 SGML 문서편집기는 고정된 문법을 이용한 문서편집 뿐 아니라 편집처리에 따른 변환에 능동적으로 처리할 수 있다는 특징을 갖게된다.

  • PDF

Generalization of error decision rules in a grammar checker using Korean WordNet, KorLex (명사 어휘의미망을 활용한 문법 검사기의 문맥 오류 결정 규칙 일반화)

  • So, Gil-Ja;Lee, Seung-Hee;Kwon, Hyuk-Chul
    • The KIPS Transactions:PartB
    • /
    • v.18B no.6
    • /
    • pp.405-414
    • /
    • 2011
  • Korean grammar checkers typically detect context-dependent errors by employing heuristic rules that are manually formulated by a language expert. These rules are appended each time a new error pattern is detected. However, such grammar checkers are not consistent. In order to resolve this shortcoming, we propose new method for generalizing error decision rules to detect the above errors. For this purpose, we use an existing thesaurus KorLex, which is the Korean version of Princeton WordNet. KorLex has hierarchical word senses for nouns, but does not contain any information about the relationships between cases in a sentence. Through the Tree Cut Model and the MDL(minimum description length) model based on information theory, we extract noun classes from KorLex and generalize error decision rules from these noun classes. In order to verify the accuracy of the new method in an experiment, we extracted nouns used as an object of the four predicates usually confused from a large corpus, and subsequently extracted noun classes from these nouns. We found that the number of error decision rules generalized from these noun classes has decreased to about 64.8%. In conclusion, the precision of our grammar checker exceeds that of conventional ones by 6.2%.

Parts-Of-Speech Tagging System Using Grammar Rule and Eojeol Relativity (문법 규칙과 어절 상관도를 이용한 품사 태깅 시스템)

  • Do, Mi-Sook;Choe, Ho-Seop;Ock, Cheol-Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.11a
    • /
    • pp.481-484
    • /
    • 2003
  • 본 논문에서는 문법 규칙과 어절 상관도를 이용한 품사 태깅 시스템을 제안한다. 원시 말뭉치와 품사태그 부착 말뭉치에서 중의 어절(ambiguity eojeol)의 앞뒤 어휘와 품사 정보를 파악하여 문법 규칙을 마련하였으며, 한국어의 품사와 문장성분적 요소를 고려한 7개의 어절 태그를 설정하여 이 어절 태그간의 확률값을 이용해 어절간의 상관도를 구하였다. 이러한 방법들을 이용하여 품사 태깅을 실험한 결과, 150 만 어절의 학습 말뭉치와 3 만 어절의 실험 말뭉치에서 각각 평균 92%와 91%의 정확률을 보였다.

  • PDF

Improvement of Korean Grammar Checker Using Partial Parsing based on Dependency Grammar and Disambiguation Rules (어휘적 중의성 제거 규칙과 부분 문장 분석을 이용한 한국어 문법 검사기 성능 향상)

  • So, Kil-Ja;Nam, Hyeon-Sook;Kim, Su-Nam;Won, Sang-Yeon;Kwon, Hyuck-Chul;Park, Dong-In
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.253-260
    • /
    • 1998
  • 한국어 문서에는 여러 어절을 검증해야만 처리할 수 있는 의미 오류와 문체 오류가 있다. 다수 어절 사이에 있는 오류는 부분 문장 분석을 한다. 논문에서는 의미 오류와 문체 오류를 처리할 때 어휘적 중의성 때문에 생기는 문제점을 제시하고 해결방법을 제안한다. 어휘적 중의성이란 한 단어가 두 가지 이상의 형태소 정보를 가짐을 뜻한다. 철자검사기와는 달리 문법 검사기에서는 어휘적 중의성을 제거하지 않으면 여러 가지 검사 오류가 발생한다. 이 논문에서는 의미, 문체 시스템에서 어휘적 중의성 때문에 검사 오류가 발생할 수 있는 과정을 크게 세 단계로 분류하였다. 연어 오류가 발생할 수 있는 검사단어가 어휘적 중의성을 가지면 표제어가 다른 규칙이 여러 개 존재한다. 이 때 규칙 선택 문제가 생긴다. 중의성 문제는 부분 문장분석 과정에서도 지배소와 의존소 사이의 의존관계를 정확하게 설정하기 어렵게 한다. 본 논문에서는 각 단계에서 발생한 문제를 최소화하여 문법 검사기의 성능을 향상시킨다.

  • PDF

An unsupervised learning of dependency grammar Using inside-outside probability (내부 및 외부 확률을 이용한 의존문법의 비통제 학습)

  • Chang, Du-Seong;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2000.10d
    • /
    • pp.133-137
    • /
    • 2000
  • 구문태그가 부착되지 않은 코퍼스를 사용하여 문법규칙의 확률을 훈련하는 비통제 학습(unsupervised learning) 방법의 대표적인 것이 CNF(Chomsky Normal Form)의 CFG(Context Free Grammar)를 입력으로 하는 inside-outside 알고리즘이다. 본 연구에서는 의존문법을 CNF로 변환하는 기법에 대해 논하고 의존문법을 위해 변형된 inside-outside 알고리즘을 논한다. 또한 이 알고리즘을 사용하여 실제 훈련한 결과를 보이고, 의존규칙과 구문구조 확률을 같이 사용하는 hybrid방식 구문분석기에 적용한 결과를 보인다.

  • PDF

Implementation of Case Phenomena in the Korean TCCG System (유형상속 결합범주문법에서의 격현상 구현)

  • Lee, Wha Yun;Lee, Yong-Hun
    • Annual Conference on Human and Language Technology
    • /
    • 2010.10a
    • /
    • pp.118-122
    • /
    • 2010
  • 격현상은 한국어의 여러 가지 문법현상들을 분석하고 이를 전산학적으로 구현하는데 아주 중요한 부분 중의 하나이다. 결합범주문법(Combinatory Categorial Grammar; CCG)을 이용한 대부분의 기존 연구들에서는 격조사나 보조사들에도 별도의 통사범주들을 할당한 후, 이들 조사들이 명사와 결합하여 하나의 명사구를 구성하는 것으로 조사들을 처리하고 있다. 그러나 이러한 방법들은 이론적인 문제점들뿐만 아니라 전산적 구현에 있어서도 문제점을 안고 있다. 본 논문에서는 이러한 문제점들을 해결하면서도 한국어의 격현상을 효과적으로 구현할 수 있는 방법을 소개한다. 본 논문에서 사용하려고 하는 문법공학 시스템은 한국어를 위한 유형상속 결합범주문법(Type-inherited Combinatory Categorial Grammar; TCCG)이다. 이 시스템 안에서는 명사구의 격조사나 보조사들이 별도의 통사범주들을 할당받지 않고, 명사의 굴절규칙(inflectional rules)에 의하여 명사와 결합하게 된다. 따라서 국어의 기본적인 격조사들을 효율적으로 구현할 수 있을 뿐만 아니라 보조사나 격조사 탈락현상들도 효과적으로 분석하고 구현할 수 있게 된다.

  • PDF

XSLT Plugin Editor Based on Element analysis (엘리먼트 정보 기반의 플러그인 XSLT 편집기)

  • 곽동규;조용윤;유재우
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10a
    • /
    • pp.751-753
    • /
    • 2004
  • XML 문서를 변환하는 목적은 하나의 어플리케이션에서 사용되는 XML 문서가 다른 어플리케이션에서 재 사용될 경우, 사용자에게 동일한 정보를 제공하는데 있다. 문서를 변환하기 위해서는 변환 규칙을 정의해야 한다. 변환 규칙을 생성하기 위해서는 엘리먼트의 정보를 분석하여야 하는데 한 가지 방법으로는 엘리먼트의 정보를 분석하기 어렵다. 그러므로 본 논문은 변환 규칙을 생성하기 위한 엘리먼트 분석으로 다수의 방법을 사용할 수 있는 XSLT 편집기를 제안한다. 본 시스템은 XML의 구조적 특성인 엘리먼트의 포함 관계와 플러그인 방식으로 유사 엘리먼트를 분석하여 사용자에게 제공하는 방법을 보인다. XML의 엘리먼트 구조는 엘리먼트가 표현하고 있는 정보간의 구조와 동일한 구조로 포함되어 있다. 또한, 플러그인 방식 포함할 수 있는 모듈로는 문법적 특성을 이용한 방법을 포함하거나. semantic web의 정보를 이용하는 방법을 추가할 수 있다 또한 기존의 XSLT 처리기를 내장하고 있어 XSLT 문서를 변환 XML에 적용하여 피 변환 XML 문서를 생성할 수 있다. 제안하는 시스템은 기존의 사용자가 사용 패턴을 분석하여 엘리먼트를 분석하고 변환 규칙을 기술하는 방법과 달리 유사한 엘리먼트에 대한 정보를 사용자에게 제공하는 장점이 있다.

  • PDF

A New Method for Estimating Rule Probabilities of Stochastic Context-Free Grammars (확률문맥자유문법의 규칙확률 추정을 위한 새로운 기법)

  • Byun, Seong-Chan;Ra, Dong-Yul
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.247-252
    • /
    • 1998
  • 본 논문에서는 확률문맥자유문법의 규칙확률을 추정하여 주는 새로운 알고리즘을 제시한다. 이 알고리즘은 이미 잘 알려진 인사이드-아웃사이드 알고리즘에 비하여 개념적으로 이해하기 쉽다는 장점을 가지고 있으며 속도면에서 훨씬 빠르다는 것이 실험으로 입증되었다.

  • PDF

Syntax-driven Automata Generation for Esterel (Esterel 문법구조 바탕의 오토마타 생성)

  • Lee, Chul-Woo;Kim, Chul-Joo;Yun, Jeong-Han;Han, Tai-Sook;Choe, Kwang-Moo
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.16 no.11
    • /
    • pp.1136-1140
    • /
    • 2010
  • Esterel is an imperative synchronous language and its formal semantic based on finite state machine makes it easy to perform program analyses using automata. In this paper, we propose a syntax-driven automata generation rule. Because our rule intuitively expresses syntactic structure, it is very useful for other program analyses.

Transfer Grammar Compiler Based on Conditional Unification for English-Korean Machine Translation (영-한 기계 번역에서 조건 단일화 기반 변환 문법 해석기)

  • 김남수;전현경;박영진;이용석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.198-200
    • /
    • 1998
  • 영-한 기계번역에 있어서 변환(Transfer)은 상이한 두 언어의 어순을 생성될 언어의 어순으로 결정하기 위한 변환 규칙에 의해서 영어의 구문 분석된 트리를 생성될 한국어의 구조에 맞게 재구성한다. 이러한 변환은 개발 단계 중 또는 그 후에 언어의 다양한 차이를 수용하기 위해 프로그램 수준에서 잦은 수정을 하게 된다. 이를 극복하기 위해서, 본 논문에서는 변환 문법을 이용하여 좀더 체계적이고 확장이 쉬운 문법을 이용하여 변환을 수행하고자 한다. 이를 위해 영어의 구구조 자질들을 쉽게 검사 및 탐색하면서 조건에 맞는 자질들을 나누어주는 기능을 하는 조건 단일화 연산자를 기반으로 일반적인 문맥자유문법(Context Free Grammar)을 이용한 변환 문법을 제안한다. 또한 변환 문법은 변환 문법 해석기에 의해 변환 프로그램으로 컴파일 됨을 보인다. 이러한 변환 방법은 영-한 변환에 있어서 문법 수준에서 변환 처리를 할 수 있어 변환 프로그램의 개발 및 유지보수에 많은 도움을 준다.

  • PDF