• Title/Summary/Keyword: 구문 구조

Search Result 475, Processing Time 0.029 seconds

An Abstract Grammar for XML Document Editing (XML 문서 편집을 위한 추상문법)

  • 신경희;최종명;유재우
    • Journal of KIISE:Software and Applications
    • /
    • v.30 no.3_4
    • /
    • pp.268-277
    • /
    • 2003
  • A document type definition(DTD) which defines tags for a document is a XML document grammar that defines syntactic structure of a document. An XML document keeps the rules and must be parsed to check validation. To parse XML document, the deterministic parsing method of programming language is irrelevant because it does not satisfy the definition of deterministic content model in element declaration. In this paper, we consider editing of a valid XML document in syntax-directed editing environment, and we suggest the internal storage representations of syntax in DTD and theirs algorithms. The consequence is that a syntactic structure of textual DTD is transformed into graph and table structures. The table structure of DTD is interpreted the context free grammar which has attribute values and is used in syntax-directed editor for XML. We called this the XML abstract grammar and showed generated results and examples.

A Post-Fail Softening Mechanism Using Two-level Syntactic Grammar (두 단계 구문 규칙을 이용한 후-실패 완화 기법)

  • 정한민;최승권;김영길;심철민
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.180-182
    • /
    • 1998
  • 웹 상에서의 자연어 처리 응용에 관한 연구가 활발히 진행되면서, 웹 문서에서 자주 나타나는 특징인 문장 표현에 있어서의 자유로움은 문장 처리의 기술적인 어려움을 가중시킨다. 특히, 문장 내의 부분적인 비정형적 표현이 흔히 나타남으로 인해 구문 분석이 자주 실패하게 되는데, 이에 대한 강건성 확보를 위해서 실패에 대한 복구 작업이 필요하다. 우리는 두 단계 구문 규칙을 사용하여 1 단계에서 정형적 표현의 문장들을 처리하고, 2 단계에서 구문 규칙의 제약을 완화하여 부분적인 비정형적 표현까지도 포용할 수 있도록 한다. 후-실패 완화과정에서 일관성 있게 구문 규칙을 사용함으로써 효율적인 구조적 파스 트리의 구조도 가능하게 하며, 차트의 재사용을 통해 구조적 애매성과 분석 시간의 단축을 가져온다.

  • PDF

Auto generation of a query language through visualization of XML (XML 시각화를 통한 자동 질의문 생성)

  • 송민호;이기호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.637-639
    • /
    • 2002
  • XML 문서를 효과적으로 관리하고 검색하기 위한 다양한 XML 질의 언어에 대한 연구가 활발히 수행되고 있지만 다양한 XML 질의 언어의 구문은 일반 사용자들이 숙지하는데 어려움이 있고, 또한 텍스트 형태의 XML 문서는 계층적인 구조로 되어있어 이러한 XML 문서의 구조를 알아야만 질의를 할 수 있다는 문제점이 있다. 따라서 본 논문에서는 복잡한 XML 질의어 구문과 질의 대상인 XML 문서의 구조를 동시에 시각화하고, 사용자와의 상호작용을 통해 질의문을 자동으로 생성하고자 한다. 이를 위해 본 논문에서는 다음과 같이 세 가지 컴포넌트를 기반으로 자동 질의어 생성을 위한 visual query interface를 제안하였다. 이 컴포넌트는 계층적 XML 문서 구조를 보여주는 XML structure viewer, 질의에 사용되는 연산자들을 아이콘화한 operator panel, 그리고 이 두 컴포넌트의 상호작용으로 작성된 질의 구문을 문법적으로 검사하기 위한 query statements panel로 구성된다. 이를 통해 다양한 계층적인 XML 문서의 구조와 복잡한 XML 질의 언어의 구문에 대해서 잘 모르는 초보자라 하더라도 쉽게 XML 문서 상에서 질의를 할 수 있다.

  • PDF

Syntax analysis of Korean based on CFG using Sentence Pattern Information as a constraint (문형을 제약 조건으로 하는 CFG 기반의 한국어 구문분석)

  • 이현영;황이규;배우정;이용석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.190-192
    • /
    • 1999
  • 한국어는 용언이 의미적 제약을 통해 문장을 지배하는 SOV 구조의 언어이다. 또한, 조사나 어미와 같은 기능어의 발달은 물론 관형절은 내포하는 문장이 주류를 이룬다. 따라서 한국어의 구문분석은 부착에 따른 많은 구문 모호성이 발생하게 된다. 본 논문에서는 조건단일화 기반의 CFG문법을 기술하고 문형을 구문 제약으로 하여 구문모호성을 해결하는 방안을 제시한다. 문형은 한국어의 특성을 용언의 하위범주화에 맞게 재분류한 문장의 구조적 유형을 말한다. 본 논문에서 제안하는 문형은 동사와 형용사를 구분하여 39가지로 설정하였다. 이런 문형 정보를 이용하여 관형형 어미를 갖는 용언이 최대의 정보를 가지도록 함으로써 관형절에서 발생하는 부사 및 체언구 부착의 문제가 해결된다. 또한 문형은 이중주어나 이중 목적어 문장을 처리할 수가 있어 한국어에서 발생하는 많은 구문모호성을 해결할 수 있다.

  • PDF

Syntactic Rule Compiler in Rule-based English-Korean Machine Translation (규칙 기반 영한 기계번역에서의 구문 규칙 컴파일러)

  • Kim, Sung-Dong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.1315-1317
    • /
    • 2013
  • 규칙 기반의 영한 기계번역 시스템의 구문 분석 시스템은 영어의 구문 구조를 기술하는 규칙 부분과 규칙을 적용하여 차트 파싱을 수행하는 실행 부분으로 구성된다. 구문 규칙은 문맥 자유 문법의 형식으로 기술되는데, 기술된 구문 규칙을 적용하여 파싱을 실행하는 실행 부분은 C 언어 함수로 표현되므로, 구문 규칙을 C 언어 함수로 변환해야 한다. 본 논문에서는 문맥 자유 문법 형식으로 기술된 구문 규칙을 C 언어 함수로 변환하는 도구인 구문 규칙 컴파일러를 개발하였다. 구문 규칙 컴파일러는 자동적으로 구문 규칙을 C 언어 함수로 변환함으로써 영한 기계번역 시스템의 성능 개선 과정에서 빈번하게 발생하는 구문 규칙의 생성과 수정을 용이하게 하여 번역 성능을 개선하는 작업을 지원한다.

Subtopic Mining from the View of Dependency Structure (의존 구문 구조 관점으로 본 서브토픽 마이닝)

  • Kim, Se-Jong;Lee, Jong-Hyeok
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06b
    • /
    • pp.294-296
    • /
    • 2012
  • 본 논문은 일본어 웹 문서 말뭉치로부터 의존 구문 구조 관점으로 바라본 단어들의 동시발생(co-occurrence) 정보를 사용하여 서브토픽 마이닝(subtopic mining)을 수행하는 방법론을 제안한다. 우리는 의존 구문 구조를 반영하는 간단한 패턴들을 사용하여 서브토픽들을 추출 및 생성하고, 제안한 수식을 바탕으로 순위화한다. 본 방법론은 기존의 주요 상용 검색 서비스에서 제공하는 연관 검색어 및 추천 검색어를 사용한 방법론보다 좋은 성능을 보였다.

A Study of Parsing System Implementation Using Segmentation and Argument Information (구간 분할과 논항정보를 이용한 구문분석시스템 구현에 관한 연구)

  • Park, Yong Uk;Kwon, Hyuk Chul
    • Journal of Korea Multimedia Society
    • /
    • v.16 no.3
    • /
    • pp.366-374
    • /
    • 2013
  • One of the most important problems in syntactic analysis is syntactic ambiguities. This paper proposes a parsing system and this system can reduce syntactic ambiguities by using segmentation method and argument information method. The proposed system uses morphemes for the input of syntax analysis system, and syntactic analysis system generates all possible parse trees from the given morphemes. Therefore, this system generates many syntactic ambiguity problems. We use three methods to solve these problems. First is disambiguation method in morphological analysis, second is segmentation method in syntactic analysis processing, and the last method is using argument information. Using these three methods, we can reduce many ambiguities in Korean syntactic analysis. In our experiment, our approach decreases about 53% of syntactic ambiguities.

High Speed Korean Dependency Analysis Using Cascaded Chunking (다단계 구단위화를 이용한 고속 한국어 의존구조 분석)

  • Oh, Jin-Young;Cha, Jeong-Won
    • Journal of the Korea Society for Simulation
    • /
    • v.19 no.1
    • /
    • pp.103-111
    • /
    • 2010
  • Syntactic analysis is an important step in natural language processing. However, we cannot use the syntactic analyzer in Korean for low performance and without robustness. We propose new robust, high speed and high performance Korean syntactic analyzer using CRFs. We treat a parsing problem as a labeling problem. We use a cascaded chunking for Korean parsing. We label syntactic information to each Eojeol at each step using CRFs. CRFs use part-of-speech tag and Eojeol syntactic tag features. Our experimental results using 10-fold cross validation show significant improvement in the robustness, speed and performance of long Korea sentences.

Maximally Efficient Syntactic Parsing with Minimal Resources (최소자원 최대효과의 구문분석)

  • Shin, Hyo-Pil
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.242-248
    • /
    • 1999
  • 이 논문은 지역적 동사구 분할에 바탕을 두고 서술어가 문말에 위치하는 언어에 특성에서 기인하는 속성을 반영하는 부분적 그러나 빠른 구문분석에 관해 논한다. 즉 완벽성 보다는 신속함 그리고 신뢰에 바탕을 둔 새로운 한국어 구문분석에 대해 논의한다. 기존의 문법이론 대신 한국어의 형태적 통사적 특성에 기인한, 성분들의 분할(partitions)에 의한 단위 (chunks) 분석방법을 제안한다. 근간은 동사구 장벽(VP-barrier) 알고리즘이며, 이 알고리즘은 한 문장안에서의 다양한 동사의 파생접사에 의해 형성되는 관형화, 명사화, 부사화 등의 파생구조와 내포된 동사구(인용문, 종속문 등)에 의해 형성되는 지역적 동사구내에서 그 성분들의 논리적인 분할을 구성하고 다시 그 다음 요소와 체계적으로 결합하는 관계로 확장하여 가능한 구조들을 생성한다. 다시 언어의존적인 발견적 규칙(heuristics)들을 점수화하여 가장 높은 점수의 단위구조를 적격한 구조로 선택한다. 이 방법은 하위범주화 및 의미정보를 사용하지 않는, 빠른 구문분석이 요구되는 시스템을 위해 고안되었으며, 집단적인 노력이 아닌 개인적인 노력 및 최소의 자원으로도 최대의 효과를 얻을 수 있다는데 그 의의가 있다.

  • PDF

Korean Structural Disambiguation using Adverb Information (부사 정보를 이용한 한국어 구조 중의성 해소)

  • Shin, Seung-Eun;Seo, Young-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2000.10d
    • /
    • pp.110-115
    • /
    • 2000
  • 자연 언어 처리의 구문 분석에서는 중의성 있는 결과가 많이 생성된다. 이러한 중의성을 해소하는데 어휘정보가 유용하다는 것은 잘 알려져 있으며, 이러한 어휘정보와 이를 이용한 중의성 해소에 관한 연구가 많이 이루어지고 있다. 본 논문은 한국어의 구문 구조 분석 시 부사에 의해 발생되는 중의성을 해소하기 위해 수식어 사전을 이용하여 구문 분석에서의 구조 중의성을 해소하였다. 수식어 사전의 어휘정보와 대상 말뭉치를 통해 각각의 부사에 대한 문법을 구성하고, 이를 이용하여 한국어 구문구조 분석에서 부사에 의해 발생되는 중의성을 줄일 수 있다.

  • PDF