• Title/Summary/Keyword: 구문복잡성

Search Result 48, Processing Time 0.029 seconds

말뭉치를 이용한 형태소 분석 단계에서의 중의성 해결에 관한 연구

  • Kim, Gyeong-Seo;Kim, Dae-Cheol;Jeong, Gang-Seok;Song, Man-Seok
    • Annual Conference on Human and Language Technology
    • /
    • 1991.10a
    • /
    • pp.36-43
    • /
    • 1991
  • 자연 언어 처리의 효율성은 대량의 정보를 담고 있는 사전을 잘 구성하는 데 있다. 사전을 잘 이용하기 위해서는 입력 어절에 대한 정확한 표제어(원형)를 효과적으로 찾아야한다. 입력 어절에 대한 표제어를 찾는 역할을 하는 형태소 분석기는 한 어절의 정보만 이용하기 때문에 입력 어절을 두 가지 이상의 표제어로 해석할 수 있다. 연세 대학교 사전편찬실이 갖고 있는 연세 말뭉치 I 에 대해 10% 이상의 어절이 두가지 이상으로 분석되는 중의성을 가진다. 이렇게 중의성을 가지는 어절이 그대로 구문 구조 분석기에 전달되면 중의성올 해결하기 위해 구운 구조 분석기의 처리 과정이 복잡해진다. 본 논문은 표제어의 중의성을 보이는 어절을 구문 구조 분석기에게 전달하기 전에 형태소 분석기와 구문 구조 분석기 사이에서 정확한 표제어를 찾는 방법을 제안한다.

  • PDF

A Comparative Analysis of the Word Depth Appearing in Representations Used in the Definitions of Mathematical Terms and Word Problem in Elementary School Mathematics Textbook (초등 수학 교과서의 수학 용어 정의 및 문장제에 사용된 표현의 문장 복잡성 비교 분석)

  • Kang, Yunji;Paik, Suckyoon
    • Journal of Elementary Mathematics Education in Korea
    • /
    • v.24 no.2
    • /
    • pp.231-257
    • /
    • 2020
  • As the main mathematical concepts are presented and expressed in various ways through textbooks during the teaching and learning process, it is necessary to look at the representations used in elementary math textbooks to find effective guidance. This study analyzed sentences used in the definition of mathematical terms and unit assessments of current elementary mathematics textbooks according to word depth (Yngve, 1960) from a syntactic perspective. As a result of the analysis, it could be seen that the sentences in textbook were generally concise, the word depth was lower, and the sentence structure and form were different depending on the individual characteristics of each term. Also, the sentences in the lower grade textbooks were more easily constructed, and the sentences of the term definition were more complex than the sentences of the unit assessments. Efforts should be made to help learners learn mathematical concepts, such as clarifying sentences in textbooks, presenting visual materials together, and providing additional explanations to suit the level of individual learners.

The Relationship between Syntactic Complexity Indices and Scores on Language Use in the Analytic Rating Scale (통사적 복잡성과 분석적 척도의 언어 사용 점수간의 관계 탐색)

  • Young-Ju Lee
    • The Journal of the Convergence on Culture Technology
    • /
    • v.9 no.5
    • /
    • pp.229-235
    • /
    • 2023
  • This study investigates the relationship between syntactic complexity indices and scores on language use in Jacobs et al.(1981)' analytic rating scale. Syntactic complexity indices obtained from TAASSC program and 440 essays written by EFL students from the ICNALE corpus were analyzed. Specifically, this study explores the relationship between scores on language use and Lu(2011)'s traditional syntactic complexity indices, phrasal complexity indices, and clausal complexity indices, respectively. Results of the stepwise regression analysis showed that phrasal complexity indices turned out to be the best predictor of scores on language use, although the variance in scores on language use was relatively small, compared with the previous study. Implications of the findings of the current study for writing instruction (i.e., syntactic structures at the phrase level) were also discussed.

Combinatory Categorial Grammar and Parsing (결합범주문법과 구문분석)

  • Cho, Hyung-Joon;Park, Jong-C.
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.223-230
    • /
    • 1999
  • 본 논문에서는 결합범주문법으로 한국어를 처리할 때 구문분석과정에서 복잡도를 높이는 역할을 하는 spurious ambiguity와 구조적 모호성이 있는 명사구 접속에 대해서 논한다. 통사적 처리와 의미적 처리가 동시에 수행되는 결합범주문법의 특징을 사용해서 spurious ambiguity로 인해 발생하는 복잡도를 줄이는 방안을 제시하고 접속항에서 접속의 중심이 되는 명사들 간의 공기유사도를 이용해서 접속항 선정에서 발생하는 복잡도와 오분석을 줄이는 방안을 제시한 뒤 이의 개선방안을 논의한다.

  • PDF

Eliminating Exceptional Subject-Verb Agreement rules in English Quantificational structure (양화사 구문에서의 예외적 주어-동사 수 일치 규칙 소거)

  • Yi, Jae Il
    • Journal of Digital Convergence
    • /
    • v.12 no.12
    • /
    • pp.529-535
    • /
    • 2014
  • This study is to establish the consistency of Subject-Verb agreement in quantifier phrase. Absence of consistency in English grammar is critical to the grammaticality. We focused on the grammar part, specifically, S-V agreement rule in quantifier phrase. We believe the existence of exceptional rules in quantifier S-V structure is not necessary as the basic grammar rule on S-V agreement is sufficient enough and adding exceptional rules just make it more difficult and confusing. We argue specific features indwelt in each quantifier are linked when quantifiers are used pronominally and the ${\pm}$feature plays an important role in quantifier S-V agreement structure. This study shows the solution to eliminate the ungrammaticality in typical English text books by simplifying quantifier S-V agreement to make it solid and systematic.

Two-Level Clausal Segmentation Algorithm using Sense Information (의미 정보를 이용한 이단계 단문 분할 알고리즘)

  • Park, Hyun-Jae;Lee, Su-Seon;Woo, Yo-Seop
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.237-241
    • /
    • 1999
  • 단문 분할은 한 문장에 중심어인 용언이 복수개인 경우 용언을 중심으로 문장을 나누는 방법이다. 기존의 방법은 정형화된 문장의 경우 효율적인 결과를 얻을 수 있으나 구문적으로 복잡한 문장인 경우는 한계를 보였다. 본 논문에서는 이러한 한계를 극복하기 위해 구문 정보의 단문 분할이 아닌 의미 정보를 활용하여 복잡한 문장을 효율적으로 단문으로 분할하는 방법을 제안한다. 정형화된 문장의 경우와 달리 일상적인 문장은 문장의 구조적 애매성이나 조사의 생략 등이 빈번하므로 의미 수준에서의 단문 분할이 필요하다. 본 논문에서는 의미 영역에서 단문 분할의 할 경우 기존의 방법들의 애매성을 해소할 수 있다는 점을 보인다. 이를 위해, 먼저 하위범주화 사전과 시소러스의 의미 정보를 이용하여 용언과 보어 성분간의 의존구조를 1차적으로 작성하고 이후 구문적인 정보와 기타 문법적인 지식을 사용하여 기타 성분을 의존구조에 점진적으로 포함시켜가는 이단계 단문 분할 알고리즘을 제안한다. 제안된 이단계 단문 분할 방법의 유용성을 보이기 위해 ETRI-KONAN의 말뭉치 중 20,000문장을 반 자동적인 방법으로 술어와 보어 성분간의 의존구조를 태깅한 후 본 논문에서 제안한 방법과 비교하는 실험을 수행한다.

  • PDF

Design and Implementation of a syntax-directed graphic editor for XTM (XTM을 위한 구문지향 그래픽 편집기의 설계와 구현)

  • Park Young-Jo;Park Ho-Byung;Cho Yong-Yoon;Yoo Chae-Woo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.11a
    • /
    • pp.967-970
    • /
    • 2004
  • 웹에는 많은 자원들과 정보들이 존재한다. XTM은 Topic, Association, Occurrence등의 태그를 활용하여 웹상의 자원들과 정보를 정의한다. XTM을 구성하는 태그는 간단한 반면에 자원과 정보를 표현하기 위해서 많은 수의 태그가 사용된다. 사용되는 태그 구조의 복잡성 때문에 사용자가 손쉽게 태그를 정의하고 사용할 수 있는 편집기가 필요하다. 본 논문은 XTM의 편집을 용이하게 하기 위해 문법에 올바른 그래픽 요소들로 표현하는 구문지향 그래픽 편집기를 설계하고 구현한다. 사용자가 XTM의 문법을 알지 못하거나 미숙한 경우에 XTM 문법상의 오류를 가진 문서를 생성할 수 있다. 이러한 문법상의 오류에 대해서 본 논문에서 제안한 편집기는 구문상의 올바른 요소를 편집 후보 집합으로 사용자에게 제시하고, 사용자는 제시하는 편집 후보 집합 중에서 올바른 요소 항목을 선택하여 편집을 수행할 수 있다. 또한, XTM의 복잡한 구조를 그래픽 형태로 표현하고 사용자는 표현된 그래픽 구조에서 편집한다. 따라서, 사용자는 텍스트기반의 편집기에 비해서 손쉽게 전체 구조를 파악할 수 있으며 편리하고 정확하게 XTM 문서를 생성할 수 있다.

  • PDF

Generalized LR Parser with Conditional Action Model(CAM) using Surface Phrasal Types (표층 구문 타입을 사용한 조건부 연산 모델의 일반화 LR 파서)

  • 곽용재;박소영;황영숙;정후중;이상주;임해창
    • Journal of KIISE:Software and Applications
    • /
    • v.30 no.1_2
    • /
    • pp.81-92
    • /
    • 2003
  • Generalized LR parsing is one of the enhanced LR parsing methods so that it overcome the limit of one-way linear stack of the traditional LR parser using graph-structured stack, and it has been playing an important role of a firm starting point to generate other variations for NL parsing equipped with various mechanisms. In this paper, we propose a conditional Action Model that can solve the problems of conventional probabilistic GLR methods. Previous probabilistic GLR parsers have used relatively limited contextual information for disambiguation due to the high complexity of internal GLR stack. Our proposed model uses Surface Phrasal Types representing the structural characteristics of the parse for its additional contextual information, so that more specified structural preferences can be reflected into the parser. Experimental results show that our GLR parser with the proposed Conditional Action Model outperforms the previous methods by about 6-7% without any lexical information, and our model can utilize the rich stack information for syntactic disambiguation of probabilistic LR parser.

An Abstraction Method for State Minimization based on Syntactic and Semantic Patterns in the Execution Space of Real-Time Systems (실시간 시스템의 실행 공간상에서 구문 및 의미패턴에 기반한 상태 최소화를 위한 추상화 방법)

  • 박지연;조기환;이문근
    • Journal of KIISE:Software and Applications
    • /
    • v.30 no.1_2
    • /
    • pp.103-116
    • /
    • 2003
  • States explosion due to composition of spaces of data, temporal, and locational values is one of the well-known critical problems which cause difficulty in understanding and analysing real-time systems specified with state-based formal methods. In order to overcome this problem, this paper presents an abstraction method for state minimization based on an abstraction in system specification and an abstraction in system execution. The first is named the syntactic in system specification and an abstraction in system execution. The first is named the syntactic abstraction, through which the patterns of the unconditionally internalized computation and the repetition and selection structures are abstracted. The latter is named the semantic abstraction, through which the patterns of the execution space represented with data. Through the abstractions, the components of a system in specification and execution model is hierarchically organized. The system can be analyzed briefly in the upper level in an skeleton manner with low complexity. The system, however, can be abstraction method for the state minimization and the decrease in analysis complexity through the abstraction with examples.

The Relationship between English Proficiency and Syntactic Complexity for Korean College Students (한국 대학생의 에세이에 나타난 영어 능력 수준과 통사적 복잡성 간의 관계 탐색)

  • Lee, Young-Ju
    • The Journal of the Convergence on Culture Technology
    • /
    • v.7 no.3
    • /
    • pp.439-444
    • /
    • 2021
  • This study investigates the relationship between syntactic complexity and English proficiency for Korean college students, using the recently developed TAASSC(the Tool for the Automatic Analysis of Syntactic Sophistication and Complexity) program. Essays on the ICNALE(International Corpus Network of Asian Learners of English) corpus were employed and phrasal complexity indices and clausal complexity indices, respectively were used to predict English proficiency level for Korean students. Results of stepwise regression analysis showed that indices of phrasal complexity explained 8% of variance in English proficiency, while indices of clausal complexity accounted for approximately 11%. That is, indices of clausal complexity were slightly better predictors of English proficiency than indices of phrasal complexity, which contradicts Biber et at.(2011)'s claim that phrasal complexity is the hallmark of writing development.