• 제목/요약/키워드: Grammatical information

검색결과 118건 처리시간 0.025초

Logic, Syntax, and Grammatical Agreement

  • Pullum, Geoffrey K.
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 1985년도 Proceedings of 84 Matsuyama Workshop on Formal Grammar
    • /
    • pp.125-152
    • /
    • 1985
  • PDF

한국어의 리듬 단위에 관한 연구 - 문법 구조와 관련하여 (A Study on Rhythmic Units in Korean -with Respect to Syntactic Structure-)

  • Kim, Sun-Mi
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 1996년도 10월 학술대회지
    • /
    • pp.224-228
    • /
    • 1996
  • This paper is intended as a study on how an utterance is divided into rhythmic units in Standard Korean with respect to its syntactic structure. With respect to the data in this study I used 150 sentences which contained similar number of words and various syntactic structures. Those sentences were read by 7 speakers of Seoul dialect in a conversation style. Each sentence was read twice in a normal speed and twice in a fast speed. As a total, 4200 sentences were recorded. Then listening to them, the author marked the sentences with two kinds of boundaries i.e. strong and weak. To explore the relationship between rhythmic units and syntactic structure I devised a framework of grammatical symbols. Each symbol is designed to have both syntactic and morphological information at the same time. So I assigned those grammatical symbols to the sentences. Having sentences marked with grammatical symbols on the one hand, and with the rhythmic boundaries on the other hand, 1 could show the relationship between rhythmic units and syntactic structure; which syntactic structures are likely to be pronounced as one rhythmic unit, and which are on the rhythmic boundaries.

  • PDF

Grammatical Structure Oriented Automated Approach for Surface Knowledge Extraction from Open Domain Unstructured Text

  • Tissera, Muditha;Weerasinghe, Ruvan
    • Journal of information and communication convergence engineering
    • /
    • 제20권2호
    • /
    • pp.113-124
    • /
    • 2022
  • News in the form of web data generates increasingly large amounts of information as unstructured text. The capability of understanding the meaning of news is limited to humans; thus, it causes information overload. This hinders the effective use of embedded knowledge in such texts. Therefore, Automatic Knowledge Extraction (AKE) has now become an integral part of Semantic web and Natural Language Processing (NLP). Although recent literature shows that AKE has progressed, the results are still behind the expectations. This study proposes a method to auto-extract surface knowledge from English news into a machine-interpretable semantic format (triple). The proposed technique was designed using the grammatical structure of the sentence, and 11 original rules were discovered. The initial experiment extracted triples from the Sri Lankan news corpus, of which 83.5% were meaningful. The experiment was extended to the British Broadcasting Corporation (BBC) news dataset to prove its generic nature. This demonstrated a higher meaningful triple extraction rate of 92.6%. These results were validated using the inter-rater agreement method, which guaranteed the high reliability.

A Family of Topic Constructions in Korean: A Construction-based Analysis

  • Kim, Jong-Bok
    • 한국언어정보학회지:언어와정보
    • /
    • 제20권1호
    • /
    • pp.1-24
    • /
    • 2016
  • Korean is well-known for its topic-prominent properties. In this paper, we look into several subtypes of topic constructions whose grammatical complexities have received much attention in generative grammar. From a semantic/pragmatic view, topics in Korean can be classified into three different types: aboutness, contrastive, and scene-setting. Meanwhile, syntax can classify topic constructions into two types, depending on whether or not the comment clause following topic has a syntactic gap linked to the topic. In this paper, we review some key properties of these topic constructions in Korean, and suggest that each type is licensed by tight interactions between syntactic and semantic constraints. In particular, the paper tries to offer a Construction Grammar analysis where each grammatical component is interacting in non-modular ways and in which the multiple inheritance network of constructions plays an important role in capturing cross-cutting generalizations of the topic constructions.

  • PDF

Recent Progresses in the Linguistic Modeling of Biological Sequences Based on Formal Language Theory

  • Park, Hyun-Seok;Galbadrakh, Bulgan;Kim, Young-Mi
    • Genomics & Informatics
    • /
    • 제9권1호
    • /
    • pp.5-11
    • /
    • 2011
  • Treating genomes just as languages raises the possibility of producing concise generalizations about information in biological sequences. Grammars used in this way would constitute a model of underlying biological processes or structures, and that grammars may, in fact, serve as an appropriate tool for theory formation. The increasing number of biological sequences that have been yielded further highlights a growing need for developing grammatical systems in bioinformatics. The intent of this review is therefore to list some bibliographic references regarding the recent progresses in the field of grammatical modeling of biological sequences. This review will also contain some sections to briefly introduce basic knowledge about formal language theory, such as the Chomsky hierarchy, for non-experts in computational linguistics, and to provide some helpful pointers to start a deeper investigation into this field.

문법관계 정보를 이용한 단계적 한국어 구문 분석 (Cascaded Parsing Korean Sentences Using Grammatical Relations)

  • 이성욱
    • 정보처리학회논문지B
    • /
    • 제15B권1호
    • /
    • pp.69-72
    • /
    • 2008
  • 본 연구는 한국어 의존 구조를 결정하는 단계적 의존 구조 분석기를 제안한다. 각 단계에서는 주어진 문법관계의 후보열에서 올바른 문법관계를 결정하는데, 대상문법관계의 종류에 따라 독립적으로 수행된다. 문법관계의 후보열은 미리 학습된 지지벡터기계를 이용하여 주어, 목적어, 보어, 부사어 등 7가지의 문법관계로 추정한다. 각 단계에서는 지지벡터기계 분류기와 어절 간의 거리, 교차 구조 금지, 격 제한의 원칙 등의 한국어 언어 특성을 이용하여 대상문법관계를 결정하며, 모든 단계를 거쳐 최종적으로 전체 의존 구조와 문법관계가 결정된다. 트리 및 문법관계 부착 말뭉치를 이용하여 제안된 시스템을 구현 및 실험하였으며 약 85.7%의 정확률을 얻었다.

한국어 문법관계에 대한 부분구문 분석 (Shallow Parsing on Grammatical Relations in Korean Sentences)

  • 이성욱;서정연
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권10호
    • /
    • pp.984-989
    • /
    • 2005
  • 본 연구의 목적은 한국어 문장의 문법관계를 분석하는 데 있다. 주된 문제는 문장의 주어, 목적어, 부사어를 문장에서 찾아내는 것이다. 이 문제를 해결하기 위해서 한국어 구문 분석에서 발생하는 여러 중의성을 고려해야 한다. 우리는 문법관계의 중의성을 먼저 해결하고 그 다음에 주어진 명사구와 용언구의 문법관계 확률을 이용하여 용언구의 술어-논항 관계 중의성을 해소하는 통계적 방법을 제안한다. 제안된 방법은 어절간의 거리, 교차구조 금지, 일문일격의 원칙 둥의 한국어 언어 특성을 반영하였다. 용언구와 명사구 사이의 문법관계에 대한 확률은 지지벡터 분류기를 이용하여 추정하였다. 제안된 방법은 문법관계 및 구문구조 부착 말뭉치를 이용하여 자동으로 문법관계를 학습하였고 주어, 목적어, 부사 각각의 문법관계분석에 대해 각각 $84.8\%,\;94.1\%,\;84.8\%$의 성능을 얻었다.

영어 품사 및 문장요소 용어 재확립에 대한 고찰 (A Study on the reestablishment of English Part of Speech and Sentence Structural Elements)

  • 이재일
    • 융합정보논문지
    • /
    • 제9권2호
    • /
    • pp.43-48
    • /
    • 2019
  • 본 연구는 현재 영어문법 교수과정에서 흔하게 나타나고 있는 문법용어 즉, 품사와 문장구성요소 용어의 오사용 문제점을 살펴보고 이에 대한 수정 및 개선할 수 있는 방안을 제시하고자 한다. 품사와 문장요소는 어떤 문법적인 기술을 위해서도 필수불가결한 것이다. 이러한 품사와 문장요소들은 학교 문법과 일반적인 문법의 기초를 이루는 부분임에도 정확한 재단 및 검증이 이루어지지 않은 채 중의적으로 사용되기도 하고 품사와 문장요소를 정확히 구분하지 않은 상태로 혼용하고 있다. 영어의 품사와 문장요소는 서로 다른 것을 지칭하는 것이고 이것들을 혼용해서 사용하는 경우 영어 교육을 위한 문법용어 설정에 큰 문제점을 야기하게 된다. 결론적으로, 현재 학교에서 사용되는 영어교재 및 각종 수험서에서 정의하고 있는 품사 및 문장요소에 대한 정의를 논의 및 제고해 볼 필요성이 있고 이러한 논의 및 분석을 통해 효과적인 영어교육을 위한 문법용어 설정에 대한 논의를 하고자 한다.

품사 정보와 템플릿을 이용한 문장 축소 방법 (A Sentence Reduction Method using Part-of-Speech Information and Templates)

  • 이승수;염기원;박지형;조성배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권5호
    • /
    • pp.313-324
    • /
    • 2008
  • 문장 축소란 원본 문장의 기본적인 의미를 유지하면서 불필요한 단어나 구를 제거하는 일련의 정보 압축 과정을 의미한다. 기존의 문장 축소에 관한 연구들은 학습 과정에서 대량의 어휘나 구문적 자원을 필요로 하였으며, 복잡한 파싱 과정을 통해서 불필요한 문장의 구성원(예를 들어, 단어나 구, 절 등)들을 제거하여 문장을 요약하였다. 그러나 학습 데이타로부터 얻을 수 있는 어휘적 자원은 매우 한정적이며, 문장의 모호성과 예외적인 표현들 때문에 구문 분석 결과가 명료하게 제공되지 않은 언어에서는 문장 요약이 용이하지 않다. 이에 본 논문에서는 구문 분석을 대체하기 위한 방법으로 템플릿과 품사 정보를 이용한 문장 축소 방법을 제안한다. 제안하는 방법은 요약문의 구조적 형태를 결정하기 위한 문장 축소 템플릿(Sentence Reduction Templates)과 문법적으로 타당한 문장 구조를 구성하는 품사기반 축소규칙(Grammatical POS-based Reduction Rules)을 이용하여 요약 대상 문장의 구성을 분석하고 요약한다. 더불어, 문장 축소 템플릿 적용 시 발생하는 연산량 증가 문제를 은닉 마르코프 모델(HMM: Hidden Markov Model)의 비터비 알고리즘(Viterbi Algorithm)을 이용하여 효과적으로 처리한다. 마지막으로, 본 논문에서 제안한 문장 축소 방법의 결과와 기존 논문의 연구 결과를 비교 및 평가함으로써 제안하는 문장 축소 방법의 유용성을 확인한다.

문법적 진화기법과 조건부 확률을 이용한 청소 로봇의 이동 패턴 계획 (Designing the Moving Pattern of Cleaning Robot based on Grammatical Evolution with Conditional Probability Table)

  • 권순조;김현태;안창욱
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권4호
    • /
    • pp.184-188
    • /
    • 2016
  • 청소 로봇은 가정에서 사용 가능한 대표적인 지능형 로봇이다. 고가형 청소 로봇은 센서로부터 정보를 제공받아 높은 커버리지 성능을 가진 알고리즘이 존재하지만, 저가형의 청소 로봇엔 적용하기 어렵다. 본 논문은 저가형의 청소 로봇과 같은 환경에서 효율적인 움직임을 구현하기 위해 문법적 진화기법 기반의 청소 로봇의 이동 패턴을 계획하는 알고리즘을 제안한다. 이를 위해 배커스-나우르 표기법을 사용하여 이동 패턴 문법을 정의하고 진화연산을 통해 최적화된 프로그램을 생성하였다. 이와 더불어 프로그램 생성 과정에서 획득한 문법 요소 간 조건부 확률 정보를 활용하였다. 제안 알고리즘의 성능 검증을 위해 청소 로봇 시뮬레이션을 활용하여 기존 알고리즘과 성능을 비교하였으며 실험 결과를 통해 본 논문에서 제안한 기법의 효율성을 확인하였다.