• 제목/요약/키워드: Syntactic Analysis

검색결과 261건 처리시간 0.026초

S-절 분할을 통한 구문 분석 (Syntactic Analysis based on Subject-Clause Segmentation)

  • 김미영;이종혁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권9호
    • /
    • pp.936-947
    • /
    • 2005
  • 한국어 장문에서는 하나의 주어를 여러 용언이 공유하는 경우가 흔하고 주어의 생략 또한 빈번하다. 따라서 주어를 공유하는 용언들의 구간을 파악하는 것이 어렵고 의존문법을 이용한 구문분석시 주어의 의존관계를 찾는데 많은 오류가 생긴다. 이러한 주어의 의존관계의 애매성을 해소하기 위하여 우리는 S(ubject)-절이라는 개념을 제안한다. S-절은 한 개의 주어와 이 주어를 공유하는 단어그룹의 집합으로 정의되고, 본 논문에서는 결정트리를 이용하여 S-절을 자동적으로 분할하는 방법을 제안한다. S-절을 사용한 결과 의존문법에 기반한 구문분석 시스템의 성능이 $5\%$ 향상되었고 주어의 지배소를 찾는 정확률이 $32\%$ 증가했다.

Predicting CEFR Levels in L2 Oral Speech, Based on Lexical and Syntactic Complexity

  • Hu, Xiaolin
    • 아시아태평양코퍼스연구
    • /
    • 제2권1호
    • /
    • pp.35-45
    • /
    • 2021
  • With the wide spread of the Common European Framework of Reference (CEFR) scales, many studies attempt to apply them in routine teaching and rater training, while more evidence regarding criterial features at different CEFR levels are still urgently needed. The current study aims to explore complexity features that distinguish and predict CEFR proficiency levels in oral performance. Using a quantitative/corpus-based approach, this research analyzed lexical and syntactic complexity features over 80 transcriptions (includes A1, A2, B1 CEFR levels, and native speakers), based on an interview test, Standard Speaking Test (SST). ANOVA and correlation analysis were conducted to exclude insignificant complexity indices before the discriminant analysis. In the result, distinctive differences in complexity between CEFR speaking levels were observed, and with a combination of six major complexity features as predictors, 78.8% of the oral transcriptions were classified into the appropriate CEFR proficiency levels. It further confirms the possibility of predicting CEFR level of L2 learners based on their objective linguistic features. This study can be helpful as an empirical reference in language pedagogy, especially for L2 learners' self-assessment and teachers' prediction of students' proficiency levels. Also, it offers implications for the validation of the rating criteria, and improvement of rating system.

의견 어구의 구문 관계를 고려한 트위터 의견 검색 (Opinion Retrieval in Twitter Considering Syntactic Relations of Sentiment Phrase)

  • 김윤성;양민철;이승욱;임해창
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제20권9호
    • /
    • pp.492-497
    • /
    • 2014
  • 본 연구에서는 대중적인 소셜 네트워크 서비스 중 하나이며 많은 사람들이 다양한 의견을 공유하는 트위터를 대상으로 질의어(또는 주제어)에 적합한 의견을 지닌 트윗을 검색하는 방법론을 제안한다. 기존의 의견 검색 시스템은 의견을 지닌 구절이 주어진 질의어나 화자와 관련이 없음에도 불구하고 그런 구절의 유무를 중요한 요소로 여겼다. 이와 같은 문제를 해결하기 위하여 본 연구에서는 1) 의견 어구-질의어 관계, 2) 의견 어구-화자 관계, 그리고 3) 의견 어구의 의존 구문 역할 등의 구문 요소를 반영하는 방법을 고안하였다. 또한, 의견을 가진 트윗을 검색하기 위하여 질의어와의 적절성, 텍스트 정보, 사용자 정보, 트위터 특화 자질에 기반한 랭킹 학습 방법을 이용하였다. 실제 데이터를 이용한 실험 결과, 본 시스템은 기존 연구들보다 더 좋은 성능을 보이고 있다.

Argumentness and Probabilistic Case Structures

  • Yang, Dan-Hee;Lee, Ik-Hwan
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2002년도 Language, Information, and Computation Proceedings of The 16th Pacific Asia Conference
    • /
    • pp.447-454
    • /
    • 2002
  • This paper proposes that the argument structures be stated in a way that uses probabilities derived from a corpus to replace a Boolean-value system of subcategorization. To do this, we make a cognitive model from a situation to an utterance to explain the phenomena of arguments'ellipsis, though the traditional term ellipsis is not suitable under our new concepts. We claim that the binary distinction is neither rational nor suitable for a real syntactic analysis. To solve this problem, we propose two new concepts argumentness and probabilistic Case structures by adapting the prototype theory. We believe that these concepts are effective in the syntactic analysis of NLP.

  • PDF

사전 정보와 차트 자료 구조를 이용한 효율적인 형태소 분석기 및 합성기(KoMAS) (An Efficient Korean Morpheme Analyzer and Synthesizer using Dictionary Information and Chart Data Structure)

  • 김정해;이상조
    • 전자공학회논문지B
    • /
    • 제31B권3호
    • /
    • pp.123-131
    • /
    • 1994
  • This paper describes on the analysis of morphemes and it's synthesis being constituted of Korean word phrases. To analyze morphemes, we propose the introduction of "morph" for morpheme features in lexicon and the usage of chart data structures. it controls over the generation of unnecessary morpheme, and extracts every possible morpheme unit in a word phrase which minimized lexicon investigation by using heuristic information. Moreover, to synthesize morphemes, it is composed of every possible analyzed morphemes in word phrases to take advantage of speech and union information which can be obtained for program. Therefore, the systhesis of analyzed morphemes were designed to aid a syntactic analysis next step of natural language processing. This system for analyzing and systhesizing morpheme was to generate a word phrase by unifying syntactic and semantic features of analyzed morphemes in lexicon, and then established by C language of the personal computer.

  • PDF

자연어 질의 분석과 검색어 확장에 기반한 웹 정보 검색 (Web Information Retrieval based on Natural Language Query Analysis and Keyword Expansion)

  • 윤성희;장혜진
    • 정보관리학회지
    • /
    • 제21권2호
    • /
    • pp.235-248
    • /
    • 2004
  • 웹 문서 정색을 위해 키워드와 불리언 연산식을 사용하는 것에 비해 자연어 질의 문장을 입력하는 방법은 검색 시스템 사용자에게 훨씬 이상적인 인터페이스이다. 본 논문은 사용자가 입력하는 자연어 질의 문장을 구문 분석하고 그 구문 구조에 기반하여 검색어를 확장하는 다중 검색 기법을 제안한다. 구문 트리를 순회하여 구조적으로 연관된 복합 명사를 조합하거나 분할하는 과정을 거치고, 이형 표기 및 축약 표기 용어들에 대해 확장 다중 검색함으로써 웹 정보 검색 시스템의 재현율과 정확도를 높일 수 있다.

범주문법과 양화사 유동 (Categorial Grammar and Quantifer Floating)

  • 강범모
    • 인지과학
    • /
    • 제2권1호
    • /
    • pp.73-86
    • /
    • 1990
  • 본 연구는 한국어의 양화사 유동현상을 일반범주문법의 관점에서 통사론 적, 의미론적으로 분석한다.' 학생들이 넷이 술을 마셨다'와 같은 문장에서 나타나느 유동양상화는 통사론적으로 동사구 수식어(VP/VP)로 파악하고, 의 미론적으로는 명사화된 속성이 관여하는 것으로 분석한다. 이밖에도, 관련된 형태인 '넷'(NP/NP),'넷을'(TV/TV)등도 엄밀한 통사론적, 의미론적 분석을 시도한다. 성공적인 분석의 걸과는 한국어 처리 인접성 조건을 준수하는 범주문법의 사용가능성을 시사해 준다.

A Family of Topic Constructions in Korean: A Construction-based Analysis

  • Kim, Jong-Bok
    • 한국언어정보학회지:언어와정보
    • /
    • 제20권1호
    • /
    • pp.1-24
    • /
    • 2016
  • Korean is well-known for its topic-prominent properties. In this paper, we look into several subtypes of topic constructions whose grammatical complexities have received much attention in generative grammar. From a semantic/pragmatic view, topics in Korean can be classified into three different types: aboutness, contrastive, and scene-setting. Meanwhile, syntax can classify topic constructions into two types, depending on whether or not the comment clause following topic has a syntactic gap linked to the topic. In this paper, we review some key properties of these topic constructions in Korean, and suggest that each type is licensed by tight interactions between syntactic and semantic constraints. In particular, the paper tries to offer a Construction Grammar analysis where each grammatical component is interacting in non-modular ways and in which the multiple inheritance network of constructions plays an important role in capturing cross-cutting generalizations of the topic constructions.

  • PDF