• 제목/요약/키워드: Syntactic Analysis

검색결과 261건 처리시간 0.021초

영한 기계번역에서 구문 분석 정확성 향상을 위한 구문 범주 예측 (Syntactic Category Prediction for Improving Parsing Accuracy in English-Korean Machine Translation)

  • 김성동
    • 정보처리학회논문지B
    • /
    • 제13B권3호
    • /
    • pp.345-352
    • /
    • 2006
  • 실용적인 영한 기계번역 시스템은 긴 문장을 빠르고 정확하게 번역할 수 있어야 한다. 보다 빠른 번역을 위해 문장 분할을 이용한 부분 파싱 방법이 제안되어 속도 향상에 기여하였다. 본 논문에서는 보다 정확한 분석을 위해 결정 트리를 이용한 구문 범주 예측 방법을 제안한다. 문장 분할을 적용한 영어 분석에서 각각의 분할된 부분은 개별적으로 분석되며 각 분석 결과들이 결합되어 문장의 구조가 생성된다. 여기서 각 분할의 구문 범주를 미리 예측하여 부분 파싱 후에 보다 정확한 분석 결과를 선정하고 예측된 구문 범주에 근거하여 올바르게 다른 문장의 분할결과와 결합함으로써 문장 분석의 정확도를 향상시키는 것이 본 논문에서 제안한 방법의 목적이다. 본 논문에서는 Wall Street Journal의 파싱된 말뭉치에서 구문 범주 예측에 필요한 특성을 추출하고 결정 트리를 이용하여 구문 범주 예측을 위한 결정 트리를 생성하였다. 실험에서는 사람이 구축한 규칙을 이용한 방법, trigram 확률을 이용한 방법, 신경망을 이용한 방법 등에 의한 구문 범주 예측 성능을 측정, 비교하였으며 제안된 구문 범주 예측이 번역의 품질 향상에 기여한 정도를 제시하였다.

다단계 구단위화를 이용한 고속 한국어 의존구조 분석 (High Speed Korean Dependency Analysis Using Cascaded Chunking)

  • 오진영;차정원
    • 한국시뮬레이션학회논문지
    • /
    • 제19권1호
    • /
    • pp.103-111
    • /
    • 2010
  • 한국어 처리에서 구문분석기에 대한 요구는 많은 반면 성능의 한계와 강건함의 부족으로 인해 채택되지 못하는 것이 현실이다. 본 연구는 구문분석을 레이블링 문제로 전환하여 성능, 속도, 강건함을 모두 실현한 시스템에 대해서 설명한다. 우리는 다단계 구 단위화(Cascaded Chunking)를 통해 한국어 구문분석을 시도한다. 각 단계에서는 어절별 품사 태그와 어절 구문표지를 자질로 사용하고 CRFs(Conditional Random Fields)를 이용하여 최적의 결과를 얻는다. 58,175문장 세종 구문 코퍼스로 10-fold Cross Validation(평균 10.97어절)으로 실험한 결과 평균 86.01%의 구문 정확도를 보였다. 이 결과는 기존에 제안되었던 구문분석기와 대등하거나 우수한 성능이며 기존 구문분석기가 처리하지 못하는 장문도 처리 가능하다.

Connectivity Effects and Questions as Specificational Subjects

  • Yoo, Eun-Jung
    • 한국언어정보학회지:언어와정보
    • /
    • 제10권2호
    • /
    • pp.21-45
    • /
    • 2006
  • Connectivity effects have been central issues in dealing with specificational pseudoclefts. While syntactic approaches motivate their analysis in order to explain connectivity effects in terms of a connected clause, these accounts have numerous problems including a wide range of anti-connectivity effects that constitute crucial counterevidence. On the other hand, semantic accounts of connectivity effects treat BV and BT connectivity by independent interpretive mechanisms providing a more fundamental explanation for connectivity effects. Yet existing semantic accounts have limitations in explaining syntactic properties and syntactic connectivity effects in SPCs, and in accounting for BV anti-connectivity effects in English. Focusing on BV connectivity, this paper explores how the relevant (anti-)connectivity facts can be accounted for by an analysis that provides both an elaborate syntactic analysis of SPCs and a semantic mechanism for bound anaphora. Based on Yoo's (2005) non-deletion based, question-answer pair analysis of SPCs, this paper shows that a functional question analysis of a specificational subject, when combined with a theory of operator scope and a non-configurational condition on bound anaphora, can explain various BV (anti-)connectivity patterns in SPCs and related constructions.

  • PDF

견고한 대화시스템을 위한 한국어 대화체의 음운론적, 구문론적 오류 분석 및 복구 (An analysis and correction of the phonological and syntactic errors in korean dialogues for a robust dialogue system)

  • 김영길;김한우;최병욱
    • 전자공학회논문지C
    • /
    • 제34C권5호
    • /
    • pp.55-65
    • /
    • 1997
  • In many cases, a dialogue system can't extract the correct analysis information of a user's spoken utterance, because of its own ungrammatical components. Therefore, in order to perform a correct before it performs the syntactic processing. In this paper, we use a real dialogue corpus and classify these ungrammatical errors as 4 categories : phonological, syntactic, semantic errors that consist of speech reparis and inversions, and propose an algorithm to detect and correct the errors. In short, this paper proposes a method to detect and correct the speech repairs and inversions that are classified as the phonological and syntactic errors to implement a robust dialogue system. And, through the test of real dialogue data, this paper shows an efficiency of the proposed algorithm.

  • PDF

엔트로피 지도 CRF를 이용한 한국어 어절 구문태그 예측 (Eojeol Syntactic Tag Prediction of Korean Text using Entropy Guided CRF)

  • 오진영;차정원
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권5호
    • /
    • pp.395-399
    • /
    • 2009
  • 본 연구에서는 의사결정나무와 Conditional Random Fields(CRFs)를 이용하여 한국어 어절 구문태그를 예측하는 시스템에 대해서 설명한다. 기계학습에서 자질의 선택은 작성자의 직관에 의해서 주로 이루어지는데 이는 작성자의 지식에 의존한다. 본 연구에서는 의사결정나무를 사용하여 보다 체계적으로 조합이 이루어지도록 하였다. 또한 오류 분석을 통하여 최적의 자질이 무엇인지를 파악하여 최고의 성능을 보이도록 하였다. 실험을 통하여 본 논문에서 제안한 방법이 성능향상에 도움이 된다는 것을 확인할 수 있어 앞으로 구문 분석에 많은 도움이 될 것이라고 확신한다.

구조적 중의성 해결을 위한 명사 수식 부사 연구 (An Analysis of Noun-modifying Adverbs for Structural Disambiguation)

  • 황선영;이공주
    • 인지과학
    • /
    • 제13권4호
    • /
    • pp.42-42
    • /
    • 2002
  • 명사 수식 부사는 서술어를 수식하는 다른 부사들과 달리, 명사를 수식하는 기능을 수행하는 부사이다. 이들 부사들은 부사의 전형적인 기능과 다른 기능을 보이기 때문에 구문 분석시 많은 오류를 일으킨다. 이 연구에서는 명사 수식 부사를 포함한 구문이 보이는 분석의 오류를 해결하기 위하여 명사 수식 부사를 분류하고 명사 수식 부사들의 사용 양태를 살펴서 구문 분석시의 처리 방안을 수립하였다. 또한 이러한 작업이 실제로 분석의 정확도를 높이는 데 기여할 수 있음을 증명하기 위해 명사 수식 부사 처리기를 구현하여 구문 분석기의 성능 향상을 실험하였다. 제안된 방법에 의해서 구문 분석의 정확도는 81.9%에서 83.6% 정도로 향상되었다.

구조적 중의성 해결을 위한 명사 수식 부사 연구 (An Analysis of Noun-modifying Adverbs for Structural Disambiguation)

  • 황선영;이공주
    • 인지과학
    • /
    • 제13권4호
    • /
    • pp.43-53
    • /
    • 2002
  • 명사 수식 부사는 서술어를 수식하는 다른 부사들과 달리, 명사를 수식하는 기능을 수행하는 부사이다. 이들 부사들은 부사의 전형적인 기능과 다른 기능을 보이기 때문에 구문 분석시 많은 오류를 일으킨다. 이 연구에서는 명사 수식 부사를 포함한 구문이 보이는 분석의 오류를 해결하기 위하여 명사 수식 부사를 분류하고 명사 수식 부사들의 사용 양태를 살펴서 구문 분석시의 처리 방안을 수립하였다. 또한 이러한 작업이 실제로 분석의 정확도를 높이는 데 기여할 수 있음을 증명하기 위해 명사 수식 부사 처리기를 구현하여 구문 분석기의 성능 향상을 실험하였다. 제안된 방법에 의해서 구문 분석의 정확도는 81.9%에서 83.6% 정도로 향상되었다.

  • PDF

자연어 활용(1) : 간편한 컴퓨터 조작을 위한 한글 문장 이해에 관한 연구 (Application of Natural Language Processing(1) : Understanding of the Hangul Sentences for Simple Computer Manipulation)

  • 장덕성;이동애
    • 인지과학
    • /
    • 제3권1호
    • /
    • pp.41-60
    • /
    • 1991
  • 대부분의 PC 사용자들은 늘 사용하는 몇 가지 명령만으로 컴퓨터를 조작하고 있다. 그러나 DOS명령 대신 한글 문장으로 컴퓨터를 조작한다면, 최적의 명령어를 생성해낼수 있을뿐 아니라 사용자에게 융통성을 제공할 수 있다. 이를 위하여 본 논문에서는 자연어로 입력되는 한글 문장을 형태소 분석, 구문분석, 의미분석, 개념분석을 통해 일련의 DOS명령으로 변환하는 방법을 연구하였다. 형태소 분석에서는 Tabular Parsing 이 이용되고, 구문 분석과 의미분석에서는 격문법이 이용된다. 문자의 의미는 개념망으로 표현되고 이로부터 DOS 명령어가 생성된다.

구문 분석과 One-Stage DMS/DP를 이용한 연속음 인식 (Continuous Speech Recognition using Syntactic Analysis and One-Stage DMS/DP)

  • 안태옥
    • 대한전자공학회논문지SP
    • /
    • 제41권3호
    • /
    • pp.201-207
    • /
    • 2004
  • 본 논문은 연속음 인식에 관한 연구로써, 구문 분석을 이용한 One-Stage DMS/DP에 의한 음성 인식 방법을 사용한다. 인식 실험을 위해 우선 구간 구분화 알고리즘을 이용하여 DMS(dynamic Multi-Section) 모델을 만들며, 구문 분석을 이용한 One-Stage DMS/DP 방법으로 연속음 데이터를 인식하게 하였다. 제안된 방법에 의한 인식 실험을 수행하는 것 외에도 비교를 위해 전통적인 One-Stage DP 방법을 같은 조건 같은 데이터를 가지고 수행하였다. 인식 실험 결과, 기존의 방법보다 구문분석을 이용한 One-Stage DMS/DP 방법이 우수한 것으로 나타났다.

신택틱 패턴 인식 알고리즘에 의한 심전도 신호의 패턴 분류에 관한 연구 (A Study of ECG Pattern Classification of Using Syntactic Pattern Recognition)

  • 남승우;이명호
    • 대한의용생체공학회:의공학회지
    • /
    • 제12권4호
    • /
    • pp.267-276
    • /
    • 1991
  • This paper describes syntactic pattern recognition algorithm for pattern recognition and diagnostic parameter extraction of ECG signal. ECG signal which is represented linguistic string is evaluated by pattern grammar and its interpreter-LALR(1) parser for pattern recognition. The proposed pattern grammar performs syntactic analysis and semantic evaluation simultaneously. The performance of proposed algorithm has been evaluated using CSE database.

  • PDF