• 제목/요약/키워드: syntactic processing

검색결과 174건 처리시간 0.027초

Prosody in Spoken Language Processing

  • Schafer Amy J.;Jun Sun-Ah
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.7-10
    • /
    • 2000
  • Studies of prosody and sentence processing have demonstrated that prosodic phrasing can exhibit strong effects on processing decisions in English. In this paper, we tested Korean sentence fragments containing syntactically ambiguous Adj-N1-N2 strings in a cross-modal naming task. Four accentual phrasing patterns were tested: (a) the default phrasing pattern, in which each word forms an accentual phrase; (b) a phrasing biased toward N1 modification; (c) a phrasing biased toward complex-NP modification; and (d) a phrasing used with adjective focus. Patterns (b) and (c) are disambiguating phrasings; the other two are commonly found with both interpretations and are thus ambiguous. The results showed that the naming time of items produced in the prosody contradicting the semantic grouping is significantly longer than that produced in either default or supporting prosody, We claim that, as in English, prosodic information in Korean is parsed into a well-formed prosodic representation during the early stages of processing. The partially constructed prosodic representation produces incremental effects on syntactic and semantic processing decisions and is retained in memory to influence reanalysis decisions.

  • PDF

용언의 구문관계를 이용한 명사 분류 (Clustering Noun Using Syntactic Relations)

  • 김현진;박세영;장명길;박재득;박동인
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.111-115
    • /
    • 1997
  • 자연언어를 처리하는 응용시스템에서는 의미적으로 유사한 집합으로 분류된 단어들을 이용하는 것이 필요하다. 특히 한국어에서는 명사마다 함께 쓰이는 용언들이 제한되어 있다. 이 논문에서는 문장에서 용언과 명사의 구문 관계로 추출되는 정보를 이용하여 명사를 분류하는 방법을 제시한다. 또한 실제 코퍼스에서 추출된 명사들을 중심으로 의미적 집합으로 묶는 작업을 하고, 각 의미군마다 특징적인 구문 정보를 적용하여 자동 명사 추출에서 나타나는 모호성 해소에도 이용하였다. 용언의 구문관계 추출은 기존 연구된 용언 하위 분류 연구를 이용하였고, 코퍼스를 통해 얻은 명사와 용언을 이용하여 수정 및 보완하였다. 실험 코퍼스는 1만 문장 가량의 구문 구조가 부착된 코퍼스(Tree Tagged Corpus)를 이용하였다.

  • PDF

대규모 말뭉치와 전산 언어 사전을 이용한 의미역 결정 규칙의 구축 (Rule Construction for Determination of Thematic Roles by Using Large Corpora and Computational Dictionaries)

  • 강신재;박정혜
    • 정보처리학회논문지B
    • /
    • 제10B권2호
    • /
    • pp.219-228
    • /
    • 2003
  • 본 논문은 한국어정보처리 과정에서 구문 관계를 의미역으로 사상시키기 위한 규칙을 효과적으로 구축하는 방법을 제시하고 있다. 의미역의 결정은 의미 분석의 핵심 작업 중 하나이며 자연어처리에서 해결해야 하는 매우 중요한 문제 중 하나이다. 일반적인 언어학 지식과 경험만 가지고 의미역 결정 규칙을 기술하는 것은 작업자의 주관에 따라 결과가 많이 달라질 수 있으며, 또 모든 경우를 다룰 수 있는 규칙의 구축은 불가능하다. 하지만 본 논문에서 제시하는 방법은 대량의 원시 말뭉치를 분석하여 실제 언어의 다양한 사용례를 반영하며, 또 수십 명의 한국어 학자들이 심도 있게 구축하고 있는 세종전자사전의 격틀 정보도 함께 고려하기 때문에 보다 객관적이고 효율적인 방법이라 할 수 있다. 의미역을 보다 정확하게 결정하기 위해 구문관계, 의미부류, 형태소 정보, 이중주어의 위치정보 등의 자질 정보를 사용하였으며, 특히 의미부류의 사용으로 인해 규칙의 적용률이 향상되는 효과를 가져올 수 있었다.

한국어 서사 텍스트 처리의 다중 표상과 구성 통합 이론: 주제어 연속성에 대한 양태 어미의 형태 통사적, 담화 화용적 기능 (A Multi-level Representation of the Korean Narrative Text Processing and Construction-Integration Theory: Morpho- syntactic and Discourse-Pragmatic Effects of Verb Modality on Topic Continuity)

  • 조숙환;김세영
    • 인지과학
    • /
    • 제17권2호
    • /
    • pp.103-118
    • /
    • 2006
  • 본 논문은 구성 통합 이론(Kintsch, 1988, Singer & Kintsch 2001, Graesser, Gernsbacher, & Goldman, 2003)을 토대로 주제어 연속성의 강도와 양태 어미 단서가 이야기 서사 텍스트에 쓰인 공주어 해석에 어떻게 이용되는지 검토했다. 실험 연구에는 명시적 조건과 중립적 조건 등 두 조건이 생성되었는데, 명시적 조건에는, 중립적 조건과는 달리, 주제어가 일관성 있게 유지되었고 또한 동사 어미의 형태 통사적 특징이 인칭과 일치되었다. 이 실험에는 59명의 대학생들이 다음 세 가지 과제에 참여했다. 실험은 첫째, 주어가 생략된 경우 피험자가 시험 문장(target sentence)을 읽는데 소요되는 시간을 측정했고, 둘째, 공주어의 해석, 즉, 선행사 (참조대상) 선택에 소요되는 반응 시간을 측정했으며, 셋째, 선행사 선정의 정답율을 분석했다. 실험 결과, 텍스트 처리과정에서 인칭과 같은 형태 통사적 조건이 유의미한 결과를 낳았으며, 또한, 주제어 연속성 조건의 효과가 형태 통사 조건에 따라 선택적인 양상을 보였다. 즉, 주제어가 지속적으로 연결되는 동안 화용적 맥락, 담화자의 사전 정보, 추론 등과 같은 총체적 정보와 주어, 동사 어미의 인칭과 같은 어휘적, 지엽적인 형태 통사적인 정보가 선행사 해석에 핵심적인 역할을 했다. 따라서, 이 실험 결과는 최소주의 가설 보다 공명 기반 모델을 지지한다.

  • PDF

문장 및 어절 유사도를 이용한 표절 탐지 시스템 구현 (Implementation of A Plagiarism Detecting System with Sentence and Syntactic Word Similarities)

  • 맹주수;박지수;손진곤
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권3호
    • /
    • pp.109-114
    • /
    • 2019
  • 기존 표절 탐지 시스템은 형태소 분석을 기반으로 공통 단어의 빈도수를 이용해 문서의 유사도를 측정한다. 그러나 주제가 같아 유사 단어가 많이 쓰인 경우, 문장 단위로 일부만 발췌 표절한 경우, 그리고 조사와 어미의 유사성이 있는 경우는 공통 단어의 빈도수만으로는 정확한 유사도를 측정하는데 한계가 있다. 따라서 본 논문에서는 공통 단어 빈도수 기반의 유사도 측정 외에 문장 유사도와 어절 유사도를 추가적으로 측정해 유사도의 정확성을 높일 수 있는 표절 탐지 시스템을 설계하고 구현하였다. 실험 결과, 문장 유사도를 측정함으로써 문장 단위로 표절이 이루어진 경우를 발견할 수 있었고, 어절 유사도를 추가로 측정함으로써 부분표절이 일어난 경우라도 조사나 어미까지 그대로 사용한 표절의 경우 등을 발견할 수 있었다.

한국어 문장의 통사 정보처리 (Syntactic processing of sentences in Korean)

  • 조명한
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.225-227
    • /
    • 1989
  • 성인의 자기 조절 읽기 과정에서나 아동의 이해 과제에서나 한국어의 통사 해독 (parsing) 은 무엇보다 입력순서대로 그리고 구 단위로 수행되며, 나아가서 SOV의 규범 어순 효과와 NP -VP의 위계 구조를 형성한다는 사실을 개관하였다. 이들 사실들은 결국 L. Frazier 의 최소 부착(minimal attachment) 의 해독 원리가 통사 처리에 적용됨을 보여주는 것이다.

  • PDF

구문론적 해석에 의한 근전도 신호의 패턴 분류 (Pattern classification of EMG signals by the syntactic analysis)

  • 왕문성;박상희;정태윤;변윤식
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 1987년도 한국자동제어학술회의논문집; 한국과학기술대학, 충남; 16-17 Oct. 1987
    • /
    • pp.699-701
    • /
    • 1987
  • This paper deals With the EMG signal processing to apply the EMG signal to the Prosthetic arm. The EMG signals are generated by the voluntary contractions of the subject's musculature and is coded into binary words by the pulse width modulation. Command strings or sentences are constructed by concatenating several words, and are syntactically described by a context free grammar in Chomsky normal form and is tried to classify the movement pattern by the CYK algorithm.

  • PDF

자연어 처리 기반 한국어 TTS 시스템 구현 (Implementation of Korean TTS System based on Natural Language Processing)

  • 김병창;이근배
    • 대한음성학회지:말소리
    • /
    • 제46호
    • /
    • pp.51-64
    • /
    • 2003
  • In order to produce high quality synthesized speech, it is very important to get an accurate grapheme-to-phoneme conversion and prosody model from texts using natural language processing. Robust preprocessing for non-Korean characters should also be required. In this paper, we analyzed Korean texts using a morphological analyzer, part-of-speech tagger and syntactic chunker. We present a new grapheme-to-phoneme conversion method for Korean using a hybrid method with a phonetic pattern dictionary and CCV (consonant vowel) LTS (letter to sound) rules, for unlimited vocabulary Korean TTS. We constructed a prosody model using a probabilistic method and decision tree-based method. The probabilistic method atone usually suffers from performance degradation due to inherent data sparseness problems. So we adopted tree-based error correction to overcome these training data limitations.

  • PDF

비문법적 실어증의 형태-통사론적 분석 (A morpho-syntactic analysis of agrammatic aphasia in Korean)

  • 김영주
    • 인지과학
    • /
    • 제9권1호
    • /
    • pp.41-46
    • /
    • 1998
  • 이 논문에서는 뇌졸중으로 인한 Broca 유형의 실어증 환자가 회복 초기와 회복이 진행됨에 따라 발화하는 서술어의 논항 구조적 속성이 정상 언어 집단의 서술어 분포와 어떻게 다르며, 또한 편으로는 전도 실어증 환자의 서술어 분포와는 어떻게 다른지 세 환자와, 조건이 비슷한 정상인의 자유 발화 산출 자료를 분석하여 비교한다. Broca 유형 실어증 환자가 발화하는 서술어 중에서 비대격 동사가 차지하는 비율을 언어간 비교해 본 결과, 영어 실어증 환자의 경우에는 계사가 아닌 비대격 동사에 심한 어려움을 겪어 거의 산출되어 못하는 것으로 나타난 반면(Kegl 1995), 한국어 실어증 환자의 경우에는 별다른 어려움을 겪지 않는 것으로 나타났다. 이에 대한 설명으로 영어의 비계사 비대격 구문에서는 d-구조와 s-구조 사이에서 동사에 상대적인 논항 이동이 일어나는 데 반해, 한국어에서는 격 부여라는 동기로 유발되는 그러한 논항 이동이 없거나, 설사 있더라도 공허하기(vacuous) 때문에 비문법적 실어증 환자들이 어려움을 느끼지 않으리라는 제안을 한다.

  • PDF

운전자 사용자경험기반의 인지향상 시스템 연구 (Driver's Behavioral Pattern in Driver Assistance System)

  • 조두리;신동희
    • 디지털콘텐츠학회 논문지
    • /
    • 제15권5호
    • /
    • pp.579-586
    • /
    • 2014
  • 본 논문은 문맥-자유 문법 (context-free grammar)를 이용하여, 차선변경 상황에서의 운전자의 행동패턴 인식을 하는 방법을 제안하는 것을 목표로 한다. 문맥-자유-문법은 기존 패턴인식 방식과는 대조적으로 유한적 기호로는 쉽게 표현될 수 없는 특징들을 비교적 손쉽게 표현할 수 있다. 이 방식을 적용하여, 동시에 여러 특징을 각각 고려해야 하는 좌표기반 데이터 처리 대신 심볼 시퀀스 방식 (symbolic sequence)을 패턴화하기 위해 구문론적 방식을 적용한다. 이 방법은 운전자와 안전 운전 분야 연구자들에게 효율적이고 보다 직관적인 방법으로 보다 더 효과적인 수행에 도움이 된다. 본 연구의 향후과제로 보다 안정적인 인식률을 획득하기 위해 확률적 구문분석 방법을 적용할 계획이다.