• 제목/요약/키워드: 구문구조

Search Result 476, Processing Time 0.021 seconds

Analysis of Structural Ambiguities Using Syntactic Graph (구문 그래프를 이용한 구문적 애매성 분석)

  • Kim, Jae-Hoon;Seo, Jung-Yun;Kim, Gil-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 1992.10a
    • /
    • pp.159-167
    • /
    • 1992
  • 한국어는 그 자체의 특성 때문에 영어와는 또 다른 형태의 구문적인 애매성을 포함하고 있다. 이와 같은 구문의 애매성을 해결하기 위해서는 여러 가지의 정보가 필요할 것이다. 예를 들면, 품사정보의 세분류, 명사들의 의미 속성정보들이 그것이다. 본 논문은 한국어 문장의 구문적인 애매성을 해결하기에 앞서 먼저 한국어 문장에 어떤 형태의 애매성이 포함되어 있는 지를 조사.분석한 것이다. 본 논문에서는 구문적인 애매성을 효율적으로 분석하기 위한 수단으로 구문 그래프를 이용하였다. 한국어 문장에는 다품사에 의한 애매성, 조사구 부착에 관한 애매성, 복합 체언구에 관한 애매성, 부사구 부착에 관한 애매성, 관형어의 수식 범위에 관한 애매성이 있다. 이들 중에서 복합 체언구에 의한 애매성이 가장 많은 애매성을 가지고 있었다. 즉, 실험 대상문장에서 발생가능한 전체의 애매성의 62%가 복합체언구에 관한 것이다. 따라서 한국어에서는 복합체언구에 관한 구문 구조적인 애매성 해소가 가장 우선적으로 해결해야 할 과제이다.

  • PDF

Robust Korean Dependency Analysis Based on CRFs (CRFs를 이용한 강건한 한국어 의존구조 분석)

  • Oh, Jin-Young;Cha, Jeong-Won
    • Annual Conference on Human and Language Technology
    • /
    • 2008.10a
    • /
    • pp.23-28
    • /
    • 2008
  • 한국어 처리에서 구문분석기에 대한 요구는 많은 반면 성능의 한계와 강건함의 부족으로 인해 채택되지 못하는 것이 현실이다. 본 연구는 구문분석을 레이블링 문제로 전환하여 성능, 속도, 강건함을 모두 실현한 시스템에 대해서 설명한다. 우리는 다단계 구 단위화(Cascaded Chunking)를 통해 한국어 구문분석을 시도한다. 각 단계에서는 어절별 품사 태그와 어절 구문표지를 자질로 사용하고 Conditional Random Fields(CRFs)를 이용하여 최적의 결과를 얻는다. 98,412문장 세종 구문 코퍼스로 학습하고 1,430문장(평균 14.59어절)으로 실험한 결과 87.30%의 구문 정확도를 보였다. 이 결과는 기존에 제안되었던 구문분석기와 대등하거나 우수한 성능이며 기존 구문분석기가 처리하지 못하는 장문도 처리 가능하다.

  • PDF

Syntax Analysis of Korean Based on Clausal Segmentation using Sentence Patterns Information as a Constraint (문형을 제약 조건으로 하는 단문 분할 기반 한국어 구문분석)

  • Lee, Hyeon-Yeong;Lee, Yong-Seok
    • Annual Conference on Human and Language Technology
    • /
    • 2006.10e
    • /
    • pp.140-147
    • /
    • 2006
  • 한국어 문장은 하나 이상의 용언으로 인해 구문 분석 과정에서 다양한 구문 모호성이 발생한다. 이들 중 대부분은 내포문의 수식 범위로부터 발생되는 구 부착의 문제 때문이다. 이런 구운 모호성은 내포문의 범위를 정해서 하나의 구문 범주의 기능을 가지도록 하면 해결할 수가 있다. 본 논문에서는 내포문의 범위를 정하기 위해서 문형과 한국어의 구문 특성을 이용한다. 먼저, 내포문에 있는 용언의 문형 정보가 가질 수 있는 필수격을 최대로 부착하여 내포문의 범위를 정해서 단문으로 분할한다. 그리고 한국어의 구문 특성을 이용해서 분할된 내포문의 기능을 하나의 구문 범주인 체언구나 부사구로 변환한다. 이렇게 함으로써 복합문의 구성 형태가 단문 구조로 변환되기 때문에 내포문의 범위에 의한 구 부착의 문제가 쉽게 해결된다. 이것을 본 논문에서는 내포문의 단문 분할이라고 한다. 본 논문에서 제안한 방법으로 432 문장을 실험한 결과 문형과 단문 분할을 이용하지 않은 방범보다 구문모호성이 87.73% 감소되었다.

  • PDF

Multi-head Attention and Pointer Network Based Syllables Dependency Parser (멀티헤드 어텐션과 포인터 네트워크 기반의 음절 단위 의존 구문 분석)

  • Kim, Hong-jin;Oh, Shin-hyeok;Kim, Dam-rin;Kim, Bo-eun;Kim, Hark-soo
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.546-548
    • /
    • 2019
  • 구문 분석은 문장을 구성하는 어절들 사이의 관계를 파악하여 문장의 구조를 이해하는 기술이다. 구문 분석은 구구조 분석과 의존 구문 분석으로 나누어진다. 한국어처럼 어순이 자유로운 언어에는 의존 구문 분석이 더 적합하다. 의존 구문 분석은 문장을 구성하고 있는 어절 간의 의존 관계를 분석하는 작업으로, 각 어절의 지배소를 찾아내어 의존 관계를 분석한다. 본 논문에서는 멀티헤드 어텐션과 포인터 네트워크를 이용한 음절 단위 의존 구문 분석기를 제안하며 UAS 92.16%, LAS 89.71%의 성능을 보였다.

  • PDF

Structural Transfer through English Parsing (구조 변환을 겸한 영어 구문 분석기)

  • 여상화;서정연
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.507-509
    • /
    • 2003
  • 본 논문에서 제안하는 영어 Parser는 Bottom-Up Best-First Chart Parser를 기반으로 영어 구문 분석과 동시에 영$\longrightarrow$한 구조변환을 수행한다. 따라서, 영어 입력문에 대한 파서의 결과는 한국어 구운 Tree가 된다. 구문 분석과 변환을 동시에 수행하므로, 번역 과정을 단순화하고 번역지식 관리가 용이하여 번역기의 튜닝이 용이하다. 구현된 파서는 대규모 문법 규칙에 대응하기가 용이하고. 새로운 규칙의 추가가 용이하여 번역기의 점진적인 성능 향상이 가능하다.

  • PDF

Korean Question-Answering System using Syntactic-Relation Information (구문 관계 정보를 이용한 한국어 질의-응답 시스템)

  • 신승은;이대연;서영훈
    • The Journal of the Korea Contents Association
    • /
    • v.4 no.2
    • /
    • pp.36-42
    • /
    • 2004
  • This paper describes the Korean Question answering system using the syntactic-relation information d verbs to overcome lack of reliable knowledge and linguistic resources. The syntactic-relation information consists d the original form d a verb, usual usage pattern, semantic category of each dependent noun, synonym verbs and passive verbs. We use the syntactic-relation information to parse sentences or phrases with usual usage pattern of the verb and semantic conditions of dependent components on the verb. We also use that information to parse answer candidate sentences, and find an answer from questioned case slot. Our experiments that usage of the syntactic-relation information of verbs to mm lack of reliable knowledge and linguistic resources can be utilized efficiently for the Korean question answering system.

  • PDF

Korean Dependency Parsing Using Statistical/Semantic Information (통계/의미 정보를 이용한 한국어 의존 파싱)

  • Jang, Myung-Gil;Ryu, Pum-Mo;Park, Jae-Deuk;Park, Dong-In;Myaeng, Sung-Hyun
    • Annual Conference on Human and Language Technology
    • /
    • 1997.10a
    • /
    • pp.313-319
    • /
    • 1997
  • 한국어 의존 파싱에서는 불필요한 의존관계의 과다한 생성과 이에 따른 다수의 구문분석 결과 생성에 대처하는 연구가 필요하다. 본 논문에서는 한국어 의존 파싱 과정에서 생기는 불 필요한 의존관계에 따른 다수의 후보 의존 트리들에 대하여 통계/의미 정보를 활용하여 최적 트리를 결정하는 구문 분석 방법을 제안한다. 본 논문의 구문 분석에서 사용하는 통계/의미 정보는 구문구조부착 말뭉치(Tree Tagged Corpus)를 이용하여 구축한 술어 하위범주화 정보 사전에서 얻었으며, 이러한 정보를 활용한 구문 분석은 한국어 구문 분석의 모호성 해소에 적용되어 한국어 구문 분석의 정확도를 높인다.

  • PDF

Lexical and Phrasal Analysis of Online Discourse of Type 2 Diabetes Patients based on Text-Mining (텍스트마이닝 기법을 이용한 제 2형 당뇨환자 온라인 담론의 어휘 및 구문구조 분석)

  • Hwang, Moonl-Hyon;Park, Jungsik
    • Journal of Digital Convergence
    • /
    • v.12 no.6
    • /
    • pp.655-667
    • /
    • 2014
  • This paper has identified five major categories of the T2D patients' concerns based on an online forum where the patients voluntarily verbalized their naturally occurring emotional reactions and concerns related to T2D. We have emphasized the fact that the lexical and phrasal analysis brought to the forefront the prevailing negative reactions and desires for clear information, professional advice, and emotional support. This study used lexical and phrasal analysis based on text-mining tools to estimate the potential of using a large sample of patient conversation of a specific disease posted on the internet for clinical features and patients' emotions. As a result, the study showed that quantitative analysis based on text-mining is a viable method of generalizing the psychological concerns and features of T2D patients.

Applikative Konstruktion und Partizipantenrelationen (적용구문과 참여자관계)

  • Shin Yong-Min
    • Koreanishche Zeitschrift fur Deutsche Sprachwissenschaft
    • /
    • v.6
    • /
    • pp.57-78
    • /
    • 2002
  • 적용구문(Applikative Konstruktion)은 타동사 구문의 일종이며 적용동사(Applikatives Verb)는 두 가지 유형으로 나눌 수 있다 적용동사가 자동사에서 타동사화 된 경우면 자동사에서는 없던 직접 목적어를 위한 슬롯이 적용형태소(Applikativmarker)를 통해 생긴다. 타동사에서 적용형태소의 삽입을 통해 변화된 적용동사는 두 개의 직접목적어를 취할 수 있는 동사의 특징을 나타내거나, 동사의 논항구조를 재배열하는 기능을 가진다. '논항구조 재배열'(rearrangement of argument structure)의 가장 전형적인 예는 타동사의 주변적인 참여자(peripherer Partizipant)를 적용동사를 통해 격상(Promotion) 시키는 반면 핵심참여자(zentraler Partizipant)는 격하(Demotion) 되는 구문이다. 즉 비 적용구문의 주변적인 참여자가 적용구문에서는 핵심참여자로서 직접목적어(direktes Objekt)의 통사적 기능을 가지는 것이다. 이러한 현상은 세계 여러 나라 언어에서 찾아 볼 수 있는데 본 논문에서는 독일어, 유카텍마야어, 인도네시아어, 캄베라어를 연구대상으로 삼았으며 이들 각 언어에서 어떤 참여자관계(Partizipantenrelation)가 적용구문의 직접목적어로 표현될 수 있는가를 살펴보았다. 이들 언어에서는 장소(Lokation)>수혜자($Benfizi\"{a}r$) & 수취인(Rezipient) > 동반자(Komitativ) > 기구(Instrument) 등의 순서로 가능하다. 이 것을 페터슨(1999)의 연구결과와 종합하여 살펴보면 적용구문의 직접목적어로 나타날 수 있는 참여자들의 순서는 루라기(2000)에 소개된 참여자의 원인연쇄(Kausale Kette)의 역순과 거의 일치하는 것을 볼 수 있는데 제일 자주 나타나는 참여자를 그 순서대로 보면 다음과 같다: 수혜자($Benefizi\"{a}r$) & 수취인(Rezipient)<장소(Lokation)>동반자(Komitativ) & 기구(Instrument)> 원인(Ursache). 이러한 순서를 우리는 '적용성의 위계'($Applikativit\"{a}tshierarchie$)라 부를 수 있으며 이것을 가능한 많은 언어에 유효한 언어의 보편성 중의 하나가 될 수 있다는 가설을 제기해 본다.

  • PDF

Building Korean Dependency Treebanks Reflected Chunking (구묶음을 반영한 한국어 의존 구조 말뭉치 생성)

  • Namgoong, Young;Kim, Chang-Hyun;Cheon, Min-Ah;Park, Ho-Min;Yoon, Ho;Choi, Min-Seok;Kim, Jae-Kyun;Kim, Jae-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.133-138
    • /
    • 2019
  • 의존 구문 분석은 문장 구성 요소의 위치에 제약이 적고 생략에도 유연하게 대처할 수 있어 한국어 구문 분석에 적합하다. 하지만 의존 구문 분석을 수행할 때 지배소를 결정해야 할 노드 수가 많으면 계산의 복잡도가 올라가고, 각 노드의 지배소를 결정할 때 방향성 문제가 있어 구문 분석에 모호함을 더한다. 이때 지배소 후위 원칙을 엄격하게 적용할 경우 구문적 중심어와 의미적 중심어가 불일치하는 문제가 발생한다. 이러한 문제들을 해소하기 위해 구묶음을 수행한 문장으로 구문 분석을 수행할 수 있다. 따라서, 본 논문에서는 기존의 의존 구문 말뭉치를 말덩이 기반의 의존 구문 말뭉치로 변환하는 알고리즘을 기술하고, 이에 따라 구축한 말뭉치와 기존의 말뭉치를 정량적으로 비교한다.

  • PDF