• 제목/요약/키워드: 구문관계

검색결과 292건 처리시간 0.028초

격 관계와 상호정보를 이용한 한국어 의존 파서 (A Study on Korean Dependency Parser Using Case Relation and Mutual Information)

  • 정석원;박의규;나동열;윤준태
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.450-456
    • /
    • 2001
  • 본 논문은 의존 문법에 기반만 한국어의 구문 분석 시스템을 제안한다. 일반적으로 올바른 구둔 구조를 얻기 위해서 많은 가능한 구문 구조를 생성하고 이 중에서 가장 좋은 것을 선택하는 방법을 사용한다. 이를 위하여 가능한 모든 구문 분석 구조를 생성하는 기법을 제안하였다. 이것은 모든 가능한 구문 구조에 관한 정보를 응축한 자료 구조를 구축한 다음 여기에서 구문 트리를 하나씩 추출하도록 하였다. 이 과정에서 의존 문법이 만족하여야 하는 모든 기본적인 제약 조건을 만족하는 트리 만이 효과적으로 추출되는 기법을 제안하였다. 그 결과 생성되는 트리의 수를 줄이게 되어 효율적인 구문 분석을 달성할 수 있게 되었다. 추출된 많은 트리 중에서 하나를 선택하는 작업에서 상호 정보가 이용되었다. 본 논문에서는 이러한 상호 정보를 구문 분석 중의성 해소에 효과적으로 사용하는 기법을 제시하였다. 제안된 기법의 타당성을 입증하기 위하여 구문 분석 시스템을 개발하고 여러 문장에 대한 분석을 실험하였다.

  • PDF

구문 분석 결과를 이용한 한국어 무제한 정보추출 (A Syntax-Based Hybrid System for Korean Open Information Extraction)

  • 김병수;유환조;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.41-45
    • /
    • 2015
  • 무제한 정보추출은 주로 영어를 대상으로 연구가 진행 되었지만, 최근에는 영어가 아닌 다른 언어에 대한 적용이 시도되고 있다. 본 논문에서는 관계 어휘의 유형을 동사형과 명사형 2가지로 정의하고, 각 유형별로 구문 분석 결과 기반의 서로 다른 방법론을 적용하는 한국어 대상 무제한 정보추출 시스템을 소개한다. 동사형 관계 어휘에 대해서는 의존 관계 기반의 추출 규칙을 적용하고, 명사형 관계 어휘에 대해서는 대량의 말뭉치로부터 자동으로 학습한 의존 관계 구조 기반의 추출 패턴을 적용한다. 임의의 100개 문장에 대해서 수행한 결과는 산출된 전체 트리플에 대해 0.8이상의 정밀도를 보임으로써 본 논문에서 제안하는 방법의 효용성을 증명하였다.

  • PDF

자연어를 이용한 사용자 접속에 관한 연구

  • 이동애;장덕성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1990년도 제2회 한글 및 한국어정보처리 학술대회
    • /
    • pp.149-155
    • /
    • 1990
  • MS-DOS 명령을 대신하는 자연어 인터페이스를 연구하였다. 자연어로 입력되는 한국어 문장을 형태소분석, 구문분석, 의미분석, 개념분석을 통해 대응되는 일련의 MS-DOS 명령을 생성한다. 형태소 분석에서는 Tabular Parsing법을 사용하였고, 구문분석에서는 문법적인 수식-피수식 관계를 확대하여 의미상의 수식-피수식 관계를 설정하고 이에 따라 문장을 몇개의 단위로 나눈다. 의미분석에서는 동사와 이들 단위들간의 관계와 단위를 구성하는 어절들간의 관계를 격관계로 설정하여, 개념망(semantic network)으로 문장의 의미를 표현한다. 이 개념망으로부터 MS-DOS 명령을 생성한다.

  • PDF

지배가능 경로 문맥을 이용한 의존 구문 분석의 수식 거리 모델 (Modification Distance Model using Headible Path Contexts for Korean Dependency Parsing)

  • 우연문;송영인;박소영;임해창
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권2호
    • /
    • pp.140-149
    • /
    • 2007
  • 본 논문에서는 한국어 의존 구문 분석을 위한 새로운 확률 모델을 제안한다. 한국어가 자유 어순 언어라 할지라도 지역적 어순은 존재하기 때문에 의존관계를 결정하기 위해 의존하는 두 어절인 의존소와 지배소 사이의 수식 거리가 유용하다는 것은 이미 많은 연구를 통해 밝혀졌다. 본 연구에서는 수식거리의 정확한 수식 거리의 추정을 위해 지배가능 경로 문맥을 이용한 수식 거리 확률 모델을 제안한다. 수식 거리를 위해 지배가능 경로를 고려함으로써, 긴 표층 문맥을 압축하는 효과를 가져다 준다. 이를 통해 구문 분석 정확률 향상과 원거리 의존 관계 향상을 보임을 설명한다. 실험 및 평가를 통해 제안하는 모델의 구문 분석 성능은 86.9%이며, 기존에 제안된 구문 분석 모델과 비교하여 높은 구문 분석 결과를 보이며, 특히 원거리 의존관계에 대하여 더욱 향상된 성능을 보인다.

적용구문과 참여자관계 (Applikative Konstruktion und Partizipantenrelationen)

  • 신용민
    • 한국독어학회지:독어학
    • /
    • 제6집
    • /
    • pp.57-78
    • /
    • 2002
  • 적용구문(Applikative Konstruktion)은 타동사 구문의 일종이며 적용동사(Applikatives Verb)는 두 가지 유형으로 나눌 수 있다 적용동사가 자동사에서 타동사화 된 경우면 자동사에서는 없던 직접 목적어를 위한 슬롯이 적용형태소(Applikativmarker)를 통해 생긴다. 타동사에서 적용형태소의 삽입을 통해 변화된 적용동사는 두 개의 직접목적어를 취할 수 있는 동사의 특징을 나타내거나, 동사의 논항구조를 재배열하는 기능을 가진다. '논항구조 재배열'(rearrangement of argument structure)의 가장 전형적인 예는 타동사의 주변적인 참여자(peripherer Partizipant)를 적용동사를 통해 격상(Promotion) 시키는 반면 핵심참여자(zentraler Partizipant)는 격하(Demotion) 되는 구문이다. 즉 비 적용구문의 주변적인 참여자가 적용구문에서는 핵심참여자로서 직접목적어(direktes Objekt)의 통사적 기능을 가지는 것이다. 이러한 현상은 세계 여러 나라 언어에서 찾아 볼 수 있는데 본 논문에서는 독일어, 유카텍마야어, 인도네시아어, 캄베라어를 연구대상으로 삼았으며 이들 각 언어에서 어떤 참여자관계(Partizipantenrelation)가 적용구문의 직접목적어로 표현될 수 있는가를 살펴보았다. 이들 언어에서는 장소(Lokation)>수혜자($Benfizi\"{a}r$) & 수취인(Rezipient) > 동반자(Komitativ) > 기구(Instrument) 등의 순서로 가능하다. 이 것을 페터슨(1999)의 연구결과와 종합하여 살펴보면 적용구문의 직접목적어로 나타날 수 있는 참여자들의 순서는 루라기(2000)에 소개된 참여자의 원인연쇄(Kausale Kette)의 역순과 거의 일치하는 것을 볼 수 있는데 제일 자주 나타나는 참여자를 그 순서대로 보면 다음과 같다: 수혜자($Benefizi\"{a}r$) & 수취인(Rezipient)<장소(Lokation)>동반자(Komitativ) & 기구(Instrument)> 원인(Ursache). 이러한 순서를 우리는 '적용성의 위계'($Applikativit\"{a}tshierarchie$)라 부를 수 있으며 이것을 가능한 많은 언어에 유효한 언어의 보편성 중의 하나가 될 수 있다는 가설을 제기해 본다.

  • PDF

Beam Search 알고리즘을 이용한 효율적인 한국어 의존 구조 분석 (Efficient Analysis of Korean Dependency Structures Using Beam Search Algorithms)

  • 김학수;서정연
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.281-286
    • /
    • 1998
  • 구문분석(syntactic analysis)은 형태소 분석된 결과를 입력으로 받아 구문단위간의 관계를 결정해 주는 자연어 처리의 한 과정이다. 그러나 구문분석된 결과는 많은 중의성(ambiguity)을 갖게 되며, 이러한 중의성은 이후의 자연어 처리 수행과정에서 많은 복잡성(complexity)를 유발하게 된다. 지금까지 이러한 문제를 해결하기 위한 여러 가지 연구들이 있었으며, 그 중 하나가 대량의 데이터로부터 추출된 통계치를 이용한 방법이다. 그러나, 생성된 모든 구문 트리(parse tree)에 통계치를 부여하고, 그것들을 순위화하는 것은 굉장히 시간 소모적인 일(time-consuming job)이다. 그러므로, 생성 가능한 트리의 수를 효과적으로 줄이는 방법이 필요하다. 본 논문에서는 이러한 문제를 해결하기 위해 개선된 beam search 알고리즘을 제안하고, 기존의 방법과 비교한다. 본 논문에서 제안된 beam search 알고리즘을 사용한 구문분석기는 beam search를 사용하지 않은 구문분석기가 생성하는 트리 수의 1/3정도만으로도 같은 구문 구조 정확률을 보였다.

  • PDF

격조사 복원: 구문분석 전처리 (Case Particle Restoration as Preprocessing for Syntactic Analysis)

  • 서형원;권홍석;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.3-7
    • /
    • 2012
  • 본 논문은 구문분석의 전처리로서 생략된 한국어 격조사의 복원 방법을 제안한다. 격조사 생략은 체언과 용언 사이의 관계가 아주 밀접하여 생략하여도 의사 전달에 문제가 없을 경우에 자주 발생한다. 이렇게 생략된 조사는 구문분석의 복잡도를 크게 높일 뿐 아니라 구문 분석의 오류의 원인이 되기도 한다. 본 논문에서는 구문구조 부착 말뭉치를 분석하여 생략된 조사는 그 체언과 용언 사이의 거리가 매우 가깝다는 사실을 발견하였고 이 성질을 이용해서 기계학습 방법을 이용해서 생략된 조사를 복원하는 방법을 제안한다. 본 논문에서는 ETRI 구문구조 부착 말뭉치를 이용해서 실험한 결과, 생략된 조사의 81%를 정확하게 복원할 수 있었다.

  • PDF

부사 정보를 이용한 구문 구조 선택 (Parse Tree Selection using Adverb Information)

  • 신승은;정천영;서영훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.381-387
    • /
    • 2001
  • 자연 언어 처리의 구문 구조 분석에서는 수식 관계의 중의성에 의한 많은 구문 구조가 생성된다. 이러한 중의성을 해소하는데 어휘 정보가 유용하다는 것은 잘 알려져 있다. 본 논문은 한국어의 구문 구조 분석 시 중의성을 해소하기 위해 어휘 정보로 부사 수식 정보와 부사 확률 정보를 사용한다. 부사들의 사용과 수식 패턴들을 대량의 말뭉치로부터 조사하고, 수식 패턴들 중 비교적 규칙적인 것들을 부사 수식 정보로, 피수식어의 상대적 위치와 피수식어의 품사에 대한 확률을 부사 확률 정보로 구성하였다. 구문 구조들 중 가장 옳은 구문 구조를 선택하기 위해 부사 수식 정보와 부사 확률 정보를 이용하였고, 구문 분석에서 부사에 의한 중의성을 해소하였다.

  • PDF

기계학습 기법을 이용한 한국어 구문분석 (Korean Parsing using Machine Learning Techniques)

  • 이용훈;이종혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.285-288
    • /
    • 2008
  • 최근의 구문분석 연구는 컴퓨터 성능 향상과 사용 가능한 대량의 구문분석 말뭉치 증가, 견고한 기계학습 기법 개발 등에 힘입어 통계적인 모델 연구가 꾸준히 증가하고 있다. 본 논문에서는 기존에 개발된 다양한 기계학습 기법 중 ME(Maximum Entropy) 모델과 SVM(Support vector machine) 모델을 이용한 한국어 구문분석 방법을 제안한다. 국어정보베이스(KIBS) 구문분석 말뭉치를 가지고 실험한 결과 SVM 모델을 이용한 한국어 구문분석기가 기존의 확률 기반 통계적 한국어 구문분석기의 성능보다도 최대 1.84% 높은 87.46%의 의존관계 결정 정확률을 보였다. 추후 언어지식을 반영한 다양한 자질들을 이용할 경우 성능 향상이 기대된다.

  • PDF

문형 정보를 이용한 규칙 기반 한국어 의존구문분석 (Rules-based Korean Dependency Parsing using Sentence Pattern Informations.)

  • 김성태;김민호;김현아;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.139-143
    • /
    • 2019
  • 본 논문에서 제안하는 구문분석기는 품사 태거를 사용하지 않고 문장에서 나오는 모든 형태소 분석 후보에 의존관계를 부여하는 광범위 의존구문분석기이다. 중의성이 발생할 수 있는 문장에 대해 나오는 모든 후보 구문분석 트리를 출력하며 규칙을 통해 순위화를 진행한다. 또한 문형 정보 말뭉치의 적절한 사용을 위해 이전 연구의 한계점을 극복한 규칙과 알고리즘을 구현하고 문형 정보를 통해 후보 구문분석 트리의 순위화를 강화하였다. 뿐만 아니라 순위화가 어려운 [명사-관형사구] 자질에 대해 문형 정보를 사용하여 순위화를 강화하였다. 그 결과, 1순위의 구문 분석 트리에 대한 UAS(Unlabeled Attachment Score)가 0.52% 향상되었고, 후보트리에 대한 평균 정답 순위는 12.2%의 성능향상을 보였다.

  • PDF