• 제목/요약/키워드: grammar induction

검색결과 7건 처리시간 0.022초

형태소 단위의 한국어 확률 의존문법 학습 (Korean Probabilistic Dependency Grammar Induction by morpheme)

  • 최선화;박혁로
    • 정보처리학회논문지B
    • /
    • 제9B권6호
    • /
    • pp.791-798
    • /
    • 2002
  • 본 논문에서는 코퍼스를 이용한 확률 의존문법 자동 생성 기술을 다룬다. 한국어의 부분 자유 어순성질과 문장의 필수적 성분의 생략과 같은 특성으로 인하여 한국어 구문분석에 관한 연구들에서는 주로 의존문법을 선호하고 있다. 본 논문에서는 기존의 어절단위학습방법에서는 학습할 수 없었던 어절 내의 의존관계를 학습할 수 있는 형태소 단위의 학습 방법을 제안한다. KAIST의 트리 부착 코퍼스 약 3만 문장에서 추출한 25,000문장의Tagged Corpus을 가지고 한국어 확률 의존문법 학습을 시도하였다. 그 결과 초기문법 2,349개의 정확한 문법을 얻을 수 있었으며, 문법의 정확성을 실험하기 위해 350개의 실험문장을 parsing한 결과 69.77%의 파싱 정확도를 보였다. 이로서 한국어 어절 특성을 고려한 형태소 단위 학습으로 얻어진 의존문법이 어절 단위 학습으로 얻어진 문법보다 더 정확하다는 사실을 알 수 있었다.

Fast Ftatistical Grammar Induction

  • Hogenhout, Wide-R.;Matsumoto, Yuji
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 1996년도 Language, Information and Computation = Selected Papers from the 11th Pacific Asia Conference on Language, Information and Computation, Seoul
    • /
    • pp.383-392
    • /
    • 1996
  • PDF

Automatic Acquisition of Lexical-Functional Grammar Resources from a Japanese Dependency Corpus

  • Oya, Masanori;Genabith, Josef Van
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2007년도 정기학술대회
    • /
    • pp.375-384
    • /
    • 2007
  • This paper describes a method for automatic acquisition of wide-coverage treebank-based deep linguistic resources for Japanese, as part of a project on treebank-based induction of multilingual resources in the framework of Lexical-Functional Grammar (LFG). We automatically annotate LFG f-structure functional equations (i.e. labelled dependencies) to the Kyoto Text Corpus version 4.0 (KTC4) (Kurohashi and Nagao 1997) and the output of of Kurohashi-Nagao Parser (KNP) (Kurohashi and Nagao 1998), a dependency parser for Japanese. The original KTC4 and KNP provide unlabelled dependencies. Our method also includes zero pronoun identification. The performance of the f-structure annotation algorithm with zero-pronoun identification for KTC4 is evaluated against a manually-corrected Gold Standard of 500 sentences randomly chosen from KTC4 and results in a pred-only dependency f-score of 94.72%. The parsing experiments on KNP output yield a pred-only dependency f-score of 82.08%.

  • PDF

한국어 확률 의존문법 학습 (Probabilistic Dependency Grammar Induction)

  • 최선화;박혁로
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.513-515
    • /
    • 2003
  • 본 논문에서는 코퍼스를 이용한 확률 의존문법 자동 생성 기술을 다룬다. 의존문법 생성을 위해 구성성분의 기능어들 간의 의존관계를 학습했던 기존 연구와는 달리. 한국어 구성성분은 내용어와 기능어의 결함 형태로 구성되고 임의 구성성룬 기능어와 임의 구성성분 내용어간의 의존관계가 의미가 있다는 사실을 반영한 의존문법 학습방법을 제안한다. KAIST의 트리 부착 코퍼스 31,086문장에서 추출한 30,600문장의 Tagged Corpus을 가지고 학습한 결과 초기문법을 64%까지 줄인 1.101 개의 의존문법을 획득했고. 실험문장 486문장을 Parsing한 결과 73.81%의 Parsing 정확도를 보였다.

  • PDF

어절 내부 의존관계를 고려한 확률 의존 문법 학습 (Probabilistic Dependency Grammar Induction using Internal Dependency Relation in Words)

  • 최선화;박혁로
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.507-510
    • /
    • 2001
  • 본 논문에서는 코퍼스를 이용한 확률 의존문법 자동 생성 기술을 다룬다. 특히 의존 문법 생성을 위해 확률 재추정 알고리즘을 의존문법생성에 맞도록 변형하여 학습하였으며 정확한 문법 생성 및 회귀데이터(Data Sparseness)문제 해결을 위해서 구성요소의 대표 지배소들 간의 의존관계 만을 학습했던 기존 연구와는 달리 구성요소 내부의 의존관계까지 학습하는 방법을 제안한다. KAIST 의 트리 부착 코퍼스 31,086 문장에서 추출한 25,000 문장의 Tagged Corpus 을 가지고 한국어 확률 의존 문법 학습을 시도 하였다. 그 결과 초기문법을 10.97% 에서 23.73% 까지 줄인 2,349 개의 정확한 문법을 얻을 수 있었다. 문법의 정확성을 실험 하기 위해 350 개의 실험문장을 Parsing 한 결과 69.61%의 파싱 정확도를 보였다. 이로서 구성요소 내부의 의존관계 학습으로 얻어진 의존문법이 더 정확했으며, 회귀데이터 문제 또한 극복할 수 있음을 알 수 있었다.

  • PDF

초등학생들이 프로그래밍 학습 시 발생하는 오류유형 분석 (Analysis of Error Types occurring on Elementary School Student's Programming Learning)

  • 문외식
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권2호
    • /
    • pp.319-327
    • /
    • 2006
  • 인지능력이 뛰어난 초등학교 고학년에는 컴퓨터 활용교육 보다 컴퓨터 기초원리 또는 프로그래밍교육이 필요하다. 본 연구에서는 재량 특별활동시간 혹은 방과 후 특기적성시간에 고학년(4,5,6학년)을 대상으로 프로그래밍교육 시 발생 가능한 문제점들을 미리 예측하고 대처하는 방법으로 초등학생들이 프로그램 작성 및 실행과정에서 발생하는 모든 오류들을 수집한 후 이를 유형별로 분류하고 분석하였다. 분석된 오류들을 활용하면 최적의 프로그래밍 교육과정을 작성할 수 있으며 이를 기초로 교수 학습 시 학습효과와 흥미도 유발에 큰 도움을 줄 수 있다. 본 연구에서 수집한 오류들의 분석에서는 초등학생들이 프로그래밍 시 어려워하는 영역들은 소프트웨어 사용미숙으로 인한 단순오류, 영어로 된 예약어 사용미숙 등으로 인한 단순코딩이 가장 많았으며 다음으로 문법 이해의 어려움으로 발생하는 오류들이 가장 많았다. 이러한 오류의 유형들은 상업용 소프트웨어개발 업체에서 분석된 오류의 유형과 반대 현상으로 나타났으나 점차 교수 학습이 향상되면 같은 현상으로 바람직하게 나타날 것으로 예측된다.

  • PDF

VR애니메이션 <Goodbye Mr Octopus> 연출 연구 (A Study of Direction of VR Animation <Goodbye Mr Octopus>)

  • 이태구;박수경
    • 문화기술의 융합
    • /
    • 제9권1호
    • /
    • pp.135-140
    • /
    • 2023
  • VR애니메이션은 애니메이션 속 공간에 위치하면서 기존 애니메이션 연출에서 볼 수 없는 360도 화면 연출을 볼 수 있다. 2020년에 제작된 VR 애니메이션 <Goodbye Mr Octopus>는 몰입형 단편 영화로 제77회 베니스 영화제에서 선정되었다. 열여섯 번째 생일을 맞은 사춘기 소녀 스텔라와 엄격한 아버지와의 갈등을 어머니의 편지로 해결되는 이야기이다. 총 11개의 씬으로 구성된 서사로 각 씬에는 시선유도, 시간흐름, 공간전환, 외화면 연출 등 VR영상 문법의 새로운 연출적 요소가 분석되었다. 시선유도 연출은 360도 시선의 불편함을 최소화하였으며, 시간 및 공간전환 연출은 서사적 사건에 따른 관객의 몰입도를 높이고, 외화면 연출은 VR공간의 확장 효과로 분석되었다.