• 제목/요약/키워드: 생성문법

검색결과 244건 처리시간 0.03초

HRNCE 문법의 언어 생성력 (Language-generating-Power of HRNCE Grammars)

  • 정태의;박동선
    • 한국정보처리학회논문지
    • /
    • 제3권7호
    • /
    • pp.1659-1668
    • /
    • 1996
  • 스트링 문법은 그래프 언어와 부분집합인 스트링 언어를 생성하는 반면 그래프 문법은 그래프 언어를 생성한다. 그래프 문법 모델중 가장 성공적인 것중의 하나인 NLC문법은 노드 레이블을 이용하여 하나의 노드를 하나의 그래프로 치환 하므로서 그래프를 생성한다. 그래프를 포함하는 하아피그래프를 생성하는 하이퍼그래프 문법 모델로는 미리 정해놓은 접착점들의 순서를 이용하여 하나의 하이퍼에지를 하나의 하이퍼그래프로 치환하는 CFHG 문법, CFHG 문법의 확장형으로서 복제 및 삭제의 방벙 을 통해 하이페이지와 그것이 포함하고 있는 노드들, 즉 하나의 핸들을 하나의 하아 퍼그래프로 차환하는 HH 문법, 그리고 eNCE방식을 이용하여 하나의 핸들을 하나의 하아퍼그래프로 치환하는 HRNCE 문법 등이 소개되었다. 본 논문에서는 HRNCE 문법이 생성하는 그래프 언어와 위에서 언급된 기타의 그래프 문법들이 생성하는 그래프 언어 들을 비교하므로서 HRNCE 문법과 타 그래프 문법들의 언어 생성력을 비교 검토하고자 한다.

  • PDF

어절 내부 의존관계를 고려한 확률 의존 문법 학습 (Probabilistic Dependency Grammar Induction using Internal Dependency Relation in Words)

  • 최선화;박혁로
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.507-510
    • /
    • 2001
  • 본 논문에서는 코퍼스를 이용한 확률 의존문법 자동 생성 기술을 다룬다. 특히 의존 문법 생성을 위해 확률 재추정 알고리즘을 의존문법생성에 맞도록 변형하여 학습하였으며 정확한 문법 생성 및 회귀데이터(Data Sparseness)문제 해결을 위해서 구성요소의 대표 지배소들 간의 의존관계 만을 학습했던 기존 연구와는 달리 구성요소 내부의 의존관계까지 학습하는 방법을 제안한다. KAIST 의 트리 부착 코퍼스 31,086 문장에서 추출한 25,000 문장의 Tagged Corpus 을 가지고 한국어 확률 의존 문법 학습을 시도 하였다. 그 결과 초기문법을 10.97% 에서 23.73% 까지 줄인 2,349 개의 정확한 문법을 얻을 수 있었다. 문법의 정확성을 실험 하기 위해 350 개의 실험문장을 Parsing 한 결과 69.61%의 파싱 정확도를 보였다. 이로서 구성요소 내부의 의존관계 학습으로 얻어진 의존문법이 더 정확했으며, 회귀데이터 문제 또한 극복할 수 있음을 알 수 있었다.

  • PDF

적대적 생성 신경망을 이용한 문법 오류 교정 (Grammatical Error Correction Using Generative Adversarial Network)

  • 권순철;유환조;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.488-491
    • /
    • 2019
  • 문법 오류 교정은 문법적으로 오류가 있는 문장을 입력 받아 오류를 교정하는 시스템이다. 문법 오류 교정을 위해서는 문법 오류를 제거하는 것과 더불어 자연스러운 문장을 생성하는 것이 중요하다. 이 연구는 적대적 생성 신경망(GAN)을 이용하여 정답 문장과 구분이 되지 않을 만큼 자연스러운 문장을 생성하는 것을 목적으로 한다. 실험 결과 GAN을 이용한 문법 오류 교정은 MaxMatch F0.5 score 기준으로 0.4942을 달성하여 Baseline의 0.4462보다 높은 성능을 기록했다.

  • PDF

공간 파서의 자동 생성 시스템에 대한 구현 (Implementation of a Spatial Parser generator)

  • 정석태;정성태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.202-204
    • /
    • 2001
  • 본 논문에서는 GUI(Graphical User Interface)를 사용하여 사용자가 상호 작용적으로 도형 언어(visual language)의 문법을 기술함으로서 자동으로 공간 파서를 생성하는 공간 파서 생성기 SPG(Spatial falser Generator)의 구현에 대하여 논한다. 본 시스템의 장점은 다음과 같다. (1) 사용자가 도형 언어의 문법을 정의하고 실제로 파싱하고 싶은 도형 언어를 입력하는데 사용되는 도형 에디터를 가지고 있다. (2) 사용자가 도형을 이용하여 대략적인 문법을 자동으로 생성한 뒤, 수정하여 최종적인 문법을 정의하도록 한다. (3) 제약 해소기(Constraint solver)를 가지고 있어서 파싱된 도형 언어들이 그 생성 규칙에 쓰여져 있는 제약을 유지한다.

  • PDF

한국어 확률 의존문법 학습 (Probabilistic Dependency Grammar Induction)

  • 최선화;박혁로
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.513-515
    • /
    • 2003
  • 본 논문에서는 코퍼스를 이용한 확률 의존문법 자동 생성 기술을 다룬다. 의존문법 생성을 위해 구성성분의 기능어들 간의 의존관계를 학습했던 기존 연구와는 달리. 한국어 구성성분은 내용어와 기능어의 결함 형태로 구성되고 임의 구성성룬 기능어와 임의 구성성분 내용어간의 의존관계가 의미가 있다는 사실을 반영한 의존문법 학습방법을 제안한다. KAIST의 트리 부착 코퍼스 31,086문장에서 추출한 30,600문장의 Tagged Corpus을 가지고 학습한 결과 초기문법을 64%까지 줄인 1.101 개의 의존문법을 획득했고. 실험문장 486문장을 Parsing한 결과 73.81%의 Parsing 정확도를 보였다.

  • PDF

비 환형 속성 문법을 이용한 코드 생성 시스템 (The Code Generating System using Noncircular Attribute Grammar)

  • 김상훈
    • 정보학연구
    • /
    • 제6권4호
    • /
    • pp.113-123
    • /
    • 2003
  • 본 논문은 사이클이 없는 속성문법을 사용한 코드 생성에 관한 연구이다. 이 연구를 수행하는 목적은 비 순환 속성문법을 기술하고 속성 문법을 표현하는 메타 언어인 속성 기술 언어를 설계하는 것이다. 여기서, 비 환형 속성 문법으로 L-attributed grammar를 사용한다. 본 시스템은 속성 문법으로부터 정보를 얻기 위한 분석기와 속성 평가기로 구성되어 있다. 속성 문법 분석기는 속성 기술 언어를 취하고 속성 평가기에 의해 요구되는 유용한 정보를 생성한다. 속성 평가는 이 정보를 사용하여 속성 값을 계산한다.

  • PDF

통합지식표현에 의한 자연언어처리기법 : 한글 구 구조문법

  • 정희성
    • ETRI Journal
    • /
    • 제11권1호
    • /
    • pp.59-74
    • /
    • 1989
  • 컴퓨터에 의한 종래의 자연언어처리에서는 보통 생성과 인식과정에서 서로 다른 지식 표현과 프로그램을 쓰고, 음운처리, 형태처리, 통어처리, 의미처리로 분리되어 있는 것이 통례이다. 이것을 분할접근법(devide and conguer approach)이라 부른다. 분할접근법은 인간의 언어처리에 있어서의 생성, 인식간의 체계적 관계를 포착하지 못할 뿐 아니라 공학적으로도 갖가지의 문제를 안고 있다. 이 논문은 인간의 언어 생성과 인식과정의 관계를 설명하기 위하여 동일 심적 프로그램이 생성과정과 인식과정을 동시에 제어하고 있다는 가설에 선다. 이 가설을 취하는 것은 생성과 인식의 프로그램과 문법을 각각 통합하고 음운처리, 형태처리, 통어처리, 의미처리를 동시에 행해야 한다는 것을 의미한다. 이것을 통합접근법(unifying approach)이라 부른다. 통합 접근법은 예를 들어 구 구조문법 (Pharase Structure Grammar)과 단일화 (unification)에 의해서 실현할 수 있다. 구 구조 문법을 이용하여 음운정보, 형태정보, 구문정보, 의미정보를 동일의 구조중에 표현할 수 있고 그 위에 이들의 정보표현을 모두 단일화에 의해 동시에 처리할 수 있다. 단일화는 입출력의 방향을 제한하지 않으므로 생성.인식 양쪽의 문법을 얻을 수 있다. 또 단일화되는 패턴에 충족 가능한 조건을 부여함에 따라 패턴에 다양한 정보를 갖게 할 수 있으므로 처리상의 일반성을 파악할 수 있으며 처리 효율을 확보할 수 있다. 이 논문에서는 통합접근법을 도입한 한글기술문법 : KPSG(Korean Phrase Structure Grammer)의 선진성에 대해서 논의하고 있다.

  • PDF

영한 기계번역의 한국어 생성 시스템에서 조동사의 생성 (Generation of Auxiliary Verbs in a Korean Generation System of English-Korean Machine Translation)

  • 안동언;조정미;김길창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.533-544
    • /
    • 1993
  • 기계번역에서 기능어의 번역은 각 언어가 고유의 문법적 특성과 표현방법을 가지고 있기 때문에 기능어가 가지는 의미와 문법적 기능을 자질로 표현하고 이를 통하여 해석과 생성을 한다. 한국어는 첨가어로 기능어가 매우 발달되어 있으며, 특히 조동사가 많은 문법적 기능을 담당하고 화자의 양태적 관계를 나타낸다. 따라서, 기계번역의 한국어 생성에서 조동사가 번역의 질에 상당한 영향을 미친다. 본 논문에서는 중간언어방식을 이용한 기계번역시스템의 한국어 생성에서 문법적 기능이나 양태적 관계를 나타낸 중간언어로부터 어떠한 조동사가 생성이 되어야 하고, 또한 조동사들간의 결합순서는 어떠한지를 살펴본다. 이를 위하여 Corpus를 분석하여 각 조동사 분류에 대한 대표 표층어를 선정하고 조동사간의 결합순서를 밝힌다. 조동사 생성을 위해 필요한 처리 과정과 언어적 지식베이스를 제안하고 시스템을 구현한다.

  • PDF

LL 언어의 특징화 (Characterization of LL languages)

  • 이경옥
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권1_2호
    • /
    • pp.126-131
    • /
    • 2002
  • 주어진 문법이 LL 언어를 생성하는가의 문제를 LL 변환 가능성의 관점에서 조사한다. LL 변환 가능 문법을 특징짓기 위해 기존의 방법은 비결정적인(nondeterministic) 복잡한 파서의 생성을 필요로 한다. 이에 기존 방법으로는 LL 언어의 본질에 대한 직관적인 이해가 어렵다. 이 단점을 극복하고자 본 논문에선 파서의 생성 없이 문법 자체의 분석을 통한 문법 유도(derivation)에 근거한 특징화를 제시한다. 새로운 특징화는 LL 언어의 본질에 대한 직관적인 이해를 도울 수 있다.

영-한 기계 번역에서 조건 단일화 기반 변환 문법 해석기 (Transfer Grammar Compiler Based on Conditional Unification for English-Korean Machine Translation)

  • 김남수;전현경;박영진;이용석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.198-200
    • /
    • 1998
  • 영-한 기계번역에 있어서 변환(Transfer)은 상이한 두 언어의 어순을 생성될 언어의 어순으로 결정하기 위한 변환 규칙에 의해서 영어의 구문 분석된 트리를 생성될 한국어의 구조에 맞게 재구성한다. 이러한 변환은 개발 단계 중 또는 그 후에 언어의 다양한 차이를 수용하기 위해 프로그램 수준에서 잦은 수정을 하게 된다. 이를 극복하기 위해서, 본 논문에서는 변환 문법을 이용하여 좀더 체계적이고 확장이 쉬운 문법을 이용하여 변환을 수행하고자 한다. 이를 위해 영어의 구구조 자질들을 쉽게 검사 및 탐색하면서 조건에 맞는 자질들을 나누어주는 기능을 하는 조건 단일화 연산자를 기반으로 일반적인 문맥자유문법(Context Free Grammar)을 이용한 변환 문법을 제안한다. 또한 변환 문법은 변환 문법 해석기에 의해 변환 프로그램으로 컴파일 됨을 보인다. 이러한 변환 방법은 영-한 변환에 있어서 문법 수준에서 변환 처리를 할 수 있어 변환 프로그램의 개발 및 유지보수에 많은 도움을 준다.

  • PDF