• 제목/요약/키워드: 문맥자유언어

검색결과 15건 처리시간 0.02초

확률문맥자유문법의 규칙확률 추정을 위한 새로운 기법 (A New Method for Estimating Rule Probabilities of Stochastic Context-Free Grammars)

  • 변성찬;나동열
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.247-252
    • /
    • 1998
  • 본 논문에서는 확률문맥자유문법의 규칙확률을 추정하여 주는 새로운 알고리즘을 제시한다. 이 알고리즘은 이미 잘 알려진 인사이드-아웃사이드 알고리즘에 비하여 개념적으로 이해하기 쉽다는 장점을 가지고 있으며 속도면에서 훨씬 빠르다는 것이 실험으로 입증되었다.

  • PDF

규칙 기반 영한 기계번역에서의 구문 규칙 컴파일러 (Syntactic Rule Compiler in Rule-based English-Korean Machine Translation)

  • 김성동
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1315-1317
    • /
    • 2013
  • 규칙 기반의 영한 기계번역 시스템의 구문 분석 시스템은 영어의 구문 구조를 기술하는 규칙 부분과 규칙을 적용하여 차트 파싱을 수행하는 실행 부분으로 구성된다. 구문 규칙은 문맥 자유 문법의 형식으로 기술되는데, 기술된 구문 규칙을 적용하여 파싱을 실행하는 실행 부분은 C 언어 함수로 표현되므로, 구문 규칙을 C 언어 함수로 변환해야 한다. 본 논문에서는 문맥 자유 문법 형식으로 기술된 구문 규칙을 C 언어 함수로 변환하는 도구인 구문 규칙 컴파일러를 개발하였다. 구문 규칙 컴파일러는 자동적으로 구문 규칙을 C 언어 함수로 변환함으로써 영한 기계번역 시스템의 성능 개선 과정에서 빈번하게 발생하는 구문 규칙의 생성과 수정을 용이하게 하여 번역 성능을 개선하는 작업을 지원한다.

DBERT: 멀티턴 문맥의 특징을 고려한 대조 학습 기반의 임베딩 모델링 (DBERT: Embedding Model Based on Contrastive Learning Considering the Characteristics of Multi-turn Context )

  • 박상민;이재윤;김재은
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.272-274
    • /
    • 2022
  • 최근에는 사람과 기계가 자유롭게 대화를 주고받을 수 있는 자유 주제 대화 시스템(Open-domain Dialogue System)이 다양한 서비스에 활용되고 있다. 자유 주제 대화 시스템이 더욱 다양한 답변을 제공할 수 있도록 사전학습 기반의 생성 언어모델이 활용되고 있지만, 답변 제공의 안정성이 떨어져 검색을 활용한 방법 또한 함께 활용되고 있다. 검색 기반 방법은 사용자의 대화가 들어오면 사전에 구축된 데이터베이스에서 유사한 대화를 검색하고 준비되어있는 답변을 제공하는 기술이다. 하지만 멀티턴으로 이루어진 대화는 일반적인 문서의 문장과 다르게 각 문장에 대한 발화의 주체가 변경되기 때문에 연속된 발화 문장이 문맥적으로 밀접하게 연결되지 않는 경우가 있다. 본 논문에서는 이와 같은 대화의 특징을 고려하여 멀티턴 대화를 효율적으로 임베딩 할 수 있는 DBERT(DialogueBERT) 모델을 제안한다. 기존 공개된 사전학습 언어모델 기반의 문장 임베딩 모델과 비교 평가 실험을 통해 제안하는 방법의 우수성을 입증한다.

  • PDF

트리 합성 문법을 이용한 한국어 파싱 (Parsing Korean Using Tree Combining Grammar)

  • 양성일;나동렬
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.426-433
    • /
    • 1994
  • 본 논문에서는 트리의 점증적인 합성에 의하여 파싱을 진행시켜 나가는 파싱 방법을 소개하며 이의 한국어 파싱에의 응용을 살펴 본다. 이와 같은 트리 합성 파싱(tree combining parsing)을 지원하기 위한 문법인 트리 합성 문법(Tree Combining Grammar)을 소개한다. 우리는 먼저 문맥 자유 문법을 작성한 후 이로부터 자동적인 변환에 의하여 트리 합성 문법을 얻는 과정을 취한다. 따라서 트리 합성 파싱은 일종의 문맥 자유 파싱(context-free parsing)으로 볼 수 있으나 점증성(incremental), 하향성(top-down), 상향성(bottom-up), 유연성(flexible) 등과 같은 장점을 갖고 있다. 트리 합성 파싱의 유연성을 기반으로 하여 부분 자유 어순, 중심어 후행성과 같은 특성을 가진 한국어를 효과적으로 파싱할 수 있도록 트리 합성 파싱을 확장하는 방법을 살펴본다.

  • PDF

운전자 사용자경험기반의 인지향상 시스템 연구 (Driver's Behavioral Pattern in Driver Assistance System)

  • 조두리;신동희
    • 디지털콘텐츠학회 논문지
    • /
    • 제15권5호
    • /
    • pp.579-586
    • /
    • 2014
  • 본 논문은 문맥-자유 문법 (context-free grammar)를 이용하여, 차선변경 상황에서의 운전자의 행동패턴 인식을 하는 방법을 제안하는 것을 목표로 한다. 문맥-자유-문법은 기존 패턴인식 방식과는 대조적으로 유한적 기호로는 쉽게 표현될 수 없는 특징들을 비교적 손쉽게 표현할 수 있다. 이 방식을 적용하여, 동시에 여러 특징을 각각 고려해야 하는 좌표기반 데이터 처리 대신 심볼 시퀀스 방식 (symbolic sequence)을 패턴화하기 위해 구문론적 방식을 적용한다. 이 방법은 운전자와 안전 운전 분야 연구자들에게 효율적이고 보다 직관적인 방법으로 보다 더 효과적인 수행에 도움이 된다. 본 연구의 향후과제로 보다 안정적인 인식률을 획득하기 위해 확률적 구문분석 방법을 적용할 계획이다.

2-level grammar를 이용한 교육용 프로그래밍 언어 (The educational programming language based on 2-level grammar)

  • 오솔길;박성빈
    • 한국컴퓨터교육학회 학술대회
    • /
    • 한국컴퓨터교육학회 2017년도 하계학술대회
    • /
    • pp.29-30
    • /
    • 2017
  • W-grammar(Van Wijngaarden grammar)[1].란 형식 문법의 한 종류인 문맥 자유 문법(Context-free grammar, CFG)의 대안으로, 두 개의 CFG가 서로 상호작용하면서 언어를 정의하도록 구성된 문법을 말하며 그 구성상의 특징을 감안하여 2-level grammar라고도 부른다. 현재 많은 프로그래밍 언어는 CFG를 기반으로 구성되어 있는데, 본 연구에서는 W-grammar로 교육용 프로그래밍 언어를 정의하여 CFG 기반이 아닌 W-grammar 프로그래밍 언어의 진입점을 제공함과 동시에 기저의 문법에 따른 계산가능성에 대해서 연구하는 토대를 쌓는 것을 목표로 한다.

  • PDF

지배가능 경로 문맥을 이용한 의존 구문 분석의 수식 거리 확률 모델 (Modification Distance Model for Korean Dependency Parsing Using Headible Path Contexts)

  • 우연문;송영인;박소영;임해창;정후중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.40-47
    • /
    • 2006
  • 본 논문에서는 한국어 의존 구문 분석을 위한 새로운 확률 모델을 제안한다. 한국어가 자유 어순 언어라 할지라도 지역적 어순은 존재하기 때문에 의존관계를 결정하기 위해 의존하는 두 어절인 의존소와 지배소 사이의 수식 거리가 유용하다는 것은 이미 많은 연구를 통해 밝혀졌다. 본 연구에서는 수식 거리의 정확한 수식 거리의 추정을 위해 지배가능경로 문맥을 이용한 수식 거리 확률 모델을 제안한다. 제안하는 모델의 구문 분석 성능은 86.9%이며, 기존에 제안된 구문 분석 모델과 비교하여 높은 구문 분석 결과를 보이며, 특히 원거리 의존관계에 대하여 더욱 향상된 성능을 보인다.

  • PDF

반복학습법에 의해 작성한 N-gram 언어모델을 이용한 연속음성인식에 관한 연구 (Continuous Speech Recognition Using N-gram Language Models Constructed by Iterative Learning)

  • 오세진;황철준;김범국;정호열;정현열
    • 한국음향학회지
    • /
    • 제19권6호
    • /
    • pp.62-70
    • /
    • 2000
  • 일반적으로 통계적 언어모델의 확률을 추정하는 방법은 대량의 텍스트 데이터로부터 출현빈도가 높은 단어를 선택하여 사용하고 있다. 하지만 특정 태스크에서 적용할 언어모델의 경우 시간적, 비용적 측면을 고려할 때 대용량의 텍스트의 사용은 비효율적일 것이다. 본 논문에서는 특정 태스크에서 사용하기 위해 소량의 텍스트 데이터로부터 효율적인 언어모델을 작성하는 방법을 제안한다. 즉, 언어모델을 작성할 때 출현빈도가 낮은 단어의 빈도를 개선하기 위해 같은 문장을 반복하여 학습에 참가시키므로 단어의 발생확률을 좀 더 강건하게 하였으며 제안된 언어모델을 이용하여 3명이 발성한 항공편 예약관련 200문장에 대하여 연속음성인식 실험을 수행하였다. 인식실험 결과, 반복학습에 의해 작성한 언어모델을 이용한 경우가 반복학습 적용 전에 비하여 평균 20.4%의 인식률 향상을 보였다. 또한 기존의 문맥자유문법을 이용한 시스템과 비교하여 인식률이 평균 13.4% 향상되어 제안한 방법이 시스템에 유효함을 확인하였다.

  • PDF

자질 집합 표현에 의한 자연언어 문법 규칙 기술 (A Feature Set Description of Grammar Rules for Natureal Languages)

  • 박성숙;한성국
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.419-425
    • /
    • 1994
  • 문법체계내의 문법규칙은 규칙의 기술양식에 의해 언어특성이 결정된다. 본 논문에서는 문법 체계의 규칙기술을 위한 새로운 자질 집합 기술 (feature set description)을 제안하고, 이를 기반으로 한 파라메터화된 문맥자유문법 (parametrized context-free grammar : PCFG)을 정의하여, 자연언어의 문법규칙을 구성하는 방법에 대하여 기술한다. 자질 집합 기술은 간결한 규칙체계를 유지하면서 강력한 생성능력을 갖는 문법체계를 구현할 수 있어, 자연언어 처리 시스템에 효과적으로 적용할 수 있음을 보였다.

  • PDF

CFG를 이용한 소프트웨어 테스트 케이스의 자동 생성 (Automatic Generation of Software Test Cases using CFG)

  • 윤성희
    • 한국산학기술학회논문지
    • /
    • 제10권5호
    • /
    • pp.985-991
    • /
    • 2009
  • 문법 기반의 테스트 케이스 자동 생성(GBTG) 알고리즘은 문법 G를 기반으로 G에 의해 수용되는 문장들의 집합 L(G), 즉 소프트웨어 테스트를 위한 테스트 케이스를 생성한다. 문맥 자유 문법으로 기술되는 대부분의 언어들은 순환적 성격을 가지며, 일반적으로 G에 의해 생성되는 집합 L(G)는 너무 커서 생성된 케이스들을 모두 실행시킬 테스트 대상으로 삼는다는 것은 현실석이지 못하다. 본 논문에서는 CFG에 의해 자동 생성되는 테스트 케이스의 집합의 크기를 통제하면서도 테스트의 주요 범위를 커버하기 위하여 문맥 자유 문법을 보강하는 문법외적 요소인 태그들을 개발하고 실험하였다.