• 제목/요약/키워드: Context-Free Grammars

검색결과 9건 처리시간 0.023초

이진 삼차 재귀 신경망과 유전자 알고리즘을 이용한 문맥-자유 문법의 추론 (Inference of Context-Free Grammars using Binary Third-order Recurrent Neural Networks with Genetic Algorithm)

  • 정순호
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권3호
    • /
    • pp.11-25
    • /
    • 2012
  • 이 논문은 이진 삼차 재귀 신경망(Binary Third-order Recurrent Neural Networks: BTRNN)에 유전자 알고리즘을 적용하여 문맥-자유 문법을 추론하는 방법을 제안한다. BTRNN은 각 입력심볼에 대응되는 재귀 신경망들의 다층적 구조이고 외부의 스택과 결합된다. BTRNN의 매개변수들은 모두 이진수로 표현되며 상태 전이와 동시에 스택의 한 동작이 실행된다. 염색체로 표현된 BTRNN들에 유전자 알고리즘을 적용하여 긍정과 부정의 입력 패턴들의 문맥-자유 문법을 추론하는 최적의 BTRNN를 얻는다. 이 방법은 기존의 신경망 이용방법보다 적은 학습량과 적은 학습회수로 작거나 같은 상태 수를 갖는 BTRNN을 추론한다. 또한 문법 표현의 염색체 이용방법보다 parsing과정에서 결정적인 상태전이와 스택동작이 실행되므로 입력 패턴에 대한 인식처리 시간복잡도가 우수하다. 문맥-자유 문법의 비단말 심볼의 개수 p, 단말 심볼의 개수 q, 그리고 길이가 k인 문자열이 입력이 될 때, BTRNN의 최대 상태수가 m이라고 하면, BTRNN의 인식처리 병렬처리 시간은 O(k)이고 순차처리 시간은 O(km)이다.

THE POWER OF PROGRAMMED GRAMMARS WITH GRAPHS FROM VARIOUS CLASSES

  • Barbaiani Madalina;Bibire Cristina;Dassow Jurgen;Delaney Aidan;Fazekas Szilard;Ionescu Mihai;Liu Guangwu;Lodhi Atif;Nagy Benedek
    • Journal of applied mathematics & informatics
    • /
    • 제22권1_2호
    • /
    • pp.21-38
    • /
    • 2006
  • Programmed grammars, one of the most important and well investigated classes of grammars with context-free rules and a mechanism controlling the application of the rules, can be described by graphs. We investigate whether or not the restriction to special classes of graphs restricts the generative power of programmed grammars with erasing rules and without appearance checking, too. We obtain that Eulerian, Hamiltonian, planar and bipartite graphs and regular graphs of degree at least three are pr-universal in that sense that any language which can be generated by programmed grammars (with erasing rules and without appearance checking) can be obtained by programmed grammars where the underlying graph belongs to the given special class of graphs, whereas complete graphs, regular graphs of degree 2 and backbone graphs lead to proper subfamilies of the family of programmed languages.

확장된 PLR(1) 문법에 대한 단일 틈 파싱 (A One-Gap Parsing with Extended PLR(1) Grammars)

  • 이경옥
    • 정보과학회 논문지
    • /
    • 제42권3호
    • /
    • pp.361-366
    • /
    • 2015
  • 틈(Gap) 파싱은 완전하지 않고 틈이 있는 입력 스트링에 대한 구문 분석을 수행한다. 이런 틈 파싱에 관한 기존 연구로서 임의의 문법에 대한 단일 틈 파싱 알고리즘과 LL(1) 문법에 대한 단일 틈 파싱 알고리즘이 제안되었으며, 이들의 시간복잡도는 각각 $O(n^3)$$O(n^2)$이다. 본 논문에서는 확장된 PLR(1) 문법에 대한 단일 틈 파싱 알고리즘을 제안한다. 확장된 PLR(1) 문법은 LR(1) 문법의 부분 클래스이지만 LL(1) 문법보다는 휠씬 넒은 범위의 문법 클래스이다. 이 문법 클래스에 대한 단일 틈 파싱 알고리즘이 LL(1) 문법에 대한 기존에 알려진 단일 틈 파싱 알고리즘의 복잡도와 동일한 $O(n^2)$임을 보인다.

CFG 방법을 이용한 필기체 한글에서의 자소추출과 인식에 관한 연구 (A Study on Phoneme Extractions and Recognitions for Handwritten Korean Characters using Context-Free Grammar)

  • 김형래;박인갑;서동필;김에녹
    • 전자공학회논문지B
    • /
    • 제29B권9호
    • /
    • pp.8-16
    • /
    • 1992
  • This paper presents a method which can recognized the Handwritten Korean characters by using a Context-Free Grammar. The input characters are thinned in order to dwindle the mount of data, the thinned characters are converted into one-dimension strings according to six-forms. when the point of contact among phonemes is found, two phonemes are seperated respectively by marking the index mark (\) at the points. The Context-Free Grammar to input characters is classified into group grammars concerning the similarity of phonemes, input characters are parsed by making use of the Pushdown automata method. As the bent parts in the Handwritten characters are found frequently, We try to correct the bent parts by using the parsing distance measure, which recognize characters according to minium value caused by measuring the weight distance between two sentences. In this experiment, the recognition rate shows 93.8% to 275 Handwritten Korean characters.

  • PDF

운전자 사용자경험기반의 인지향상 시스템 연구 (Driver's Behavioral Pattern in Driver Assistance System)

  • 조두리;신동희
    • 디지털콘텐츠학회 논문지
    • /
    • 제15권5호
    • /
    • pp.579-586
    • /
    • 2014
  • 본 논문은 문맥-자유 문법 (context-free grammar)를 이용하여, 차선변경 상황에서의 운전자의 행동패턴 인식을 하는 방법을 제안하는 것을 목표로 한다. 문맥-자유-문법은 기존 패턴인식 방식과는 대조적으로 유한적 기호로는 쉽게 표현될 수 없는 특징들을 비교적 손쉽게 표현할 수 있다. 이 방식을 적용하여, 동시에 여러 특징을 각각 고려해야 하는 좌표기반 데이터 처리 대신 심볼 시퀀스 방식 (symbolic sequence)을 패턴화하기 위해 구문론적 방식을 적용한다. 이 방법은 운전자와 안전 운전 분야 연구자들에게 효율적이고 보다 직관적인 방법으로 보다 더 효과적인 수행에 도움이 된다. 본 연구의 향후과제로 보다 안정적인 인식률을 획득하기 위해 확률적 구문분석 방법을 적용할 계획이다.

확률문맥자유문법의 규칙확률 추정을 위한 새로운 기법 (A New Method for Estimating Rule Probabilities of Stochastic Context-Free Grammars)

  • 변성찬;나동열
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.247-252
    • /
    • 1998
  • 본 논문에서는 확률문맥자유문법의 규칙확률을 추정하여 주는 새로운 알고리즘을 제시한다. 이 알고리즘은 이미 잘 알려진 인사이드-아웃사이드 알고리즘에 비하여 개념적으로 이해하기 쉽다는 장점을 가지고 있으며 속도면에서 훨씬 빠르다는 것이 실험으로 입증되었다.

  • PDF

소규모 문맥 자유 문법에 대한 Left-Corner / Look-Ahead 차트 파싱 알고리즘의 성능 평가 (Performance Evaluation of Left-Comer and Look-Ahead Chart Parsing for Small-Sized Context Free Grammar)

  • 심광섭
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권7호
    • /
    • pp.571-579
    • /
    • 2009
  • 차트 파싱 알고리즘에서 left-corner와 look-ahead 정보를 이용하여 불필요한 중간 구조가 생성되지 않도록 함으로써 파싱 속도를 향상시키는 방법이 제안된 바 있다. left-corner와 look-ahead 정보를 이용할 경우 불필요한 중간 구조가 생성되지 않으므로 파싱 속도가 빨라지겠지만 이러한 정보를 유지 관리하고 참조하는 데 따른 추가 비용이 발생한다. 이러한 추가 비용이 발생함에도 불구하고 대규모 문법을 사용하여 파싱을 할 때에는 파싱 속도가 상당한 많이 향상되었다는 연구 결과가 있었다. 본 논문에서 는 소규모 문법을 사용했을 때 파싱 속도가 어느 정도 향상되는가를 관찰하는 실험을 하였다. 실험 결과 소규모의 문법에서는 파싱 속도 향상 정도가 상대적으로 낮았으며 left-corner 정보는 파싱 속도를 향상 시키는 것이 아니라 오히려 저해한다는 사실을 알 수 있었다.

Why Korean Is Not a Regular Language: A Proof

  • No, Yong-Kyoon
    • 한국언어정보학회지:언어와정보
    • /
    • 제5권2호
    • /
    • pp.1-8
    • /
    • 2001
  • Natural language string sets are known to require a grammar with a generative capacity slightly beyond that of Context Free Grammars. Proofs regarding complexity of natural language have involved particular properties of languages like English, Swiss German and Bambara. While it is not very difficult to prove that Korean is more complex than the simplest of the many infinite sets, no proof has been given of this in the literature. I identify two types of center embedding in Korean and use them in proving that Korean is not a regular set, i.e. that no FSA's can recognize its string set. The regular language i salam i (i salam ul$)^j$ michi (key ha)^k$ essta is intersected with Korean, to give {i salam i (i salam ul$)^j$ michi (key ha$)^k$ essta i $$\mid$$ j, k $\geq$ 0 and j $\leq$ k}. This latter language is proved to be nonregular. As the class of regular sets is closed under intersection, Korean cannot be regular.

  • PDF

정보 검색을 위한 숫자의 해석에 관한 구문적.의미적 판별 기법 (Syntactic and Semantic Disambiguation for Interpretation of Numerals in the Information Retrieval)

  • 문유진
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권8호
    • /
    • pp.65-71
    • /
    • 2009
  • 월드 와이드 웹의 정보 검색에서 산출되어지는 수많은 정보를 효율적으로 검색하기 위해서 자연어 정보처리가 필수적이다. 이 논문은 텍스트에서 숫자의 의미 파악을 위한 판별기법을 제안한 것이다. 숫자 의미 판별기법은 챠트 파싱 기법과 함께 문맥자유 문법을 활용하여 숫자 스트링과 연관된 접사를 해석하였으며, N-그램 기반의 단어에 의거하여 조직화된 의미 파악을 하도록 설계되었다. 그리고 POS 태거를 사용하여 트라이그램 단어의 제한조건이 자동 인식되도록 시스템을 구성하여, 점진적으로 효율적인 숫자의 의미 파악을 하도록 하였다. 이 논문에서 제안한 숫자 해석 시스템을 실험한 결과, 빈도수 비례 방법은 86.3%의 정확률을 나타냈고 조건수 비례 방법은 82.8%의 정확률을 나타냈다.