• Title/Summary/Keyword: 연결숫자인식

Search Result 62, Processing Time 0.022 seconds

Performance Improvement of korean Connected Digit Recognition Based on Acoustic Parameters (음향학적 파라메터를 이용한 한국어 연결숫자인식의 성능개선)

  • Kim Seunghi;Kim Hyung Soon
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.44-47
    • /
    • 1999
  • 본 논문에서는 한국어 연결숫자인식에 있어서 모델간의 변별력 향상을 통해 인식률을 높이기 위하여 음향학적 파라메터(Acousticparameter)를 사용하는 짓을 제안한다. 제안된 방법은 음성학적 지식에 근거하여 적절한 주파수 대역별 에너지의 비의 로그값을 추가적인 특징파라메터로 사용한다. 실험결과, 제안된 방법을 사용함으로써 기본 인식시스템에 비해 오류율이 최고 $46\%$ 정도 감소됨을 확인할 수 있었다. 그리고 채널보상 기술을 함께 적용함으로써 $69\%$ 정도의 오류율 감소를 얻었다.

  • PDF

A Study on Recognition of Korean Connected-Digits Using group-labelling by VQ and One-stage DP (벡터양자화에 의한 group-labelling과 1-段 DP를 이용한 한국어 연결 숫자음 인식에 관한 연구)

  • Kim, Ja-Ryong;Choi, Kap-Seok
    • The Journal of the Acoustical Society of Korea
    • /
    • v.10 no.2
    • /
    • pp.5-12
    • /
    • 1991
  • In this paper, we have recognized Korean connected-digits. To reduce the processing time the method of combining VQ one-stage DP is introduced and to reduce the number of reference pattern a new group labelling technique is proposed. Group-labelling is a method to segment and label connected-digit into groups by VQ. As experimental results with 3 connected-digits, the number of reference patterns are reduced in proportion to the number of groups which are labelled.

  • PDF

The Optimal and Complete Prompts Lists Generation Algorithm for Connected Spoken Word Speech Corpus (연결 단어 음성 인식기 학습용 음성DB 녹음을 위한 최적의 대본 작성 알고리즘)

  • 유하진
    • The Journal of the Acoustical Society of Korea
    • /
    • v.23 no.2
    • /
    • pp.187-191
    • /
    • 2004
  • This paper describes an efficient algorithm to generate compact and complete prompts lists for connected spoken words speech corpus. In building a connected spoken digit recognizer, we have to acquire speech data in various contexts. However, in many speech databases the lists are made by using random generators. We provide an efficient algorithm that can generate compact and complete lists of digits in various contexts. This paper includes the proof of optimality and completeness of the algorithm.

A Study on Korean 4-connected Digit Recognition Using Demi-syllable Context-dependent Models (반음절 문맥종속 모델을 이용한 한국어 4 연숫자음 인식에 관한 연구)

  • 이기영;최성호;이호영;배명진
    • The Journal of the Acoustical Society of Korea
    • /
    • v.22 no.3
    • /
    • pp.175-181
    • /
    • 2003
  • Because a word of Korean digits is a syllable and deeply coarticulatied in connected digits, some recognition models based on demisyllables have been proposed by researchers. However, they could not show an excellent recognition results yet. This paper proposes a recognition model based on extended and context-dependent demisyllables, such as a tri-demisyllable like a tri-phone, for the Korean 4-connected digits recognition. For experiments, we use a toolkit of HTK 3.0 for building this model of continuous HMMs using training Korean connected digits from SiTEC database and for recognizing unknown ones. The results show that the recognition rate is 92% and this model has an ability to improve the recognition performance of Korean connected digits.

The Implementation of Continuous Digit Recognition Using DSP (DSP를 이용한 연속숫자 음성 인식기 구현)

  • Lee Seong-Kwon;Lim Young-chun;Seo Jun-Bae;Jung Hyun-youl
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.93-96
    • /
    • 2004
  • 본 논문은 TMS320C5501 16bit DSP를 적용한 실시간 화자독립 연속 숫자인식기의 구현에 관해 서술한다. 하드웨어 모듈의 구성은 TMS320C5501 300MHz DSP, 코덱으로는 TLV320AIC1103, SDRAM, 외부장치와의 인터페이스를 위한 HPI, Uart, MIC, SPK Out 단자로 구성되었다. 음성인식 알고리즘은 HM-Net 방식을 사용하였고 고정소수점 연산처리 방식으로 C를 이용한 최적화 작업을 수행하였으며 스트리밍 방식의 인식 방법으로 실시간 처리가 가능하도록 구현하였다. 숫자 인식에 사용한 모델은 41음소에 기반한 트라이폰을 학습하였으며, 특징 파라미터로는 LPCMEL 20차를 사용하였다. 임베디드 시스템의 실시간 음성인식 시스템 구성에 중점을 두었으며 PC상에서의 성능과 비교해 볼때 본 DSP 상에서 500단어, 50문장의 인식을 평균 1.5초 전후로 인식하도록 하였으며 간단한 연결 단어 인식을 수행하는데 무리 없음을 보여준다. 특별히 한국어 연속숫자 부분에 중점을 두었고, 본 연구에서 구현된 연속 음성인식 시스템에 사용된 숫자 인식에서 음절 바이폰 모델에 대하여 $92.92\%$의 인식율을 얻을 수 있었다.

  • PDF

A Study on the Recognition of the Connected Digits Using CorrectIve Trammg WIth HMM and Post Processing (HMM의 교정 학습과 후처리를 이용한 연결 숫자음 인식에 관한 연구)

  • 우인봉
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1994.06c
    • /
    • pp.161-165
    • /
    • 1994
  • HMM은 좋은 결과를 보이면서 현재 음성 인식 분야에서 널리 사용되는 알고리즘이다. 그러나, 이 HMM의 학습방법인 maimum like-ihood estimation 은 인식률을 극대화하는 모델의 파라메터 값을 생성하지 못하는 단점이 있다. 이러한 문제점을 보와하기 위하여 연결어 인식 알고리즘인 Segmental K-means의 학습과정에 교정 학습법을 도입하여 모델 파라메터 값을 재조정 해 준다. 한국어 연속 숫자음은 영어 연속 숫자음과 달리 연음 현상의 영향을 많이 받는다. Level building 과정에서 연음에 의한 오류를 감소시키기 위해 연음에 의해 발생할 수 있는 단어를 별도의 모델로 추가했다. 이렇게 추가된 단어 모델들에 대한 몇가지 규픽을 인식 결과에 적용하여 출력을 다시 조정한다. 본 시스템은 TMS320C30 프로세서 내장한 DSP 보드와 IBM PC 사엥서 구현되었고, 표준 패턴은 실험실 잡음 환경에서 남성화자 3명을 대상으로 작성하였다. 인식 결과 21종 전화번호 252개 데이터에 대하여 화자 종속으로 92.1% 인식률을 나타내었다.

  • PDF

Car License Plate Extraction Based on Numeral Recognition (숫자 인식에 기반한 자동차 번호판 추출)

  • Lee, Duk-Ryong;Oh, Il-Seok
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.06c
    • /
    • pp.407-411
    • /
    • 2007
  • 이 논문은 우리나라 차량 영상에서 번호판 영역을 추출하는 알고리즘을 제안한다. 우리나라 번호판은 하단에 네개의 숫자를 포함하고 있으므로, 네 개의 숫자를 찾으면 번호판을 추출 할 수 있다. 제안하는 방법은 입력된 영상에서 숫자의 가능성을 가진 연결 요소를 검출하고 이들을 군집화 한다. 군집화 된 연결요소들을 바탕으로 숫자 네개(4-digits) 후보를 생성한다. 4-digits 후보들을 인식하여 숫자의 가능성을 측정하고, 적합도로 변환한다. 후보영역 중 적합도가 가장 높은 영역을 번호판 영역으로 추출한다. 적합도는 Perfect Metrics 방법으로 측정하였다. 제안하는 방법을 주간 영상 4600장과 야간 영상 264장으로 테스트 한 결과 각각 97.23%, 95.45%의 검출률과 0.09%, 0.11%의 오검출률을 얻었다.

  • PDF

A Study on the Number Recognition using Cellular Neural Network (Cellular Neural Network을 이용한 숫자인식에 관한 연구)

  • 전흥우;김명관;정금섭
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.6 no.6
    • /
    • pp.819-826
    • /
    • 2002
  • Cellular neural networks(CNN) are neural networks that have locally connected characteristics and real-time image processing. Locally connected characteristics are suitable for VLSI implementation. It also has applications in such areas as image processing and pattern recognition. In this thesis cellular neural networks are used for feature detection in number recognition at the stage of re-processing. The four or six directional shadow detectors are used in numbers recognition. At the stage of classification, this result of feature detection was simulated by using a multi-layer back Propagation neural network. The experiments indicate that the CNN feature detectors capture good features for number recognition tasks.

A Study on Numerical Recognition Using Artificial Neural Network (인공신경망을 이용한 숫자인식에 관한 연구)

  • Jun, Min-Hyeok;Kim, Byoung-Wook
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.511-514
    • /
    • 2019
  • 인공지능이 정형화된 수치 데이터뿐만 아니라 비정형 데이터까지도 인식해야하는 시대가 왔다. 보안 분야 이외에도 사회 전반에서 숫자 인식을 활용하고 점차 확대되고 있다. 숫자인식을 위해 인공신경망을 이용하였다. 인공신경망은 입력 층, 중간 층, 출력 층으로 이루어져 있다. 각 층은 노드와 노드들을 연결하는 가중치로 구성되어 있다. data set을 입력 값으로 하여 각각의 가중치를 곱한다. 오차역전파법을 이용하여 가중치 값을 갱신한다. 갱신하는 과정에서 학습률과 가중치 조정을 통해 결과 값의 정확도를 연구한다. 궁극적으로 학습된 data set과 인공신경망 알고리즘을 이용하여 손 글씨로 된 숫자를 인식한다. 실험에서 학습률과 중간층의 노드 개수를 조정하여 인식률을 높여간다.

Performance Improvement of Korean Connected Digit Recognition Based on Acoustic Parameters (음향학적 파라메터를 이용한 한국어 연결숫자인식의 성능개선)

  • 김승희;김형순
    • The Journal of the Acoustical Society of Korea
    • /
    • v.18 no.5
    • /
    • pp.58-62
    • /
    • 1999
  • This paper proposes use of acoustic parameters to improve the discriminability among digit models in Korean connected digit recognition. The proposed method used the logarithmic values of energy ratio between the predetermined frequency bands as additional feature parameters, based on the acoustic-phonetic knowledge. The results of our experiment show that the proposed method reduced the error rate by 46% in comparison with the baseline system. And incorporation of channel compensation technique in the proposed method yielded error reduction of about 69%.

  • PDF