• 제목/요약/키워드: 연결숫자인식

검색결과 62건 처리시간 0.02초

연결 숫자음 인식 시스템의 구현과 성능 변화 (A Study on the Implementation of Connected-Digit Recognition System and Changes of its Performance)

  • 윤영선;박윤상;채의근
    • 대한음성학회지:말소리
    • /
    • 제45호
    • /
    • pp.47-61
    • /
    • 2003
  • In this paper, we consider the implementation of connected digit recognition system and the several approaches to improve its performance. To implement efficiently the fixed or variable length digit recognition system, finite state network (FSN) is required. We merge the word network algorithm that implements the FSN with one pass dynamic programming search algorithm that is used for general speech recognition system for fast search. To find the efficient modeling of digit recognition system, we perform some experiments along the various conditions to affect the performance and summarize the results.

  • PDF

한국어 연결숫자 인식에서의 발화 검증과 대체오류 수정 (Utterance Verification and Substitution Error Correction In Korean Connected Digit Recognition)

  • 정두경;송화전;정호영;김형순
    • 대한음성학회지:말소리
    • /
    • 제45호
    • /
    • pp.79-91
    • /
    • 2003
  • Utterance verification aims at rejecting both out-of-vocabulary (OOV) utterances and low-confidence-scored in-vocabulary (IV) utterances. For utterance verification on Korean connected digit recognition task, we investigate several methods to construct filler and anti-digit models. In particular, we propose a substitution error correction method based on 2-best decoding results. In this method, when 1st candidate is rejected, 2nd candidate is selected if it is accepted by a specific hypothesis test, instead of simply rejecting the 1st one. Experimental results show that the proposed method outperforms the conventional log likelihood ratio (LLR) test method.

  • PDF

한국어 연결 숫자음 인식을 위한 시공간 신경회로망의 개발 (Development of Spatio-Temporal Neural Network for Connected Korean Digits Recognition)

  • 이종식
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.69-72
    • /
    • 1995
  • In this paper, a new approach for Korean connected digits recognition using the spatio-temporal neural network is reported. The data of seven digits phone numbers are used in the recognition of connected words, and in the initial experiment, digit recognition rate of 28% was achieved. In this paper, to increase recognition rate, two different approaches are analyzed. In the first system, to compensate the STNN's own defect and to emphasize the Korean word's phonic characters, the starting point of phone is pointed by comparing the average magnitude and zero-crossing rate and the ending point is pointed by comparing only zero-crossing rate. The digit recoginiton rate increased to 61%. Also, in the second system, to consider fact that same word's phone is varied severally, the number of STNN's of each word is increased from one to five, and then the varied same word's phones can be included to the increased STNN's. The digit recogniton rate of connected words increased to 89%.

  • PDF

연결숫자음 전화음성 인식에서의 오인식 유형 분석 (Analysis of Error Patterns in Korean Connected Digit Telephone Speech Recognition)

  • 김민성;정성윤;손종목;배건성;김상훈
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2003년도 5월 학술대회지
    • /
    • pp.115-118
    • /
    • 2003
  • Channel distortion and coarticulation effect in the connected digit telephone speech make it difficult to recognize, and degrade recognition performance in the telephone environment. In this paper, as a basic research to improve the recognition performance of Korean connected digit telephone, error patterns are investigated and analyzed. Telephone digit speech database released by SITEC with HTK system is used for recognition experiments. Both DWFBA and MRTCN methods are used for feature extraction and channel compensation, respectively. Experimental results are discussed with our findings.

  • PDF

연결 성분 분석과 크기 정규화를 이용한 도로 노면 표시와 숫자 인식 (Recognition of Road Surface Marks and Numbers Using Connected Component Analysis and Size Normalization)

  • 정민철
    • 반도체디스플레이기술학회지
    • /
    • 제21권1호
    • /
    • pp.22-26
    • /
    • 2022
  • This paper proposes a new method for the recognition of road surface marks and numbers. The proposed method designates a region of interest on the road surface without first detecting a lane. The road surface markings are extracted by location and size using a connection component analysis. Distortion due to the perspective effect is minimized by normalizing the size of the road markings. The road surface marking of the connected component is recognized by matching it with the stored road marking templates. The proposed method is implemented using C language in Raspberry Pi 4 system with a camera module for a real-time image processing. The system was fixedly installed in a moving vehicle, and it recorded a video like a vehicle black box. Each frame of the recorded video was extracted, and then the proposed method was tested. The results show that the proposed method is successful for the recognition of road surface marks and numbers.

한국어 음성인식을 위한 음성 데이터 수집 (Speech Data Collection for korean Speech Recognition)

  • 박종렬;권오욱;김도영;최인정;정호영;은종관
    • 한국음향학회지
    • /
    • 제14권4호
    • /
    • pp.74-81
    • /
    • 1995
  • 본 논문에서는 한국과학기술원(KAIST) 통신연구실에서 개발한 한국어 음성 데이터베이스의 개발에 관하여 기술한다. 음성 데이터베이스의 구축을 위하여 사용된 절차와 환경, 및 데이터베이스의 음성학적, 언어학적 성질들이 상세히 기술된다. 데이터베이스는 음성인식 알고리듬의 개발 및 평가를 위하여 사용되도록 고안되었다. 데이터베이스는 5종류의 음성 데이터, 즉 3천단어 규모의 무역관련 연속음성, 가변길이 연결 숫자음, phoneme-balanced75 고립단어, 지역명 관련 500 고립단어, 한국어 아-세트로 구성되어 있다.

  • PDF

치수보조선을 이용한 도면의 주벽인식 (A Main Wall Recognition of Architectural Drawings using Dimension Extension Line)

  • 권영빈
    • 정보처리학회논문지B
    • /
    • 제10B권7호
    • /
    • pp.837-846
    • /
    • 2003
  • 본 연구에서는 아파트의 설계도면을 처리의 대상으로 하고 있다. 이러한 아파트 도면은 굵고 평행한 두 개의 선으로 표현되는 주벽과 심볼(문, 창, 베란다. 타일 $\cdots$), 치수선(Dimension Line), 치수보조선, 여러 가지 수치를 나타내는 숫자(치수)와 문자 등으로 구성되어 있다. 본 연구에서는 이러한 아파트 도면 내에서 아파트 건물의 골격을 이루는 주벽을 인식하는 방법을 제시하고 있다. 이를 위해서 가는 라인을 제거하고 굵은 라인만을 남기는 이진화 방법을 사용하여, 이러한 라인들을 벡터화하고, 주벽의 존재위치를 한정하였다. 이를 이용해 치수보조선을 구하고 찾은 피수보조선을 이용하여 주벽을 검출하고, 찾아진 주벽에 연결되는 다른 주벽으로 영역을 확장해 나가는 방법을 구현하였다. 마지막으로, 주벽사이에 있는 창문은 비록 주벽이 아닌 창문 심볼로 표현되어 있더라도 주벽으로 인식해야 하기 때문에, 찾아진 주벽을 이용해 이들 주벽사이에 존재하는 창문을 찾는다. 실험결과 인식률에서 본 연구에서 제시하는 방법이 96.5%의 인식율을 나타내어 Karl Tombre 연구팀의 방법 90.7%보다 5.8% 더 우수하게 나타났고, 오인식의 수도 작게 나타났다.

Haar-like Feature 및 CLNF 알고리즘을 이용한 차량 번호판 인식 (A Vehicle License Plate Recognition Using the Haar-like Feature and CLNF Algorithm)

  • 박승현;조성원
    • 스마트미디어저널
    • /
    • 제5권1호
    • /
    • pp.15-23
    • /
    • 2016
  • 본 논문은 한국의 차량 번호판 인식에 효과적인 방법을 제안한다. 획득한 자동차 이미지로부터 Haar-Like Feature를 이용해 대략적인 번호판 후보 영역을 찾아낸 후, 랭크 필터를 사용하여 전처리를 하고 캐니 에지 추출 (Canny Edge Detecting) 알고리즘을 이용하여 연결된 사각형을 찾아 번호판을 추출한다. 추출된 번호판의 색상 정보를 이용하여 흰색/녹색 번호판을 구분하고, 각 번호판을 OTSU 이진화와 주변 전경 픽셀 전파 알고리즘인 CLNF (CCLUF with NFPP)을 통해 문자를 제외한 잡음을 제거하고 레이블링하여 숫자 및 문자 영역을 분리한다. 분리된 문자 영역은 메쉬 방법 및 세선화 후 X-Y 투영 방법으로 특징 벡터를 추출한다. 추출된 특징 벡터는 역전파 알고리즘을 사용하여 학습된 신경망을 이용하여 문자 인식을 수행한다. 제안된 차량 번호판 인식 알고리즘의 효과적 동작은 실험을 통해 확인하였다.

옥외영상의 개선된 차량번호판 인식기술 (An Improved License Plate Recognition Technique in Outdoor Image)

  • 김병준;김동훈;이준환
    • 한국지능시스템학회논문지
    • /
    • 제26권5호
    • /
    • pp.423-431
    • /
    • 2016
  • 일반적으로 옥외영상에서의 자동차 번호판 인식은 인위적인 환경에서와는 다르게 기하학적으로 왜곡되어 있을 뿐만 아니라 조명 변화도 크기 때문에 단순환 문제가 아니다. 본 논문에서는 일반 CCTV 카메라로 옥외에서 촬영된 영상에서 자동차 번호판 인식을 위한 개선된 기술들을 제안한다. 먼저 다양한 특징을 상보적으로 사용하는 직렬구조의 다단계 Adaboost 검출기를 제안한다. 제안하는 검출기는 MB-LBP 및 Haar-like 특징을 사용하는 Adaboost 구조를 직렬로 연결하여 번호판 검출의 검출성능을 향상시켰다. 또한 검출된 번호판의 기하학적 왜곡을 보정하고 번호판의 타입을 먼저 결정하여 영상처리를 용이하게 하는 방법을 제안한다. 이런 방법은 그래이 변환, 문자/숫자 분리, 분리된 영상의 영상처리 등에서 사전지식 없이 전체 번호판 영상을 이용하는 경우보다 효율적이다. 본 논문에서 DBN(Deep Belief Network)를 문자/숫자 인식기로 사용하여 영상처리과정에서 기인한 획 손실이나 기울어짐 같은 기하학적인 왜곡에서도 강건한 인식률을 달성하였다.

신경망 학습 과정중 불필요한 입력 정보 및 파라미터들의 제거 (Elimination of Redundant Input Information and Parameters during Neural Network Training)

  • 원용관;박광규
    • 한국정보처리학회논문지
    • /
    • 제3권3호
    • /
    • pp.439-448
    • /
    • 1996
  • 형태 인식에서 유익한 특징정보의 선정 및 추출이 대단히 중요한 역할을 한다. 본 논문은 유익한 특징정보의 선정과 신경망의 학습을 동시에 수행할 수 있는 알고리 즘을 기술한다. 알고리즘은 근본적으로 반복적으로 수행되는 세 단계로 구성되어 있는데, 이들은 학습, 연결자 제거, 그리고 입력 신경세포 제거이다. 초기 학습을 실행한후, 먼저 적은 절대값을 갖는 연결자들이 제거 된다. 그런 후, 내부 계층 신경 세포들과 은 숫자의 결자들을 갖는 입력 신경세포들이 제거된다. 이 과정은 제거된 입력 신경세포들에 상응하는 특징정보들을 제외시키는 것과 동일하다. 만약, 에러값이 증가 하면, 연결자 제거 및 입력 신경세포 제거 과정의 반복으로 구성된 신경망의 재학습을 실행한다. 그 결과, 알고리즘은 다른 공간계로의 변환없이 특징정보 추출 공간내에서 중요한 특징들을 선정하게 된다. 또한, 즉징정보 선정인 형태 분류 관점에서의 성능과 긴밀하게 연결되어 수행되므로, 선정 된 특징정보들은 형태 분류에 가장 좋은 정보를 제공한다. 이 알고리즘은 불필요 또는 그다지 중요하지 않은 정보의 추출로 인한 경제 적 손실을 피할수 있게 한다. 더구나, 마지막에 얻어진 신경망은 인식 성능에 저해 요인이 될 수있는 불필요한 파라미터들, 즉 가중 연결자 및 바이어스를 포함하지 않는다. 응용결과,, 본 알고리즘은 가장 좋은 정보를 갖는 특징들만을 남기며, 성능 저하를 일으 키지 않으면서도 특징 벡터의 차원을 현저하게 줄였다.

  • PDF