• 제목/요약/키워드: 연결숫자인식

검색결과 62건 처리시간 0.025초

숫자 영역 탐색에 기반한 자동차 번호판 추출 (Car License Plate Extraction Based on Detection of Numeral Regions)

  • 이득용;오일석
    • 한국ITS학회 논문지
    • /
    • 제7권1호
    • /
    • pp.59-67
    • /
    • 2008
  • 이 논문은 우리나라 차량 영상에서 번호판 영역을 추출하는 알고리즘을 제안한다. 이 논문의 아이디어는 차량 영상에서 네 개의 숫자를 찾고 그 정보를 이용하여 번호판 영역을 분할하는 것이다. 이 방법으로 번호판 영역을 찾으면 네 개 숫자 영역도 더불어 얻게 되는 장점을 가진다. 첫 단계는 입력된 영상에서 적절한 크기의 연결 요소를 검출하고 이들을 군집화 한다. 둘째 군집화 된 연결요소들을 바탕으로 숫자 네 개 (4-digits)후보를 생성한다. 세 번째 단계는 4-digits후보들을 인식하여 숫자일 신뢰도를 측정한다. 마지막으로 후보 영역 중 신뢰도가 가장 높은 영역을 번호판 영역으로 추출한다 신뢰도를 얻기 위해 Perfect Metrics 분류 알고리즘을 사용하였다. 제안하는 방법을 주간 영상 4600장과 야간 영상 264장으로 테스트 한 결과 각각 97.23%와 95.45%의 검출률과 0.09%와 0.11%의 오검출률을 얻었다.

  • PDF

퍼지 RBFNNs와 증분형 주성분 분석법으로 실현된 숫자 인식 시스템의 설계 (Design of Digit Recognition System Realized with the Aid of Fuzzy RBFNNs and Incremental-PCA)

  • 김봉연;오성권;김진율
    • 한국지능시스템학회논문지
    • /
    • 제26권1호
    • /
    • pp.56-63
    • /
    • 2016
  • 본 연구에서는 퍼지 RBFNNs과 증분형 주성분 분석법으로 실현된 숫자인식 시스템의 설계를 소개한다. 주성분 분석법은 차원축소를 위해 사용되는 알고리즘으로 학습데이터의 차원 수가 고차원이거나 데이터의 양이 많을 때 특징 추출을 위한 많은 계산 시간을 필요로 한다. 따라서 고차원 데이터의 효율적인 차원축소와 점진적인 학습을 위해 증분형 주성분분석법을 적용하는 방법을 제안한다. 방사형 기저함수 신경회로망의 구조는 조건부, 결론부, 추론부의 3가지 기능적 모듈로서 구분이 가능하다. 조건부에서는 FCM 클러스터링 알고리즘의 도움으로 실현된 퍼지 클러스터링의 사용으로 입력 공간을 분할한다. 또한 가우시안 함수 대신 FCM(Fuzzy C-Means)클러스터링 알고리즘의 멤버쉽 값을 사용함으로써 입력 데이터의 특성을 좀 더 잘 반영할 수 있도록 개선하였으며, 결론부에서 연결가중치는 상수항에서 일차식과 이차식, 그리고 변형된 이차식과 같은 다항식의 형태로 확장하여 사용한다. 실험 결과는 공인 숫자 데이터인 MNIST 필기체 숫자 데이터를 사용하여 제안된 숫자 인식 시스템의 효율성을 다른 연구와의 비교를 통해 입증한다.

MLP-VQ와 가중 DHMM을 이용한 연결 숫자음 인식에 관한 연구 (A study on the connected-digit recognition using MLP-VQ and Weighted DHMM)

  • 정광우;홍광석
    • 전자공학회논문지S
    • /
    • 제35S권8호
    • /
    • pp.96-105
    • /
    • 1998
  • 본 논문에서는 화자 독립 연속 숫자음 인식 시스템의 성능향상을 위하여 MLP-VQ (Multi-Layer Perceptron-Vector Quantizer)를 이용한 가중 DHMM(WDHMM : Weighted Discrete Hidden Markov Models)을 제안한다. MLP 신경망의 출력분포는 입력 패턴과 학습 패턴들간의 비선형 매핑을 통해 각 패턴들간의 유사도를 나타내는 확률분포를 갖는다. 본 논문에서는 MLP 신경망의 출력분포중 가장 높은 출력 값을 갖는 MLP 신경망의 출력 노드를 인덱스를 이용하여 코드워드를 생성하는 MLP-VQ를 제안하였다. 제안된 MLP-VQ는 기존의 VQ에 비해 현재 입력패턴과 학습된 각 class 패턴들간의 유사성 정도를 인식모델을 반영할 수 있는 특징을 갖는다. 또한 MLP 신경망의 출력분포를 DHMM의 심벌 발생 확률의 가중치로 이용하는 가중 DHMM보다는 음소 클래스간의 관계를 인식모델에 반영할 수 있기 때문에 적은 계산양의 증가로 인식기의 성능을 14.71%개선할 수 있었다. 실험결과에 의하면, MLP-VQ와 WDHMM에 의한 화자독립 연결 숫자음 인식율은 84.22%이다.

  • PDF

DSP보드를 이용한 자동차 번호판 추출 및 인식 시스템 (Car Plate Extraction and Recognition System Using DSP Board)

  • 김경현;이상훈;신복숙;차의영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (상)
    • /
    • pp.627-630
    • /
    • 2003
  • 기존의 자동차 번호판 인식시스템은 특정위치에 설치된 카메라로부터 획득한 영상을 서버로 전송하여 서버가 모든 처리 및 인식을 하게 된다. 하지만 다량의 카메라를 설치할 경우 서버의 부하가 심해지는 단점이 있다. 따라서 본 논문에서는 카메라에 연결된 DSP 보드를 통해 자동차 번호판 인식에 필요한 각각의 문자라 숫자를 추출하고, 이진화 및 정규화 과정을 거쳐 서버로 전송함으로써, 서버는 인식단계만을 수행하여 부하를 줄이는 방식을 제안한다.

  • PDF

트리 구조 어휘 사전을 이용한 연결 숫자음 인식 시스템의 구현 (Implementation of Connected-Digit Recognition System Using Tree Structured Lexicon Model)

  • 윤영선;채의근
    • 대한음성학회지:말소리
    • /
    • 제50호
    • /
    • pp.123-137
    • /
    • 2004
  • In this paper, we consider the implementation of connected digit recognition system using tree structured lexicon model. To implement efficiently the fixed or variable length digit recognition system, finite state network (FSN) is required. We merge the word network algorithm that implements the FSN with lexical tree search algorithm that is used for general speech recognition system for fast search and large vocabulary systems. To find the efficient modeling of digit recognition system, we investigate some performance changes when the lexical tree search is applied.

  • PDF

연결 숫자음 인식기 학습용 음성DB 녹음을 위한 최적의 대본 작성 (The Optimal and Complete Prompts Lists for Connected Spoken Digit Speech Corpus)

  • 유하진
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2003년도 5월 학술대회지
    • /
    • pp.131-134
    • /
    • 2003
  • This paper describes an efficient algorithm to generate compact and complete prompts lists for connected spoken digits database. In building a connected spoken digit recognizer, we have to acquire speech data in various contexts. However, in many speech databases the lists are made by using random generators. We provide an efficient algorithm that can generate compact and complete lists of digits in various contexts. This paper includes the proof of optimality and completeness of the algorithm.

  • PDF

HMM에 의한 한국어음성의 자동분할 시스템의 구현에 관한 연구 (A Study on the Implementation of an Automatic Segmentation System of Korean Speech based on the Hidden Markov Model)

  • 김윤중;김미경;이인동
    • 정보기술응용연구
    • /
    • 제1권3_4호
    • /
    • pp.1-23
    • /
    • 1999
  • 본 연구에서는 HMM(Hidden Markov Model) 및 Levelbuilding 알고리즘을 이용하여 인식대상 음소열의 표본 집합(훈련패턴 집합)을 입력으로 하는 음성의 자동 분할 시스템을 구현하였다. 본 시스템은 자연스럽게 발음되어진 연결음 음성으로부터 표준 음소모델을 생성한다. 본 시스템의 구성은 초기화 과정, HMM학습과정 그리고 Levelbuilding을 이용한 분리 및 CLustering 과정으로 구성되어 있다. 초기화 과정에서는 제어 정보를 이용하여 훈련패턴 집합으로부터 초기 음소 집합 군을 생성한다. Levelbuilding을 이용한 분리 및 Clustering 단계에서는 음소 모델과 제어 정보를 이용하여 훈련패턴들을 음소 단위로 분리하고, 분리된 후보 음소들을 Clustering하여 음소집합 군을 생성한다. 음소모델의 구성에 변화가 없을 때까지 이 작업을 반복 수행하여 최적의 음소모델을 생성한다. 본 연구에서는 3개 이하의 숫자단어로 구성된 연결되어 음성 패턴을 대상으로 실험하였다. 연결단어에 대한 음소의 표준모델 생성과정에서 가장 중요한 처리인 훈련패턴의 자동분할 과정을 분석하기 위하여 각 반복과정에서 분리된 정보를 그래프로 도시화하여 확인하였다.

  • PDF

주파수 부대역의 켑스트럼 해상도 최적화에 의한 특징추출 (Feature Extraction by Optimizing the Cepstral Resolution of Frequency Sub-bands)

  • 지상문;조훈영;오영환
    • 한국음향학회지
    • /
    • 제22권1호
    • /
    • pp.35-41
    • /
    • 2003
  • 일반적인 음성인식 방법에서는 주파수 전대역에서 추출한 특징벡터를 사용하므로, 각 주파수 부대역은 최종인식 결과에 동등하게 기여한다. 본 논문에서는 주파수 부대역별로 독립적인 특징을 추출하고, 음성인식에 효과적이 되도록 부대역의 켑스트럼 해상도를 조절하는 방법을 제안한다. 주파수 부대역별로 독립적인 특징을 추출하는 멀티밴드 음성인식접근을 사용하여 부대역 특징벡터의 차원을 변화시킨다. 최적의 벡터 차원 조합을 찾기 위하여 음성인식률과 군집화 품질을 사용한다. TIDIGITS 연결 숫자음을 사용한 실험결과에서, 제안한 방법은 전대역 특징추출에 비해 적은 계산량으로도 숫자열 인식률은 99.12%, 백분율 정확도 (percent correct)는 99.775%, 백분율 정밀도 (percent accuracy)는 99.705%를 얻었으며, 이는 전대역 특징벡터에 비해 상대적 오류율을 각각 38%, 32%, 37% 감소시킨 결과이다.

자동통역용 한국어 음성 데이터베이스 (A Korean Speech Database for Use in Automatic Translation)

  • 최인정
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.287-290
    • /
    • 1994
  • 음성 인식 시스템의 개발을 위해서는 음성 데이터베이스구축이 중요한 과제의 하나로서, 많은 시간과 노력이 요구된다. 개별적인 음성데이타베이스 구축에 따른 중복 투자를 줄이고 다양한 인식 알고리듬의 성능 비교와 국내 음성 인식 기술의 발전을 위해서는 벤치마크 시험을 위한 공통의 음성 데이터베이스가 필수적이다. 본 논문에서는 한국과학기술원 통신연구실에서 제작한 한국어 음성 데이터베이스에 관하여 기술한다. KAIST 음성데이타베이스는 자동통ㅇ역을 N이한 무역 상담과 관련되 3,000 단어 규모의 연속어를 비롯하여, 가변 길이 연결 숫자음, phoneme-balanced 75 고립단어, 지역명 관련 500 고립단어, 한국어 아-세트로 구성되어 있다. 이 음성 데이터베이스의 구축을 위하여 사용된 태스크선정 절차, 녹음 방법, 규격, 및 기대효과 등 세부사항을 기술한다.

  • PDF

새로운 음성 인식 모델 : 동적 국부 자기 조직 지도 모델 (A New Speech Recognition Model : Dynamically Localized Self-organizing Map Model)

  • 나경민;임재열;안수길
    • The Journal of the Acoustical Society of Korea
    • /
    • 제13권1E호
    • /
    • pp.20-24
    • /
    • 1994
  • 이 논문에서는 새로운 음성 인식 모델인 동적 국부 자기 조직 지도 모델과 그 학습 알고리즘을 제안한다. 동적 국부 자기 조직 지도 모델은 음성의 시간적, 공간적 왜곡을 프로그래밍 기법과 국부 자기 조직 지도로 각각 정규화 시킨다. 한국어 숫자음에 대한 실험 결과로 제안하는 모델이 예측 신경회로망 모델보다 적은 수의 연결을 갖고서도 약간 높은 인식률을 보여 효과적임을 알 수 있었다.

  • PDF