• 제목/요약/키워드: Recognition time reduction

검색결과 125건 처리시간 0.024초

시간 동기 비터비 빔 탐색을 위한 인식 시간 감축법 (Recognition Time Reduction Technique for the Time-synchronous Viterbi Beam Search)

  • 이강성
    • 한국음향학회지
    • /
    • 제20권6호
    • /
    • pp.46-50
    • /
    • 2001
  • 본 논문은 HMM (Hidden Markov Model) 음성 인식 시스템에 적용할 수 있는 새로운 인식 시간 알고리즘인 스코아 캐쉬기법을 제안한다. 다른 많은 기법들이 인식 시간을 줄이면서 계산량을 줄이기 위하여 어느 정도의 인식율 저하를 감수하는 반면에 제안하는 스코아 캐쉬기법은 인식율 저하를 전혀 일으키지 않으면서 인식 시간을 상당량 줄일 수 있는 기법이다. 단독어 인식 시스템에 적용 가능할 뿐 아니라 연속어 인식에도 적용이 가능하며, 기존에 이미 설계된 인식 시스템의 구조를 전혀 흩트리지 않고 간단히 하나의 함수만 대치함으로서 인식시간을 크게 감축할 수 있다 또한 기존의 계산량 감축 알고리즘과 함께 적용 가능하므로 추가의 계산량 감소를 얻을 수 있다. 스코아 캐쉬 기법을 적용한 결과 최대 54% 만큼 계산량을 줄일 수 있었다.

  • PDF

A Real-Time Pattern Recognition for Multifunction Myoelectric Hand Control

  • Chu, Jun-Uk;Moon, In-Hyuk;Mun, Mu-Seong
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2005년도 ICCAS
    • /
    • pp.842-847
    • /
    • 2005
  • This paper proposes a novel real-time EMG pattern recognition for the control of a multifunction myoelectric hand from four channel EMG signals. To cope with the nonstationary signal property of the EMG, features are extracted by wavelet packet transform. For dimensionality reduction and nonlinear mapping of the features, we also propose a linear-nonlinear feature projection composed of PCA and SOFM. The dimensionality reduction by PCA simplifies the structure of the classifier, and reduces processing time for the pattern recognition. The nonlinear mapping by SOFM transforms the PCA-reduced features to a new feature space with high class separability. Finally a multilayer neural network is employed as the pattern classifier. We implement a real-time control system for a multifunction virtual hand. From experimental results, we show that all processes, including virtual hand control, are completed within 125 msec, and the proposed method is applicable to real-time myoelectric hand control without an operation time delay.

  • PDF

고속 RFID Reader 시스템 개발 (Development of High-Speed RFID Reader System)

  • 신재호;홍연찬
    • 제어로봇시스템학회논문지
    • /
    • 제13권9호
    • /
    • pp.915-919
    • /
    • 2007
  • This paper proposed a transponder detection method to reduce recognition time in RFID system. It's also shown that conventional procedure of communication in the system could cause a waste of time when a reader recognizes a transponder. The reduction of recognition time can be obtained by developing a circuit to detect a transponder actively. Detecting a transponder is achieved by using the voltage variation of reader antenna voltage that happens when a transponder approaches to the vicinity of magnetic field formed by the reader. By adding a comparator to the antenna receiver of a reader, the reader can perceive approach or existence of a transponder. A reader for experiment is made using the MFRC500 by Phillips that supports ISO/IEC 14443 protocol. Comparing the proposed method with the conventional methods by experiment, there are 47.5ms reduction of recognition time maximally and 12ms in average.

포즈 인식에서 효율적 특징 추출을 위한 3차원 데이터의 차원 축소 (3D Data Dimension Reduction for Efficient Feature Extraction in Posture Recognition)

  • 경동욱;이윤리;정기철
    • 정보처리학회논문지B
    • /
    • 제15B권5호
    • /
    • pp.435-448
    • /
    • 2008
  • 사용자 포즈의 3차원 데이터 생성을 통한 3차원 포즈 인식은 2차원 포즈 인식의 문제점을 해결하기 위해서 많이 연구되고 있지만, 3차원 표면 데이터의 방대한 양으로 포즈 인식에서 중요한 특징 추출(feature extraction)이 어렵고 수행 시간이 많이 걸리는 문제점을 가지고 있다. 본 논문에서는 3차원 포즈 인식의 두 가지 문제점인 특징 추출의 어려움과 느린 처리속도를 개선하기 위해서 3차원 형상복원 기술로 모델의 3차원 표면 점들로 구성된 데이터를 2차원 데이터로 변환하는 차원 축소(dimension reduction) 방법을 제안한다. 실린더형 외곽점을 이용한 메쉬없는 매개변수화(meshless parameterization) 방법은 방대한 데이터인 3차원 포즈 데이터를 2차원 데이터로 변환하여 특징 추출과 매칭과정의 연산 속도를 향상 시키며, 특징 추출의 효율성 검증을 위해 간단한 환경에서 실험이 가능한 손 포즈 인식 및 인간 포즈 인식에 적용하였다.

시간지연 신경회로망을 이용한 잡음제거 시스템 (Noise reduction system using time-delay neural network)

  • 최재승
    • 대한전자공학회논문지SP
    • /
    • 제42권3호
    • /
    • pp.121-128
    • /
    • 2005
  • 음성신호를 대상으로 하는 연구 분야에서 신경회로망은 주로 음성인식 등의 카테고리 분류의 목적으로 사용되며 신호처리의 응용에도 유망하다. 따라서 본 논문에서는 신경회로망에 시간구조를 취한 시간지연 신경회로망을 이용하여 잡음이 중첩된 음성신호의 공간으로부터 잡음이 없는 음성신호의 공간으로 사상을 실행함으로써 잡음을 제거하는 것을 목적으로 한다. 본 논문은 푸리에 변환의 진폭성분을 복원하는 잡음제거의 알고리즘을 사용하여 백색잡음 및 유색잡음에 대해서 본 수법의 유효성을 확인한다.

음성인식에서 주 성분 분석에 의한 차원 저감 (Dimensionality Reduction in Speech Recognition by Principal Component Analysis)

  • 이창영
    • 한국전자통신학회논문지
    • /
    • 제8권9호
    • /
    • pp.1299-1305
    • /
    • 2013
  • 이 논문에서 우리는 MFCC 특징벡터의 차원 저감을 통해 음성 인식에서의 계산량을 줄이는 방법을 조사한다. 특징벡터의 특성분해는 벡터의 성분을 분산의 크기에 따라 배치되도록 선형 변환 시켜준다. 첫 번째 성분은 가장 큰 분산을 가져서 패턴 분류에서 가장 중요한 역할을 한다. 따라서, 분산이 작은 성분들을 제외시키는 차원 저감을 통하여, 계산량을 줄이면서 동시에 음성 인식 성능을 저하시키지 않는 방법을 생각할 수 있다. 실험 결과, MFCC 특징벡터의 성분을 절반 정도로 줄여도 음성인식 오류율에 큰 악영향이 없음이 확인되었다.

멀티미디어 응용을 위한 얼굴 인식시스템 (Face Recognition System for Multimedia Application)

  • 박상규;성현경;한영환
    • 전기전자학회논문지
    • /
    • 제6권2호
    • /
    • pp.152-160
    • /
    • 2002
  • 본 논문에서는 멀티미디어 환경을 위한 얼굴 인식 시스템을 구현하였다. 본 얼굴 인식 시스템에서는 얼굴 영역을 선정하고 출력하는 처리시간의 단축과 인식률 향상을 위한 설계에 중점을 두었다. 전형적인 RGB 색상체계를 변형 없이 사용함으로써 색상체계 변환에 필요한 시간을 감소시켰으며, 얼굴 특성을 이용한 알고리즘과 신경망 기법을 활용하여 인식률을 향상시켰다. 본 시스템은 입력된 영상을 모자이크화 시킨 후 모자이크 블록의 색상 분석을 통하여 얼굴 색상 후보 블록을 선정하고, 얼굴이 가지는 특성을 활용하여 잘못 검색된 얼굴 색상 후보 블록을 제거한다 잘못 검색된 얼굴 색상 후보 블록이 제거된 모자이크 블록 영역에서 신경망의 입력으로 사용될 4가지 특성 값을 산출하여 오류 역전파 학습과정을 거친 신경망에서 처리한 후 그 출력 값을 가지고 얼굴 영역의 진위 여부를 판단하게 된다. 본 논문에서 구현된 시스템은 복수의 인원이 포함된 10장의 입력영상을 사용하여 실험한 결과 0.1초미만의 처리시간 내에 90%의 얼굴 인식률을 보여주었다. 이 결과는 멀티미디어 동영상의 응용을 위한 얼굴인식 시스템으로 충분히 이용될 수 있을 것이다.

  • PDF

대용량 음성인식을 위한 하이브리드 빔 탐색 방법과 가변 플로링 기법을 이용한 고속 디코더 알고리듬 연구 (Fast Decoder Algorithm Using Hybrid Beam Search and Variable Flooring for Large Vocabulary Speech Recognition)

  • 김용민;김진영;김동화;권오일
    • 음성과학
    • /
    • 제8권4호
    • /
    • pp.17-33
    • /
    • 2001
  • In this paper, we implement the large variable vocabulary speech recognition system, which is characterized by no additional pre-training process and no limitation of recognized word list. We have designed the system in order to achieve the high recognition rate using the decision tree based state tying algorithm and in order to reduce the processing time using the gaussian selection based variable flooring algorithm, the limitation algorithm of the number of nodes and ENNS algorithm. The gaussian selection based variable flooring algorithm shows that it can reduce the total processing time by more than half of the recognition time, but it brings about the reduction of recognition rate. In other words, there is a trade off between the recognition rate and the processing time. The limitation algorithm of the number of nodes shows the best performance when the number of gaussian mixtures is a three. Both of the off-line and on-line experiments show the same performance. In our experiments, there are some differences of the recognition rate and the average recognition time according to the distinction of genders, speakers, and the number of vocabulary.

  • PDF

FFT 켑스트럼의 처리시간 단축에 관한 연구 (On a Reduction of Computation Time of FFT Cepstrum)

  • 조왕래;김종국;배명진
    • 음성과학
    • /
    • 제10권2호
    • /
    • pp.57-64
    • /
    • 2003
  • The cepstrum coefficients are the most popular feature for speech recognition or speaker recognition. The cepstrum coefficients are also used for speech synthesis and speech coding but has major drawback of long processing time. In this paper, we proposed a new method that can reduce the processing time of FFT cepstrum analysis. We use the normal ordered inputs for FFT function and the bit-reversed inputs for IFFT function. Therefore we can omit the bit-reversing process and reduce the processing time of FFT ceptrum analysis.

  • PDF

실시간 근전도 패턴인식을 위한 특징투영 기법에 관한 연구 (A Study on Feature Projection Methods for a Real-Time EMG Pattern Recognition)

  • 추준욱;김신기;문무성;문인혁
    • 제어로봇시스템학회논문지
    • /
    • 제12권9호
    • /
    • pp.935-944
    • /
    • 2006
  • EMG pattern recognition is essential for the control of a multifunction myoelectric hand. The main goal of this study is to develop an efficient feature projection method for EMC pattern recognition. To this end, we propose a linear supervised feature projection that utilizes linear discriminant analysis (LDA). We first perform wavelet packet transform (WPT) to extract the feature vector from four channel EMC signals. For dimensionality reduction and clustering of the WPT features, the LDA incorporates class information into the learning procedure, and finds a linear matrix to maximize the class separability for the projected features. Finally, the multilayer perceptron classifies the LDA-reduced features into nine hand motions. To evaluate the performance of LDA for the WPT features, we compare LDA with three other feature projection methods. From a visualization and quantitative comparison, we show that LDA has better performance for the class separability, and the LDA-projected features improve the classification accuracy with a short processing time. We implemented a real-time pattern recognition system for a multifunction myoelectric hand. In experiment, we show that the proposed method achieves 97.2% recognition accuracy, and that all processes, including the generation of control commands for myoelectric hand, are completed within 97 msec. These results confirm that our method is applicable to real-time EMG pattern recognition far myoelectric hand control.