• 제목/요약/키워드: Tone Feature Extraction

검색결과 8건 처리시간 0.022초

Feature Extraction Based on DBN-SVM for Tone Recognition

  • Chao, Hao;Song, Cheng;Lu, Bao-Yun;Liu, Yong-Li
    • Journal of Information Processing Systems
    • /
    • 제15권1호
    • /
    • pp.91-99
    • /
    • 2019
  • An innovative tone modeling framework based on deep neural networks in tone recognition was proposed in this paper. In the framework, both the prosodic features and the articulatory features were firstly extracted as the raw input data. Then, a 5-layer-deep deep belief network was presented to obtain high-level tone features. Finally, support vector machine was trained to recognize tones. The 863-data corpus had been applied in experiments, and the results show that the proposed method helped improve the recognition accuracy significantly for all tone patterns. Meanwhile, the average tone recognition rate reached 83.03%, which is 8.61% higher than that of the original method.

감마톤 특징 추출 음향 모델을 이용한 음성 인식 성능 향상 (Speech Recognition Performance Improvement using Gamma-tone Feature Extraction Acoustic Model)

  • 안찬식;최기호
    • 디지털융복합연구
    • /
    • 제11권7호
    • /
    • pp.209-214
    • /
    • 2013
  • 음성 인식 시스템에서는 인식 성능 향상을 위한 방법으로 인간의 청취 능력을 인식 시스템에 접목하였으며 잡음 환경에서 음성 신호와 잡음을 분리하여 원하는 음성 신호만을 선택할 수 있도록 구성되었다. 하지만 실용적 측면에서 음성 인식 시스템의 성능 저하 요인으로 인식 환경 변화에 따른 잡음으로 인한 음성 검출이 정확하지 못하여 일어나는 것과 학습 모델이 일치하지 않는 것을 들 수 있다. 따라서 본 논문에서는 음성 인식 향상을 위해 감마톤을 이용하여 특징을 추출하고 음향 모델을 이용한 학습 모델을 제안하였다. 제안한 방법은 청각 장면 분석을 이용한 특징을 추출을 통해 인간의 청각 인지 능력을 반영하였으며 인식을 위한 학습 모델 과정에서 음향 모델을 이용하여 인식 성능을 향상시켰다. 성능 평가를 위해 잡음 환경의 -10dB, -5dB 신호에서 잡음 제거를 수행하여 SNR을 측정한 결과 3.12dB, 2.04dB의 성능이 향상됨을 확인하였다.

Automatic Face Identification System Using Adaptive Face Region Detection and Facial Feature Vector Classification

  • Kim, Jung-Hoon;Do, Kyeong-Hoon;Lee, Eung-Joo
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -2
    • /
    • pp.1252-1255
    • /
    • 2002
  • In this paper, face recognition algorithm, by using skin color information of HSI color coordinate collected from face images, elliptical mask, fratures of face including eyes, nose and mouth, and geometrical feature vectors of face and facial angles, is proposed. The proposed algorithm improved face region extraction efficacy by using HSI information relatively similar to human's visual system along with color tone information about skin colors of face, elliptical mask and intensity information. Moreover, it improved face recognition efficacy with using feature information of eyes, nose and mouth, and Θ1(ACRED), Θ2(AMRED) and Θ 3(ANRED), which are geometrical face angles of face. In the proposed algorithm, it enables exact face reading by using color tone information, elliptical mask, brightness information and structural characteristic angle together, not like using only brightness information in existing algorithm. Moreover, it uses structural related value of characteristics and certain vectors together for the recognition method.

  • PDF

원거리 무인기 신호 식별을 위한 특징추출 알고리즘 (Feature Extraction Algorithm for Distant Unmmaned Aerial Vehicle Detection)

  • 김주호;이기배;배진호;이종현
    • 전자공학회논문지
    • /
    • 제53권3호
    • /
    • pp.114-123
    • /
    • 2016
  • 본 논문에서는 무인항공기의 엔진 음향 신호를 탐지하기 위한 효과적인 특징 추출 방법을 제안하고 검증한다. 엔진 음향신호는 기본주파수와 배음이 정수배 관계를 갖는 조화 복합음(Harmonic complex tone)으로 구성되며, 각 주파수의 시간에 따른 변화는 연속적이다. 이러한 특성을 이용하여 기본주파수의 정수배와 실제 배음 주파수 차이의 평균과 분산, 주파수 변화량 등으로 구성된 특징벡터를 제안하였다. 모의 실험을 수행한 결과 제안한 특징벡터는 목표신호와 다양한 간섭 신호에 대해 우수한 변별력을 보였으며, 시간에 따라 주파수가 변하는 경우에도 영향을 받지 않고 안정적인 결과를 보였다. 원거리에서 실측된 엔진 음향신호로 부터 특징의 Fisher score를 계산하여 변별력을 비교한 결과, 제안한 특징 중 주파수에 기반한 세 가지 특징들이 신호 대 잡음비가 낮은 상황에서도 높은 변별력을 보였다. ELM 분류기를 이용해 MFCC와의 인식 성능을 비교한 결과, 제안한 방법을 이용할 경우 모의 간섭신호에 대한 오류율이 37.6% 개선되었다. 또한 신호대 잡음비가 시간에 따라 점진적으로 증가하는 경우 MFCC에 비해 4.5 dB 낮은 시점에서 목표신호 탐지가 가능하였다.

실 해상 실험 데이터를 이용한 정합장 처리에서의 특성치 추출 기법 분석 (Matched Field Processing: Ocean Experimental Data Analysis Using Feature Extraction Method)

  • Kim Kyung Seop;Seong Woo Jae;Song Hee Chun
    • The Journal of the Acoustical Society of Korea
    • /
    • 제24권1E호
    • /
    • pp.21-27
    • /
    • 2005
  • Environmental mismatch has been one of important issues discussed in matched field processing for underwater source detection problem. To overcome this mismatch many algorithms professing robustness have been suggested. Feature extraction method (FEM) [Seong and Byun, IEEE Journal of Oceanic Engineering, 27(3), 642-652 (2002)] is one of robust matched field processing algorithms, which is based on the eigenvector estimation. Excluding eigenvectors of replica covariance matrix corresponding to large eigenvalues and forming an incoherent subspace of the replica field, the processor is formulated similarly to MUSIC algorithm. In this paper, by using the ocean experimental data, processing results of FEM and MVDR with white noise constraint (WNC) are presented for two levels of multi-tone source. Analysis of eigen-space of CSDM and FEM performance are also presented.

OptiNeural System for Optical Pattern Classification

  • Kim, Myung-Soo
    • Journal of Electrical Engineering and information Science
    • /
    • 제3권3호
    • /
    • pp.342-347
    • /
    • 1998
  • An OptiNeural system is developed for optical pattern classification. It is a novel hybrid system which consists of an optical processor and a multilayer neural network. It takes advantages of two dimensional processing capability of an optical processor and nonlinear mapping capability of a neural network. The optical processor with a binary phase only filter is used as a preprocessor for feature extraction and the neural network is used as a decision system through mapping. OptiNeural system is trained for optical pattern classification by use of a simulated annealing algorithm. Its classification performance for grey tone texture patterns is excellent, while a conventional optical system shows poor classification performance.

  • PDF

음성의 감성요소 추출을 통한 감성 인식 시스템 (The Emotion Recognition System through The Extraction of Emotional Components from Speech)

  • 박창현;심귀보
    • 제어로봇시스템학회논문지
    • /
    • 제10권9호
    • /
    • pp.763-770
    • /
    • 2004
  • The important issue of emotion recognition from speech is a feature extracting and pattern classification. Features should involve essential information for classifying the emotions. Feature selection is needed to decompose the components of speech and analyze the relation between features and emotions. Specially, a pitch of speech components includes much information for emotion. Accordingly, this paper searches the relation of emotion to features such as the sound loudness, pitch, etc. and classifies the emotions by using the statistic of the collecting data. This paper deals with the method of recognizing emotion from the sound. The most important emotional component of sound is a tone. Also, the inference ability of a brain takes part in the emotion recognition. This paper finds empirically the emotional components from the speech and experiment on the emotion recognition. This paper also proposes the recognition method using these emotional components and the transition probability.

기저막 특성을 이용한 새로운 음성 특징 추출 및 성능 분석 (Performance of analysis and extraction of speech feature using characteristics of basilar membrane)

  • 이철희;신유식;정성환;김종교
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.153-156
    • /
    • 2000
  • 본 논문에서는 음성 인식률 향상을 위한 여러 가지방법들 중에서 음성특징 파라미터 추출 방법에 관한 한가지 방법을 제시하였다. 본 논문에서는 청각 특성을 기반으로 한 MFCC(met frequency cepstrum coef-ficients)와 성능 향상을 위한 방법으로 GFCC (gamma-tone filter frequency cepstrum coefficients)를 제시하고 음성 인식을 수행하여 성능을 분석하였다. MFCC에서 일반적으로 사용하는 임계 대역 필터로 삼각 필터(triangular filter) 대신 청각 구조의 기저막(basilar membrane)특성을 묘사한 gammatone 대역 통과 필터를 이용하여 특징 파라미터를 추출하였다. DTW 알고리즘으로 인식률을 분석한 결과 삼각 대역 필터를 이용한 것보다 gammatone 대역 통과 필터를 이용한 추출법이 약 2∼3%의 성능 향상을 보였다.

  • PDF