• 제목/요약/키워드: Filter bank method

검색결과 169건 처리시간 0.023초

새로운 시간축 정규화 방법을 이용한 한국어 고립단어 인식기 (Korean isolated word recognizer using new time alignment method of speech signal)

  • 남명우;박규홍;노승용
    • 대한전자공학회논문지SP
    • /
    • 제38권5호
    • /
    • pp.567-575
    • /
    • 2001
  • 본 논문에서는 음성신호의 발성길이와 상관없이 일정한 크기의 파라미터를 얻을 수 있는 새로운 방법을 제안하였다. 음성인식기의 성능은 음성신호에서 추출된 파라미터간의 유사도(패턴간의 거리)를 어떻게 비교하는지에 따라 결정된다. 그러나 화자에 따른 음성신호의 변이나 발성속도의 차이는 음성신호에서 일정한 크기의 파라미터 추출을 어렵게 한다. 제안한 방법은 음성신호에서 얻어진 파라미터를 스펙토그램의 형태로 표현한 뒤 2차원 DCT(Discrete Cosine Transform)를 이용해 일정한 크기의 파라미터로 정규화시키는 방법이다. 제안한 방법의 유효성을 입증하기 위해 청각세포를 모델링한 32개의 대역통과 필터로부터 얻어진 음성신호의 파라미터를 2차원 DCT 방법으로 가공한 후, 신경 회로망의 입력으로 사용하였다. 또한 기존 방법과의 인식률 비교를 위해 기존의 정규화된 입력을 구하는 방법 중 하나를 선택하여 비교 실험을 수행하였다. 실험결과 제안한 방법은 기존 방법에 비해 화자종속 및 화자독립 고립단어 인식에서 더 높은 인식률과 빠른 인식속도를 얻을 수 있었다.

  • PDF

HMM을 기반으로 한 자율이동로봇의 음성명령 인식시스템의 개발 (Development of Autonomous Mobile Robot with Speech Teaching Command Recognition System Based on Hidden Markov Model)

  • 조현수;박민규;이현정;이민철
    • 제어로봇시스템학회논문지
    • /
    • 제13권8호
    • /
    • pp.726-734
    • /
    • 2007
  • Generally, a mobile robot is moved by original input programs. However, it is very hard for a non-expert to change the program generating the moving path of a mobile robot, because he doesn't know almost the teaching command and operating method for driving the robot. Therefore, the teaching method with speech command for a handicapped person without hands or a non-expert without an expert knowledge to generate the path is required gradually. In this study, for easily teaching the moving path of the autonomous mobile robot, the autonomous mobile robot with the function of speech recognition is developed. The use of human voice as the teaching method provides more convenient user-interface for mobile robot. To implement the teaching function, the designed robot system is composed of three separated control modules, which are speech preprocessing module, DC servo motor control module, and main control module. In this study, we design and implement a speaker dependent isolated word recognition system for creating moving path of an autonomous mobile robot in the unknown environment. The system uses word-level Hidden Markov Models(HMM) for designated command vocabularies to control a mobile robot, and it has postprocessing by neural network according to the condition based on confidence score. As the spectral analysis method, we use a filter-bank analysis model to extract of features of the voice. The proposed word recognition system is tested using 33 Korean words for control of the mobile robot navigation, and we also evaluate the performance of navigation of a mobile robot using only voice command.

능동 소나 시스템에서 HFM 펄스의 확장 레플리카 상관기를 이용한 고속 광대역 능동탐지 및 도플러 추정 기법 (Fast Wideband Active Detection and Doppler Estimation Using the Extended Replica of an HFM Pulse in Active SONAR Systems)

  • 신종우;김완진;도대원;이동훈;김형남
    • 전자공학회논문지
    • /
    • 제51권8호
    • /
    • pp.11-19
    • /
    • 2014
  • 최근 능동 소나 시스템은 다중 목표물 탐지가 가능하도록 높은 거리 분해능을 얻기 위해 협대역 시스템에서 광대역 시스템으로 발전하고 있다. 하지만, 목표물 탐지 및 파라미터 추정 등의 성능 향상을 위해서는 광대역 신호처리가 요구되며, 이로 인해 연산량의 증가가 불가피하다. 본 논문에서는 hyperbolic frequency modulation (HFM) 펄스를 사용하는 광대역 능동소나 시스템에서 연산량의 증가를 최소화 하면서도 고속으로 목표물의 탐지 및 속도정보 추정을 할 수 있도록, 확장 레플리카를 이용한 광대역 HFM 탐지기 설계 방법을 제안한다. 모의실험을 통해 제안된 방법이 기존의 필터뱅크를 이용한 광대역 소나 탐지기법에 비해 탐지 및 도플러 추정에서 약간의 성능 열화가 있지만, 연산량 측면에서 매우 우수함을 보인다.

화자 정규화를 위한 새로운 파워 스펙트럼 Warping 방법 (A New Power Spectrum Warping Approach to Speaker Warping)

  • 유일수;김동주;노용완;홍광석
    • 대한전자공학회논문지SP
    • /
    • 제41권4호
    • /
    • pp.103-111
    • /
    • 2004
  • 화자 정규화 방법은 화자 독립 음성인식 시스템에서 음성 인식의 정확성을 높이기 위한 성공적인 방법으로 알려져 왔다. 널리 사용되는 화자 정규화 방법은 maximum likelihood 반의 주파수 warping 방법이다. 본 논문은 주파수 warping 보다 더 좋은 화자 정규화의 성능 개선을 위해 새로운 파워 스펙트럼 warping 방법을 제안한다. 파워 스펙트럼 warping은 멜 주파수 켑스트럼 분석(MFCC) 방법을 이용하며, MFCC 처리 단계에서 필터 뱅크의 파워 스펙트럼을 조절함으로써 화자 정규화를 수행하는 간단한 메커니즘으로 갖는다. 또한 본 논문은 파워 스펙트럼 warping과 주파수 warping 방법을 서로 결합한 hybrid VTN 방법을 제안한다. 본 논문의 실험은 baseline 시스템에 각 화자 정규화 방법을 적용하여 SKKU PBW DB에서 인식 성능을 비교 분석하였다. 실험 결과를 보면 baseline 시스템의 단어 인식 성능을 기준으로 주파수 warping은 2.06%, 파워 스펙트럼 warping은 3.05%, 그리고 hybrid VTN은 4.07%의 단어 에러 율의 감소를 보였다.

깊은 신경망을 이용한 오디오 이벤트 검출 (Audio Event Detection Using Deep Neural Networks)

  • 임민규;이동현;박호성;김지환
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권1호
    • /
    • pp.183-190
    • /
    • 2017
  • 본 논문에서는 깊은 신경망을 이용한 오디오 이벤트 검출 방법을 제안한다. 오디오 입력의 매 프레임에 대한 오디오 이벤트 확률을 feed-forward 신경망을 적용하여 생성한다. 매 프레임에 대하여 멜 스케일 필터 뱅크 특징을 추출한 후, 해당 프레임의 전후 프레임으로부터의 특징벡터들을 하나의 특징벡터로 결합하고 이를 feed-forward 신경망의 입력으로 사용한다. 깊은 신경망의 출력층은 입력 프레임 특징값에 대한 오디오 이벤트 확률값을 나타낸다. 연속된 5개 이상의 프레임에서의 이벤트 확률값이 임계값을 넘을 경우 해당 구간이 오디오 이벤트로 검출된다. 검출된 오디오 이벤트는 1초 이내에 동일 이벤트로 검출되는 동안 하나의 오디오 이벤트로 유지된다. 제안된 방법으로 구현된 오디오 이벤트 검출기는 UrbanSound8K와 BBC Sound FX자료에서의 20개 오디오 이벤트에 대하여 71.8%의 검출 정확도를 보였다.

DHMM 음성 인식 시스템을 위한 양자화 기반의 화자 정규화 (Quantization Based Speaker Normalization for DHMM Speech Recognition System)

  • 신옥근
    • 한국음향학회지
    • /
    • 제22권4호
    • /
    • pp.299-307
    • /
    • 2003
  • 화자독립 음성인식기에서 화자사이의 성도 길이의 영향을 최소화시켜 인식 성능을 개선하는 화자 정규화에 대한 많은 연구가 있어 왔다. 본 연구에서는 벡터양자화기를 이용하여 화자 검증이 가능하다는 사실에 착안하여 벡터 양자화기를 이용한 비교적 간단한 선형 워핑 화자정규화방법을 제안한다. 제안하는 방법에서는 먼저 정규화에 이용될 최적의 코드북을 생성한 다음, 이 코드 북을 이용하여 화자의 선형 워핑계수를 추출하고 추출된 워핑계수는 멜 켑스트럼 추출시에 사용되는 멜스케일 필터뱅크를 워핑하기 위해 이용된다. 본고에서 제안한 워핑계수 추출 및 적용 방법의 성능을 확인하기 위해 이산 HMM을 이용한 13가지의 단음절 한글 숫자음 인식기를 이용하여 인식실험을 수행하였으며, 실험 결과 약 29%의 오인식률 감소를 보여 제안하는 화자 정규화방법이 다른 라인서치 워핑계수추출 방법보다 간단한 동시에 효용가치가 있음을 확인하였다.

영전압 제어 방법을 적용한 가변 펄스형 Nd:YAG 레이저시스템 (A Variable pulsed Nd:YAG laser system adopted ZCC method)

  • Doo-Youl Park;Whi-Young Kim
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권3호
    • /
    • pp.357-362
    • /
    • 2001
  • 기존의 레이저통신용 스위칭 방식은 변압기 2차측에 정류부 및 평활용 콘덴서가 필수적으로 포함되어 있으며, 이렇게 얻어진 직류전압의 후단부를 스위칭 하게 되므로 시스템장치가 복잡하다. 또한 스위칭에 의한 손실이 크고, 펄스반복율(pulse repetition rate)이 증가할수록 콘덴서에 저장된 에너지가 램프로 충분히 전달되지 못하여 레이저 출력 효율이 저감되는 단점이 있다. 본 연구에서는 스위칭에 의한 손실을 줄여 레이저의 출력 효율을 개선하고자 교류전압의 영점(ZERO)을 ZCC(zero cross control)방식으로 검출하여 변압기 2차측 교류전압의 영점에서 SCR을 턴-온(turn-on)시키는 레이저 시스템을 설계 및 제작하였다. 그 결과 기존의 평활용 콘덴서와 정류부를 사용한 레이저 시스템보다 펄스반복울이 10[pps]씩 증가할수록 레이저 출력 효율 약 3.5$\%$씩 증가하여 60pps에서는 약 25$\%$까지 상승하였다.

  • PDF

프로세서 구조에 따른 DCT 알고리즘의 구현 성능 비교 (Performance Comparison of DCT Algorithm Implementations Based on Hardware Architecture)

  • 이재성;박영철;윤대희
    • 한국통신학회논문지
    • /
    • 제31권6C호
    • /
    • pp.637-644
    • /
    • 2006
  • 본 논문에서는 MPEG 오디오 부호화 과정 중 서브밴드 필터뱅크를 구현하기 위해 사용되는 DCT(Discrete Cosine Transform) 과정에 대해 구현 시스템의 구조에 따른 DCT 알고리즘의 구현 결과와 성능 차이를 분석한다. 고속 DCT 알고리즘은 코사인 계수의 내적을 통해 구하는 직접 구현 방법보다 연산량이 현저하게 적은 것으로 알려져 있지만, 피연산자의 어드레스가 불규칙적이고 출력 데이터를 재정렬하는 과정이 필요하기 때문에 규칙성이 결여되며, 재정렬만을 위한 추가적인 연산이 필요한 경우도 있다. 따라서 DSP와 같이 반복적인 연산을 고속으로 수행하기 위해 최적화된 구조의 하드웨어에서는 알고리즘의 규칙성이 높은 직접 구현 방법에 비해 고속 알고리즘이 불리한 측면이 있으며, 더욱이 유효 자리수를 제한하는 경우, 직접 구현 방법에 비해 더 많은 프로세싱 단계를 거쳐야 하므로 누적 오차가 커진다. 본 논문에서는 알고리즘의 규칙성과 각 프로세서의 연산 방법간의 관계와 유효 자리수에 따른 누적 오차를 분석하고 프로세서의 구조에 따른 고속 알고리즘의 선택 기준을 제시하였다.

주파수 공유기법을 적용한 RF 송수신기에 대한 연구 (The Study on the RF Transceiver Applied to Cognitive Radio Method)

  • 김기중;김종성;배문관
    • 한국전자통신학회논문지
    • /
    • 제10권12호
    • /
    • pp.1315-1320
    • /
    • 2015
  • 본 논문은 군통신 데이터링크 장비에 대해서 주파수 자원을 효율적으로 이용하기 위하여 고속도약기법, 주파수환경센싱기법, 수신2채널기법, 수신필터뱅크부 적용 등을 이용하여 동일한 주파수 대역을 사용하는 레이다 등의 타장비와 공유할 수 있는 기법을 소개한다. 사전에 운용대역의 주파수 환경을 실시간 측정 및 분석하였고, 일차적으로 개발하려는 장비가 기존 운용하고 있는 레이다에 간섭영향성이 최소화하는 방법을 분석하였으며, 반대로 레이다가 간섭을 주는 환경에서 본 논문에서 제시한 주파수 공유기법을 사용하여 최대한 통신확률을 높이는 구조를 제시한다. 최종적으로 설계된 RF송수신기의 잡음지수, 상호혼변조(IMD)와 같은 주요 규격에 대한 모의실험을 통하여 만족여부를 사전 검증하였다.

서브밴드 필터 뱅크를 이용한 강인한 음원 추적시스템에 대한 연구 (A Study on the Robust Sound Localization System Using Subband Filter Bank)

  • 박규식;박재현;온승엽;오상헌
    • 한국음향학회지
    • /
    • 제20권1호
    • /
    • pp.36-42
    • /
    • 2001
  • 본 연구는 폐쇄된 사무 공간상에서 2개의 마이크로폰을 이용하여 임의의 위치에서 발생한 음성 및 음향의 방향성 (방향각)을 추적하는 새로운 알고리듬을 제안한다. 본 논문에서 제안한 Subband CPSP (Cross Power Spectrum Phase) 알고리듬은 기존의 CPSP 알고리듬을 개선한 것으로서, 마이크로폰에 수신된 2개의 입력 신호에 대해 서브밴드 필터 뱅크를 이 용하여 대역 분할하고 각 서브밴드 대역에서 구해지는 대역별 CPSP 결과의 평균값을 제공한다. 이러한 주파수 대역 분할방식은 잡음의 영향을 각 대역으로 한정 분산시켜 사무 공간내 잡음의 영향을 각 대역으로 한정하여 음원의 방향각 계산시 발생하는 오차를 최소화할 수 있는 보다 강인하고 정확한 음원 추적 시스템을 가능하게 한다. 제안된 알고리듬의 성능을 입증하기 위해 기존의 CPSP 와 Subband CPSP 알고리듬의 실시간 음원 추적 실험을 수행하였으며, 실험 결과 제안된 Subband CPSP가 CPSP에 비해 평균 5% 이상의 성능 향상을 가져옴을 확인할 수 있었다.

  • PDF