• 제목/요약/키워드: Simulation speech

검색결과 299건 처리시간 0.023초

지연 추정 기능을 갖는 적응 마이크로폰 어레이 알고리즘 (Adaptive Microphone Array System with Self-Delay Estimator)

  • 정양원;강홍구;이충용;윤대희
    • 한국통신학회논문지
    • /
    • 제30권1C호
    • /
    • pp.54-60
    • /
    • 2005
  • 본 논문은 지연 추정 기능을 갖는 적응 마이크로폰 어레이 알고리즘을 제안한다. Generalized sidelobe canceller (GSC)의 적응 차단 행렬이 각 센서간의 상호 시간 지연을 추정할 수 있다는 것을 보임으로써, 제안한 시스템은 적응 차단 행렬을 목적 신호의 차단 뿐 아니라 각 센서의 시간 지연 추정을 위해 사용한다. 이로 인해, 제안한 시스템은 GSC 구조만을 사용하면서. 시간 지연 추정기를 외부의 전처리기로 사용하는 기존의 시스템과 같은 성능을 얻을 수 있다. 실제 환경에서의 실험 결과를 통해 제안한 시스템의 성능이 기존의 시스템과 유사함을 확인하였다.

E-MIND II를 이용한 고립 단어 인식 시스템의 설계 (Isolated Word Recognition with the E-MIND II Neurocomputer)

  • 김준우;정홍;김명원
    • 전자공학회논문지B
    • /
    • 제32B권11호
    • /
    • pp.1527-1535
    • /
    • 1995
  • This paper introduces an isolated word recognition system realized on a neurocomputer called E-MIND II, which is a 2-D torus wavefront array processor consisting of 256 DNP IIs. The DNP II is an all digital VLSI unit processor for the EMIND II featuring the emulation capability of more than thousands of neurons, the 40 MHz clock speed, and the on-chip learning. Built by these PEs in 2-D toroidal mesh architecture, the E- MIND II can be accelerated over 2 Gcps computation speed. In this light, the advantages of the E-MIND II in its capability of computing speed, scalability, computer interface, and learning are especially suitable for real time application such as speech recognition. We show how to map a TDNN structure on this array and how to code the learning and recognition algorithms for a user independent isolated word recognition. Through hardware simulation, we show that recognition rate of this system is about 97% for 30 command words for a robot control.

  • PDF

Bayesian 기법의 모수 추정을 이용한 결정트리 상태 공유 모델링 (Decision Tree State Tying Modeling Using Parameter Estimation of Bayesian Method)

  • 오상엽
    • 디지털융복합연구
    • /
    • 제13권1호
    • /
    • pp.243-248
    • /
    • 2015
  • 인식 모델을 구성할 때 정의되지 않은 모델, 인식 모델 구성 후에 추가되어진 모델, 모델이 부족하여 하나의 모델 클러스터링으로 모델링하여 생성된 인식 모델들은 인식률 저하의 원인이 된다. 이러한 원인을 개선하기 위하여 Bayesian 기법의 모수 추정을 이용한 결정트리 상태 공유 모델링 방법을 제안하였다. 제안 방법은 Bayesian 기법의 파라미터 추정을 통하여 탐색된 결과로부터 결정트리 기반 상태 공유 모델링의 최대 확률 기법에 따라 인식모델을 결정한다. 본 논문에서 제안하여 시뮬레이션 데이터를 이용한 실험 결과에서 제안한 군집화 방식을 비교하여 1.29%의 음성인식 오류감소율을 보였으며, 기존 군집화 방식에 비해 개선된 성능을 보였다.

잡음에 강인한 내용기반 음악 검색 시스템에 대한 연구 (A Study of Noise Robust Content-Based Music Retrieval System)

  • 윤원중;박규식
    • 대한전자공학회논문지SP
    • /
    • 제45권6호
    • /
    • pp.148-155
    • /
    • 2008
  • 본 논문에서는 모바일 환경에서 적용 가능한 잡음에 강인한 내용기반 음악 검색 시스템을 구축하였다. 제안된 시스템은 기존의 음성인식 분야에서 잡음에 강인한 특성을 가진 것으로 알려진 ZCPA 특징을 내용기반 음악 검색 시스템에 적용시켜 그 성능을 검증하였다. 또한 본 논문에서는 대용량 음악 DB 검색에서 기존의 전수(Exhaustive) 검색에 비해 검색 속도를 99% 가까이 개선할 수 있는 새로운 인덱싱 방법과 고속 검색 알고리즘을 제안하였다. 신호대 잡음비가 15dB - 0dB인 잡음 환경에서의 모의실험 결과, 제안 시스템은 기존의 MFCC와 필터뱅크 에너지 특징에 비해 약 5% - 30% 정도의 우수한 성능을 나타냄을 확인하였다.

확산필터뱅크를 전처리기로 사용한 한국어 단모음인식 (The Recognition of Korean Single vowels by Use of the Diffusion Filter Bank as a Pre-processor)

  • 허만탁;김재창
    • 한국음향학회지
    • /
    • 제16권1호
    • /
    • pp.81-87
    • /
    • 1997
  • 본 논문에서는 스펙트럼 포락선을 이용하여 음성을 인식하기 위한 새로운 전처리 방법을 제안한다. 이는 확산필터뱅크를 사용하여 스펙트럼 포락선을 추출하는 새로운 방법이다. 확산필터뱅크의 분석대역을 몇 개의 작은 대역으로 나눔으로써 확산회수를 줄였으며 차분회수를 늘임으로써 선택도를 높였다. 이 결과, 총처리시간을 대폭 줄였으며 스펙트럼의 변별력을 증가시켰다. 컴퓨터 시뮬레이션을 통하여 간단한 인식 알고리듬으로 실제 음성의 단모음 인식 실험을 해본 결과 3%의 인식율을 얻음으로써 확산필터뱅크가 많은 주파수 성분을 가진 음성의 주파수 분석을 이용하는 음성인식에 대단히 유효하다는 것을 확인하였다.

  • PDF

다중 채널 디지털 보청기 알고리즘의 고정 소수점 연산 최적화 (Fixed-point Optimization of a Multi-channel Digital Hearing Aid Algorithm)

  • 이근상;백용현;박영철
    • 한국정보전자통신기술학회논문지
    • /
    • 제2권2호
    • /
    • pp.37-43
    • /
    • 2009
  • 본 논문에서는 저 전력 시스템에 적합한 고정 소수점 연산기로 구현된 다중 채널 디지털 보청기 알고리즘의 최적화 기법을 제시한다. 먼저 입력 신호를 고속 MDCT(modified discrete cosine transform) 방법을 사용하여 주파수 대역 분할함으로써 알고리듬의 복잡도를 최소화 하였고, MDCT 출력을 비선형 대역 분할 과정을 거쳐 채널별 그룹핑을 한 다음, 각 채널 신호를 난청인의 청각 손실 정도에 따라 구성한 라우드니스 보상 함수(loudness compensation function: LCF)표를 이용하여 이득을 조절하고, 최종적으로 TDAC 기법을 구현하는 IMDCT(Inverse MDCT) 변환을 거쳐 보상된 출력을 합성한다. 모든 과정은 16비트 정수 연산으로 구현되며, 이득을 계산하기 위해 측정되는 로그 단위의 연산 과정은 미리 계산된 테이블과 고속 탐색 알고리듬을 이용하여 구현된다. 구성된 보청기 알고리즘의 성능을 컴퓨터 시뮬레이션을 통해 평가하였다.

  • PDF

근접 센서의 방위정보를 이용한 수중표적 예상위치 추정 기법 (Position Estimation of Underwater Target Using Proximity Sensor with Bearing Information)

  • 최영두;김정훈;윤경식;서익수;이동훈;이균경
    • 한국군사과학기술학회지
    • /
    • 제17권4호
    • /
    • pp.422-429
    • /
    • 2014
  • Proximity sensor networks are aimed at estimation kinematic state of target using estimated position of the target by each sensor node or target parameter. To analyze the kinematic state of target, traditional approaches require detections on multiple sensors, very large number of sensors to achieve acceptable performance. In this paper, we propose a novel method which can estimate predicted position of the underwater target using minimum proximity sensor with bearing information to this problem. The proposed algorithm was verified performance through simulation.

머신러닝과 립 모션을 활용한 지화 번역 시스템 구현에 관한 연구 (A Study on Finger Language Translation System using Machine Learning and Leap Motion)

  • 손다은;고형민;신행용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.552-554
    • /
    • 2019
  • 농아는 청각장애인과 언어장애인을 말하며 청각장애인과 언어장애인은 음성으로 의사소통하는 것에 어려움이 있기 때문에 수화나 구화 등을 이용하여 의사소통을 한다. 그러나 수화는 모든 사람들이 사용하는 통신 수단이 아니기 때문에 수화를 알지 못하는 사람과의 의사소통하는 데 있어 한계가 생길 수밖에 없다. 본 논문에서는 장애인과 비장애인이 어려움 없이 의사소통할 수 있는 수단으로 지화 번역 시스템을 제안하고 설계 및 구현하였다. 립 모션으로 지화를 인식하였고 인식률을 높이기 위해 머신 러닝 기술을 이용하여 지화 데이터를 스스로 학습시켰다. 구현 및 실험 결과를 통해 제안한 알고리즘 적용으로 인식률 개선이 이뤄졌음을 확인하였다.

CONTINUOUS DIGIT RECOGNITION FOR A REAL-TIME VOICE DIALING SYSTEM USING DISCRETE HIDDEN MARKOV MODELS

  • Choi, S.H.;Hong, H.J.;Lee, S.W.;Kim, H.K.;Oh, K.C.;Kim, K.C.;Lee, H.S.
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 FIFTH WESTERN PACIFIC REGIONAL ACOUSTICS CONFERENCE SEOUL KOREA
    • /
    • pp.1027-1032
    • /
    • 1994
  • This paper introduces a interword modeling and a Viterbi search method for continuous speech recognition. We also describe a development of a real-time voice dialing system which can recognize around one hundred words and continuous digits in speaker independent mode. For continuous digit recognition, between-word units have been proposed to provide a more precise representation of word junctures. The best path in HMM is found by the Viterbi search algorithm, from which digit sequences are recognized. The simulation results show that a interword modeling using the context-dependent between-word units provide better recognition rates than a pause modeling using the context-independent pause unit. The voice dialing system is implemented on a DSP board with a telephone interface plugged in an IBM PC AT/486.

  • PDF

대역 분할 장구간 예측을 이용한 CELP 부호화기 (A CELP Coder using the Band-Divided Long Term Prediction)

  • 최용수;강홍구;임명섭;안동순;윤대희
    • 한국음향학회지
    • /
    • 제14권4호
    • /
    • pp.38-45
    • /
    • 1995
  • 본 논문에서는 CELP (Code Excited Linear Prediction) 부호화기의 장구간 예측단에 MBE(Multi-Band Excitation) 방법을 도입하여 4.8kbps 이하의 낮은 전송률에서 성능을 향상시키는 방법을 제안한다. 제안한 방법에서는 기존의 CELP 방법으로 장구간 예측을 한 후에도 여전히 남아 있는 주기적 성분들을 다시 한번 다중대역(multiband)으로 장구간 예측을 한다. 이때 전 스펙트럼을 기본 주파수의 하모닉 간격으로 대역 분할하고, 주기적 다중대역 여기 신호는 각 대역 내의 하모닉들에서 여기 신호 스펙트럼과 근사한 크기를 갖는 정현파 (sine wave)의 합으로 표현함으로써 실제 여기 신호의 특성을 잘 반영하도록 한다. 제안된 방법의 성능 평가를 위해서 4.8 kbps의 전송률에서 컴퓨터 모의 실험을 하였다. 음질 평가의 비교 기준 대상으로 4.8 kbps DoD CELP와 4.4 kbps IMBE를 선정하여 주관적인 음질 평가를 실시한 결과 4.8 kbps DoD CELP보다 우수하였고, 4.4 kbps IMBE와는 비슷하였다.

  • PDF