• 제목/요약/키워드: Speech signal processing

검색결과 331건 처리시간 0.022초

선형예측계수를 사용한 신경회로망에 의한 잡음량의 인식 (Recognition of Noise Quantity by Neural Network using Linear Predictive Coefficient)

  • 최재승
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 추계종합학술대회 B
    • /
    • pp.379-382
    • /
    • 2008
  • 잡음환경 하의 회화에서 잡음량을 줄이고 신호처리 시스템의 성능을 향상시키기 위해서는 잡음량에 따라서 적응적으로 처리되는 신호처리 시스템이 필요하다. 따라서 본 논문에서는 선형예측계수를 사용하여 잡음량을 인식하는 방법을 제안하며, 본 잡음량 인식은 다양한 배경잡음에 의하여 열화된 3종류의 음성이 신경회로망에 의하여 학습되어진다. 본 실험에서는 Aurora2 데이터베이스를 사용하여 여러 잡음에 대하여 평균적으로 약 97.6% 이상의 양호한 인식결과를 확인할 수 있었다.

  • PDF

고정 소수점 연산에 의한 고속 DCT 알고리듬의 오차해석 (A Fixed-Point Error Analysis of fast DCT Algorithms)

  • 연일동;이상욱
    • 대한전기학회논문지
    • /
    • 제40권4호
    • /
    • pp.331-341
    • /
    • 1991
  • The discrete cosine transform (DCT) is widely used in many signal processing areas, including image and speech data compression. In this paper, we investigate a fixed-point error analysis for fast DCT algorithms, namely, Lee [6], Hou [7] and Vetterli [8]. A statistical model for fixed-point error is analyzed to predict the output noise due to the fixed-point implementation. This paper deals with two's complement fixed-point data representation with truncation and rounding. For a comparison purpose, we also investigate the direct form DCT algorithm. We also propose a suitable scaling model for the fixed-point implementation to avoid an overflow occurring in the addition operation. Computer simulation results reveal that there is a close agreement between the theoretical and the experimental results. The result shows that Vetterli's algorithm is better than the other algorithms in terms of SNR.

  • PDF

클러스터링 기법을 이용한 음원의 위치추정 성능향상 (Enhancement of Source Localization Performance using Clustering Ranging Method)

  • 이호진;윤경식;이균경
    • 한국군사과학기술학회지
    • /
    • 제19권1호
    • /
    • pp.9-15
    • /
    • 2016
  • Source localization has developed in various fields of signal processing including radar, sonar, and wireless communication, etc. Source localization can be found by estimating the time difference of arrival between the each of sensors. Several methods like the NLS(Nonlinear Least Square) cost function have been proposed in order to improve the performance of time delay estimation. In this paper, we propose a clustering method using the four sensors with the same aperture as previous methods of using the three sensors. Clustering method can be improved the source localization performance by grouping similar estimated values. The performance of source localization using clustering method is evaluated by Monte Carlo simulation.

운율교육을 위한 운율이식기술 개선 방안 연구 (Improvement of Prosody Transplantation Technology for English Prosody Education and Its Application)

  • 이서배
    • 대한음성학회지:말소리
    • /
    • 제61호
    • /
    • pp.49-62
    • /
    • 2007
  • This study focused on the improvement of prosody transplantation technology to be used for effective prosody education. Issues making the technology a less acceptable tool for prosody education were addressed. Instead of merely copying the target pitch onto a learner's utterances, the target pitch was resealed in semitone before the transplantation. In so doing, distortion of a signal was minimized and the transplanted utterance could have the quality of sound not different from the learner's utterances. Instead of manual transplantation, an automatic procedure was proposed to increase the reliability and the consistency of the outcome and enable real time processing. The perceptual performance of the automatic transplantation was evaluated by the perception experiment showing the automatic ransplantation was as good as the manual process.

  • PDF

저작운동으로 인한 진동 잡음 신호의 경감을 위한 측두골 이식형 마이크로폰의 설계 (The Design of Temporal Bone Type Implantable Microphone for Reduction of the Vibrational Noise due to Masticatory Movement)

  • 우승탁;정의성;임형규;이윤정;성기웅;이정현;조진호
    • 센서학회지
    • /
    • 제21권2호
    • /
    • pp.144-150
    • /
    • 2012
  • A microphone for fully implantable hearing device was generally implanted under the skin of the temporal bone. So, the implanted microphone's characteristics can be affected by the accompanying noise due to masticatory movement. In this paper, the implantable microphone with 2-channels structure was designed for reduction of the generated noise signal by masticatory movement. And an experimental model for generation of the noise by masticatory movement was developed with considering the characteristics of human temporal bone and skin. Using the model, the speech signal by a speaker and the artificial noise by a vibrator were supplied simultaneously into the experimental model, the electrical signals were measured at the proposed microphone. The collected signals were processed using a general adaptive filter with least mean square(LMS) algorithm. To confirm performance of the proposed methods, the correlation coefficient and the signal to noise ratio(SNR) before and after the signal processing were calculated. Finally, the results were compared each other.

확산필터뱅크를 전처리기로 사용한 한국어 단모음인식 (The Recognition of Korean Single vowels by Use of the Diffusion Filter Bank as a Pre-processor)

  • 허만탁;김재창
    • 한국음향학회지
    • /
    • 제16권1호
    • /
    • pp.81-87
    • /
    • 1997
  • 본 논문에서는 스펙트럼 포락선을 이용하여 음성을 인식하기 위한 새로운 전처리 방법을 제안한다. 이는 확산필터뱅크를 사용하여 스펙트럼 포락선을 추출하는 새로운 방법이다. 확산필터뱅크의 분석대역을 몇 개의 작은 대역으로 나눔으로써 확산회수를 줄였으며 차분회수를 늘임으로써 선택도를 높였다. 이 결과, 총처리시간을 대폭 줄였으며 스펙트럼의 변별력을 증가시켰다. 컴퓨터 시뮬레이션을 통하여 간단한 인식 알고리듬으로 실제 음성의 단모음 인식 실험을 해본 결과 3%의 인식율을 얻음으로써 확산필터뱅크가 많은 주파수 성분을 가진 음성의 주파수 분석을 이용하는 음성인식에 대단히 유효하다는 것을 확인하였다.

  • PDF

음성 정보 분석값을 통한 장년기 남성의 사상체질 분류 (Sasang Constitution Classification of a Middle-Aged Man Using Speech Signal Analysis)

  • 김봉현;이세환;박선애;가민경;조동욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.117-120
    • /
    • 2007
  • 개인의 체질에 맞춰 의학적 행위를 시행하는 사상의학은 우리나라 고유의 전통의학으로 가치를 인정받고 있다. 이러한 사상의학에서 가장 중요한 것은 사상체질의 정확한 분류이다. 본 논문에서는 기존의 사상체질 분류 방법인 용모사기, 체형기상, QSCCII, 체질침 등이 임상의들의 직관에 의해 행해지고 있다는 문제점을 해결하기 위해 사상체질 분류의 정량화 및 객관화를 위한 연구를 수행하였다. 이를 위해 본 논문에서는 음성 신호 분석에서 발생하는 정보의 출력값에 의해 사상 체질을 분류하는 방법을 제안하였다. 이를 위해 40대 이상의 장년기 남성을 대상으로 사상체질 전문의의 진단표에서 뚜렷한 특징을 보유하고 있는 집단군을 구성하고 이들의 음성 특성을 분류하여 음성학적 요소를 추출하고자 한다. 또한 출력된 결과값을 토대로 체질 집단별 차이점과 유사성을 분류하여 사상 체질 분류를 행하였다.

  • PDF

근접센서를 이용한 수중 표적 정보 추정기법 (Underwater Target Information Estimation using Proximity Sensor)

  • 김정훈;윤경식;서익수;이균경
    • 전자공학회논문지
    • /
    • 제52권5호
    • /
    • pp.174-180
    • /
    • 2015
  • 본 논문은 근접센서를 이용하여 수중 표적의 정보를 추정하는 수동소나 신호처리 기법을 제안한다. 이 기법은 수중 센서망을 구성하는 단일 센서에서 수행되며 계층적 신호처리 구조를 가진다. 이를 통해 추정되는 표적 정보는 표적의 속도, 깊이, CPA 상황에서의 거리와 방위각이며 계층적 신호처리 구조를 가짐으로써 신호처리 기법의 정확도를 향상시킬 수 있다. 제안하는 기법의 성능을 검증하기 위해 모의실험을 수행하였고 이를 통해 최대 탐지거리 내에서 최대 20%의 오차를 가짐을 확인하였다. 또한 해상실험을 통해 실제 해상환경에서 신뢰성을 가지는지 확인하였다.

다중비 신호처리에 적용한 선형 주기적 시변 시스템의 입출력 이득 (Input-Output Gains of Linear Periodic Time-Varying Systems with Applications to Multirate Signal Processing)

  • 이상철;박계원
    • 한국정보통신학회논문지
    • /
    • 제4권5호
    • /
    • pp.963-969
    • /
    • 2000
  • 본 논문에서는, 선형 주기적 시변 시스템에 대해서, 두 개의 입출력 이득을 정의한다. 그 하나는 단위 크기의 ι$_2$노름을 갖는 모든 입력에 대한 최악의 $\iota_2$ 노름의 출력의 비로서, G($\iota_2,\iota_2$ 로 표기한다. 또 다른 하나는 단위 크기의 RMS 값을 갖는 모든 입력에 대한 최악의 RMS 값의 출력의 비로서, G(RMS, RMS)로 표기한다. 선형 시불변 시스템에 대해서는 이 두 개의 이득은 등가라는 사실이 잘 알려져 있다. 본 논문에서는 선형 주기적 시변 시스템에 대해서도 이 두 개의 이득이 등가라는 것을 증명한다. 또한, 선형 주기적 시변 시스템에 대한 주파수 응답을 얻는 두 가지 방법 사이의 관계를 유도한다. 이렇게 정의된 입출력 이득은 M-채널 필터 뱅크에 적용한다. 필터 뱅크는 음성 압축 등에 사용되는 대표적인 다중비 신호처리 시스템이다. 이러한 필터뱅크에는 일반적으로 에일리어징 왜곡, 진폭 왜곡 및 위상 왜곡이 존재한다. 본 논문에서는 오차 시스템의 G($\iota_2,\iota_2$ 이득을 최적화 하는 방법에 의해 필터 뱅크를 설계함으로써, 필터 뱅크에서 일반적으로 존재하는 왜곡을 작게할 수 있음을 보인다.

  • PDF

M-채널 서브밴드 QMF 필터뱅크를 이용한 웨이브릿변환기반 적응 음향반향제거기 (An Adaptive AEC Based on the Wavelet Transform Using M-channel Subband QMF Filter Banks)

  • 안주원;권기룡;문광석;김문수
    • 한국멀티미디어학회논문지
    • /
    • 제3권4호
    • /
    • pp.347-355
    • /
    • 2000
  • 본 논문에서는 M-채널 서브밴드 QMF 필터 뱅크를 이용한 웨이브릿 변환기반 적응 음향반향제거기를 제안한다. 제안한 적응 음향반향제거기는 웨이브릿변환 필터뱅크의 적은 계산량, 서브밴드 처리 및 웨이브릿 서브밴드 필터의 직교성에 의해 정상상태 성능을 향상시키고, 실시간 처리가 가능하도록 구현한다. 각 서브밴드에서 적응필터의 계수적응을 위한 알고리듬으로는 실시간 반향제거와 하드웨어 구현시 비용감소를 위하여 계산량이 적고 구현이 간단한 LMS 적응 알고리듬을 사용한다. 제안한 적응 음향반향제거기의 성능평가를 위한 실험으로서 백색 가우시안 잡음 및 주변잡음을 포함한 실제의 음성신호를 입력신호로 반향제거 기에 인가하여 반향성능을 평가하였다. 실험 결과로서 제안한 음향반향제거기는 웨이브릿 완전복원 필터뱅크에 의해 수렴후 점근적 에러가 적고, 적은 계산량을 요구하며 안정한 수렴성능을 나타내었다.

  • PDF