• 제목/요약/키워드: speech signal processing

검색결과 333건 처리시간 0.028초

Robust Speech Hash Function

  • Chen, Ning;Wan, Wanggen
    • ETRI Journal
    • /
    • 제32권2호
    • /
    • pp.345-347
    • /
    • 2010
  • In this letter, we present a new speech hash function based on the non-negative matrix factorization (NMF) of linear prediction coefficients (LPCs). First, linear prediction analysis is applied to the speech to obtain its LPCs, which represent the frequency shaping attributes of the vocal tract. Then, the NMF is performed on the LPCs to capture the speech's local feature, which is then used for hash vector generation. Experimental results demonstrate the effectiveness of the proposed hash function in terms of discrimination and robustness against various types of content preserving signal processing manipulations.

정서정보의 변화에 따른 음성신호의 특성분석에 관한 연구 (Analysis of Speech Signals According to the Various Emotional Contents)

  • 조철우;조은경;민경환
    • 한국음향학회지
    • /
    • 제16권3호
    • /
    • pp.33-37
    • /
    • 1997
  • 본 논문은 정서정보를 포함하여 수집된 음성자료를 여러 가지 신호처리 방법으로 분석한 결과에 대하여 기술하고 있다. 정서정보를 포함한 음성은 연극배우로부터 수집하였으며 분석은 주로 피치정보의 변화와 지속시간을 중심으로 행하였다. 수집된 음성에 대한 분석결과 정서정보의 변화에 따른 음성 파라미터의 변화치를 얻을 수 있었으며 이 실험은 앞으로의 정서음성정보의 분석에 필요한 기초적 실험으로 의의가 있다.

  • PDF

효율적인 잡음억제를 위한 Soft Decision 기반의 음성향상 기법 (Speech Enhancement Based on Soft Decision for Effective Noise Suppression)

  • 임형근;김유신;정재호
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.47-50
    • /
    • 2000
  • 비상관적인 가산잡음에 오염된 음성으로부터 향상된 음성을 얻기 위한 방법 중 Soft Decision에 근거한 음성 향상 기법이 뛰어난 성능을 가진다고 알려져 있다. Soft Decision은 주파수 영역에서 음성에 가산된 잡음을 처리하며, 잡음 환경에 대한 사전정보에 의존적이다. 본 연구에서는 Soft Decision을 근거로 음성에 가산된 잡음신호를 비선형 처리를 하여 효과적으로 음성에 포함된 잡음을 추정하도록 하였으며, 잡음환경에 대한 사전 정보 없이 효율적으로 잡음을 억제하는 방법을 제안한다. 본 연구에서 제안한 음성향상 기법은 주관적인 음질평가에서 기존의 방법들보다 나은 성능을 나타내었다

  • PDF

IMT2000을 위한 하중 hadamard 변환의 다차원 reverse jacket 매트릭스의 서브샘플링 (The multidimensional subsampling of reverse jacket matrix of wighted hadamard transform for IMT2000)

  • 박주용;이문호
    • 한국통신학회논문지
    • /
    • 제22권11호
    • /
    • pp.2512-2520
    • /
    • 1997
  • The classes of Reverse Jacket matrix [RJ]$_{N}$ and the corresponding Restclass Reverse Jacket matrix ([RRJ]$_{N}$) are defined;the main property of [RJ]$_{N}$ is that the inverse matrices of them can be obtained very easily and have a special structure. [RJ]$_{N}$ is derived from the weighted hadamard Transform corresponding to hadamard matrix [H]$_{N}$ and a basic symmertric matrix D. the classes of [RJ]$_{2}$ can be used as a generalize Quincunx subsampling matrix and serveral polygonal subsampling matrices. In this paper, we will present in particular the systematical block-wise extending-method for {RJ]$_{N}$. We have deduced a new orthorgonal matrix $M_{1}$.mem.[RRJ]$_{N}$ from a nonorthogonal matrix $M_{O}$.mem.[RJ]$_{N}$. These matrices can be used to develop efficient algorithms in IMT2000 signal processing, multidimensional subsampling, spectrum analyzers, and signal screamblers, as well as in speech and image signal processing.gnal processing.g.

  • PDF

적응필터를 이용한 음성신호처리 (Speech Signal Processing using Adaptative Filter)

  • 김수용;지석근;박동진
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 춘계종합학술대회
    • /
    • pp.743-749
    • /
    • 2007
  • 오늘날, 우리는 어디엔가 엔제나 무전기 통신 장치를 사용할 수 있다. 때때로, 우리는 음향잡음환경에서 장치를 사용하였다. 그 음향잡음은 통신장치에서 많은 문제를 만들었다. 음향잡음환경에서는, 말은 음성신호와 잡음신호 양쪽에 신호를 포함하고, 받았기 때문에 깨끗한 정보를 받기위해 보낼 수가 없었다. 디지털필터는 바라는 신호를 얻기 위해 옳기는 잡음으로서 유용하였다. 방법의 하나는 자동적으로 맞추는 필터 파라미터로서 적응 잡음 망상조직으로 적응디지털필터를 사용하는 것이다. 본 논문은 두 적응필터 방법에 의하여 현실에서 음향잡음으로서 명료도 알고리즘의 번지라고 할 수가 있다. 하나는 두 입력 채널과 함께 적응잡음 망상조직이라 할 수 있고, 또 다른 것은 하나 입력 채널과 함께 스펙트럼 빼기 필터이다. 이 실험의 결과는 제안된 필터로부터 스펙트럼 진폭필터는 움직이지 않는 잡음은 효력이 있는 동안 움직이는 것을 줄이기 위해 사용되어지는 것은 적응잡음망상조직으로 보여준다.

  • PDF

포르만트 주파수를 이용한 한국어 음성의 자동인식에 관한 연구

  • 김순협;박규태
    • 한국통신학회:학술대회논문집
    • /
    • 한국통신학회 1983년도 춘계학술발표회논문집
    • /
    • pp.16-17
    • /
    • 1983
  • In Speech signal processing, ARMA spectral estimation method is used. It has been demonstrated that the ARMA model provides better spectral estimation then the more specialized AR model and MA model. Dynamic program is used to achieve time algnment. Speech sound similarity is defined to be proportional to the distance seperating to sound in a vector space defined by ARMA model. AS a result, the recognition rate of 97.3% for three speaker is obtained.

  • PDF

확산망을 이용한 음성인식 (The Speech Recognition Using the Diffusion Network)

  • 허만택
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1996년도 영남지부 학술발표회 논문집 Acoustic Society of Korean Youngnam Chapter Symposium Proceedings
    • /
    • pp.70-75
    • /
    • 1996
  • In this paper, the pre-precessing method for the recognition of single vowels by use of spectrum envelope is presented , we use new method of an extrating spectrum envelope using the diffusion filter bank. We reduced the total processing time, and got higher enhancement of discrimination . By getting 88.3% of average recognition rate for single vowels of real voice through computer simulation, we confirmed it to be useful for speech recongition which use spectrum analysis for voice signal to have many frequency components.

  • PDF

원 파형과 임의 반복시킨 파형의 비교에 의한 유성음의 피치검출 (The Pitch Extraction of Voiced Speech by the Comparison Between the Original and the Repeated Segmental Waveform.)

  • 배명진;안수길
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1988년도 전기.전자공학 학술대회 논문집
    • /
    • pp.39-42
    • /
    • 1988
  • In speech signal processing, it is necessary to estimate exactly the pitch. We propose a new algorithm which uses the correlation coefficient between the original and the repeated segmental waveform in the frame as a parameter in the pitch extraction. The correlation coefficient in the frame reflects the periodic component and the transient ratio of the waveform.

  • PDF

고속 웨이브렛 변환 적응알고리즘을 이용한 적응잡음제거기에 관한 연구 (Adaptive Noise Canceler Using Fast Wavelet Transform Adaptive Algorithm)

  • 이채욱;박세기;오신범;강명수
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 하계종합학술대회 논문집(4)
    • /
    • pp.179-182
    • /
    • 2002
  • In this paper, we propose a wavelet based adaptive algorithm which improves the convergence speed and reduces computational complexity using the fast running FIR filtering efficiently We compared the performance of the proposed algorithm with time and frequence domain adaptive algorithm using computer simulation of adaptive noise canceler based on synthesis speech. As the result, the proposed algorithm is suitable for adaptive signal processing area using speech or acoustic field.

  • PDF

변형된 AMDF를 이용한 피치 주기 검출 알고리즘 (Pitch Period Detection Algorithm Using Modified AMDF)

  • 서현수;배상범;김남호
    • 한국정보통신학회논문지
    • /
    • 제10권1호
    • /
    • pp.23-28
    • /
    • 2006
  • 피치 주기는 음성 인식, 화자 식별, 음성 분석 및 합성 등과 같은 음성 신호 처리 분야에 있어서 중요한 요소이며, 이러한 피치 주기 검출에 관련된 다양한 알고리즘이 지금까지 연구되고 있다. 피치 검출에 사용되는 알고리즘의 하나인 AMDF(average magnitude difference function)는 각 계곡점의 거리를 피치 주기로 계산한다. 이때, 피치 주기 검출을 위한 계곡점 선정에 있어서 알고리즘이 복잡해지는 문제점이 발생한다. 따라서 본 논문에서는 AMDF의 회전변환을 이용하여 전체 최소 계곡점을 음성 신호의 피치 주기로 검출하는 간단한 알고리즘을 제안하였으며, 시뮬레이션을 통해 기존의 방법들과 비교하였다.