• 제목/요약/키워드: Vocoder

검색결과 151건 처리시간 0.022초

ON A REDUCTION OF PITCH SEARCHING TIME BY PREPROCESSING IN THE CELP VOCODER

  • Kim, Daesik;Bae, Myungjin;Kim, Jongjae;Byun, Kyungjin;Han, Kichun;Yoo, Hahyoung
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 FIFTH WESTERN PACIFIC REGIONAL ACOUSTICS CONFERENCE SEOUL KOREA
    • /
    • pp.904-911
    • /
    • 1994
  • Code Excited Linear Prediction (CELP) speech coders exhibit good performance at data rates below 4.8 kbps. The major drawback to CELP type coders is their many computation. In this paper, we propose a new pitch search method that preserves the quality of the CELP vocoder with reducing complexity. The basic idea is to apply the preprocessing technique beforehand grasping the autocorrelation property of speech waveform. By using the proposed method, we can get approximately 77% complexity reduction in the pitch search.

  • PDF

성분분리에 의한 CELP 보코더의 피치 검색시간 단축에 관한 연구 (On a Reduction of Pitch Searching Time by Separating the Speech Components in the CELP Vocoder)

  • 현진일;변경진;한기천;김종재;유하영;김재석;김대식;배명진
    • The Journal of the Acoustical Society of Korea
    • /
    • 제14권1E호
    • /
    • pp.22-29
    • /
    • 1995
  • 부호여기된 선형예측(CELP) 음성부호화기는 4.8 kbps 이하의 낮은 전송 비율에서도 좋은 성능을 갖는다. CELP형 부호기의 단점은 많은 계산량을 필요로 한다는 것이다. 본 논문에서, 우리는 복잡성을 줄이면서 CELP 보코더의 음질을 유지하는 새로운 피치 검색법을 제안하였다. 그 기본 개념을 피치를 검색하고자하는 신호에 대해 음소 성분 분리를 통해 예비피치주기를 사전에 파악하고 이를 예비피치에 대해서만 본격적인 피치 검색을 수행하는 것이다. 제안한 방법을 CELP 보코더에 적용하므로써, 피침검색에서 기존의 방법에 대해 약 90%의 복잡성이 감소되었다.

  • PDF

음성/음악 분류 향상을 위한 2차 조건 사후 최대 확률기법 기반 SVM (Improving SVM with Second-Order Conditional MAP for Speech/Music Classification)

  • 임정수;장준혁
    • 대한전자공학회논문지SP
    • /
    • 제48권5호
    • /
    • pp.102-108
    • /
    • 2011
  • Support vector machine (SVM)은 패턴인식 분야에 많이 사용되어지고 있고 그 한 예로서 3GPP2 selectable mode vocoder(SMV)와 같은 규격화된 코덱에 쓰여 코덱의 음성/음악 분류 성능을 향상시킬 수 있다. 본 논문에서는 SVM을 개선시켜 음성/음악의 분류성능을 더욱 향상시키는 새로운 방법을 제안한다. 음성/음악신호의 각 프레임들은 서로 강한 상관관계를 가지고 있는데, 이를 바탕으로 2차 조건 사후 최대 확률기법을 SVM에 적용하여 음성/음악 분류성능을 향상시킨다. 또한 SVM을 학습시킬 때 적용되는 기존의 기법들과는 달리 제안되는 기법은 SVM이 패턴분류를 행할 때 사용된다. 그렇기 때문에 기존의 기법들과 독립적으로 개발되고 사용될 수 있고, 따라서 패턴분류의 성능을 한층 더 향상시킬 수 있다. 실험을 통해 제안된 기법의 독립성과 성능향상을 기존의 기법들과 비교하여 증명하였다.

SVM의 미세조정을 통한 음성/음악 분류 성능향상 (Fine-tuning SVM for Enhancing Speech/Music Classification)

  • 임정수;송지현;장준혁
    • 대한전자공학회논문지SP
    • /
    • 제48권2호
    • /
    • pp.141-148
    • /
    • 2011
  • Support vector machine (SVM)은 패턴인식 분야에 많이 사용되어지고 있다. 한 예로서 3GPP2 selectable mode vocoder (SMV)와 같은 규격화된 코덱에 쓰여 코덱의 음성/음악 분류 성능을 향상시킬 수 있다. 본 논문에서는 SVM을 개선시켜 음성/음악의 분류성능을 향상시키는 새로운 방법을 제안한다. SVM을 학습시킬 때 적용되는 기존의 기법들과는 달리 제안되는 기법은 SVM이 패턴분류를 행할 때 사용된다. 그렇기 때문에 기존의 기법들과 독립적으로 개발되고 사용될 수 있고, 따라서 패턴분류의 성능을 한층 더 향상시킬 수 있다. 이를 위해 먼저 radial basis function의 커널 width 파라미터가 SVM의 패턴분류에 미치는 영향을 분석해 보았다. 분석한 결과, 커널 width 파라미터를 가지고 SVM의 패턴분류 성향을 미세 조정할 수 있다는 것을 알았다. 또한 음성신호의 각 프레임 간의 상관관계 (correlation)을 확인하고 이를 커널 width 파라미터조절의 길잡이로 삼았다. 실험을 통해, 제안된 기법이 SVM의 성능을 향상시킬 수 있음을 증명하였다.

보코더에서 서브프레임 수의 변화를 이용한 피치검색 성능 개선에 관한 연구 (A Study on Improving Pitch Search by Varying the number of Subframes for Vocoder)

  • 백금란;배명진
    • 전자공학회논문지
    • /
    • 제49권10호
    • /
    • pp.83-88
    • /
    • 2012
  • 보코더에서의 피치 검색 과정은 매우 중요하다. 일반적으로 먼저 신호의 주기성을 강조한 후 피치를 검색하는 방법을 주로 사용한다. 프레임 내에서 두 개의 펄스 간격을 변화시켜 가며 신호와의 상관관계를 구하는 것으로 상관관계 값이 가장 높을때가 주기가 가장 두드러지는 반복 구간이므로 이때 의 펄스 간격을 피치 주기로 찾는다. 그러나 프레임 내에서의 신호의 진폭이 일정하지 않고 갑자기 변하는 구간이 있는 경우 정확하지 않는 피치가 얻어진다. 이를 해결하기 위해 프레임을 여러 개의 서브프레임으로 다시 나누어 피치를 검색하는 방법을 사용하고 있는데 이 방법은 피치를 정확하게 검색할 수 있지만 계산량이 많아진다. 본 논문에서는 프레임의 에너지 비율로 프레임 내의 진폭 변화율을 예측하여 서브프레임 수를 가변시키는 방법을 제안한다. 이 방법들을 적용하면 합성 음질에는 영향을 주지 않는 상태에서 피치검색 시간을 단축할 수 있고, 피치 검색의 정확도를 높일 수 있어 전반적인 피치 검색에 관한 성능 개선이 된다.

화자 의존 환경의 AMR 7.4Kbit/s모드에 기반한 보코더 (A New Vocoder based on AMR 7.4Kbit/s Mode for Speaker Dependent System)

  • 민병제;박동철
    • 한국통신학회논문지
    • /
    • 제33권9C호
    • /
    • pp.691-696
    • /
    • 2008
  • 본 논문은 AMR(Adaptive Multi Rate)코더의 7.4kit/s 모드를 기반으로 화자 의존적인 환경에서 더욱 압축률을 높인 새로운 켈프(CELP)계열의 코더를 제안한다. 제안된 코더는 OGM(OutGoing Message)이나 TTS(Text-To-Speech) 등 한 사람의 음성만을 필요로 하는 시스템에서 유용하게 사용할 수 있다. 새로운 코더의 압축률을 높이기 위해서 무감독 학습 신경망인 Centroid Neural Networks(CNN)를 이용한 새로운 LSP 코드북을 생성하여 사용한다. 또한 고정 코드북 탐색 단계에서 AMR 7.4 kbit/s 모드에서는 4개의 펄스를 서브프레임 마다 사용하는 대신에 새로운 코더에서는 오직 2개의 펄스만을 사용하기 때문에 압축률을 더 높일 수 있다. 이로 인해서 스피치의 질이 감소하게 되는데, 각 서브프레임 마다 예상하는 펄스를 적용함으로써 보상받을 수 있다. 제안된 보코더는 기존 AMR 7.4Kbps모드와 비교해 27% 높은 압축률을 가지는 동시에, MOS( Mean Opinion Score)의 면에서 볼 때, 대등한 음질을 보였다.

SMV코덱의 음성/음악 분류 성능 향상을 위한 Support Vector Machine의 적용 (Analysis and Implementation of Speech/Music Classification for 3GPP2 SMV Codec Based on Support Vector Machine)

  • 김상균;장준혁
    • 대한전자공학회논문지SP
    • /
    • 제45권6호
    • /
    • pp.142-147
    • /
    • 2008
  • 본 논문에서는 support vector machine (SVM)을 이용하여 기존의 3GPP2 selectable mode vocoder (SMV)코덱의 음성/음악 분류 성능을 향상시키는 방법을 제시한다. SVM은 통계적 학습 이론으로 훈련 데이터 사이의 최적 분류 초평면을 찾아내 최적화된 이진 분류를 보여준다. SMV의 음성/음악 실시간 분류 알고리즘에서 사용된 특징벡터와 분류방법을 분석하고, 이를 기반으로 분류성능향상을 위해 통계적 학습 이론인 SVM을 도입한다. 구체적으로, SMV의 음성/음악 분류알고리즘에서 사용되어진 특징벡터만을 선택적으로 사용하여 효과적으로 SVM을 구성한 분류기법을 제시한다. SMV의 음성/음악 분류에 적용한 SVM의 성능 평가를 위해 SMV 원래의 분류알고리즘과 비교하였으며, 다양한 음악장르에 대해 시스템의 성능을 평가한 결과 SVM을 이용하였을 때 기존의 SMV의 방법보다 우수한 음성/음악 분류 성능을 보였다.

해상도 조절과 검색순서 조절을 통한 음성부호화기용 복잡도 감소 알고리즘 (The Reduction Algorithm of Complexity using Adjustment of Resolution and Search Sequence for Vocoder)

  • 민소연;이광형;배명진
    • 한국산학기술학회논문지
    • /
    • 제8권5호
    • /
    • pp.1122-1127
    • /
    • 2007
  • 일정한 스펙트럼 민감도와 낮은 스펙트럼 왜곡을 보이고 선형 보간이 용이하다는 장점을 갖는 LSP 파라미터는 음성코덱(codec)이나 인식기에서 음성신호를 분석하여 전송형이나 저장형 파라미터로 변환되어, 주로 저전송률 음성부호화기에 사용된다. 그러나 LPC 계수를 LSP로 변환하는 방법이 복잡하여 계산시간이 많이 소요된다는 단점이 있다. 기존의 LSP 변환 방법 중 음성 부호화기에서 주로 사용하는 real root 방법은 근을 구하기 위해 주파수 영역을 순차적으로 검색하기 때문에 계산시간이 많이 소요되는 단점을 갖는다. 본 논문에서 제안하는 알고리즘은 LSP분포 특성에 따라 검색구간의 순서와 검색간격을 달리하며, 제1 포만트와 제2 포만트의 연관성을 고려하여 검색구간을 조절한다. 기존의 real root 방법과 제안한 방법을 비교한 결과 검색시간이 평균 48.13% 단축되었다.

  • PDF

3GPP2 SMV의 실시간 음성/음악 분류 성능 향상을 위한 Gaussian Mixture Model의 적용 (Analysis and Implementation of Speech/Music Classification for 3GPP2 SMV Based on GMM)

  • 송지현;이계환;장준혁
    • 한국음향학회지
    • /
    • 제26권8호
    • /
    • pp.390-396
    • /
    • 2007
  • 본 논문에서는 음성 인식과 음악 인식에서 뛰어난 성능을 보이는 Expectation-Maximization(EM) 알고리즘 기반의 패턴인식기법인 가우시안 혼합모델(Gaussian Mixture Model, GMM)을 이용하여 기존의 3GPP2 Selectable Mode Vocoder(SMV)의 실시간 음성/음악 분류 성능을 향상 시키는 방법을 제안한다 SMV의 음성/음악 실시간 분류 알고리즘에서 사용된 특징벡터와 분류방법을 분석하고, 이를 기반으로 분류성능향상을 위해 패턴인식 알고리즘인 GMM을 도입한다. 구체적으로, SMV의 음성/음악 분류알고리즘에서 사용되어진 특징벡터만을 선택적으로 사용하여 효과적인 GMM을 구성한 실시간 분류기법이 제시되었다. SMV의 음성/음악 분류에 적용한 GMM의 성능 평가를 위해 SMV 원래의 분류알고리즘과 비교하였으며, 다양한 음악장르에 대해 시스템의 성능을 평가한 결과 GMM을 이용하였을 때 기존의 SMV의 방법보다 우수한 음성/음악 분류 성능을 보였다.

변별적 가중치 학습을 이용한 3GPP2 SVM의 실시간 음성/음악 분류 성능 향상 (Enhancement of Speech/Music Classification for 3GPP2 SMV Codec Employing Discriminative Weight Training)

  • 강상익;장준혁;이성로
    • 한국음향학회지
    • /
    • 제27권6호
    • /
    • pp.319-324
    • /
    • 2008
  • 본 논문에서는 변별적 가중치 학습 (discriminative weight training) 기반의 3GPP2 Selectable Mode Vocoder (SMV) 실시간 음성/음악 분류 성능을 향상 시키는 방법을 제안한다. SMV의 음성/음악 실시간 분류 알고리즘에서 사용된 특징벡터와 분류방법을 분석하고, 이를 기반으로 분류성능향상을 위해 MCE (minimum classification error)방법을 도입하여, 각 특징 백터별로 다른 가중치를 적용하는 음성/음악 결정법 (decision rule)을 제시한다. 구체적으로 SMV의 음성/음악 분류알고리즘에서 사용되어진 특징벡터만을 선택적으로 사용하여 가중치를 적용한 값을 기하 평균한 값을 문턱값과 비교하는 실시간 분류기법이 제시되었다. SMV의 음성/음악 분류에 제안한 방법의 성능 평가를 위해 SMV 원래의 분류알고리즘과 비교하였으며, 다양한 음악장르에 대해 시스템의 성능을 평가한 결과 가중치를 적용하였을 때 기존의 SMV의 방법보다 우수한 음성/음악 분류 성능을 보였다.