• 제목/요약/키워드: 음성 부호기

검색결과 76건 처리시간 0.025초

TeakLite DSP를 이용한 적응형 다중 비트율 광대역 (AMR-WB) 음성부호화기의 실시간 구현 (Real-time Implementation of AMR-WB Speech Codec Using TeakLite DSP)

  • 정희범;김경수;한민수;변경진
    • 한국음향학회지
    • /
    • 제23권3호
    • /
    • pp.262-267
    • /
    • 2004
  • 적응형 다중 비트율 광대역 (AMR-WB) 음성부호화기는 50∼7000 Hz의 오디오 신호를 압축/복원하는 3GPP의 가장 최근의 음성 부호화 표준으로써 23.85 kbit/s에서 6.60 kbit/s까지 9가지의 다중 비트율을 가지고 있다. 본 논문에서는 16비트 고정 소수점형 TeakLite DSP를 이용하여 AMR WB 음성부호화기를 실시간 구현한 결과에 대해 기술하였다. 구현된 AMR-WB 보코더는 가장 높은 비트율인 23.85 kbit/s모드에서 52.2 MIPS의 복잡도를 가지고 있으며, 사용된 프로그램 메모리는 약 17.9 kwords 이고, 데이터 RAM 메모리는 11.8 kwords, 데이터 ROM 메모리는 약 10.1 kwords 이다. 구현된 AMR-WB 프로그램은 3GPP의 표준시험 벡터 23개를 9개 모드에 대해 비트 단위로 일치시켜 검증을 완료하고, 실시간 보드 시험에서도 오디오 신호의 입출력이 왜곡되지 않고 실시간 지연없이 안정적으로 동작하는 것을 확인하였다.

음성응답과 기록을 통한 가정 방문객 관리 시스템의 구현 -쌍 1차 차분을 통한 음성 파형부호화용 예측기- (On Realizing the Voice Response and Recoding System for a Home Visitor - A Predictor for the waveform Coding of Speech Signals by using the Dual First-Order Difference Values-)

  • 배명진;이미숙;임운천
    • 한국음향학회지
    • /
    • 제11권1호
    • /
    • pp.60-66
    • /
    • 1992
  • 음성표본간의 자기상관관계를 살펴보면 인접한 양쪽 표본의 자기상관관계가 시간지연된 여러 차수의 것보다는 크게 나타난다. 그러므로 현재표본을 기준으로 몇 차 지연된 과거값을 이용하여 현재값을 에측하는 것보다는 바로 인접한 과거 및 미래의 표본에 의해 현재의 표본값을 예측하는 것이 더 효과적이다. 따라서 본 논문에서는 한 표본 미래값과 한 표본 과거값을 취하여 현재의 표본을 예측하는 파형부호화용 예측기를 새로이 제안하였다. 제안된 예측기는 CCITT-표준 ADPCM보다 예측이득이 최고 9dB까지 높게 얻어졌다.

  • PDF

평탄화된 여기 스펙트럼에서 켑스트럼 피치 변경법에 관한 연구 (On a Pitch Alteration Technique by Cepstrum Analysis of Flatten Excitation Spectrum)

  • 조왕래;함명규;배명진
    • 한국음향학회지
    • /
    • 제17권8호
    • /
    • pp.82-87
    • /
    • 1998
  • 음성합성은 합성방식에 따라 파형부호화법, 신호원부호화법, 혼성부호화법으로 분류 할 수 있다. 특히 고음질 합성을 위해서는 파형부호화를 이용한 합성방식이 적합하다. 그렇 지만, 파형부호화를 이용한 합성법은 여기 성분과 여파기 성분을 분리하지 않고 처리하기 때문에 음절단위나 음소단위의 합성기법으로는 바람직하지 못하다. 따라서 파형부호화법을 규칙에 의한 합성에 적용되도록 음원피치를 변경시키기 위한 피치 변경법이 필요하게 된다. 본 논문에서는 스펙트럼 왜곡을 최소화하기 위해 켑스트럼의 성질을 이용하여 피치를 변경 하는 방법에 대하여 제안하였다. 이 방법은 주파수영역상에서 여기 스펙트럼과 여파기 스펙 트럼을 분리하여 여기 스펙트럼을 여기 켑스트럼으로 변환한 후 영값 삽입이나 삭제에 의해 피치를 변경하고 스펙트럼영역에서 피치 변경된 스펙트럼을 재구성하는 기법을 적용하였다. 제안한 방법의 성능을 평가하기 위해 스펙트럼 왜곡율을 측정하여 본 결과 평균 스펙트럼 왜곡율은 평균 2.29%이하로 유지되었으며 주관적인 음질도 평균 3.74로 우수하였다.

  • PDF

효율적인 비디오 브라우징 및 검색을 위한 통합 멀티미디어 응용 형식 (Integrated Multimedia Application Format for Active Video Browsing and Retrieval)

  • 조준호;진성호;양승지;노용만
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.155-158
    • /
    • 2005
  • 본 논문에서는 MPEG 의 멀티미디어 응용 표준인 MAF(Multimedia Application Format)를 기반으로, 효율적인 비디오 콘텐츠의 검색 및 활용을 위한 통합 미디어 구조, 즉 비디오 MAF 를 제안한다. 제안하는 비디오 MAF 는 ISO 미디어 포맷을 기반으로 하고 단일의 비주얼 스트림과 다중 음성을 지원하기 위한 다수의 오디오 스트림, 내용기반의 정보를 포함하는 메타데이터, 그리고 비디오 콘텐츠의 대표 이미지를 동시에 포함하는 구조이다. 제안하는 파일포맷의 유용성을 검증하기 위해 비디오 MAF 로 생성 및 해석할 수 있는 부호기(encoder)와 복호기(decoder)를 설계하고 구현하여, 통합 미디어에 내재된 메타데이터를 이용한 효율적인 검색과 멀티트랙의 오디오 스트림을 활용한 다중 음성에 대한 지원이 가능함을 확인하였다. 또한 내재된 대표이미지는 비디오 콘텐츠에 대한 브라우징이 효과적으로 활용됨을 확인하였다.

  • PDF

3개의 직렬 MAP 복호기를 이용한 반복 터보 복호화기 (Iterative Turbo Decoding Using Three Cascade MAP Decoder)

  • 김동원;이호웅;강철호
    • 한국통신학회논문지
    • /
    • 제26권6B호
    • /
    • pp.709-716
    • /
    • 2001
  • 반복 복호 알고리듬에 의해 복호화된 터보 코드는 가산성 백색 가우시안 잡음(AWGN) 채널 환경에서 이론적으로 Shannon의 한계에 근접한 뛰어난 코딩 이득을 나타내는 것으로 보여지고 있다. 그러나, 터보 코드의 성능은 터보 부호화기에서 프레임의 크기 즉, 인터리버의 크기에 의존한다. IMT-2000과 같은 이동 통신 채널 환경에서 음성을 전송하는 경우에는 터보 코드의 프레임 크기는 매우 작다. 그리고, 그것은 터보 코드의 성능을 떨어뜨리는 직접적인 원인이 된다. 본 논문에서는 차세대 이동 통신 시스템에서 프레임 크기가 작은 음성 프레임을 이용하여 터보 코드의 성능을 검증하며, 작은 프레임 크기에 알맞은 3개의 직렬 MAP(Maximum A Posteriori probability) 복호기를 이용한 반복 복호의 터보 코드를 제안하고 부호율 1/3, 구속장의 길이 3 또는 4, 프레임 크기 24, 192 비트에 대하여 컴퓨터 모의실험을 통해 터보 코드의 성능을 분석한다.

  • PDF

VSELP 부호화기의 음질 및 주기탐색 개선에 관한 연구 (A Study on Improving Voice Quality and Pitch Searching of the VSELP Coder)

  • 성기철;문상재
    • 한국통신학회논문지
    • /
    • 제19권4호
    • /
    • pp.740-749
    • /
    • 1994
  • 본 논문에서는 기존의 PSELP음성 부호화기의 성능을 개선하는 방법들을 제안하였다. 혼합 방법에 의한 주기추출법을 제안하여 기존의 PSELP음성 부호화기의 피치 주기 탐색시간을 줄였으며, 장기 필터(long term filter)의 출력 여기신호에서의 양자화 오차로 인해 발생할 수 있는 주기추출 오류를 개선시켰다. 또한 주기성을 향상기키고 잡음을 줄이기위해 본 논문에서 제안한 주기성 향상 필터를 복호기의 여기신호에 적용하여으며, 합성된 음성신호에서 음의 명료도를 높이기 위해 적응 일차 필터를 적용하였다. 작시한 방식과 필터를 적용한 결과 주기탐색시간이 기존에 대해 26%로 줄었으며, 최종합성음의 MOS(mean opinion score) 측정기에서 기존함성음은 3.19를 나타낸데 비해 개선된 합성읍의 4.04를 나타내었다.

  • PDF

해상도 조절과 검색순서 조절을 통한 음성부호화기용 복잡도 감소 알고리즘 (The Reduction Algorithm of Complexity using Adjustment of Resolution and Search Sequence for Vocoder)

  • 민소연;이광형;배명진
    • 한국산학기술학회논문지
    • /
    • 제8권5호
    • /
    • pp.1122-1127
    • /
    • 2007
  • 일정한 스펙트럼 민감도와 낮은 스펙트럼 왜곡을 보이고 선형 보간이 용이하다는 장점을 갖는 LSP 파라미터는 음성코덱(codec)이나 인식기에서 음성신호를 분석하여 전송형이나 저장형 파라미터로 변환되어, 주로 저전송률 음성부호화기에 사용된다. 그러나 LPC 계수를 LSP로 변환하는 방법이 복잡하여 계산시간이 많이 소요된다는 단점이 있다. 기존의 LSP 변환 방법 중 음성 부호화기에서 주로 사용하는 real root 방법은 근을 구하기 위해 주파수 영역을 순차적으로 검색하기 때문에 계산시간이 많이 소요되는 단점을 갖는다. 본 논문에서 제안하는 알고리즘은 LSP분포 특성에 따라 검색구간의 순서와 검색간격을 달리하며, 제1 포만트와 제2 포만트의 연관성을 고려하여 검색구간을 조절한다. 기존의 real root 방법과 제안한 방법을 비교한 결과 검색시간이 평균 48.13% 단축되었다.

  • PDF

CELP 보코더에서 전처리에 의한 피치검색 시간의 단축 (On A Reduction of Pitch Searching Time by Preprocessing in the CELP Vocoder)

  • 김대식;배명진;김종재;변경진;한기천;유하영
    • 한국음향학회지
    • /
    • 제13권3호
    • /
    • pp.33-40
    • /
    • 1994
  • 부호여기된 선형예측(CELP) 음성부호화기는 4.8 kbps 이하의 낮은 전송 비율에서도 좋은 성능을 갖는다. CELP형 부호기의 단점은 많은 계산량을 필요로 한다는 것이다. 본 논문에서, 우리는 복잡성을 줄이면서 CELP 보코더의 음질을 유지하는 새로운 피치 검색법을 제안하였다. 이것은 음성 파형의 자기상관계를 간단한 전처리관계식에 의해 사전에 파악하여 필요한 구간에 대해서만 피치검색을 수행하는 방법이다. 제안한 방법은 피치검색에서 기존의 방법에 비해 약 $77\%$의 복잡성이 감소되었다.

  • PDF

고음질 합성방식용 V/UV 스펙트럼상의 피치변경법에 관한 연구 (On a Pitch Alteration Technique in the V/UV Spectrum for High Quality Speech Synthesis Technique)

  • 조왕래;배명진;김동성
    • 한국음향학회지
    • /
    • 제15권6호
    • /
    • pp.99-103
    • /
    • 1996
  • 파형부호화법은 파형의 잉여성분 제거과정을 통해 음성파형의 꼴을 단순히 보존하는 부호화법이다. 음성합성분야에서 파형부호화법은 주로 분석에 의한 고음질 합성방식으로 적용되고 있다. 그렇지만 이 부호화법은 분석시에 여기원과 성도여파기 피라미터들로 분류하여 처리하지 않기 때문에 규칙에 의한 합성방식으로는 적용하기가 힘들다. 본 논문에서는 스펙트럼영역에서 유성스펙트럼에 대해서만 스펙트럼축의 변경을 통해 피치를 조절하는 새로운 피치변경법을 제안하였다. 이 방법은 주파수영역의 처리법이며 50%의 피치변경을 수행하여도 스펙트럼 왜곡율이 2.7% 이하로 얻어졌고, 시간영역의 위상특성 보상에 의해 프레임간의 진폭연결이 자연스럽다는 장점을 갖느다.

  • PDF

CELP 부호화기의 코드북 탐색 시간 개선 (Reduced Search for a CELP Adaptive Codebook)

  • 이지웅;나훈;정대권
    • 한국항행학회논문지
    • /
    • 제4권1호
    • /
    • pp.67-77
    • /
    • 2000
  • 본 논문에서는 웨이블렛 변환계수를 이용하여 CELP 부호기의 코드북 탐색 시간을 개선하는 새로운 방법을 제안하고 있다. CELP 음성 부호화기에서 적응 코드북 탐색시 개루프(open loop) 및 폐루프(closed loop) 탐색을 이용하여 피치를 추출하는 과정은 많은 연산량을 필요로 한다. 특히 개루프 탐색에서 전구간에 걸쳐 자기상관함수를 이용한 피치 추출은 과도한 탐색시간에 비효율적인 것으로 지적되어 왔다. 본 논문에서는 다양한 스케일리 계수에 대한 다이애딕 웨이블렛 변환계수의 최대값의 위치가 변하지 않는 주파수에 피치가 존재하는 특성을 이용하여 새로운 적응코드북 탐색 방법을 제안하고 있다. 제안한 알고리즘은 기존의 적응 코드북 탐색 시간을 25% 감소시켰고, 합성된 음성신호의 음질의 차이는 거의 느낄 수 없었다.

  • PDF