• 제목/요약/키워드: Speech Coder

검색결과 166건 처리시간 0.027초

인터넷 환경에서 FEC 기능이 추가된 AMR음성 부호화기를 이용한 오디오 스트림 전송 (Audio Stream Delivery Using AMR(Adaptive Multi-Rate) Coder with Forward Error Correction in the Internet)

  • 김은중;이인성
    • 한국통신학회논문지
    • /
    • 제26권12A호
    • /
    • pp.2027-2035
    • /
    • 2001
  • 본 논문에서는 ETSI와 3GPP에서 차세대 이동통신 IMT-2000 서비스의 음성부호화기의 표준으로 채택한 AMR을 인터넷을 통한 멀티미디어 서비스에서 사용하기 위해 부가 정보를 이용한 손실 패킷 복구 방법이 첨가된 전송방법을 제시한다. 인터넷과 같은 패킷 교환 망에서의 음성 통신에서 과도한 패킷 손실은 급격한 음질 저하를 유발한다. 본 논문에서는 음성 패킷 데이터를 순방향 오류정정(FEC)의 부가 정보로 사용하고 연속 패킷 손실이 발생하였을 경우 오류 은닉방법을 사용하여 패킷 손실에 의한 음질 저하를 개선하는 방법을 제안한다. 순방향 오류정정방법 중 부가 음성 정보를 원래의 음성정보와 함께 보냄으로써 손실된 음성은 부가 음성 정보를 이용해 복구할 수 있다. 본 연구에서 사용한 AMR 음성 부호화기는 CELP기반의 음성 부호화기 이므로 음성 부호화기의 특징을 이용해 2개 이상의 군집오류가 발생했을 경우 패킷 손실이 일어나기 전후의 데이터를 이용해서 손실된 패킷으로 인한 영향을 최소로 하는 오류은닉 방법을 사용하였다. 제안된 방법의 성능을 평가하기 위해 AMR 부호화기의 고음질 압축 방법인 12.2 kbit/s 모드로 전송하는 방법과 ITU-T 표준안인 CS-ACELP로 전송하는 방법을 SNR과 MOS 측정을 통해 비교하였다. 제안된 방법이 10%의 평균 패킷 손실률에서 부호화기 자체의 오류은닉 기술을 적용한 AMR - 12.2 kbit/s 모드보다 MOS값에서는 1.1, SNR값은 5.61 dB 높았으며, 제안된 방법은 20%의 손실률에서도 통신 가능한 음질을 유지하였다.

  • PDF

음성 파형의 Embedded 부호화에 관한 연구 (Embedded Waveform Coding of Speech)

  • 이형호;은종관
    • 대한전자공학회논문지
    • /
    • 제21권3호
    • /
    • pp.73-83
    • /
    • 1984
  • 본 논문에서는 embedded ADPCM, embedded ABM 및 delayed decision 방식을 사용한 system이 실제 음성을 부호화할 때 그 성능을 연구하였다. Embedded ADPCM과 ADM 부호화기는 종래의 ADPCM과 ADM 부호화기를 개조함으로써 얻어졌다. Embedded ADPCM 부호화기는 기본적으로 Cummiskey에 의해 최초로 제안된 바 있는 ADPCM을 기초로 하고 있다. Embedded ADM system은 CVSD와 HCDM system을 개조하여 만들었다. 이들 embedded 부호화기 중에서 embedded HCDM의 성능이 다른 부호화기에 비하여 16kbits/s에서 64kbits/s의 넓은 범위의 전송률에 걸쳐 우수하다. Embedded ADPCM에 delayed decision 방식을 적용하면 모든 전송률에서 성능이 크게 향상된다. 그러나 16kHz로 sample되는 embedded ADM system에 있어서는 같은 수의 지연 sample을 가진 embedded ADPCM에서 만큼 크게 성능이 향상되지는 않음을 알아내었다.

  • PDF

정현파 모델 부호화기를 위한 MP(Matching Pursuit) 알고리즘과 파라미터 양자화기 (Matching Pursuit Estimation and Quantizer Design for Sinusoidal Model-based Coder)

  • 안영욱;정규혁;김종학;양용호;이인성
    • 한국음향학회지
    • /
    • 제24권7호
    • /
    • pp.402-409
    • /
    • 2005
  • 본 논문에서는 고대역 (4kHz-8kHz)의 주기적 성분이 강하게 나타나는 신호에 대해서 MP (Matching Pursuit) 알고리즘을 이용한 부호화 방법을 제안한다. 또한 분석된 스펙트럼 크기 파라미터와 위상 파라미터의 효율적인 양자화 방법을 제안한다. MP 알고리즘은 오류 상쇄 원리와 정현파 모델에 바탕을 두고 있기 때문에 정확한 피치 주기 예측이 필요하다. 고대역의 정확한 피치 주기 예측을 위해 저대역 (0kHz-4kHz) 신호에서 검출한 피치 주기를 이용함으로써 부호화와 비트할당의 효율을 높일 수 있다. 스펙트럼 크기 계수의 양자화를 위해 계수들에 대해 고정 차원 이산코사인 변환 (MDCT : Modified Discrete Cosine Transform) 및 다단계 (multi-stage) 구조를 결합시킨 양자화 기법을 사용하였고, 위상 값들은 스펙트럼 크기에 따른 가중치 필터와 위상의 $2{\pi}$ 순환 특성을 이용하여 양자화하였다. 또한 제안한 양자화 기법과 부호화 방법을 음성 분석-합성 (analysis-by-synthesis) 시스템에 적용하여, 목적 신호와의 비교를 통해 검증한다. 향후 대역 분할을 기본 구조로 하는 계층 구조의 광대역 음성부호화기에의 적용 가능성을 제시한다.

AMR과 EVRC 음성부호화기를 위한 파라미터 직접 변환 방식의 상호부호화 알고리듬 (Transcoding Algorithm for AMR and EVRC Vocoders Via Direct Parameter Transformation)

  • 이선일;유창동
    • 대한전자공학회논문지SP
    • /
    • 제39권6호
    • /
    • pp.696-708
    • /
    • 2002
  • 본 논문에서는 AMR과 EVRC 음성부호화기를 위한 새로운 파라미터 직접 변환 방식의 상호부호화 알고리듬을 제안한다. 상호부호화를 위하여 부가적인 복호화, 부호화 과정을 거쳐야하는 기존의 Tandem 방식과 달리 제안된 파라미터 직접 변환 방식에서는 양 음성부호화기가 음성을 부호화하기 위하여 공통적으로 사용하는 파라미터들이 직접 변환된다. 제안된 알고리듬은 파라미터 복호화, 프레임 분류, 모드 결정, 그리고 두가지 프레임형을 위한 상호부호화기로 구성된다. 상호부호화기는 LSP, 프레임 에너지, 적응 코드북을 위한 피치 지연, 고정 코드북 벡터, 그리고 양 코드북의 이득을 변환한다. 제안된 알고리듬을 다양한 방법으로 평가해본 결과 기존의 Tandem 방식과 비교하여 계산량과 지연 시간을 줄이면서도 동등한 음질을 구현함을 확인할 수 있었다.

블록 제한 트렐리스 부호화 양자화 기법을 이용한 협대역 음성 부호화기용 LPC 계수 양자화기 설계 (Designing a Quantizer of LPC Parameters for the Narrowband Speech Coder using Block-Constrained Trellis Coded Quantization)

  • 전자경;박상국;강상원
    • 한국통신학회논문지
    • /
    • 제32권3C호
    • /
    • pp.234-240
    • /
    • 2007
  • 본 논문에서는 기존의 트렐리스 부호화 양자화 기법을 이용, 변형하여 저 복잡도 블록 제한 격자 부호화 양자화 기법 (Block-Constrained Trellis Coded Quantization, 이하 BC-TCQ)을 제안하곤 이를 이용한 협대역 음성 부호화기용 예측 BC-TCQ를 설계하였다. 트렐리스 부호화 양자화 기법은 일종의 벡터 양자화 방식으로 부호화에 요구되는 벡터 코드북을 트렐리스 구조에 기반한 스칼라 코드북으로 구성함으로써 VQ와 비교 할 만한 성능을 보일 뿐 아니라 복잡도가 훨씬 작은 특성을 보인다. 본 논문에서 제안한 예측 BC-TCQ는 프레임당 26비트에서 IS-641 음성 부호화기보다 평균 SD가 0.4107dB 향상되었으며, 더하기 연산이 64.54%, 곱하기 연산이 76.93%, 비교 연산이 2.35% 감소하였다.

AMR과 G.723.1 음성부호화기를 위한 효율적인 상호부호화 알고리듬 및 성능평가 (An efficient transcoding algorithm for AMR and G.723.1 speech coders and performance evaluation)

  • 최진규;윤성완;강홍구;윤대희
    • 대한전자공학회논문지SP
    • /
    • 제41권4호
    • /
    • pp.121-130
    • /
    • 2004
  • 무선망과 VoIP 같은 서로 다른 음성 통신 네트워크간의 통신을 할 경우, 서로 다른 구조를 갖는 두 음성부호화기간의 효율적인 연동이 필요하다. 이런 경우, 가장 간단한 방법으로 두 음성부호화기의 복호화기와 부호화기를 직렬로 연결시키는 tandem방식을 사용할 수 있다. 하지만, tandem방식은 긴 지연시간과 많은 연산량, 그리고 음질저하의 문제점들을 갖는데, 이는 상호부호화 방법을 통해서 해결할 수 있다. 상호부호화 알고리듬은 송신단과 수신단의 음성 부호화기의 구조에 의해 결정되고, 본 논문에서는 연산량은 감소시키고, 음질은 향상시킬 수 있는 LSP 변환, 개선된 고속 피치 검색, 상호부호화기를 위한 새로운 지각가중 필터 알고리듬을 제안한다. 제안된 알고리듬은 AMR과 G.723.1간의 상호부호화기에 적용하였다. 제안된 상호부호화 알고리듬을 사용함으로써 tandem 방식에 비하여 연산량은 약 20%-58% 감소되는 반면, 음질은 향상된다.

MPEG 오디오 최신 표준: USAC 기술 (MPEG Audio New Standard: USAC Technology)

  • 이태진;강경옥;김환우
    • 방송공학회논문지
    • /
    • 제16권5호
    • /
    • pp.693-704
    • /
    • 2011
  • 다양한 기능을 가지는 모바일 기기들이 하나로 융합되어 가는 방향으로 기술이 발전함에 따라, 음성 및 오디오 모두에 대해 우수한 음질을 제공하는 부호화 기술에 대한 요구사항이 증대되고 있다. 이와 같은 새로운 부호화 기술에 대한 요구사항에 따라, MPEG에서는 2007년 10월 82차 회의에서 CfP를 시작으로 USAC 표준화를 시작하였고, 2011년 7월 97차 회의에서 FDIS까지 승인하였다. MPEG-D USAC 기술은 최신 음성 부호화기인 AMR-WB+와 최신 오디오 부호화기인 HE-AAC V2를 융합한 기술로 입력 신호의 특성에 따라 코어 대역 부호화로 AAC, ACELP, TCX 등 다양한 방법 중 하나를 선택하여 부호화를 수행하고, 고대역 부호화 기술로는 SBR, 스테레오 부호화 기술로는 MPEG-Surround를 이용하며, 다양한 코어 코더 사이의 천이를 위한 윈도우 기술을 이용한다. USAC 기술은 음성과 음악 신호 모두에 대해 우수한 음질을 제공할 수 있으며, 모바일 기기로의 멀티미디어 콘텐츠 다운로드, 디지털 라디오, 모바일 TV 및 오디오 북 등에서 응용이 가능하다.

효율적인 다채널 구현을 위한 ITU-T G.723,1 음성 부호화기 고속 알고리듬 제안 (A Proposal of fast Algorithms of ITU-T G.723.1 for Efficient Multichannel Implementation)

  • 정성교;박영철;윤성완;차일환;윤대희
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.67-70
    • /
    • 2000
  • 최근 들어, 인터넷의 폭넓은 보급과 급속한 대중화에 따라 네트워크를 통하여 음성을 전송하거나 저장하려는 시도가 많이 이루어지고 있다. 본 논문에서는 네트워크를 통한 멀티미디어 전송에서 음성부호화 표준으로 널리 상용되는 ITU-T G.723.1 dual-rate speech coder의 효율적인 다채널 구현을 위한 고속 알고리듬을 제안한다. 고속 알고리듬은 부호화 과정에서 많은 계산량을 차지하는 적응 코드북 검색과 고정 코드북 검색 과정에 적용된다. 적응 코드북 검색 과정에서는 지연과 이득을 동시에 찾는 기존의 방법 대신, 지연과 이득을 순차적으로 검색함으로써 계산량을 개선하였다. 전송률에 따라 다른 알고리듬을 사용하는 고정 코드북 검색 과정에서는 다음과 같은 고속 알고리듬을 제안한다. MP-MLQ(Multi-Pulse Maximum Likely Quantization) 방법을 사용하는 높은 전송률(6.3 kbit/s)인 경우, 펄스를 등 간격으로 검색함으로써 계산량을 줄였다. ACELP(Algebraic CELP) 방법을 사용하는 낮은 전송률(5.3 kbit/s)인 경우는 기존의 nested-loop 검색방법 대신, 펄스를 쌍으로 나누어 순차적으로 찾는 depth-first tree 검색 방법을 적용하여 계산량을 감소시켰다. 제안된 고속 알고리듬에 대해 주관적 음질 평가 방법을 수행한 결과, 제안된 방법이 기존의 방법에 비해 음질의 저하가 없음을 확인하였다. 고정 소수점 DSP인 TMS320C6201을 사용하여 고속 알고리듬을 구현한 결과, 높은 전송률의 경우에는 10.29 MIPS, 낮은 전송률의 경우에는 8.70 MIPS의 연산량으로 구현 가능함을 확인하였다.

  • PDF

CELP 부호화기의 코드북 탐색 시간 개선 (Reduced Search for a CELP Adaptive Codebook)

  • 이지웅;나훈;정대권
    • 한국항행학회논문지
    • /
    • 제4권1호
    • /
    • pp.67-77
    • /
    • 2000
  • 본 논문에서는 웨이블렛 변환계수를 이용하여 CELP 부호기의 코드북 탐색 시간을 개선하는 새로운 방법을 제안하고 있다. CELP 음성 부호화기에서 적응 코드북 탐색시 개루프(open loop) 및 폐루프(closed loop) 탐색을 이용하여 피치를 추출하는 과정은 많은 연산량을 필요로 한다. 특히 개루프 탐색에서 전구간에 걸쳐 자기상관함수를 이용한 피치 추출은 과도한 탐색시간에 비효율적인 것으로 지적되어 왔다. 본 논문에서는 다양한 스케일리 계수에 대한 다이애딕 웨이블렛 변환계수의 최대값의 위치가 변하지 않는 주파수에 피치가 존재하는 특성을 이용하여 새로운 적응코드북 탐색 방법을 제안하고 있다. 제안한 알고리즘은 기존의 적응 코드북 탐색 시간을 25% 감소시켰고, 합성된 음성신호의 음질의 차이는 거의 느낄 수 없었다.

  • PDF

트리 코팅에서 전송에러에 강한 역방향 적응 피치 예측 (Robust Backward Adaptive Pitch Prediction for Tree Coding)

  • 이인성
    • 한국통신학회논문지
    • /
    • 제19권8호
    • /
    • pp.1587-1594
    • /
    • 1994
  • 피지 예측기는 강인한 트리 부호화기에서 가장 중요한 부분 중에 하나이다. 피치 예측기는 역방향으로 블록 적용 방법과 회귀적인 방법이 결합되어 구성되어진다. 부호화기의 전송에러에 대한 성능을 개선하고 입력 음성의 피치주기의 변화를 추적하기 위해 피치 예측기의 스무더를 부가하는 방법을 제시한다. 3개의 탭을 갖는 스무더는 고정된 계수를 가지거나 피치 합성기의 출력신호의 자기상관 함수에 따라 변화되는 가계변수를 가질 수 있다. 피치 예측기에 스무더의 부가는 한 블록 내에서의 피치주기의 변화를 추적할 수 있고 채널에러에 대한 영향도 줄일 수 있다.

  • PDF