• 제목/요약/키워드: 음성압축

검색결과 218건 처리시간 0.029초

G.729 음성 압축기의 계산량 감소 (Complexity Reduction of G.729 Vocoder)

  • 최윤창;박호종
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 학술발표대회 논문집 제19권 2호
    • /
    • pp.15-18
    • /
    • 2000
  • ACELP는 우수한 음질을 제공하지만 최적의 코드 벡터를 찾기 위한 계산량이 상당히 많은 단점이 있고, 이로 인하여 모든 시스템과 단말기에서는 고성능 DSP칩을 사용하여 동작시킨다. 본 논문에서는 고속 ACELP 코드북 검색 방법인 펄스 교환 검색 방법을 G.729 음성 압축기에 적용시켜 G.729 음성 압축기의 계산량을 감소시키는 방법을 연구하였다. 적용된 방법은 두 단계 과정을 가지며, 첫 단계에서는 완전 순차적 검색 방법을 통하여 매우 빠르게 대략적인 코드 벡터를 찾는다. 두 번째 단계에서는 앞에서 선택된 코드 벡터의 각 펄스의 중요도를 계산하여 역할이 적은 펄스를 제거하고 새로운 펄스로 교환하는 펄스 교환 과정을 통하여 코드 벡터의 성능을 향상시킨다. 적용된 방법은 표준에서 사용하는 코드북 검색 방법보다 적은 계산량을 가진다. 적용된 방법의 성능은 표준보다 0.3-0.5dB 정도의 SNRseg 감소를 보이지만 Fast Algorithm인 G.729A보다는 우수한 음질의 코드 벡터를 찾으며, 다양한 음성신호를 이용한 모의 실험을 통하여 이 결과를 확인하였다.

  • PDF

비트스트림의 구조 분석을 이용한 음성 부호화 방식 추정 기법 (Blind Classification of Speech Compression Methods using Structural Analysis of Bitstreams)

  • 유훈;박철순;박영미;김종호
    • 한국정보통신학회논문지
    • /
    • 제16권1호
    • /
    • pp.59-64
    • /
    • 2012
  • 본 논문에서는 임의의 음성 압축 비트스트림의 구조를 분석하여 음성 신호의 부호화 방식을 추정 및 분류하는 기법을 제안한다. 저 비트율 전송 및 저장을 위하여 다양한 보코더 방식의 음성 압축 기법이 개발되었는데, 이들은 블록 구조를 반드시 포함하고 있다. 각 부호화 방식을 구분하는데 있어, 본 논문에서는 Measure of Inter-Block Correlation (MIBC)를 이용하여 블록 구조의 유무 및 신호 블록의 길이를 파악하고, 블록 길이가 동일한 부호화 방식의 경우 각 부호화 방식마다 압축 스트림 내의 각 비트 위치별로 상관도 분포가 다르다는 점을 이용하여 해당 부호화 방식을 정확하게 추정하는 기법을 제안한다. 실험 결과 제안한 비트스트림 분석 기법은 다양한 음성 신호의 종류, 음성 신호의 길이 및 잡음 환경에 강인한 검출 능력을 나타냄을 보인다.

실시간 오디오 스트림 생성/복원/전송 시스템 구현에 관한 연구 (A study on implementing real time audio stream generation/restruction/sending system)

  • 이경남;박인규
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1998년도 추계종합학술대회 논문집
    • /
    • pp.1199-1202
    • /
    • 1998
  • 4채널 입력으로부터 입력되는 오디오를 압축,복원,저장, 전송하는 ㅅ스템을 설계한다. 이러한 시스템은 보안 시스템 중에서 특정 센서로부터 alarm 신호를 디지털 데이터로 변환한 후, 압축시켜 저장하고 동시에 압축된 오디오 데이터를 비디오 데이터와 통합하여 하나의 스트림으로 만들어 통신망으로 보내주는 시스템에 적용된다. 이러한 시스템의 구조를 간단히 설명하면 아날로그 음성 신호를 디지털 음성 data로 변환하기 위해 OKI사의 MSM 7570L-91이라는 ADPCM codec을 사용하였고 ADPCMcodec을 거쳐 나온 ADPCM 데이터를 64Mbyte SDRAM에 저장하였다가 FIFO를 거쳐서 통신망으로 전송을 한다. 복원은 SDRAM에 저장된 ADPCM 데이터를 MSM 7570L-01을 거쳐 아날로그 신호로 변환한 후 엠프를 거쳐 스피커로 출력을 하게 된다.

  • PDF

인터넷 영상회의의 흐름제어를 위한 H.261의 압축율 분석 (Analysis of the H.261 compression rate change for flow-controlling the Internet video conferencing)

  • 고동환;고민수;안종석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (3)
    • /
    • pp.456-458
    • /
    • 1998
  • 최근 인터넷 상에서의 효율적인 영상/음성 시스템을 개발하려는 연구가 활발히 진행되고 있다. 이러한 연구중의 중요한 분야로는 인터넷의 대역폭을 효율적으로 사용하려는 즉 가변적인 인터넷의 사용가능한 대역폭을 예측하고, 예측된 대역폭에 알맞게 영상과 음성 정보를 압축하는 연구일 것이다. 본 논문에서는 사용 가능한 대역폭 예측에 알맞게 영상정보의 압축률을 조절하는 기법을 소개한다. 본 논문에서는 영상 압축 알고리즘의 하나인 H.261에서 압축률에 관련된 변수 값과 다양한 영상에서의 압축율 변화의 상관관계를 측정하였다. 또한 본 논문에서는 측정된 상관 관계를 수식화되고, 이 수식을 어떻게 전송량 조절 (flow control)알고리즘에 사용할 것인가를 제안한다.

  • PDF

Context Tree Weighting을 이용한 AMR 음성 데이터 압축 성능 개선 (Improvement of AMR Data Compression Using the Context Tree Weighting Method)

  • 이은수;오은주;유훈
    • 인터넷정보학회논문지
    • /
    • 제21권4호
    • /
    • pp.35-41
    • /
    • 2020
  • 본 논문은 Context Tree Weighting (CTW) 를 이용하여 Adaptive Multi-Rate (AMR) 데이터의 압축 성능을 개선하는 알고리즘을 제안한다. AMR은 IMT-2000에서 채택된 음성부호화 표준안으로써, 무선채널의 환경변화에 대처할 수 있도록 4.75 kbit/s 에서 12.2 kbit/s 까지 8가지의 전송률을 지원한다. CTW는 산술부호화기의 일종으로, 가변 차수 마르코프 모델을 사용하는 압축기이다. 우리는 CTW가 비트단위로 수행한다는 점을 고려하여 AMR 데이터를 변환한 후 CTW로 압축하는 알고리즘을 제안한다. 제안하는 알고리즘의 유효성을 검증하기 위하여 ZIP을 포함한 기존 압축방식과 제안된 알고리즘의 압축률을 비교하는 실험을 하였다. 실험 결과, AMR 데이터의 평균 추가 압축률이 ZIP의 경우 약 3.21%, 제안된 알고리즘의 경우 약 9.10%로 나타났다. 따라서 본 논문에서 제안한 알고리즘이 AMR 데이터의 압축 성능을 약 5.89% 개선하였다.

DSP를 이용한 음성 및 오디오 시스템 설계

  • 김성수;조성호
    • 전기의세계
    • /
    • 제46권5호
    • /
    • pp.39-44
    • /
    • 1997
  • 현재 DSP는 음성 및 오디오 신호처리 시스템, 디지털 통신 시스템, 제어 시스템, 영상처리 시스템 등 많은 영역에 걸쳐 성공적으로 사용되고 있다. 몇가지 대표적인 활용분야를 살펴보면, 음성신호 압축 분야 [1-4], MPEG (moving picture expert group)과 같은 오디오신호 압축분야[5,6], 그리고 디지털 통신 시스템에서의 적응 반향제거기, 적응 동화기, 채널간섭 제거, 변복조기, 채널 코딩, 암호화기[7-14] 등에서도 DSP가 사용되고 있다. 그리고 수중 음향 신호처리[15], 디지털 필터 디자인, 전력 스펙트럼 추정, 수중 음향 신호처리 같은 디지털 신호처리 분야[16-23]와 적응 신호처리[24-26], 이외에도 능동 소음 제어기 및 적응 제어기와 같은 제어 시스템 [27]에도 유용하게 이용되고 있다. 또한 영상 압축, 디지털 방송, 의료기기 등과 같은 영상처리 분야[28-32] 및 그 밖의 많은 분야에서 DSP의 활용은 점점 커져가고 있는 추세이다.

  • PDF

고성능 CELP 음성 압축기를 위한 새로운 코드북 구조 (New Codebook Structure For A High-Quality CELP Speech Coder)

  • 박호종;권순영
    • 한국음향학회지
    • /
    • 제17권2호
    • /
    • pp.43-49
    • /
    • 1998
  • 본 논문에서는 고성능 CELP 음성 압축기를 위한 "Boaseline 코드벡터"와 "Implied 코드벡터"로 구성되는 새로운 구조의 코드북을 제안한다. Implied 코드벡터는 피치 주기 이 전의 합성음으로부터 구하여지며 여기(勵起)신호의 피치 구조를 강화하여 합성음의 음질을 향상시킨다. Implied 코드벡터는 전달되지 않고 인코더 및 디코더에서 각각 합성음을 이용 하여 독립적으로 구하여진다. 또한 펄스와 랜덤 성분을 모두 가지는 복합 여기방식을 이용 하여 음질을 더욱 향상시킨다. 제안된 코드북 구조를 이용하여 10msec프레임을 가지는 8kbps CELP 음성 압축기를 설계하여 하나의 DSP칩에 실시간 구현 하였고, 이것의 성능을 SNRseg와 MOS로 측정하였다. 평균 SNRseg는 12.14dB로 CS-ACELP의 SNRseg보다 6dB 높고, 조용한 환경에서의 MOS는 3.80으로 G.729 CS-ACELP의 MOS보다 0.02 높다.

  • PDF

배경 잡음환경에서 가변 임계값에 의한 Dual Rate ADPCM 음성 부호화 기법 (Coding Method of Variable Threshold Dual Rate ADPCM Speech Considering the Background Noise)

  • 한경호
    • 조명전기설비학회논문지
    • /
    • 제17권6호
    • /
    • pp.154-159
    • /
    • 2003
  • 본 논문에서는 ITU G.726 규격을 만족하는 표준형 ADPCM 부호화 법을 이용하여 배경잡음의 크기에 따라 음성의 부호화율이 두가지로 가변하도록 함으로써, 낮은 데이터 전송률을 가지고도 단일 부호화율의 경우보다 개선된 음질을 갖는 부호화 기법을 제안하였다. 이를 위하여 배경잡음보다 큰 음성신호에 대하여는 데이터의 양이 커지더라도 음질을 향상시키기 위하여 40 [Kbps]로 압축하고, 작은 음성신호에 대하여는 16[Kbps]로 압축하여 데이터의 양을 줄이도록 하여 전체적으로 압축데이터의 양을 줄이면서 음질을 개선하도록 하였다. 입력된 음성신호에 대하여 두가지 압축율을 결정하기 위하여 영교차율(ZCR)을 사용하여 처리속도를 빠르도록 하였다.

극대 및 극소점에서의 비균일 표본화에 의한 음성압축 (Speech Compression by Non-uniform Sampling at the maxima and minima)

  • 임재열;백성준;안수길;김범훈
    • 한국음향학회지
    • /
    • 제11권4호
    • /
    • pp.36-44
    • /
    • 1992
  • 리던던시(redundancy)가 존재하는 신호의 데이타 압축을 위한 한 방법으로 비균일 표본화 방법이 연구되어져 왔다. 그런데 많은 리던던시가 존재한다고 알려진 음성신호에 기존의 비균일 표본화 방법을 그대로 적용하며, 데이타량이 PCM과 같은 균일 표본화에 의한 것에 필적하게 되거나 오히려 많아지게 된다. 이 문제를 해결하기 위하여 본 논문에서는 음성의 인지측면에서 리던던트한 샘플을 제거하는, 극대점과 극소점에서 비균일 표본화하는 방법을 제안한다. 그리고 본 논문에서는 제안된 방법의 성능을 분석하고자, 실험적인 방법으로 압축비관계를 살펴보며, 아울러 묶음구간 처리에 의하여 압축비를 크게 향상 시킬 수 있음을 보인다. 실험결과로써는 8kHz 8-bit PCM신호에 대하여 1.54배, 묶음처리를 한 경우에는 2.88배의 압축비를 얻었다.

  • PDF

고품질 내장형 음성합성 시스템을 위한 음성합성 DB구현 (The implementation of database for high quality Embedded Text-to-speech system)

  • 권오일
    • 대한전자공학회논문지SP
    • /
    • 제42권4호
    • /
    • pp.103-110
    • /
    • 2005
  • 음성 데이터베이스는 TTS 시스템에서 가장 중요한 요소 중의 하나이다. 특히, 내장형 TTS 시스템에서는 서버형 TTS 시스템에서보다 좀 더 작은 데이터베이스를 필요로 한다. 이러한 이유로, 음성합성 데이터의 압축과 통계적 축소과정의 비중은 내장형 TTS 시스템에서 아주 중요한 항목이라고 말할 수 있다. 그러나 이러한 압축과 통계적 축소과정은 합성음질의 저하를 유발시킨다. 본 논문에서는 고품질 내장형 TTS 시스템에서의 데이터 구축방법을 제안하며, MOS 테스트를 통한 합성음질을 검증한다.