• 제목/요약/키워드: artificial bandwidth extension

검색결과 5건 처리시간 0.016초

하모닉 구조 확장과 NMF 기반의 인공 대역 확장 기술 (Artificial Bandwidth Extension Based on Harmonic Structure Extension and NMF)

  • 김기준;박호종
    • 전자공학회논문지
    • /
    • 제50권12호
    • /
    • pp.197-204
    • /
    • 2013
  • 본 논문에서는 주파수 영역에서 협대역 신호를 광대역으로 확장하는 새로운 인공 대역 확장 기술을 제안한다. 제안한 기술은 협대역 신호를 여기 신호와 스펙트럼 포락선 성분으로 분리하고, 주파수 영역에서 각각 독립적인 방법으로 확장한다. 여기 신호는 저대역의 하모닉 구조가 고대역에서 유지되도록 확장하고, 스펙트럼 포락선은 부대역별 에너지를 기반으로 NMF방법으로 확장한다. 마지막으로 시간 축에서 프레임 사이의 상관관계를 기반으로 스펙트럼 위상을 결정하여 최종 광대역 신호를 생성한다. 주관적 청취 평가를 통하여 제안한 방법으로 대역 확장된 신호가 원 협대역 신호보다 음질이 향상된 것을 확인하였다.

시간 영역에서 개선된 파라미터 추론을 통한 효율적인 초광대역 확장 시스템 설계 (Designing of efficient super-wide bandwidth extension system using enhanced parameter estimation in time domain)

  • 전종근
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 추계학술대회
    • /
    • pp.431-433
    • /
    • 2018
  • 본 논문은 광대역 음성의 음질 향상을 위해 시간 영역에서 인공대역 확장 기술을 사용하여 초광대역 음성신호를 출력하여 사용자에게 개선된 음질의 음성을 제공하는 시스템을 제안한다. 시간 영역에서 소스필터 모델에 기반하여 광대역 여기신호 및 LSP를 추출하고, 각각의 대역폭 확장 알고리즘을 적용였고, 초광대역 여기신호 및 LSP를 추론하여 초광대역 음성신호를 합성한다. 주관적인 테스트를 통해 광대역 음성신호보다 초광대역 음성신호의 음질을 더 선호하는 결과를 도출하였다.

  • PDF

심층 신뢰 신경망을 이용한 오푸스 코덱 기반 인공 음성 대역 확장 기술 (Artificial speech bandwidth extension technique based on opus codec using deep belief network)

  • 최윤상;이아성;강상원
    • 한국음향학회지
    • /
    • 제36권1호
    • /
    • pp.70-77
    • /
    • 2017
  • 대역폭 확장 기술은 300 ~ 3,400 Hz 대역의 협대역 음성 신호를 50 ~ 7,000 Hz 대역의 광대역 음성신호로 확장하여 음질, 명료도, 그리고 자연성을 높이는 기술이다. 본 논문에서는 협대역 음성 정보를 이용하여 광대역 음성신호를 추정하는 인공 대역폭 확장 기술을 설계하여, 오푸스(Opus) 오디오 복호화기에 내장시킴으로써, 대역폭 확장 모듈에서의 LPC(Linear Prediction Coding) 분석 및 LSF(Line Spectral Frequencies) 해석과 관련된 계산량을 감소시켰고 알고리즘 지연도 줄였다. 이를 위해 현재 다양한 분야에 적용되고 있는 딥 러닝 기술 중 하나인 심층 신뢰 신경망(Deep Belief Network, DBN) 방식을 스펙트럼 포락선 확장에 도입하여 전통적인 코드북 매핑법보다 더 좋은 품질의 스펙트럼을 만들 수 있었다.

AMR 기반 저 전력 인공 대역 확장 기술 개발 (Developing a Low Power BWE Technique Based on the AMR Coder)

  • 구본강;박희완;주연재;강상원
    • 한국음향학회지
    • /
    • 제30권4호
    • /
    • pp.190-196
    • /
    • 2011
  • 대역폭 확장 (Bandwidth Extension)은 300-3400 Hz 대역의 협대역 음성 신호를 50-7000 Hz 대역의 광대역 음성신호로 확장하여 협대역 음성신호의 음질과 명료도를 높이는 기술이다. 본 논문에서는 협대역 음성 정보만을 이용해서 광대역 음성신호를 추정하는 인공 대역폭 확장 기술을 설계하여, ITU-T 협대역 표준 음성 코덱인 AMR (adaptive multi-rate) 복호화기에 내장시킴 (embedded)으로써, 대역폭 확장 모듈에서의 LPC 분석 및 LSP 해석과 관련된 계산량을 감소시켰고, 알고리즘 지연도 줄였다. 그리고 SDS (single distance search) 고속 탐색 방식을 대역폭 확장 시스템의 코드북 매핑에 적용하여, 최종적으로 저 전력 대역 확장 AMR 복호화기를 설계하였다. 제안된 대역폭 확장 방법은 AMR 복호화기 후단에 독립적으로 설치되는 기존 DTE (decode then extend)방식에 비해 28 % 정도의 계산량을 줄이고 알고리즘 지연도 20 msec 줄였다. 또한 제안방식은 피치정보를 이용한 classified 코드북 매핑 방식을 사용하여 스펙트럼 포락선을 확장하였고, 코드 벡터 탐색 시 가중치를 적용하여 광대역 합성 음성의 성능을 향상시켰다.

BWE 예측기반 대역분할 부호화기에 대한 연구 (A Study of BWE-Prediction-Based Split-Band Coding Scheme)

  • 송근배;김석호
    • 한국음향학회지
    • /
    • 제27권6호
    • /
    • pp.309-318
    • /
    • 2008
  • 본 논문에서는 입력신호를 하위대역 (low-band)과 상위대역 (high-band)으로 나누어 각 대역을 개별적으로 부호화하는 대역분할 부호화 (split-band coding) 방식에 있어서, 상인대역 신호를 효율적으로 부호화하는 방법에 대해 다룬다. 일반적으로 그리고 특히, 그 동안 대역폭 확장법 (Bandwidth Extension, BWE)에 관한 연구를 통하여 두 대역 사이에 일정 정도의 상관관계가 존재한다는 사실이 밝혀져 있다. 따라서 두 대역간에 예측 부호화 기법을 도입함으로써 부호화 효율을 향상시킬 수 있다. BWE 예측기반 부호화 기법과 관련하여, 단순히 선형 BWE 함수를 이용하는 것은 두 대역간의 관계가 비선형성을 가지고 있으므로 최적의 결과를 얹기 어렵다. 따라서 비선형 BWE 함수를 포함한 다양한 예측 함수들의 성능비교를 통하여 가장 적절한 예측기를 선택하고자 하는 노력이 필요하다. 본 논문에서는 몇몇 대표적인 BWE 함수를 이용한 주파수 대역간 예측 부호화 방법에 대해 살펴 보고 각각의 성능을 평가한다. 또한 BWE 예측기반 부호화기를 (주파수)공간상의 중복제거 기술로 볼 때, 시간적 중복 제거 기술 즉, 예측 벡터 양자화기 (predictive vector quantizer)와의 결합이 부호화 효율향상에 상승효과가 있는지에 대해서도 검토한다.