• 제목/요약/키워드: 오디오 음질

검색결과 131건 처리시간 0.024초

음성통신망에서 디지털 오디오 신호 음질개선을 위한 전처리방법 (Preprocessing method for enhancing digital audio quality in speech communication system)

  • 송근배;안철용;김재범;박호종;김석호
    • 방송공학회논문지
    • /
    • 제11권2호
    • /
    • pp.200-206
    • /
    • 2006
  • 본 논문은 음성 부호화기에서 입력 오디오 신호가 보다 효과적으로 처리되도록 하기 위해 입력오디오신호를 전 처리하는 방법을 소개한다. 이를 위해 본 논문은 잡음억제 및 적응이득제어 방법을 도입한다. 여기서 입력 오디오 신호는 잡음 부가된 신호로 간주되며 그 오디오 신호의 부호화오차신호는 부가된 잡음신호로 간주된다. 입력 오디오 신호는 기존의 잡음억제방식에 따라 잡음신호 즉, 부호화 오차신호가 억제된 뒤 적응이득제어기를 거쳐 최종적으로 음성 부호화기에 인가된다. 결과적으로 이러한 동작을 통하여 입력 오디오 신호의 주파수 스펙트럼 분포가 음성 부호화기 특성에 맞게 재배치된다 이 방법의 하나의 단점은 부호화 오차를 계산하기 위해 사전에 추가적인 부호화 동작이 필요하다는 것이다. 반면, 이 방법은 일반적인 구조를 가지고 있으며 따라서 기존의 여러 음성부호화기에 쉽게 적용될 수 있다는 장점을 가진다. 주관적인 선호도 조사결과 제안된 방법이 복잡한 음악신호로 기인한 성가신 잡음을 사전에 억제해 주며 결과적으로 음질개선을 가져다준다는 것을 확인할 수 있었다.

가변 임계값을 이용한 지각 필터의 적응적인 음질 개선 알고리즘 (Adaptive Enhancement Algorithm of Perceptual Filter Using Variable Threshold)

  • 차형태
    • 한국음향학회지
    • /
    • 제23권6호
    • /
    • pp.446-453
    • /
    • 2004
  • 본 논문에서는 잡음에 의해 열화된 오디오 신호를 가변 임계값을 이용한 적응 지각 필터를 사용하여 음질을 개선하는 알고리즘을 제안한다. 제안된 적응 지각 필터는 신호 구간마다 달라지는 신호의 세기와 잡음의 영향 정도를 고려하여 임계값을 가변적으로 조정함으로써 잔여 잡음을 효과적으로 제어하는 방식으로 지각적으로 개선된 음질의 신호를 얻을 수 있다 제안한 방식은 잡음에 의해 열화된 오디오 신호를 주파수 영역으로 변환한 후 임계 대역 기반의 임계 대역 에너지 (Critical intensity energy)와 마스킹 영향이 고려된 청각 자극 에너지 (Excitation energy)를 계산한 다음, 지각 필터를 기반으로 한 적응 지각 필터 알고리즘으로 각 단계별 지각 필터 응답을 임계값으로 이용하여 가변 임계값이 재조정되는 단계를 결정하게 된다. 신호의 구간별 에너지 크기에 의한 잡음에 의해 열화된 정도의 차이를 가변 임계값을 이용하여 고려함으로써 잔여 잡음의 효과적인 제어가 가능하게 된다. 제안한 방법은 다양한 신호대 잡음비에서 열화된 오디오 신호를 입력으로 사용하였다. 입력 신호대 잡음비가 15dB, 20dB, 25dB와 30dB의 각각의 경우에 대하여 잡음대 마스킹비 (Noise-to-mask ratio, NMR)와 청감 테스트 (Mean opinion score, MOS Test)를 시행하였다. 그 결과, 잡음대 마스킹비의 개선 측면에서 각각의 경우에 대해 17.4dB, 15.3dB, 12.8dB, 9.8dB의 개선을 확인할 수 있었고, 청감 테스트의 개선 측면에서는 각각 2.9, 2.5, 2.3, 1.7의 개선된 음질을 확인할 수 있었다.

오디오 품질을 개선하기 위한 6개의 Jitter Control 알고리즘의 성능 분석 (Performance Evaluation of Six Jitter Control Algorithms for Improving Audio Quality)

  • 나승구;유홍준;안종석;이태진
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2000년도 정기총회 및 학술대회
    • /
    • pp.29-35
    • /
    • 2000
  • 음성 데이터의 패킷 지터(jitter)가 심할수록 오디오 플레이어가 오디오 데이터를 자연스럽게 재생하지 못하기 때문에 사용자는 원래의 음성을 거의 알아들을 수 없게 된다. 이 문제점을 해결하기 위하여 오디오 수신자는 전송 받은 오디오 데이터를 바로 재생하지 않고 재생시간을 지연시키는 방법을 사용한다. 본 연구자의 조사에 의하면 이러한 재생시간을 지연하는 대표적인 지터 컨트롤 알고리즘으로 6가지 방식이 제안되고 있다. 그 중 세 가지는 NeVot, Vat, Open H.323 프로그램 등에 구현되어 실제로 사용되고 있다 본 논문에서는 이들 6가지의 모델의 지터 컨트롤 알고리즘의 특성을 알아보고 어느 알고리즘이 효율적인지 알아보기 위해 현재 인터넷의 성능을 파악하고 이를 기초로 제안된 6가지 알고리즘 중 어느 것이 가장 효율적인가를 파악하여 오디오의 음질을 개선하기 위한 방법을 제시하고자 한다.

  • PDF

저비트율로 압축된 오디오의 음질 개선 방법 (Audio Quality Enhancement at a Low-bit Rate Perceptual Audio Coding)

  • 서정일;서진수;홍진우;강경옥
    • 한국음향학회지
    • /
    • 제21권6호
    • /
    • pp.566-575
    • /
    • 2002
  • 이동통신망과 같이 제한된 대역폭에서 실시간 멀티미디어 스트리밍 서비스를 제공하기 위해서는 보다 낮은 비트율로 비디오와 오디오 데이터를 압축하여야 한다. 또한 대부분의 대역이 비디오 데이터를 위해 할당되어 있으므로 제한된 대역폭만이 오디오에 할당되게 된다. 오디오 데이터를 낮은 비트율로 압축하기 위해서는 압축율이 높은 알고리즘을 사용하거나, 표본화 주파수 (sampling frequency)를 낮춤으로써 데이터 양을 줄여 낮은 비트율로 부호화하여야 한다. 본 논문에서는 이러한 문제점을 극복하기 위해서 낮은 표본화 주파수로 오디오 신호를 압축하고, 낮은 표본화주파수를 사용함으로서 발생하는 대역폭의 손실은 소량의 부가정보를 이용하여 복원해 줌으로써 음질을 향상시키는 알고리즘을 제안한다. 높은 주파수의 스펙트럼을 복원하기 위하여 부호화단에서 낮은 주파수 대역과 다운 샘플링 과정 중에 손실되는 높은 주파수 대역간의 에너지비를 바크밴드에 구한 후 이를 부호화하여 복호화 단으로 전달하고 이를 이용하여 높은 주파수 성분을 복원하는 방법을 제안하였다. 제안된 방법을 이용하면 10%∼20% 정도의 추가적인 비트를 사용하면서 기존의 방식보다 세그멘탈 신호대 잡음비는 1㏈∼3㏈의 성능 개선을 보였으며, 주관적인 MOS 듣기 평가를 수행한 결과 기존의 방식보다 음질이 향상됨을 확인하였다. 또한 본 논문에서 제안한 방법은 주파수 영역에서 압축을 수행하는 모든 오디오 부호화 방식에도 적용이 가능하다.

고음질을 위한 디지털 오디오 워터마킹에 관한 연구 (A Study on the Digital Audio Watermarking for a High Quality Audio)

  • 조병록;정일용;박창균;이강현
    • 전자공학회논문지CI
    • /
    • 제39권3호
    • /
    • pp.53-61
    • /
    • 2002
  • 본 논문에서는 고음질을 위한 디지털 오디오 워터마킹(watermarking) 알고리즘을 제안한다. 오늘날 디지털 저작물을 확인하는데 디지털 워터마크(digital watermark)가 쓰이고 있으며, 영상뿐만 아니라 디지털 오디오 분야도 연구가 활발하다. 특히, 디지털 오디오 분야에서의 워터마크 삽입은 워터마크의 강인성뿐만 아니라 워터마킹된 오디오 데이터 자체의 음질에 상당한 영향을 주게 된다. 오디오 워터마크는 일반적으로 FFT 변환 후 주파수 영역에 워터마크를 삽입하는데, 이때 워터마크 삽입 영향으로 오디오 데이터 음질에 영향을 미치게 된다. 따라서 오디오의 고음질을 유지하면서 강인한 워터마크를 삽입하는 연구가 큰 문제로 대두되었다. 논문에서는 심리음향 모델(Psychoacoustic model) 및 MDCT/IMDCT(Modified Discrete Cosine Transform/Inverse Modified Discrete Cosine Transform)를 사용한 고음질 오디오 워터마킹 알고리즘을 제안한다. 제안된 논문에서, 오디오 워터마킹 알고리즘을 위하여 44.1㎑, 128Kbps, 스테레오 오디오 파일을 이용하였다. 오디오 데이터가 MDCT를 통해 주파수 변환하는 과정에서 256, 1024, 2048 포인트 간격으로 워터마크를 삽입할 수 있다. 50㎳의 RMS 윈도우를 사용했을 때 원 오디오 데이터와 워터마킹 된 오디오 데이터의 전체 RMS 파워의 차이는 0.8㏈이다.

통합 음성 오디오 부호화 기술 (Unified Speech and Audio Coding Technology)

  • 이태진;백승권;강경옥;김환우
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 하계학술대회
    • /
    • pp.264-267
    • /
    • 2011
  • 다양한 기능을 가지는 모바일 기기들이 하나로 융합되어 가는 방향으로 기술이 발전함에 따라, 음성 및 오디오 모두에 대해 우수한 음질을 제공하는 부호화 기술에 대한 요구사항이 증대되고 있다. MPEG 에서는 2008 년 10 월부터 MPEG-D USAC 기술에 대해 CfP 를 시작으로 본격적으로 표준화를 진행하고 있으며, 2011 년 3 월 96 차 미팅에서 Study on DIS 까지 승인하였다. 본 논문에서는 LPD 모드의 TCX 윈도우의 변경을 통한 USAC 성능향상 방법은 제안한다. TCX 프레임의 연결에 고정된 크기의 중첩만을 이용하는 현재의 방식과는 달리, 이전 TCX 모드와 다음 TCX 모드, transient 의 존재 유무에 따라 적절하게 TCX 윈도우 중첩크기를 조절하여 음악 특성 신호에 대해 LPD 모드의 음질을 개선할 수 있다.

  • PDF

초고선명 디지털 TV 를 위한 차세대 라우드스피커 레이아웃 (Next-generation loudspeaker layout for Ultra High Definition (UHD) Digital TV)

  • 이영우;김선민
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 하계학술대회
    • /
    • pp.57-60
    • /
    • 2011
  • 본 논문에서는 초고선명 디지털 TV 를 위한 차세대 멀티채널 사운드 시스템의 최적의 라우드스피커 레이아웃을 도출하기 위해 다양한 라우드스피커 배치 환경에서 인지 관점의 오디오 음질 주관평가를 실시하였다. NHK 22.2 채널 시스템, ITU-R BS.775-2 표준의 7.1 채널 시스템과, 실감 음향에 가장 중요한 역할을 하는 Top Layer 라우드스피커에 중점을 두고 다양한 신규 레이아웃 구성들을 비교하였으며, 스튜디오에서 믹싱된 컨텐츠와 B-format 레코딩을 멀티채널로 생성한 컨텐츠를 이용하여 주관 평가를 실시하였다. 주관 평가 결과, Top Layer 에 3 개의 라우드스피커를 가지는 10.2 채널 라우드스피커 레이아웃이 평가에서 사용된 전체적인 오디오 음질의 등급에서 NHK 22.2 채널 시스템과 차이를 인지하기 어렵다는 결과를 도출하였다.

  • PDF

위성 DMB 환경에서의 멀티채널 오디오 서비스 시스템 연구 (Research for Multi-channel audio service system on Satellite DMB environment)

  • 이용주;서정일;백승권;강경옥
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 하계학술대회
    • /
    • pp.486-489
    • /
    • 2011
  • 본 논문에서는 위성 DMB 환경에서 멀티채널 오디오 서비스를 제공할 수 있는 시스템을 제안한다. 위성 DMB 서비스는 2005 년부터 상용서비스를 시작한 이동멀티미디어방송 서비스로서, QVGA 급의 영상과 FM 음질의 오디오 서비스를 제공한다. 본 연구에서는 기존의 위성 DMB 시스템과 호환성을 유지하면서, 적은 비트율의 데이터를 추가하여 멀티채널 오디오 서비스를 제공하는 시스템에 대한 연구를 수행하였다. 이를 위하여 기존의 스테레오 오디오 시스템과 호환성을 가지면서도 적은 비트율의 데이터 추가만으로 멀티채널 오디오 신호의 재현이 가능한 멀티채널 오디오 부호화 기술을 적용하였고, 기존 위성 DMB 단말의 동작에 영향을 주지 않으면서, 멀티채널 오디오 서비스가 제공되는 것을 식별할 수 있도록 하는 시그널링 방법을 개발하여 적용하였다. 연구 결과의 검증을 위하여 위성 DMB 멀티채널 오디오 부호화기 및 단말을 개발하여 방송 실험을 수행하였고, 이를 통하여 제안한 방법으로 위성 DMB 환경에서 멀티채널 오디오 서비스를 효율적으로 제공할 수 있음을 증명하였다.

  • PDF

직교배열법을 이용한 차량 음향 시스템의 음질평가 (An Assessment on the Sound Quality of the Car Audio System Using the Orthogonal Designs)

  • 두세진;최경미
    • 한국음향학회지
    • /
    • 제27권5호
    • /
    • pp.229-238
    • /
    • 2008
  • 음향 튜닝 과정을 통하여 카오디오의 음질은 개선되며 완성차의 품질 또한 향상된다. 하지만 소비자를 대상으로 한 선호도 조사 없이 소비자가 만족하도록 카오디오를 튜닝하는 것은 쉽지 않은 일이다. 소비자의 기호를 조사하기 위하여 주파수 특성, 밸런스, 공간감 등과 같은 매우 다양한 음향특성을 조사해야 하지만, 조사할 음향특성 항목이 많아질수록 비교 청취해야 하는 음원의 수가 급격히 증가하므로 여러 가지 문제점이 발행한다. 평가자의 피로도 증가로 인하여 실험이 어려워질 뿐 아니라, 개개의 음향특성과 전체의 음질의 연관성을 파악하는 것 또한 쉽지 않다. 본 연구에서는 음질 선호도를 조사할 때에 비교 청취되는 음원의 수를 크게 줄일 수 있도록 통계적 직교배열법을 사용하였으며, 분산분석법을 이용하여 청취실험 자료를 분석하였다. 특히, 직교배열법을 사용하여 여덟 가지 음향특성들의 256 가지 조합으로 이루어진 음향 환경을 16가지 비교음원을 사용하여 재생하였다. 분산분석 결과, 팝 음원의 경우에는 Treble이 일반적으로 재생된 음향의 음질 선호도에 가장 유의한 영향을 미치는 음향특성임을 밝혔다. 그 밖에도 Deep Bass와 SAD 및 Treble과 SAD의 교호작용 등이 유의한 음향특성으로 나타났다. 클래식 음원의 경우에는 SAD가 유일하게 유의하게 나타났다.

파라메트릭 스테레오 오디오 부호화를 위한 향상된 위상 합성 기법 (Improved Phase Synthesis for Parametric Stereo Audio Coding)

  • 현동일;박영철;윤대희
    • 전자공학회논문지
    • /
    • 제50권12호
    • /
    • pp.184-190
    • /
    • 2013
  • 파라메트릭 스테레오 오디오 부호화는 공간 오디오 기법 중 스테레오에 특화된 부호화 기법이다. 본 논문에서는 기존의 파라메트릭 스테레오 기법에서 채널간 위상차 합성시 발생하는 문제점을 분석하였다. 기존의 업믹스 행렬에서는 채널간 위상차를 다운믹스 신호뿐만 아니라 잔향신호에도 합성하고 이로 인하여 반위상 관계를 위반한다. 채널간 상관도가 낮을 때, 잔향 성분에 대한 채널간 위상차 합성으로 인하여 발생하는 음질열화를 분석하였다. 이러한 문제점들을 해결하기 위하여 신호 모델을 만족할 수 있도록 주요 성분에만 채널간 위상차를 합성하는 업믹스 행렬을 제안하였다. 주관적 음질 평가를 통하여 제안된 업믹스 행렬의 성능을 검증하였다.