• 제목/요약/키워드: 오디오 신호 개선

검색결과 72건 처리시간 0.021초

잔차 신호 복제 기반 오디오 대역 확장 방법 (Research on audio bandwidth extension using residual signal replication)

  • 임우택;백승권;이태진
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.57-60
    • /
    • 2021
  • 오디오 대역 확장 기술은 저 해상도의 오디오 신호를 고 해상도의 오디오 신호로 복원 또는 생성해 내는 기술이다. 이와 관련하여 오디오 코덱에서는 고 대역 오디오 신호의 저 비트 부호화를 위해 사람이 청각이 둔감하게 인지하는 고 대역의 오디오 신호에 대해 실제 신호에 대한 양자화를 수행하지 않고, 코딩 되어 전송된 저 대역 신호와 고 대역의 파라미터를 이용하여 신호를 합성하는 스펙트럼 대역 복제 기술이 널리 사용된다. 본 연구에서는 선형 예측 기반의 주파수 대역 복제 방법을 통해 추가 정보를 활용한 오디오 대역 확장을 수행하고 신경망 기반의 오디오 신호 개선을 통해 복제된 신호의 개선 가능성을 검토하였다. 실험 평가는 MPEG 에서 코덱 평가용으로 사용되는 테스트 시퀀스를 사용하였으며, 실험 결과 제안하는 방법을 적용하여 기존 오디오 대역 확장 기술 대비 성능이 향상됨을 확인하였다.

  • PDF

잡음에 열화된 오디오 신호의 분석을 통한 효율적인 적응지각필터 반복 수행 계수의 예측 (Prediction of Efficient Adaptive Perceptual Filter Iterate Coefficient through Analysis of Noisy Signal)

  • 류일현;차형태;구교식;서보국
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2005년도 추계학술대회 논문집
    • /
    • pp.238-241
    • /
    • 2005
  • 디지털 미디어 기술의 발전은 코딩 분야를 비롯하여 다양하게 발전하고 있다. 특히 오디오 신호 처리 분야에서는 디지털 오디오 신호의 생성, 압축, 복원의 단계가 다양한 형태로 개발되고 있다. 오디오 신호 처리에서 인간의 청각 기관을 모델링한 심리음향 기법은 이용하여 압축뿐만 아니라 잡음 신호의 개선에서도 효과적으로 이용되고 있다. 이러한 심리음향모델을 기반으로 하여 구성된 적응지각필터는 지각필터를 이용하여 적응적으로 잡음에 열화된 신호를 개선한다. 이때, 적응지각필터 반복 수행 계수의 효과적인 결절은 오디오 신호의 청각적 손실을 줄이는 동시에 정확한 잡음 제거를 수행한다. 성능을 확인하기 위해서 SNR 및 NMR 비교를 수행하였다.

  • PDF

채널 간 중복성을 이용한 다채널 오디오 부호화 (Multichannel Audio Coding using inter-channel Redundancies)

  • 신종인
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.150-154
    • /
    • 1995
  • 기존의 2-채널 오디오 복호화기와 호환성을 유지하기 위해서는 다채널 오디오 부호화기에 할당되는 비트율이 제한되어야 한다. 늘어난 채널 신호에 적은 양의 비트를 할당해줌으로 인해서 복원음의 음질이 저하되는 결과를 초래한다. 따라서 기존의 방법에 신호의 채널 간 중복성을 이용한 다채널 오디오 신호의 음질을 개선시킬 필요가 있다. 본 논문에서는 채널간 중복성을 이용하기 위한 방법으로 적응 채널 간 예측법을 제안하였다. 적응 채널 간 예측법은 주로 저주파 대역에서 스테레오 신호 간에 존재하는 중복된 정보를 제거하고자 하는 방법이다. 저주파 대역에서는 큰 예측 이득을 얻을 수 있어서 스테레오 음상에 불필요한 정보를 없애는데 유리하다. 기존의 방법과 제안된 예측 부호화법을 비교해 보면 두 신호의 상관 관계가 클수록 개선폭이 증가함을 알 수 있으며 낮은 비트율에서 기존이 부호화기가 처리하기 어려운 광대역 신호에 대해서 음질이 개선되는 결과를 얻었다.

  • PDF

음성통신망에서 디지털 오디오 신호 음질개선을 위한 전처리방법 (Preprocessing method for enhancing digital audio quality in speech communication system)

  • 송근배;안철용;김재범;박호종;김석호
    • 방송공학회논문지
    • /
    • 제11권2호
    • /
    • pp.200-206
    • /
    • 2006
  • 본 논문은 음성 부호화기에서 입력 오디오 신호가 보다 효과적으로 처리되도록 하기 위해 입력오디오신호를 전 처리하는 방법을 소개한다. 이를 위해 본 논문은 잡음억제 및 적응이득제어 방법을 도입한다. 여기서 입력 오디오 신호는 잡음 부가된 신호로 간주되며 그 오디오 신호의 부호화오차신호는 부가된 잡음신호로 간주된다. 입력 오디오 신호는 기존의 잡음억제방식에 따라 잡음신호 즉, 부호화 오차신호가 억제된 뒤 적응이득제어기를 거쳐 최종적으로 음성 부호화기에 인가된다. 결과적으로 이러한 동작을 통하여 입력 오디오 신호의 주파수 스펙트럼 분포가 음성 부호화기 특성에 맞게 재배치된다 이 방법의 하나의 단점은 부호화 오차를 계산하기 위해 사전에 추가적인 부호화 동작이 필요하다는 것이다. 반면, 이 방법은 일반적인 구조를 가지고 있으며 따라서 기존의 여러 음성부호화기에 쉽게 적용될 수 있다는 장점을 가진다. 주관적인 선호도 조사결과 제안된 방법이 복잡한 음악신호로 기인한 성가신 잡음을 사전에 억제해 주며 결과적으로 음질개선을 가져다준다는 것을 확인할 수 있었다.

LSB 기법을 이용하는 개선된 오디오 스테가노그래피 (The Improved-Scheme of Audio Steganography using LSB Techniques)

  • 지선수
    • 한국산업정보학회논문지
    • /
    • 제17권5호
    • /
    • pp.37-42
    • /
    • 2012
  • 오디오 스테가노그래피는 오디오 매체(신호)에 암호화된 비밀 메시지를 은닉하여 전송하는 일반적이고, 폭넓게 이용되는 통신기법이다. 인간은 청각시스템의 지각능력의 한계 때문에 커버 오디오 파일과 스테고 오디오 파일의 지각품질(perceptual quality) 차이는 없다. 또한 공격자로부터의 안전성과 견고성 측면에서 LSB 기법은 디지털화된 오디오 신호에 메시지를 삽입하는 효율적이고, 경제적인 방법으로 널리 이용되고 있다. 이 논문에서는 LSB 기법을 기반으로 하고, 디지털화된 비밀 메시지의 비트별 위치를 변경하고, 암호화한 후 커버 오디오 매체에 은닉하는 개선된 방법을 제시한다.

컨벌루션 신경망을 이용한 공간큐 기반 다채널 오디오 확장 기술

  • 백승권;임우택;이태진
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 하계학술대회
    • /
    • pp.153-155
    • /
    • 2019
  • 본 논문에서는 컨볼루션 신경망을 이용하여 예측 된 공간 오디오 큐를 이용한 오디오 채널 확장 기술을 소개한다. 오디오 채널 확장 기술은 일반적인 스테레오 신호에 적용되어 5.1 레이아웃과 같은 고차원 오디오 신호를 생성하는 기술이다. 스테레오 신호에서 채널을 확장하기 위해 스테레오 신호에서 공간 큐를 예측하고 예측 공간 큐의 방향에 따라 5.1 채널 신호의 스펙트럼 구성 요소를 할당하여 다중 채널 신호를 합성한다. 제안된 방식으로 생성된 5.1 채널 신호는 원 5.1 채널과 유사한 공간 정보 합성 능력과 스테레오 대비 주관적 선호도가 개선된 음질을 제공한다.

  • PDF

MPEG 오디오 부호화 바업의 성능 향상 (Improved MPEG-Audio Coding Method)

  • 신종인
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.183-187
    • /
    • 1994
  • ISO/MPEG 에서는 스테레오 신호만을 부호화할 수 있는 MPEG-1 오디오 부호화 방법을 5.1 채널의 다채널 신호로 확장한 MPEG-2 오디오 방법을 제안하였다. 압축해야 될 신호가 증가하면서 MPEG에서는 채널 내의 부호화 방법으로는 MPEG-1에서 제안된 방법을 사용하고, 부가적으로 채널 간의 부호화 방법을 이용하여 MPEG-1과 호환이 가능하도록 하는 부호화 방법을 다방면에 걸쳐서 연구하여 표준화 작업을 진행하고 있다. 본 논문에서는 MPEG 오디오 부호화 방법을 두가지 측면에서 효율적으로 향상시키는 방법을 제안하고자 한다. 첫 번째는 MPEG에서 제안한 오디오 부호화 알고리듬을 개선하여 음질과 비트율에 있어 향상시키는 것으로 각 서브밴드의 비트 할당 방법과 시간 영역에서의 마스킹 효과 등을 사용한 심리음향 모델 등의 개선 방법이 제안되었다. 두 번째 방법은 부호화기의 계산량을 감소시키는 방법으로 심리음향 모델이나 비트 할당시의 계산과정에 있어 반복적인 과정은 시간 여역에서의 중복성을 이용하여 계산량에 대한 향상을 얻을 수 있었다.

  • PDF

적응 지각 필터를 이용한 오디오 음질 개선 알고리즘 (Audio Enhancement Algorithm Using Adaptive Perceptual Filter)

  • 엄혜영;한헌수;홍민철;차형태
    • 한국음향학회지
    • /
    • 제22권8호
    • /
    • pp.687-693
    • /
    • 2003
  • 본 논문에서는 적응적인 방식으로 필터의 성능을 향상시킴으로써 잡음에 의해 열화된 오디오 신호의 음질을 개선하는 알고리즘을 제안한다. 주파수 영역으로 변환된 잡음에 의해 열화된 신호를 바크 대역으로 분할하여 청각 자극 에너지를 계산하고, 필터를 적응적으로 적용하여 잡음 에너지를 제거함으로써 본래의 신호를 획득하는 방식을 사용하였다. 기존의 방식에서는 묵음 구간에서 획득한 잡음 에너지를 사용하여 필터를 구성하여 사용하며, 이때 잡음의 에너지가 급격하게 변화한다면 음질의 개선률이 급격하게 감소함을 알 수 있다. 그러나 제안하는 방식에서는 잡음 에너지가 급격하게 변화하여도 음질 개선률에는 변화가 적음을 알 수 있었다. 기존 방식과의 비교를 위하여 신호대 잡음비와 잡음대 마스킹비를 비교하였고 청각 테스트를 수행하여 그 결과로부터 향상된 음질 개선을 확인할 수 있었다.

시간 영역에서의 효율적인 오디오 워터마크 추출 (An Efficient Audio Watermark Extraction in Time Domain)

  • 강혜원;정성환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (하)
    • /
    • pp.1937-1940
    • /
    • 2003
  • 본 논문은 기존의 오디오 워터마킹 추출과정을 수정함으로써 원 신호의 영향을 크게 줄이고 추출과정에서 효율성을 높이는 방법을 제안한다. 즉, 추출과정에서 전 처리 과정으로 원 신호와 유사한 신호를 제거하기 위해 간단한 저주파 필터의 사용과, 워터마크의 반복삽입을 통해 추출의 효율성을 향상시킨다. 몇가지 실제 오디오 데이터를 이용하여 실험한 결과, 약 79%의 워터마크 검출율 개선을 얻었다.

  • PDF

차세대 실감 방송의 구현을 위한 심리 음향의 이해 (Towards a better understanding of psychoacoustics in the future broadcasting)

  • 김성영
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2004년도 정기총회 및 학술대회
    • /
    • pp.215-219
    • /
    • 2004
  • 차세대 실감 방송에서의 오디오 신호는 정보의 전달이라는 기존의 역할을 넘어서 현장감의 재현이라는 실감 방송의 목표를 구현하는 역할을 감당하게 될 것이다. 이 논문에서는 이러한 차세대 실감 방송에서 오디오 신호가 가지는 심리음향학적인(psychoacoustic) 특성을 방송현장의 운용자들을 위해 기존의 연구들에 근거하여 선명하였다. 차세대 방송은 첫째, 멀티채널 오디오 방송, 둘째, 고 해상도 데이터의 활용 그리고 셋째, 멀티 모달 전송로 특정지울 수 있는 새로운 오디오 산업의 기술진행 방향을 통해, 방송으로 전달되어지는 객체에 대하여 개선된 정위(localization), Envelopment 명료도(Clarity)등의 개선된 심리음향학적인 특성을 가지게 한다. 이와 같은 심리음향학적인 개선은 운용자의 올바른 개념적인 이해와 결합하여 보다 현장감 넘치는 방송을 청취자들에게 가져다 줄 것이다.

  • PDF