• 제목/요약/키워드: 오디오 신호 처리

검색결과 148건 처리시간 0.028초

멀티채널 오디오 압축 코덱 음질의 객관적인 측정방법 (Objective measurement of spatial auditory quality for multi channel audio codecs)

  • 최인용;전상배;성굉모
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2005년도 추계종합학술대회
    • /
    • pp.431-434
    • /
    • 2005
  • 본 논문은 멀티채널 오디오 압축 코덱의 음질을 객관적으로 평가할 수 있는 시스템 및 파라메터에 관한 것으로, 멀티채널 오디오 신호로부터 양이입력신호(ear input signals)를 만들어내는 전처리 과정과 이 과정을 통해 출력되는 양이입력신호로부터 양이레벨차이왜곡(inter-aural level difference distortion)을 구하는 과정 및 양이레벨차이왜곡이 청취평가 결과와 일관적인 상관관계를 보임을 서술한다. 본 연구에 의하면 멀티채널 오디오 압축 코덱의 음질을 선별된 청취자에 의한 주관적인 평가와 통계처리 없이 객관적인 측정만을 통해 평가하는 것이 가능하며, 이를 사용하면 멀티채널 오디오 압축 코덱 개발자들이 시간, 경제적 부담 없이 자신이 개발한 압축 코덱의 음질을 간단하게 평가해볼 수 있다.

  • PDF

음악 및 음성 신호의 융합 압축 기술 (Unified coding scheme of speech and music)

  • 오은미
    • 방송과미디어
    • /
    • 제16권4호
    • /
    • pp.59-71
    • /
    • 2011
  • 오디오와 음성 압축 기술적 근간은 서로 다르지만, 최근의 모바일 멀티미디어 기기 시장의 컨버전스 현상에 따라 압축하고자 하는 신호가 혼용되고 있으며, 비슷한 목표 전송률과 음질로 수렴하고 있다. 현재는 동일 기기에서 서로 다른 압축 기술을 적용하고 있으나, 음성과 음악이 동시에 서비스 되는 멀티미디어 기기에서는 단일 압축 방식으로 처리하고자 하는 이슈가 부각되고 있다. 특히, 스마트 폰 및 음악 콘텐츠 포탈 서비스의 대중화를 고려할 때, 음성 및 음악 신호 모두를 효율적으로 압축하는 음악 및 음성 신호의 융합 압축 기술이 더욱 필요해 보인다. 본 고에서는 MPEG 오디오 그룹에서 가장 최근 진행한 Unified Speech and Audio Coding(USAC)의 탄생 배경 및 표준화 현황을 소개한다. USAC는 64kbps 이하에서 기술적으로 최고 성능을 지닌 AMR-WB+ 및 HE-AAC v2보다도 우월한 음질을 보이며, 높은 비트율에서도 동등한 음질을 보장한다. 이런 우수한 음질에 기여한 USAC의 스위칭 구조와 더불어 기술적으로 향상된 주요 모듈인 파라미터 기반 스테레오 및 고주파 압축, 그리고 엔트로피 코딩 방식에 대해서 살펴 본다. 향후, 다양한 오디오 신호를 효율적으로 압축하는 USAC는 디지털 라디오, 모바일 TV, 그리고 오디오 북과 같은 사용자 시나리오에서 사용될 확률이 높아 보인다. 또한, USAC는 배경 잡음이나 배경 음악이 있는 경우에도 성능이 우수하기 때문에 YouTube 및 podcast 등과 같이 사용자가 콘텐츠를 생성할 때도 유용하게 사용 될 수 있다.

3차원 오디오 시스템에서 합과 차 여파기를 이용한 새로운 광대억 간섭신호 제거 방법 (A New Robust Acoustic Crosstalk Cancellation Method with Sum and Difference Filter in 3D Audio System)

  • 김래훈;임준석;성굉모
    • 한국음향학회지
    • /
    • 제20권4호
    • /
    • pp.17-21
    • /
    • 2001
  • 현재 라우드스피커를 이용하는 3차원 오디오 시스템에서의 간섭신호를 제거함으로써 최적 청취 영역 (sweet spot)을 넓히는 여러 가지 방법들이 제안되어 있다. 그러나 기존의 방법들은 간섭신호를 제거할 수 있는 주파수가 제한되어 최적 청취 영역 형성이 제한되는 단점을 공통적으로 가지고 있다. 특히, 저주파 대역의 간섭신호를 제거하지 못하는 본질적인 문제점을 가지고 있다. 본 논문에서는 기존의 시스템보다 훨씬 넓은 주파수 대역에서 간섭신호를 효과적으로 제거할 수 있는 새로운 광대역 간섭신호제거 방법을 제안한다. 이 방법은 세 개의 라우드스피커를 이용한 방법에 합과 차 여파기를 적용하였다.

  • PDF

시간축 변형을 고려한 디지털 오디오의 계층적 워터마크 (Robust Layered Watermarking of Digital Audio for Possible Timing Changes)

  • 정사라;홍진우
    • 한국음향학회지
    • /
    • 제21권8호
    • /
    • pp.719-726
    • /
    • 2002
  • 본 논문에서는 디지털 오디오 신호에 부가 정보를 삽입하는 기술로써 계층적 워터마크를 사용하여 시간축 변형을 감지할 수 있고, 필요에 따라 검출 복잡도를 조절할 수 있는 기법을 제안한다. 1계층 워터마크는 오디오신호의 시간축 변형을 감지할 수 있도록 오디오 신호의 반향을 이용하고, 2계층 워터마크는 1계층 워터마크된 오디오 신호를 기준으로 대역 확산 기법을 이용하여 저작권 정보 등의 요구량이 많은 부가 정보를 삽입한다. 이 때, 2계층 워터마크는 프레임의 동기 확보를 위한 동기 수열, 다른 하나는 부가 정보 삽입을 위한 데이터 수열, 두 개를 이용한다 검출기에서는 시스템의 요구 사항에 따라 1계층, 2계층 전단계, 2계층 본단계 등의 계층적 순서로 검출할 수 있으며, 각 계층은 데이터에 가해진 변형 정도를 추정하여 다음 계층의 검출단에 정보를 제공한다. 여러 가지 실험 결과를 통하여 제안한 방식이 다양한 신호 처리에 강인함을 보였다.

자동 이득 제어기를 적용한 5-밴드 디지털 오디오 그래픽 이퀄라이저 설계 (Design of the 5-band Digital Audio Graphic Equalizer adopted Automatic Gain Controller)

  • 김태형;김환용
    • 한국컴퓨터산업학회논문지
    • /
    • 제3권1호
    • /
    • pp.27-34
    • /
    • 2002
  • 네트워크와 IT산업의 급속한 발전과 더불어 정보통신에 대한 관심이 매우 커지고 있다. 정보통신 분야에서는 주로 디지털 신호가 사용되므로 아날로그 신호를 디지털 신호로 변환하여야 한다. 그러나 음성이나 영상과 같은 자연상태의 아날로그 신호가 디지털 신호로 변환될 때 발생하는 왜곡을 제거하는 것은 매우 어려운 과정이다. 원음 또는 각자 취향에 맞는 음질을 발생시키기 위해서 기존의 오디오 그래픽 이퀄라이저는 매우 복잡한 과정을 통하여 고차의 필터 계수 및 이득을 계산하였다. 그러므로 이러한 요구사항을 만족시키기 위해서 는 시스템이 복잡하여 경제성이 떨어지고 타 시스템 내부에 장착할 수가 없었다. 본 논문에서는 오디오 음질의 개선과 시스템 성능향상 및 내부 장착이 가능한 새로운 디지털 오디오 그래픽 이퀄라이저를 설계하였다. 또한 필터 계수 및 이득을 자동으로 처리함으로써 실시간 처리가 가능하고 음질이 향상되도록 하였다.

  • PDF

GAN으로 합성한 음성의 충실도 향상 (Improving Fidelity of Synthesized Voices Generated by Using GANs)

  • 백문기;윤승원;이상백;이규철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권1호
    • /
    • pp.9-18
    • /
    • 2021
  • 생성적 적대 신경망(Generative Adversarial Networks, GANs)은 컴퓨터 비전 분야와 관련 분야에서 큰 인기를 얻었으나, 아직까지는 오디오 신호를 직접적으로 생성하는 GAN이 제시되지 못했다. 오디오 신호는 이미지와 다르게 이산 값으로 구성된 생플링된 신호이므로, 이미지 생성에 널리 사용되는 CNN 구조로 학습하기 어렵다. 이러한 제약을 해결하고자, 최근 GAN 연구자들은 오디오 신호의 시간-주파수 표현을 기존 이미지 생성 GAN에 적용하는 전략을 제안했다. 본 논문은 이 전략을 따르면서 GAN을 사용해 생성된 오디오 신호의 충실도를 높이기 위한 개선된 방법을 제안한다. 본 방법은 공개된 스피치 데이터세트를 사용해 검증했으며, 프레쳇 인셉션 거리(Fréchet Inception Distance, FID)를 사용해 평가했다. 기존의 최신(state-of-the-art) 방법은 11.973의 FID를, 본 연구에서 제안하는 방법은 10.504의 FID를 보였다(FID가 낮을수록 충실도는 높다).

육상 이동 라디오 시스템용 호처리기 IC (A Signaling Processor IC for Land Mobile Radio System)

  • 전형근;김종문;송호준
    • 한국통신학회논문지
    • /
    • 제24권10A호
    • /
    • pp.1588-1596
    • /
    • 1999
  • 본 논문에서는 육상 이동 라디오 시스템을 호처리기 IC에 관하여 논한다. 본 IC는 육상 이동 라디오 시스템간의 호처리를 위하여 CTCSS 톤 또는 DCS 코드를 발생시키는 기능과 이를 다시 해독하여 음성경로를 개폐하는 기능을 수행한다. 호처리를 위한 CTCSS 톤 및 DCS 코드 신호는 서브오디오 대역에 위치하며 음성신호와 함께 전송된다. 오디오 및 서브오디오 경로는 스위치드 커패시터 필터로 구성되어 있다. 본 IC는 0.6-$\mu\textrm{m}$ CMOS 공정으로 구현되었으며 전체 칩 크기는 3 mm$\times$4.3 mm 이며 3.3 V에서 dir 3.4 mA의 전류를 소모한다.

  • PDF

회의실의 명료성(STI) 향상을 위한 오디오신호 처리 및 시스템 설계 (Audio Signal Processing and System Design for improved intelligibility in Conference Room)

  • 강철용;이석주;조광연;이선희
    • 한국인터넷방송통신학회논문지
    • /
    • 제17권2호
    • /
    • pp.225-232
    • /
    • 2017
  • 최근에 오디오 신호의 디지털 전송기술의 발전 및 디지털 전송기술을 이용한 오디오 네트워크 장비들의 출시가 이루어지고 있다. 이에 따라 음향시스템의 설계 및 시공에 있어서도 오디오 네트워크 기술 및 장비의 적용이 적극적으로 이루어지고 있다. 회의실이라는 공간은 다수의 참가자가 상호의견교환 및 의사전달을 하는 공간으로, 발언내용이 참석자에게 잘 전달되어야 한다. 마이크 및 스피커 등의 전기음향 장치를 이용하는 것 만 아니라 오디오 네트워크를 이용한 사례를 통해 회의실의 명료도 향상을 개선하고 실제 사례를 통해 오디오 네트워크를 이용한 음향시스템 설계의 적용과 향후 발전방향을 전망한다.

엔트로피 모델을 활용한 심층 신경망 기반 오디오 압축 모델 최적화 (DNN-based Audio Compression Model Optimization Utilizing Entropy Model)

  • 임형섭;강홍구;장인선
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.54-57
    • /
    • 2022
  • 본 논문에서는 심층 신경망 기반 점진적 다계층 오디오 코덱의 비트 전송률 효율 향상을 위한 엔트로피 모델 기반 양자화 방식을 제안한다. 최근 심층 신경망을 이용하여 전통적인 신호 처리 이론 기반의 상용 오디오 코덱들을 대체하기 위한 오디오 압축 및 복원 시스템에 관한 연구가 활발하게 이루어지고 있다. 그러나 아직은 기존 상용 코덱의 성능에 도달하지 못하고 있으며 특히 종단 간 오디오 압축 모델의 경우, 적은 정보량으로 높은 품질을 얻기 위해서는 부호화기의 양자화 구조를 개선하는 것이 필수적이다. 본 연구에서는 기존에 제안된 종단 간 오디오 압축 모델 중 하나인 점진적 다계층 오디오 코덱의 벡터 양자화기를 엔트로피 모델 기반 양자화기로 대체하고 전송률-왜곡 트레이드오프 관계를 활용하여 전송률을 다양한 형태로 조절할 수 있음을 보임으로써 엔트로피 모델 기반 양자화기 도입의 타당성을 검증한다.

  • PDF

내용기반 오디오 장르 분류를 위한 신호 처리 연구 (A Study on the Signal Processing for Content-Based Audio Genre Classification)

  • 윤원중;이강규;박규식
    • 대한전자공학회논문지SP
    • /
    • 제41권6호
    • /
    • pp.271-278
    • /
    • 2004
  • 본 논문에서는 디지털 신호처리를 이용하여 Classic, Hiphop, Jazz, Rock, Speech 등 5개의 오디오 장르를 자동적으로 분류하는 내용기반 오디오 장르 분류기를 제안하였다. 20초 분량의 질의 오디오로부터 23ms 크기의 Hamming window를 이동시켜 가며 Spectral Centroid, Rolloff, Flux 등 STFT 기반의 특징 계수들과 MFCC, LPC 등의 계수들을 구하여 총 54차에 해당하는 특징 벡터 열을 추출하였으며 분류 알고리즘으로는 k-NN, Gaussian, GMM 분류기를 사용하였다. 최적의 특징 벡터를 선별하는 알고리즘으로 총 54차의 특징벡터 중 가장 성능이 좋은 특징 계수들을 찾아 순차적으로 재배치하는 SFS(Sequential Forward Selection)방법을 사용하였고, 이를 이용하여 최적화 된 10차의 특징 벡터만을 선정해서 오디오 장르 분류에 사용하였다. SFS를 적용한 실험 결과 약 90% 가까운 분류 성공률을 보이고 있어 기존 연구에 비하여 약 10%∼20% 정도의 성능 향상을 꾀 할 수 있었다. 한편 실제 사용자들이 오디오 자동 장르 분류 시스템을 사용할 때 일어날 수 있는 상황을 가정하여 임의 구간에서 질의 데이터를 추출하여 실험을 수행하였으며 실험 결과 오디오 파일의 맨 앞과 맨 뒤 등 worst-case 질의를 제외하고는 약 80%대의 분류 성공률을 얻을 수 있었다.