• 제목/요약/키워드: 공간 오디오 부호화

검색결과 11건 처리시간 0.019초

복소 공간큐를 활용한 다채널 오디오 코딩 기술 (Complex Spatial Cue based Channel Audio Coding)

  • 백승권;임우택;이태진
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.58-60
    • /
    • 2022
  • 본 논문에서는 복소(complex) 공간큐를 활용한 다채널 오디오 부호화 기술을 제안한다. 복소 공간큐 방식의 다채널 오디오 부호화 기술은 시간영역에서 수행된다. 시간영역의 오디오 채널 신호를 복소 데이터로 변환하여 각 오디오 채널 간의 상관관계를 복소 공간큐로 표현하고, 이를 활용하여 채널 부호화를 수행하기 위한 오디오 채널 신호를 생성한다. 참조 기술로는 최고 성능의 오디오 코덱인 USAC의 예측 부호화 방식의 다채널 오디오 부호화 기술과 비교하여 정보량 감축 측면에 있어서 평균 2.24 dB 이상의 높은 SNR을 나타냄을 관측할 수 있었다.

  • PDF

다채널 오디오 코딩을 위한 MPEG Surround-1부: 기본 구조 (MPEG Surround for Multi-Channel Audio Coding-Part 1: Basic Structure)

  • 방희석
    • 한국음향학회지
    • /
    • 제28권7호
    • /
    • pp.599-609
    • /
    • 2009
  • 최근 국제 표준으로 등록된 MPEG의 다채널 오디오 코딩 기술인 MPEG Surround에 대해 소개한다. 이 오디오 표준은 멀티채널 신호를 다운믹스하여 모노나 스테레오 신호를 생성하고 동시에 공간 파라미터를 추출하는 방법을 이용하여 부호화 과정을 수행한다. 복호화 과정에서는 다운믹스 신호와 공간 파라미터들을 사용하여 다채널 신호를 생성하는데, 다운믹스 신호는 AAC나 MP3등 일반 오디오 코딩 방법에 의해 부호화하며 공간 파라미터들도 매우 낮은 정보량을 사용하기 때문에 전체적으로 매우 적은 비트율을 사용하여 고음질의 신호를 생성할 수 있다는 장점이 있다. 또한, 공간 파라미터들을 무시할 경우 휴대용 오디오 재생 기기에서 다운믹스 신호를 재생할 수 있으므로 기존 코딩 방법에 대해 역방향 호환성을 가진다. 본 논문의 1부에서는 MPEG Surround의 기본 구조에 대해 소개하고, 이어지는 2부에서는 헤드폰이나 이어폰을 이용하여 가상의 5.1 채널을 지원하는 바이노럴 모드를 포함해 다양한 모드와 툴들에 대해 소개한다. 여러 회사와 기관들에 의해 수행된 청취 평가의 결과도 함께 보이고 있다.

MPEG-2 오디오 부호화기 설계 (Design of An MPEG-2 Audio Encoder Chip)

  • 정남훈
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.205-208
    • /
    • 1998
  • 본 논문에서는 VLSI 기술에 바탕을 둔 top-down 접근 방식에 의하여 MPEG-2 오디오 부호화 알고리듬을 구현하였다. MPEG-2 오디오 부호화기의 알고리듬은 많은 연산량을 갖고 이질적인 특성을 갖고 이질적인 특성을 갖는 알고리듬들이 복합적으로 존재한다. 그러므로, 부호화기를 효과적으로 구현하기 위해서는 알고리듬 수준에서 구조적 수준에 이르기까지 많은 고찰이 이루어져야 한다. 본 논문에서는 우선 전체 부호화 알고리듬을 분석하여 이들을 다시 작업이라고 정의된 작은 부-알고리듬으로 나누었다. 다음으로, 분할된 작업들은 시간과 공간을 초대한 활용할 수 있도록 적절한 작업 순서를 부여하고, 좀 더 큰 모듈들로 모으는 클러스터링을 수행하였다. 마지막으로 이러한 분석 결과를 바탕으로, 실시간으로 동작하는 5.1 채널 MPEG-2 오디오 부호화기를 설계하였다. 설계된 시스템은 두 개의 하드웨어 블록과 한 개의 ASIP형 DSP 프로세서를 갖는 이질적인 다중 프로세서의 형태를 갖는다. 설계된 오디오 부호화기는 0.6$\mu\textrm{m}$ 표준 셀 기술을 이용하여 단일 칩으로 제작되었으며, PC에 탑재 가능한 시험 기판을 제작하여 동작을 검증하였다.

  • PDF

반위상 주요성분에 기반을 둔 개선된 음수 채널간 상관도 파라미터 합성 기법 (Improved Synthesis Method of Negative Inter-channel Correlation Parameter Based on Anti-phase Primary Component)

  • 현동일;이석필;박영철;윤대희
    • 한국음향학회지
    • /
    • 제31권6호
    • /
    • pp.410-418
    • /
    • 2012
  • 파라메트릭 스테레오와 MPEG 서라운드는 대표적인 공간 오디오 부호화 기법이다. 본 논문에서는 기존의 공간 오디오 부호화 기법에서 채널간 상관도 합성의 문제점을 분석하였다. 기존의 방법에서는 출력신호에 합성되는 주요성분들은 서로 동위상 관계에 있는 반면 잔향성분들은 서로 반위상 관계에 있다고 가정하고 있다. 음수 채널간 상관도에 대해서 이러한 가정은 잔향성분을 과도하게 포함하도록 하는 문제점을 야기할 수 있다. 이에 대한 해결책으로 음수 채널간 상관도를 가지는 경우에 대해서는 주요성분들이 반위상 관계에 있다는 가정을 기반으로 새로운 채널간 상관도 합성 기법을 제안하였다. 제안된 기법은 실제 부호화 및 복호화기에서 동작하는 근사화 과정에도 적용되었다. 컴퓨터 시뮬레이션을 통하여 제안된 기법의 성능을 평가하였으며 주관적 청취 실험을 통하여 제안된 방법이 헤드폰 환경뿐만 아니라 스피커 환경에서도 효과적으로 동작함을 검증하였다.

채널 간 위상차 파라미터 생략 기법을 이용한 오디오 부호화 (An Audio Coding Technique Employing the Inter-channel Phase Difference Skip)

  • 김현휘;김인철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 하계학술대회
    • /
    • pp.3-4
    • /
    • 2015
  • 본 논문에서는 공간 오디오 부호화 기법인 MPEG 서라운드에서 공간 파라미터 전송 시 위상 파라미터를 생략하는 기법에 대해 다룬다. 기존 방법에서는 한 프레임이 모두 적은 위상차를 가지는 경우에도 정상적으로 처리하여 전송한다. 이러한 경우 위상차 파라미터를 생략하여 비트 효율을 향상시킬 수 있다. 스테레오 복원 과정에서 발생하는 채널 간 시간차에 기반해 설계된 양자화기를 생략 기법에 적용하면 기존에 비해 평균적으로 40 ~ 50% 정도의 위상 파라미터 절감 효과를 얻을 수 있다.

  • PDF

MPEG-I Immersive Audio 표준화 및 기술 동향 (Standardization of MPEG-I Immersive Audio and Related Technologies)

  • 장대영;강경옥;이용주;유재현;이태진
    • 전자통신동향분석
    • /
    • 제37권3호
    • /
    • pp.52-63
    • /
    • 2022
  • Immersive media, also known as spatial media, has become essential with the decrease in face-to-face activities in the COVID-19 pandemic era. Teleconference, metaverse, and digital twin have been developed with high expectations as immersive media services, and the demand for hyper-realistic media is increasing. Under these circumstances, MPEG-I Immersive Media is being standardized as a technologies of navigable virtual reality, which is expected to be launched in the first half of 2024, and the Audio Group is working to standardize the immersive audio technology. Following this trend, this article introduces the trend in MPEG-I immersive audio standardization. Further, it describes the features of the immersive audio rendering technology, focusing on the structure and function of the RM0 base technology, which was chosen after evaluating all the technologies proposed in the January 2022 "MPEG Audio Meeting."

파라메트릭 스테레오 오디오 부호화를 위한 향상된 위상 합성 기법 (Improved Phase Synthesis for Parametric Stereo Audio Coding)

  • 현동일;박영철;윤대희
    • 전자공학회논문지
    • /
    • 제50권12호
    • /
    • pp.184-190
    • /
    • 2013
  • 파라메트릭 스테레오 오디오 부호화는 공간 오디오 기법 중 스테레오에 특화된 부호화 기법이다. 본 논문에서는 기존의 파라메트릭 스테레오 기법에서 채널간 위상차 합성시 발생하는 문제점을 분석하였다. 기존의 업믹스 행렬에서는 채널간 위상차를 다운믹스 신호뿐만 아니라 잔향신호에도 합성하고 이로 인하여 반위상 관계를 위반한다. 채널간 상관도가 낮을 때, 잔향 성분에 대한 채널간 위상차 합성으로 인하여 발생하는 음질열화를 분석하였다. 이러한 문제점들을 해결하기 위하여 신호 모델을 만족할 수 있도록 주요 성분에만 채널간 위상차를 합성하는 업믹스 행렬을 제안하였다. 주관적 음질 평가를 통하여 제안된 업믹스 행렬의 성능을 검증하였다.

채널 간 위상차 파라미터 생략 기법을 이용한 오디오 부호화 (An Audio Coding Technique Employing the Inter-channel Phase Difference Skip)

  • 김현휘;김인철
    • 방송공학회논문지
    • /
    • 제21권3호
    • /
    • pp.369-379
    • /
    • 2016
  • 본 논문에서는 음성/음악 통합 압축 기술(USAC)에 적용된 공간 오디오 부호화 기법인 MPEG 서라운드에서 채널 간 위상차(IPD) 파라미터를 효과적으로 생략하는 기법에 대해 다룬다. 기존의 방법에서는 파라미터 밴드의 IPD 파라미터가 모두 작은 경우에도 전체를 처리하여 전송한다. 이러한 경우 생략을 통해 비트 효율을 향상시킬 수 있다. IPD 파라미터의 심리음향적 민감도를 고려하여 청취 환경에서 인지하지 못하는 문턱 값을 추정하고, 문턱 값 아래의 위상차를 발생시키는 IPD 파라미터는 0으로 설정하고 전송하지 않는다. 제안하는 채널 간 위상차 파라미터 생략 기법을 적용하면 기존에 비해 38% 정도의 위상 파라미터 절감 효과를 얻을 수 있고, MUSHRA 청취 실험을 통해 복호화된 오디오의 음질 하락이 없음을 보인다.

오디오의 Peak 특징을 이용한 동일 영화 콘텐츠 검색 (Similar Movie Contents Retrieval Using Peak Features from Audio)

  • 정명범;성보경;고일주
    • 한국멀티미디어학회논문지
    • /
    • 제12권11호
    • /
    • pp.1572-1580
    • /
    • 2009
  • 검색을 위해 동영상 데이터 전체를 이용하면 많은 시간과 저장 공간이 필요하다. 이를 보완하고자 기존의 동일 영화 검색은 영상 정보의 일부를 이용하여 동일한 영상 검색에 사용해 왔다. 그러나 이 방법은 같은 영상임에도 비디오 부호화기이나 해상도가 다른 경우 전혀 다른 영상으로 인식한다. 따라서 본 논문에서는 동영상의 오디오 정보를 이용하여 동일한 동영상을 찾는 알고리즘을 제안한다. 제안 방법은 부호화율, 부호화기, 샘플링 수의 변화에도 유사한 파형을 형성하는 Peak 정보를 바탕으로 데이터베이스에 색인하고, 검색한다. 논문에서는 제안 방법의 성능을 확인하기 위해 1,000개의 동영상 데이터를 검색 실험하였으며, 92.1%의 성공률을 나타내었다.

  • PDF

MPEG-I AEP 기반 실시간 6 자유도 공간음향 렌더링 시스템 (A Real Time 6 DoF Spatial Audio Rendering System based on MPEG-I AEP)

  • 강경옥;유재현;장대영;이용주;이태진
    • 방송공학회논문지
    • /
    • 제28권2호
    • /
    • pp.213-229
    • /
    • 2023
  • 본 논문에서는 가상환경에 위치한 청취자의 움직임에 대응하여 실시간으로 6DoF 공간음향을 제공하는 공간음향 렌더링 시스템에 대해 소개한다. 본 시스템은 MPEG-I Immersive Audio CfP 대응을 위하여 MPEG-I AEP를 개발환경으로 사용하여 구현되었으며 인코더와, 디코더를 포함하는 렌더러로 구성된다. 인코더는 인코더 입력 포맷(EIF) 파일에 포함된 가상공간 장면의 공간적 오디오 파라미터와, SOFA 파일로 제공되는 음원의 지향성 정보 등의 메타데이터를 오프라인으로 부호화하여 비트스트림으로 전달하는 역할을 하며, 렌더러는 전달된 비트스트림을 수신하여 청취자의 위치에 따라 실시간으로 6DoF 공간음향 렌더링을 수행한다. 개발된 렌더링 시스템에 적용한 주요 공간음향 처리 기술로는 음원 효과 및 장애물 효과 처리 기술이 있으며, 그 외 시스템 동작에 필요한 기술로는 도플러 효과 및 음장효과 처리 기술 등이 있다. 개발된 시스템에 대한 성능평가 결과로서 자체 주관평가 결과를 소개한다.