• Title/Summary/Keyword: audio format

검색결과 94건 처리시간 0.022초

사용자 기반 실감 객체 오디오 파일 포맷 및 오디오 장면 묘사 기법 (An User Controllable Object Audio File Format and Audio Scene Description)

  • 조충상;김제우
    • 대한전자공학회논문지SP
    • /
    • 제47권5호
    • /
    • pp.25-33
    • /
    • 2010
  • 최근의 오디오 기술은 사용자 중심으로 변화하고 있으며, 사용자의 환경과 의도에 따라 능동적으로 서비스가 이루어지는 대화형 오디오 서비스 시대로 변화하고 있다. 이에 맞추어 시장에서는 고품질 오디오 서비스를 위한 무손실 오디오 기술을 탑재한 멀티미디어 기기와 사용자가 선택적으로 악기를 조절할 수 있는 객체 오디오 음원 서비스가 이루어지고 있다. 본 논문에서는 사용자가 컨트롤 할 수 있는 실감 객체 오디오 파일 포맷을 설계하고 실감 정보를 낮은 복잡도에서 저장 매체와 전송 매체에 적용 가능한 오디오 장면 묘사 방법을 제안한다. 설계된 실감 객체 오디오 파일 포맷은 MPEG-4 파일 포맷을 기반으로 설계되었다. MPEG-4 파일 포맷은 MPEG-4에 속하는 고성능 오디오 코덱을 오디오 코덱 객체 번호를 통해서 쉽게 적용가능하다. 또한 오디오 객체 개수의 변화에 따라 파일 포맷의 트랙을 변화 시켜 사용하면 되므로 객체 오디오를 포함하기에 적절하다. 본 연구에서 개발된 파일 포맷은 실감 객체오디오 생성시 MPEG-4 오디오 코덱으로 압축된 객체 오디오, 실감 객체 오디오를 위한 오디오 장면 묘사 데이터를 독립적인 트랙으로 포함하고 있다. 포함된 오디오 장면 묘사 기법은 저장 매체를 위해 전체 오디오 장면에 적용되는 오디오 묘사 기법과 각각의 오디오 객체에 적용되는 오디오 묘사 기법을 노드 구조로 설계 하였으며, 전송 매체를 위해서 기본적인 객체 오디오 동작을 하기위한 필수 정보와 오디오 세부장면 묘사를 위한 정보로 분할하여 설계하였다. 이를 바탕으로 본 연구에서는 실감 객체 오디오 시뮬레이터를 개발하였다. 개발된 시뮬레이터는 객체 음원과 오디오 장면 묘사 정보를 부호화하여 MPEG-4 파일 포맷에 저장하며, 생성된 실감 객체 오디오 파일은 재생 모듈에서 오디오 객체에 입력 받은 사용자 정보와 오디오 장면 묘사 정보가 적용되어 사용자에게 몰입감이 높은 실감 오디오 서비스를 제공한다.

차세대 디지털 TV 방송을 위한 오디오 규격 비교 분석 및 제언 (Audio Format Comparative Study and Suggestion for Next Generation DTV)

  • 이재홍
    • 한국음향학회지
    • /
    • 제30권6호
    • /
    • pp.337-343
    • /
    • 2011
  • 3D 디지털 시험 방송 개시와 함께, 다가오는 UHDTV 시대에 대비 한 차세대 디지털 방송 방식에 관한 연구가 활발히 진행되고 있다. 본 논문에서는 현행 사용 중이거나 연구되고 있는 주요 서라운드 오디오 규격을 비교 분석하고 차세대 디지털 방송용 오디오 규격을 제시한다. 현재 주목받고 있는 손실 및 비손실 압축 방식을 채용한 디지털 서라운드 오디오 규격인 Dolby True HD와 DTS HD MA (Master Audio) 규격과 함께 일본 NHK 연구소가 제안한 UHDTV용 22.2 채널 서라운드 규격에 대해 비교 검토한다. 이를 기초로 하여 우리나라의 주택 사정을 감안한 3D 서라운드 7.1 손실 압축 오디오 규격과 하이파이 오디오와의 호환성을 중시하는 2.0, 4.0 비손실 압축규격을 차세대 디지털 방송용 규격으로 제시한다. 이와 함께 개인별 HRTF (Head Related Transfer Function) 생성을 통하여 홀로그래픽 사운드에 근접하는 3차원 입체 음장 제공을 해줄 수 있는 바이노럴 (binaural) 헤드폰용 2 채널 오디오 데이터를 부음성 규격으로 별도로 전송 방안도 함께 제시한다. 각 전송 규격 별 소요 비트 레이트 율도 함께 산출하여 제시하였다.

시청각 유형 보존포맷 선정기준 및 권고포맷 연구 - 오디오 유형을 중심으로 - (Research on Audiovisual Type Preservation Format Selection Criteria and Recommended Formats: Focusing on Audio Types)

  • 전한역;양동민
    • 한국비블리아학회지
    • /
    • 제35권1호
    • /
    • pp.273-300
    • /
    • 2024
  • 전자기록 환경에서는 아날로그 기록물의 디지털화 방안에 대한 논의와 함께, 전자적으로 생산, 접수된 기록물에 대한 유형별 보존전략 마련이 중요하게 인식된다. 같은 맥락에서, 문서유형 외 데이터세트, 시청각 유형 전자기록물의 장기보존을 목표로 보존포맷 선정체계를 적용하기 위한 논의가 필요하다. 시청각 기록물은 이미지, 오디오, 비디오와 같이 매체별 특성에 적합한 보존전략을 적용해야 한다. 본 연구는 시청각 중 오디오 유형 전자기록물의 보존포맷 선정을 위한 고유기준을 문헌 조사에 바탕을 둔 필수보존속성 분석을 통해 수립하고, 오디오 유형 보존포맷 적합성 평가항목을 구성하고 이를 적용한 결과를 토대로 권고포맷을 제안했다.

복수 포멧 지원 오디오 복호화기 설계 (A Design of Multi-Format Audio Decoder)

  • 박성욱
    • 한국지능시스템학회논문지
    • /
    • 제17권4호
    • /
    • pp.477-482
    • /
    • 2007
  • 본 논문은 AC-3와 MPEG-2를 모두 복호화할 수 있는 오디오 복호화기 구조를 제시한다. MPEG-2 합성필터는 AC-3와 공통점을 얻기 위해서 32 포인트 FFT를 활용하도록 변환되었다. 복호화기는 프로그래머블 오디오 DSP 코어와 공용의 합성필터로 구성되어 서로 다른 포멧을 효과적으로 분석, 복호화가 가능하다.

MPEG 오디오 표준화 동향 (Status of MPEG Audio Standard)

  • 서정일;강경옥
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2008년도 하계종합학술대회
    • /
    • pp.49-52
    • /
    • 2008
  • This paper briefly introduces the current status of MPEG Audio Subgroup activities for standardizing a new audio coding technologies. Currently MPEG Audio Subgroup focused on spatial audio coding tools for compressing multiple audio objects and unified coding tools for presenting the consistence performance on speech and audio signal at the same time. Also a new MAF (MPEG Application Format) for interactive music was introduced at the 84th MPEG meeting.

  • PDF

MPEG-4 Over MPEG-2 TS로부터 MP4 파일로의 포맷 변환기 설계 (Design of a Format Converter from MPEG-4 Over MPEG-2 TS to MP4)

  • 최재영;정제창
    • 방송공학회논문지
    • /
    • 제5권2호
    • /
    • pp.176-187
    • /
    • 2000
  • 본 논문에서는 MPEG-2 시스템 층의 하나인 방송 및 전송을 위한 트랜스포트 스트림(TS)상에 MPEG-4 데이터를 구조화하여 MPEG-4 Over MPEG-2 TS 비트 스트림을 만드는 방법과 이를 저장 매체 포맷중 하나인 MP4 파일로 변환하는 방법에 관한 연구이다. MPEG-4는 객체 단위의 부호화 비트 스트림으로 구성되기 때문에 이들 객체의 속성을 표현하는 객체 기술자, 객체들간의 시공간 관계를 표현하는 장면 기술자가 필요하며 또한 모든 객체들간의 복호화 정보와 객체간의 동기화를 위해 다양한 여러 가지 기술자들이 필요한데 이런 다양한 MPEG-4 비트 스트림을 어떻게 MPEG-2 TS 규격에 맞게 전송하는가에 초점을 두었다. 또한 설계한 MPEG-4 Over MPEG-2 TS 비트 스트림을 저장매체를 대상으로 하는 새로운 파일 규격인 MP4 파일로 변환하는 알고리듬을 제시하고 구현 방법을 소개한다.

  • PDF

MPEG Audio 비트스트림의 효율적 처리를 위한 입력 버퍼에 관한 연구 (A Study on the input butter for efficient processing of MPEG Audio bitstream)

  • 임성룡;공진흥
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 하계종합학술대회 논문집(2)
    • /
    • pp.181-184
    • /
    • 2000
  • In this paper, we described a design of the input buffer system for efficiently dealing with MPEG audio bitstream to demux header and side information, audio data. In order to overcome the limitations of fixed-word manipulation in bitstream demuxing, we proposed a new variable length bit retrieval system with FSM sequencer supporting MPEG audio frame format, and serial buffer demuxing audio stream, FIFO circular buffer including header and side information.

  • PDF

초고선명 방송을 위한 오디오 포맷 및 부호화 기법 (Audio Signal Format and Coding Method for Ultra High Definition Television (UHDTV))

  • 서정일;강경옥
    • 한국음향학회지
    • /
    • 제28권7호
    • /
    • pp.580-588
    • /
    • 2009
  • 본 논문에서는 초고선명 방송 (UHDTV)에서의 고품질 실감 오디오를 재현하기 위한 오디오 신호규격 및 멀티채널 오디오 재생시스템 형상, 멀티채널 오디오 부호화 기법에 대한 기술개발 동향, 표준화 현황, 문제점에 대해서 살펴보고 국내의 방송 및 통신 환경에 적절한 해결 방안을 제시한다.

MPEG-I Immersive Audio 표준화 동향 (MPEG-I Immersive Audio Standardization Trend)

  • 강경옥;이미숙;이용주;유재현;장대영;이태진
    • 방송공학회논문지
    • /
    • 제25권5호
    • /
    • pp.723-733
    • /
    • 2020
  • 본 고에서는 현재 탐색단계의 표준화가 진행 중인 MPEG-I Immersive Audio 표준화 동향을 소개한다. 이 표준은 5G/6G와 같은 초연결 환경에서 킬러 어플리케이션으로 기대되는 가상현실(Virtual Reality; VR) 및 증강현실(Augmemted Reality; AR)에서, 이용자가 가상환경과 상호작용을 통해 6 자유도(Degrees of freedom; DoF)로 소리를 실감나게 느끼고 실제 환경에서 경험하는 것과 같은 공간음향 체험을 제공하는 것을 목표로 한다. 이를 위하여, MPEG Audio Working Group에서는 가상현실 및 증강현실에서 공간음향 체험을 위한 시스템 구조 및 요구사항을 정의하였다. 이를 기반으로 요구사항에 대한 제안 기술 선정을 위한 오디오 평가 플랫폼(Audio evaluation platform; AEP), 인코더 입력 포맷(Encoder input format; EIF) 및 평가 절차 등에 대한 논의를 진행하고 있으며, 본 고에서는 그 주요 내용을 요약 기술한다.

CSpeech(Version 3.1)

  • Sik, Choe-Hong
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 1995년도 제4회 학술대회 심포지움 및 워크샵
    • /
    • pp.141-153
    • /
    • 1995
  • CSpeech is a software package that implements an audio waveform/speech analysis workstation on an IBM Personal Computer or hardware compatible computer. Features include digitizing audio waveforms on single or multiple channels, displaying the digitized waveforms, playing back audio waveforms from selected intervals of sing1e channels, saving and retrieving waveforms from binary format disk files, and analysing audio waveforms for their temporal and spectral properties. The distinguishing characteristics of CSpeech are its support for multiple channels, minimal restrictions on sample rate and waveform duration support fur a variety of hardware configurations, fast graphics display, and its user- extensible menu- based command structure.

  • PDF