• 제목/요약/키워드: 3D Audio

검색결과 210건 처리시간 0.025초

대화형 방송을 위한 3차원 오디오 방송단말 (A 3D Audio Broadcasting Terminal for Interactive Broadcasting Services)

  • 박기윤;이태진;강경옥;홍진우
    • 방송공학회논문지
    • /
    • 제10권1호
    • /
    • pp.22-30
    • /
    • 2005
  • 본 논문에서는 사용자 제어에 따라 3차원 오디오 장면을 재구성할 수 있는 대화형 오디오 방송단말에 관하여 기술한다. MPEG-4 AudioBIFS 규격에 따라 계층적으로 표현한 오디오 장면의 속성을 사용자 제어에 따라 갱신하고, 주어진 속성을 참조하여 오디오 데이터를 3차원 공간상에 재합성하는 방식을 취한다. 단말은 MPEG-4 Audio 최상위 노드와 몇몇 비디오 노드를 지원하며, 센서 노드와 라우트 요소를 이용하는 대신에 노드 유형에 따른 사용자 인터페이스를 미리 정의함으로써 필드 갱신 BIFS 명령어를 지원한다. 3차원 오디오 데이터를 재생하는 기능은 사용자의 입력에 대한 피드백을 풍부하게 하여 대화형 방송의 효과를 극대화하고, 사실감을 제고하는 데 중요한 역할을 담당한다. 본 단말에서는 3차원 오디오 기술을 이용하여 음상의 위치, 지향성, 모양, 잔향특성 등을 사용자가 제어할 수 있다. 본 논문에서는 가상 합주 프로그램 등의 서비스 예를 통해 대화형 방송단말의 서비스 모델을 제시한다.

A Color Image Watermarking Method for Embedding Audio Signal

  • Kim Sang Jin;Kim Chung Hwa
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2004년도 학술대회지
    • /
    • pp.631-635
    • /
    • 2004
  • The rapid development of digital media and communication network urgently brings about the need of data certification technology to protect IPR (Intellectual property right). This paper proposed a new watermarking method for embedding contents owner's audio signal in order to protect color image IPR. Since this method evolves the existing static model and embeds audio signal of big data, it has the advantage of restoring signal transformed due to attacks. Three basic stages of watermarking include: 1) Encode analogue ID owner's audio signal using PCM and create new 3D audio watermark; 2) Interleave 3D audio watermark by linear bit expansion and 3) Transform Y signal of color image into wavelet and embed interleaved audio watermark in the low frequency band on the transform domain. The results demonstrated that the audio signal embedding in color image proposed in this paper enhanced robustness against lossy JPEG compression, standard image compression and image cropping and rotation which remove a part of image.

  • PDF

3D사운드 컨텐츠 개발 시스템의 고찰 (A Study of the Development System of 3D Sound Contents)

  • 이우석;김경식
    • 한국게임학회 논문지
    • /
    • 제2권2호
    • /
    • pp.72-77
    • /
    • 2002
  • 오늘날 사운드 컨텐츠는 DVD의 등장으로 CD음질이상인 3D서라운드 오디오를 기본으로 하는 추세이다. 이에 맞춰 컨텐츠 개발환경이 보다 진보되어야하며, 이러한 시스템의 효과적인 응용이 필요하다. 게임 및 멀티미디어 사운드컨텐츠 제작에 필수적인 시스템 장치인 Sound/Audio Card의 효과적인 이용을 위한 개선방법과 3D사운드제작에 필요한 관련지식과 제작 Tool의 사용방법과 응용을 연구하였다.

  • PDF

체감형 미디어 서비스를 위한 공간음향 기술 동향 (Spatial Audio Technologies for Immersive Media Services)

  • 이용주;유재현;장대영;이미숙;이태진
    • 전자통신동향분석
    • /
    • 제34권3호
    • /
    • pp.13-22
    • /
    • 2019
  • Although virtual reality technology may not be deemed as having a satisfactory quality for all users, it tends to incite interest because of the expectation that the technology can allow one to experience something that they may never experience in real life. The most important aspect of this indirect experience is the provision of immersive 3D audio and video, which interacts naturally with every action of the user. The immersive audio faithfully reproduces an acoustic scene in a space corresponding to the position and movement of the listener, and this technology is also called spatial audio. In this paper, we briefly introduce the trend of spatial audio technology in view of acquisition, analysis, reproduction, and the concept of MPEG-I audio standard technology, which is being promoted for spatial audio services.

차세대 디지털 TV 방송을 위한 오디오 규격 비교 분석 및 제언 (Audio Format Comparative Study and Suggestion for Next Generation DTV)

  • 이재홍
    • 한국음향학회지
    • /
    • 제30권6호
    • /
    • pp.337-343
    • /
    • 2011
  • 3D 디지털 시험 방송 개시와 함께, 다가오는 UHDTV 시대에 대비 한 차세대 디지털 방송 방식에 관한 연구가 활발히 진행되고 있다. 본 논문에서는 현행 사용 중이거나 연구되고 있는 주요 서라운드 오디오 규격을 비교 분석하고 차세대 디지털 방송용 오디오 규격을 제시한다. 현재 주목받고 있는 손실 및 비손실 압축 방식을 채용한 디지털 서라운드 오디오 규격인 Dolby True HD와 DTS HD MA (Master Audio) 규격과 함께 일본 NHK 연구소가 제안한 UHDTV용 22.2 채널 서라운드 규격에 대해 비교 검토한다. 이를 기초로 하여 우리나라의 주택 사정을 감안한 3D 서라운드 7.1 손실 압축 오디오 규격과 하이파이 오디오와의 호환성을 중시하는 2.0, 4.0 비손실 압축규격을 차세대 디지털 방송용 규격으로 제시한다. 이와 함께 개인별 HRTF (Head Related Transfer Function) 생성을 통하여 홀로그래픽 사운드에 근접하는 3차원 입체 음장 제공을 해줄 수 있는 바이노럴 (binaural) 헤드폰용 2 채널 오디오 데이터를 부음성 규격으로 별도로 전송 방안도 함께 제시한다. 각 전송 규격 별 소요 비트 레이트 율도 함께 산출하여 제시하였다.

오디오 D/A 컨버터를 위한 인터폴레이티드 디지털 델타-시그마 변조기 (Interpolated Digital Delta-Sigma Modulator for Audio D/A Converter)

  • 노진호;유창식
    • 전자공학회논문지
    • /
    • 제49권11호
    • /
    • pp.149-156
    • /
    • 2012
  • 디지털 입력 D급 증폭기는 보청기에서 사용되고 있으며 D급 증폭기는 디지털 회로와 아날로그 회로로 구성되어진다. 아날로그 회로는 가청 주파수 대역에서 잡음을 억제하고 디지털 입력을 아날로그 신호로 변환한다. 본 논문에서 제안한 인터폴레이티드 디지털 델타-시그마 변조기는 디지털 신호 처리기의 출력 신호를 D/A 변조기 입력에 적합하도록 데이터를 변조시킨다. 디지털 필터는 16-bit, 25-kbps 펄스 코드 변조 신호를 16-bit, 50-kbps 신호로 보간 작업을 한다. 이 보간 필터 출력은 3차 디지털 델타-시그마 변조기를 통하여 노이즈 쉐이핑(noise shaping) 처리된다. 최종적으로, 1.5-bit, 3.2-Mbps 신호가 D/A 변조기 입력으로 인가된다.

MPEG-H 3D 오디오 표준 복호화기 구조 및 연산량 분석 (MPEG-H 3D Audio Decoder Structure and Complexity Analysis)

  • 문현기;박영철;이용주;황영수
    • 한국통신학회논문지
    • /
    • 제42권2호
    • /
    • pp.432-443
    • /
    • 2017
  • MPEG-H 3D 오디오 표준은 UHDTV 등의 초고해상도 방송서비스에 대응하는 실감음향 서비스의 제공을 목표로 한다. 이를 위해 본 표준은 다채널 신호, 객체 신호, 장면 기반 신호의 부호화/복호화 기술과 다양한 재생 환경에서 3차원 오디오 제공을 위한 렌더링 기술, 후처리 기술 등 방대한 기술을 통합하였다. 본 표준의 참조 소프트웨어 복호화기는 여러 모듈들이 결합된 구조로 다양한 모드에서 동작이 가능하며, 각 모듈들이 독립된 실행파일로 순차적으로 실행되어 실시간 처리가 불가능하다. 본 논문에서는 MPEG-H 3D 오디오의 코어 복호화기, 포맷 변환기, 객체 렌더러, 바이노럴 렌더러의 각 함수를 동적 라이브러리화 및 통합하여 프레임 기반 복호화가 가능하도록 하였다. 또한 MPEG-H 3D 오디오의 각 모드별 연산량을 측정하여 다양한 하드웨어 플랫폼에서 적합한 모드를 선택하기 위한 참고 자료를 제공한다. 연산량 분석 결과, 한국 방송 표준에 포함된 저연산량 프로파일은 채널 신호로 렌더링을 할 경우 QMF 합성 연산의 2.8배에서 12.4배의 연산량을 가지며, 바이노럴 렌더링을 할 경우 QMF 합성 연산의 4.1배에서 15.3배의 연산량을 가진다.

수정된 잡음 채움 기법을 적용한 3D 오디오 부호기 (A 3D Audio Codec Employing a Revised Noise Filling Method)

  • 김인철
    • 방송공학회논문지
    • /
    • 제26권3호
    • /
    • pp.327-330
    • /
    • 2021
  • 본 논문에서는 3D 오디오 부호기의 성능 향상을 위해 새로운 잡음 채움 기법을 제안한다. 제안한 잡음 채움 기법에서는 핵심 대역을 IGF 시작 주파수까지가 아니라 MAX_SFB로 설정되는 영역까지로 제한한다. 그리고, IGF 입력 패치의 모든 주파수 영역에 잡음 채움이 수행되도록 한다. 본 논문에서 수정된 잡음 채움 기법의 성능은 MUSHRA 테스트를 통해 평가되었고, 그 결과 기존의 방법보다 우수한 성능을 보임을 입증한다.

심리음향 모델 II와 MDCT를 이용한 오디오 포렌식 마킹 (Audio Forensic Marking using Psychoacoustic Model II and MDCT)

  • 이강현
    • 전자공학회논문지CI
    • /
    • 제49권4호
    • /
    • pp.16-22
    • /
    • 2012
  • 본 논문에서는 심리음향 모델(Psychoacoustic model) II와 MDCT를 이용한 고음질 오디오 포렌식 마킹 알고리즘을 제안한다. 제안된 알고리즘은 오디오 신호의 에너지가 스펙트럼 마스킹 레벨보다 적은 서브밴드를 선택하여 콘텐츠 사용자의 핑거프린팅 코드를 삽입하는 포렌식 마킹 방법이다. 원 오디오 신호의 FFT 처리를 위한 2,048 샘플의 한 프레임 범위에서, 3개의 서브밴드를 선택하여 포렌식 마킹을 한다. 핑거프린팅 코드의 평균화 공격에 따른 공모코드의 100% 추적율을 갖는 범위에서, 한 프레임의 SNR을 측정하였다. 핑거프린팅 코드의 최저강도 0.1 삽입에서 SNR은 38.44dB 이며, 화이트 가우시안 노이즈의 강도 0.5가 추가된 SNR은 19.09dB로 제안된 오디오 포렌식 마킹 알고리즘은 핑거프린팅 코드의 마킹 강인성과 오디오 고음질이 유지됨을 확인하였다.

그룹 양자화를 이용한 오디오 워터마킹 기술 개발 (Development of Audio Watermarking Technique using Group Quantization)

  • 신승원;박창목;김종원;최종욱
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.323-326
    • /
    • 2002
  • In this paper, we propose a watermarking technique that it is possible to winnow illegal contents from scattered contents on the internet. The identification is performed using an embedded unique content ID by the watermarking technique. The proposed watermarking technique accepts A/D-D/A conversion and a lot of lossy compression such as MP3, AAC, WMA and Real Audio. Watermark robustness is enabled using group quantization, selecting watermark inserting point, and error correction code. Test results show that the correct extraction is about $90\%$ and SNR is above $50\~60dB$. The above figures means that the proposed technique is able to extract encoded information at least one more times per audio and that it is very difficult to discriminate between a watermarked audio and a original audio.

  • PDF