• Title/Summary/Keyword: 실감 오디오

Search Result 45, Processing Time 0.03 seconds

A study on 3-D sound design for 3-D broadcast (입체방송을 위한 입체음향 제작기법 연구)

  • Lee Sin-lyul;Lee Jun-soo;Sung Koeng-Mo
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.259-262
    • /
    • 2001
  • 인간이 실제 생활에서 느끼는 입체음향을 녹음해서 재생기를 통해 듣고자하는 시도는 역사적으로 이미 한 세기가 지났으나 아직도 실감 있는 입체음향 녹음 및 재생기법 연구는 계속진행 중에 있다. 스피커 혹은 헤드폰으로 전후, 좌우, 상하의 모든 방향 및 거리감까지도 재생시킬 수 있는 있어야 진정한 입체음향이라 말할 수 있겠지만 많은 오디오 기기 제조업체들이 홍보효과를 위해 입체음향을 부적절하게 사용함으로써 일반 사용자들은 입체음향에 대해 많이 혼돈하고 있는 실정이다. 정확한 의미로 오늘날 대부분의 오디오 기기를 차지하고 있는 스테레오 사운드는 1차원(좌우 축)사운드라고 말할 수 있으며, 극장 사운드는 2차원(좌우, 전후 축)사운드이며 상용화된 3차원 사운드 제품은 아직 존재하지 않는다고 말할 수 있다 본 논문에서는 현재 연구 중인 "방송을 위한 입체음향 생성 및 재생 기법" 중 대표적인 바이노럴 기법과 Ambisonic 기법 및 문제점에 대해 알아보았다

  • PDF

Real-Time Vision Based Speaker Location Detection for Realistic Audio Reproduction (실감 음향 재생을 위한 영상기반의 실시간 화자 위치 검출)

  • Lim Jaehyun;Lee Chulhee
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.143-146
    • /
    • 2004
  • 일반적으로, 화상회의에서 화자의 위치를 검출하는 것은 음향 신호를 기반으로 이루어져 왔다. 그러나 물리적인 환경의 제약이나 화자 검출 시스템의 한계를 벗어나는 노이즈가 발생하는 경우에는 검출 시스템의 성능저하를 초래하게 된다. 본 논문에서는 음향 기반의 검출 시스템과 독립적으로, 혹은 상호 보완적으로 사용될 수 있는 영상 기반의 화자 검출 알고리즘에 대하여 제안하고자 한다. 화자의 위치에 관한 정보는 화상회의에 한층 사실감을 부여하는 3 차원 오디오 재생에 사용될 수 있다.

  • PDF

A Study for Change of Audio Data according to Rotation Degree of VR Video (VR 영상의 회전각도에 따른 오디오 데이터 변화에 관한 연구)

  • Ko, Eun-Ji;Yang, Ji-Hee;Kim, Young-Ae;Park, Goo-Man;Kim, Seong-Kweon
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.12 no.6
    • /
    • pp.1135-1142
    • /
    • 2017
  • In this paper, we propose an algorithm that can automatically mix the screen and sound by tracking the change of the sound data according to the screen change so that the real sound can be implemented in the personal broadcasting service. Since the personal broadcasting service is often broadcasted lively, it should be convenient to have a real-time mixing. Through experiments, it was confirmed that the sound pressure changes in a wide range in the high frequency band related to the clarity for understanding according to the rotation angle change of the screen. Regression analysis of the sound pressure changes at 2kHz, 4kHz, and 8kHz, The attenuation change of sound pressure was observed at the slope of -1.17, the slope of -2.0, and the slope of -2.44 for each frequency. Therefore, these experiment results can be applied to the VR service. This study is expected to be useful data in the implementation of personal broadcasting service.

A Real Time 6 DoF Spatial Audio Rendering System based on MPEG-I AEP (MPEG-I AEP 기반 실시간 6 자유도 공간음향 렌더링 시스템)

  • Kyeongok Kang;Jae-hyoun Yoo;Daeyoung Jang;Yong Ju Lee;Taejin Lee
    • Journal of Broadcast Engineering
    • /
    • v.28 no.2
    • /
    • pp.213-229
    • /
    • 2023
  • In this paper, we introduce a spatial sound rendering system that provides 6DoF spatial sound in real time in response to the movement of a listener located in a virtual environment. This system was implemented using MPEG-I AEP as a development environment for the CfP response of MPEG-I Immersive Audio and consists of an encoder and a renderer including a decoder. The encoder serves to offline encode metadata such as the spatial audio parameters of the virtual space scene included in EIF and the directivity information of the sound source provided in the SOFA file and deliver them to the bitstream. The renderer receives the transmitted bitstream and performs 6DoF spatial sound rendering in real time according to the position of the listener. The main spatial sound processing technologies applied to the rendering system include sound source effect and obstacle effect, and other ones for the system processing include Doppler effect, sound field effect and etc. The results of self-subjective evaluation of the developed system are introduced.

MPEG-H 3D Audio Decoder Structure and Complexity Analysis (MPEG-H 3D 오디오 표준 복호화기 구조 및 연산량 분석)

  • Moon, Hyeongi;Park, Young-cheol;Lee, Yong Ju;Whang, Young-soo
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.42 no.2
    • /
    • pp.432-443
    • /
    • 2017
  • The primary goal of the MPEG-H 3D Audio standard is to provide immersive audio environments for high-resolution broadcasting services such as UHDTV. This standard incorporates a wide range of technologies such as encoding/decoding technology for multi-channel/object/scene-based signal, rendering technology for providing 3D audio in various playback environments, and post-processing technology. The reference software decoder of this standard is a structure combining several modules and can operate in various modes. Each module is composed of independent executable files and executed sequentially, real time decoding is impossible. In this paper, we make DLL library of the core decoder, format converter, object renderer, and binaural renderer of the standard and integrate them to enable frame-based decoding. In addition, by measuring the computation complexity of each mode of the MPEG-H 3D-Audio decoder, this paper also provides a reference for selecting the appropriate decoding mode for various hardware platforms. As a result of the computational complexity measurement, the low complexity profiles included in Korean broadcasting standard has a computation complexity of 2.8 times to 12.4 times that of the QMF synthesis operation in case of rendering as a channel signals, and it has a computation complexity of 4.1 times to 15.3 times of the QMF synthesis operation in case of rendering as a binaural signals.

Multichannel Audio Reproduction Technology based on 10.2ch for UHDTV (UHDTV를 위한 10.2 채널 기반 다채널 오디오 재현 기술)

  • Lee, Tae-Jin;Yoo, Jae-Hyoun;Seo, Jeong-Il;Kang, Kyeong-Ok;Kim, Whan-Woo
    • Journal of Broadcast Engineering
    • /
    • v.17 no.5
    • /
    • pp.827-837
    • /
    • 2012
  • As broadcasting environments change rapidly to digital, user requirements for next-generation broadcasting service which surpass current HDTV service become bigger and bigger. The next-generation broadcasting service progress from 2D to 3D, from HD to UHD and from 5.1ch audio to more than 10ch audio for high quality realistic broadcasting service. In this paper, we propose 10.2ch based multichannel audio reproduction system for UHDTV. The 10.2ch-based audio reproduction system add two side loudspeakers to enhance the surround sound localization effect and add two height and one ceiling loudspeakers to enhance the elevation localization effect. To evaluate the proposed system, we used APM(Auditory Process Model) for objective localization test and conducted subjective localization test. As a result of objective/subjective localization test, the proposed system shows the statistically same performance compare with 22.2ch audio system and shows the significantly better performance compared with 5.1ch audio system.

Speech Codec Standardization for Super-wideband Communication (초광대역 음성통화 서비스를 위한 압축 기술 및 표준화)

  • O, Eun-Mi
    • Broadcasting and Media Magazine
    • /
    • v.19 no.1
    • /
    • pp.48-55
    • /
    • 2014
  • One of the recent noticeable evolutions in mobile communication systems is that wideband-codec is deployed rapidly in VoLTE (Voice over Long Term Evolution) service or HD voice. This paper is concerned with next generation HD voice or VoLTE service that is coined to describe high quality communication with super-wideband voice codec. 3GPP EVS (Enhanced Voice Service) Codec is being standardized to develop the super-wideband voice codec. This paper deals with the codec design constraints, performance requirements, the status of standardization, and finally perspective on VoLTE service in future.

터치 스크린에서의 촉각 기술 동향

  • Im, Jeong-Muk;Lee, Jong-Uk;Park, Jun-Seok
    • Information and Communications Magazine
    • /
    • v.29 no.7
    • /
    • pp.16-24
    • /
    • 2012
  • Apple의 iPod Touch가 등장한 이래로, 다양한 모바일 디바이스에서 터치 인터페이스가 사용자 입력 수단으로서 사용되고 있다. 또한 최근 터치 인터페이스 기술은 터치할 때 사용자에게 실감나는 촉각 피드백을 제공하기 위한 다양한 방법을 시도하고 있다. 촉각 피드백의 유용성은 터치 입력에 대한 즉각적인 피드백, 오디오나 그래픽과 융합하여 사실적이고 직관적인 피드백 제공 등으로 요약할 수 있다. 이러한 장점은 터치 인터페이스 사용에 대한 사용자 경험 (User Experience)을 차별화 할 수 있기 때문에 제품 경쟁력에도 도움이 된다. 본 고에서는 촉각 피드백을 제공하는 햅틱 시스템에 대해 일반적인 내용을 알아보고, 특히 터치 인터페이스를 갖는 모바일 디바이스에서 사용될 수 있는 촉각 제 시 방법 및 촉각 액추에이터의 최근 기술동향에 대해 살펴본다.

Research Trends in 3DTV Contents (3차원 TV 콘텐츠 기술 동향)

  • Lee, S.K.;Yoon, Y.S.;Suh, Y.H.;Yoo, W.Y.;Ho, Y.S.
    • Electronics and Telecommunications Trends
    • /
    • v.26 no.1
    • /
    • pp.1-12
    • /
    • 2011
  • 미국과 일본, 그리고 유럽의 일부 선진국에서는 이미 1990년대 초부터 3차원 TV에 대한 연구를 시작하였고 국내에서도 이와 관련하여 일부 대학 및 연구소를 중심으로 3차원 입체영상 방식과 3차원 정보처리 기술에 대한 기초 연구가 진행되고 있다. 3차원 TV 및 실감방송 서비스를 제공하기 위해서는 다양한 멀티미디어 처리 기술이 필요하다. 다시점 카메라 시스템, 깊이 카메라, 다채널 오디오 획득 장치를 이용하여 미디어를 획득하여 편집한 후, 이를 부호화하여 전송하고 디스플레이 단에서 재현하는 기술 개발이 진행되고 있다. 현재, 국제 표준화 기구인 MPEG에서는 이런 멀티미디어 처리 기술을 바탕으로 3차원 TV에 관한 표준화 작업을 진행하고 있다. 본 고에서는 3차원 TV의 개념 및 세계 동향 그리고 현재 사용되고 있는 다양한 3차원 비디오 부호화 기술에 관하여 기술하고자 한다.

  • PDF

Audio Contents Adaptation Technology According to User′s Preference on Sound Fields (사용자의 음장선호도에 따른 오디오 콘텐츠 적응 기술)

  • 강경옥;홍재근;서정일
    • The Journal of the Acoustical Society of Korea
    • /
    • v.23 no.6
    • /
    • pp.437-445
    • /
    • 2004
  • In this paper. we describe a novel method for transforming audio contents according to user's preference on sound field. Sound field effect technologies. which transform or simulate acoustic environments as user's preference, are very important for enlarging the reality of acoustic scene. However huge amount of computational power is required to process sound field effect in real time. so it is hard to implement this functionality at the portable audio devices such as MP3 player. In this paper, we propose an efficient method for providing sound field effect to audio contents independent of terminal's computational power through processing this functionality at the server using user's sound field preference, which is transfered from terminal side. To describe sound field preference, user can use perceptual acoustic parameters as well as the URI address of room impulse response signal. In addition, a novel fast convolution method is presented to implement a sound field effect engine as a result of convoluting with a room impulse response signal at the realtime application. and verified to be applicable to real-time applications through experiments. To verify the evidence of benefit of proposed method we performed two subjective listening tests about sound field descrimitive ability and preference on sound field processed sounds. The results showed that the proposed sound field preference can be applicable to the public.