Search | Korea Science

증강현실 오디오 시스템에서의 객체 오디오 획득 및 렌더링 기술

Jeon, Chan-Jun;Kim, Hong-Guk
- Information and Communications Magazine
- /
- v.33 no.9
- /
- pp.8-16
- /
- 2016
본 고에서는 증강현실 오디오에 대한 개념을 기술하고, 이를 실현하기 위하여 필요한 요소 기술들을 논한다. 먼저, 실사 오디오의 객체화를 위하여 실사 오디오의 획득 방법 및 이를 객체화하는 방법에 대하여 서술한다. 또한, 실사 오디오와 가상 오디오의 혼합을 위하여 필요한 실사 오디오의 공간 정보 추출 및 가상 오디오의 공간 정보 부여 기술을 설명한다. 그리고 오디오 증강을 위한 객체 오디오의 렌더링 기술에 대해 소개한다. 마지막으로 이러한 요소 기술들을 통합한 증강현실 오디오 시스템의 사례를 기술하는 것으로 본 고를 마무리한다.
PDF KSCI

An User Controllable Object Audio File Format and Audio Scene Description (사용자 기반 실감 객체 오디오 파일 포맷 및 오디오 장면 묘사 기법)

Cho, Choong-Sang;Kim, Je-Woo
- Journal of the Institute of Electronics Engineers of Korea SP
- /
- v.47 no.5
- /
- pp.25-33
- /
- 2010
Multi-media service has been changed into user based audio services, which service supports actively user's preference and interaction with the users. In the market, multi-media products which can support the highest audio-quality by using lossless audio technology have been released and object audio music which user can select the objects has been serviced. In this paper, we design user's preference information based object audio file format and audio scene description for storage and transmission media. The designed file format is designed based on MPEG-4 file format because high-quality audio codecs in MPEG-4 audio can be easily used and the track of file format can be flexibly controlled depend on the number of the instrument in music. The encoded audio data of each objects and encoded audio scene description by binary encoding that has independent track are packed in a file. The scene description for storage media is consist of full and object scene description, the scene description for transmission media has an essential description for object audio operation and a specific description for real audio sound. The designed file format based simulator is developed and it generates an object audio file with several scene descriptions. Also, the real audio sound is serviced by the interaction with user and the unpacked scene description.
PDF KSCI

Audio Streaming Technology for Internet Audio Broadcasting (인터넷 오디오 방송을 위한 오디오 스트리밍 기술)

Kang Kyeongok;Hong Jin-Woo
- Proceedings of the Acoustical Society of Korea Conference
- /
- spring
- /
- pp.347-350
- /
- 2000
인터넷을 이용한 디지털 오디오 방송 서비스에 대한 관심이 집중되면서 디지털 오디오 데이터를 서버로부터 사용자에게까지 실시간으로 전송하기 위한 연구가 진행되고 있다. 디지털 오디오 방송의 실시간 전송을 위하여 효율적인 오디오 압축 기술의 개발도 중요하지만 이들 오디오 압축 기술과 연계되는 오디오 스트리밍 기술이 매우 중요하다. 본 논문에서는 현재 사용되고 인터넷 오디오 방송관련 기술을 분석하고, 특히, IETF에서 논의되고 있는 MPEG-2AAC 및 MPEG-4 오디오를 인터넷을 통하여 전송하기 위한 RTP payload 포맷을 분석하고, 기술개발을 위한 고려사항을 제안한다.
PDF

Audio Texture Synthesis using EM Optimization (EM 최적화를 이용한 오디오 텍스처 합성)

Roe, Chang-Hwan;Yoo, Min-Joon;Lee, In-Kwon
- 한국HCI학회:학술대회논문집
- /
- 2007.02a
- /
- pp.274-280
- /
- 2007
오디오 텍스처 합성은 주어진 짧은 오디오 클립으로부터 임의의 길이를 갖는 새로운 오디오 클립을 생성하는 방법이다. 이는 애니메이션이나 영화에서 비디오와 정확한 동기화를 이루는 사운드 효과를, 혹은 임의의 길이를 갖는 배경 음악을 효율적으로 만들 수 있는 방법이다. 최근 Lie Lu는 주어진 예제 오디오 클립을 여러 조각으로 나눈 후, 이 조각들을 그래프 형태로 연결하고, 생성된 그래프를 탐색하면서 임의의 길이를 가지는 오디오 클립을 합성하는 방법을 제안하였다. 비교적 간단한 방법으로도 원본 오디오 클립과 비슷한 느낌의 오디오 클립을 만들어낸다는 장점이 있지만, 이는 원본 내의 여러 오디오 조각들이 단지 지속적으로 연결되는 형태로 합성되기 때문에 종종 반복되는 느낌을 받는다는 단점이 있다. 본 논문에서는 Lie Lu의 방법과는 달리 주어진 예제 오디오 클립을 직접 합성함으로써 반복성을 줄이면서도 원본과 비슷한 느낌을 갖는 결과 오디오 클립을 생성할 수 있는 방법을 제안한다. 특히 본 논문에서는 정확한 합성을 위하여 EM 최적화 방법을 사용한다. 본 논문에서 제안하는 합성 방법은 먼저 예제 오디오 클립을 일정 단위로 나누고 이렇게 나눠진 부분들을 일정 길이만큼 서로 겹쳐지게 합성하여 임의의 길이의 오디오 클립을 만든다. 그 후 만들어진 오디오 클립을 예제 오디오 클립과 부분 부분을 비교하여 확장된 오디오 클립과 최대한 비슷한 부분을 예제 오디오 클립에서 찾는다. 그 다음 찾아진 결과를 결과 오디오에 다시 합성하여 오디오 클립을 만든다. 이런 과정을 반복하여 최적화된 가장 적절한 결과값을 구한다. 이 결과는 분할된 부분들이 가장 자연스럽게 이어지는 결과가 된다. 본 논문에서는 최적화를 사용하여 오디오를 합성하기 때문에 합성 결과를 쉽게 조정할 수 있다는 장점이 있다. 최적화 문제에 특정 제약 조건을 넣음으로써 사용자가 원하는 부분의 음악이 결과 사운드의 특정 부분에 위치 할 수 있게 하고 이로써 특정 흐름을 만들어낼 수 있으며, 일부가 손실된 사운드 데이터의 복구를 가능하게 하는 등의 결과를 생성할 수 있다. EM 최적화를 사용한 오디오 텍스처 합성 방법은 기존의 합성 방법에 비해 질적인 측면에서 보다 좋은 결과를 생성할 수 있고, 비교적 반복이 덜한 패턴들을 만들어 낼 수 있다. 이를 입증하기 위해 이에 대한 사용자 설문 조사 결과가 제시된다.
PDF

360VR 오디오 기술 및 표준화 동향

Lee, Yong-Ju;Lee, Tae-Jin;Kim, Hwi-Yong
- Broadcasting and Media Magazine
- /
- v.23 no.4
- /
- pp.67-81
- /
- 2018
최근 영화, 스포츠 중계, 게임 등 다양한 종류의 콘텐츠가 VR 형태로 서비스되고 있는데, 이러한 360도 영상 서비스 환경에서 영상과 오디오를 더욱 실감나게 제공하는 기술에 대한 연구도 많이 이루어지고 있다. 오디오의 경우 스테레오, 5.1 채널 오디오 등과 같은 채널 기반 오디오가 방송, 영화 등에서 주로 사용되었는데, 최근에는 객체 기반 오디오, 장면 기반 오디오 기술의 적용이 시도되고 있다. VR 서비스에서도 더욱 실감 있는 오디오를 제공하기 위하여 이러한 최신 오디오 기술의 적용이 시도되고 있다. 본 고에서는 증강 현실 및 가상 현실에 활용될 수 있는 최신 오디오 기술에 대해 간략하게 살펴보고, 최신 오디오 기술이 어떻게 VR 서비스에 적용이 되고 있는지에 대해 살펴본다. 그리고, VR 서비스를 위한 규격 제정 측면에서 오디오 기술은 어떻게 진행이 되고 있는지에 대하여 간략하게 살펴본다.
PDF KSCI

Effect of Background Sound for Audio Guide in Museums (박물관 오디오가이드에서 음향효과가 주는 효과)

Kang, Min-Seo;Oh, Jeung-Min;Gweon, Gahgene;Lee, Jae-Gil
- Proceedings of the Korea Information Processing Society Conference
- /
- 2014.04a
- /
- pp.985-987
- /
- 2014
우리는 우리가 방문하는 박물관에 대한 배경지식이 없으면 박물관에서 제공하는 오디오 가이드를 이용한다. 그러나 기존의 오디오 가이드는 크게 두 가지 문제점이 있다. 첫째, 기존의 오디오 가이드는 단순히 성우가 텍스트 컨텐츠를 읽은 것에 지나지 않기 때문에 지루하다. 지루하기 때문에 사용자들은 자연스레 오디오 가이드에 집중하지 못한다. 둘째, 기존의 오디오 가이드에는 포인트가 없다. 오디오 가이드에서 성우들의 목소리에 톤이나 어조가 일정하기 때문에 사람들은 오디오 가이드를 들을 때 중요한 부분에 대해 알지 못한다. 이러한 문제점들을 해결하기 위해서 우리는 기존의 오디오 가이드 컨텐츠의 키워드에 단어와 관계있는 음향효과를 추가해서 새로운 오디오 가이드를 만들었다. 새로운 오디오 가이드는 기존의 오디오 가이드의 문제점인 지루함과 중요 포인트가 없음을 해결해서 사용자의 흥미도와 집중력을 높여주었다. 우리의 실험이 성공적이었기 때문에 향후 우리의 이론은 좀 더 일반적인 컨텐츠들로 확장 될 수 있을 것이다.
https://doi.org/10.3745/PKIPS.y2014m04a.985 인용 PDF

Analysis of MPEG Audio Coding Technology (MPEG 오디오 부호화 기술 분석)

홍진우
- Proceedings of the Acoustical Society of Korea Conference
- /
- 1998.06c
- /
- pp.249-254
- /
- 1998
MPEG 오디오 그룹에서는 오디오 부호화 기술의 국제 표준으로 MPEG-1 오디오, MPEG-2 오디오 BC, MPEG-2 AAC의 규격 제정을 완료하였고, 현재 MPEG-4 오디오 및 MPEG-7 오디오의 국제 표준을 제정하고 있다. 본 논문에서는 이들 표준에 대한 요구 기능 및 기술 특징을 분석하고, 각각의 표준에 대한 응용분야와 향후의 계획에 대하여 기술한다.
PDF

The Design of Object-based 3D Audio Broadcasting System (객체기반 3차원 오디오 방송 시스템 설계)

강경옥;장대영;서정일;정대권
- The Journal of the Acoustical Society of Korea
- /
- v.22 no.7
- /
- pp.592-602
- /
- 2003
This paper aims to describe the basic structure of novel object-based 3D audio broadcasting system To overcome current uni-directional audio broadcasting services, the object-based 3D audio broadcasting system is designed for providing the ability to interact with important audio objects as well as realistic 3D effects based on the MPEG-4 standard. The system is composed of 6 sub-modules. The audio input module collects the background sound object, which is recored by 3D microphone, and audio objects, which are recorded by monaural microphone or extracted through source separation method. The sound scene authoring module edits the 3D information of audio objects such as acoustical characteristics, location, directivity and etc. It also defines the final sound scene with a 3D background sound, which is intended to be delievered to a receiving terminal by producer. The encoder module encodes scene descriptors and audio objects for effective transmission. The decoder module extracts scene descriptors and audio objects from decoding received bistreams. The sound scene composition module reconstructs the 3D sound scene with scene descriptors and audio objects. The 3D sound renderer module maximizes the 3D sound effects through adapting the final sound to the listner's acoustical environments. It also receives the user's controls on audio objects and sends them to the scene composition module for changing the sound scene.
PDF KSCI

Study on the downmix method of parametric multichannel audio codec (파라메트릭 멀티채널 오디오 코덱의 다운믹스 방식에 대한 연구)

Moon, Han-Gil;Lee, Chu-Lwoo
- Proceedings of the KIEE Conference
- /
- 2008.10b
- /
- pp.304-305
- /
- 2008
DVD/BD 및 HDTV의 보급으로 인해 다수의 오디오 컨텐츠들이 멀티채널(5.1채널 이상) 형식으로 제작되고 있다. 오디오 정보를 담고 있는 물리적인 채널의 수가 증가하면, 이에 따라 정보량도 선형적으로 증가하게 된다. 선형적으로 증가된 정보를 기존의 오디오 코덱을 이용해 큰 압축할 경우, 압축에 필요한 비트레이트의 선형적인 증가를 피할 수 없다. 최근 채널 수 증가로 야기되는 비트레이트의 증가를 최소화하고 효율적으로 멀티채널 오디오 신호를 압축할 수 있는 방법으로 MPEG surround와 같은 파라메트릭 멀티채널 오디오 코딩 방식이 제안되었다. 파라메트릭 멀티채널 오디오 코딩 방식의 경우, 멀티채널 오디오 신호를 채널 수가 감소된 다운믹스 신호와 다운믹스 신호로부터 다시 멀티채널 오디오 업믹스 하는데 필요한 파라미터로 표현하는 방식이다. 따라서 다운믹스 방식 및 업믹스에 필요한 파라미터에 따라 업믹스된 멀티채널 오디오 신호의 품질이 달라진다. 본 논문에서는 MPEG surround에서 사용하고 있는 기존의 ITU-R 다운믹스 방식의 문제점을 실제 멀티채널 오디오 신호의 사례를 통해 제시하고 이 문제점을 해결하기 위한 새로운 다운믹스 방식과 파라미터를 제안하고자 한다.
PDF

Fast Audio Retrieval For Frequently Accessed Melodies (멜로디 접근 빈도를 이용한 오디오 검색 시스템의 설계 및 구현)

박동문;황인준
- Proceedings of the Korea Multimedia Society Conference
- /
- 2002.05c
- /
- pp.112-117
- /
- 2002
웹의 급속한 발전과 함께 오디오 컨텐츠의 양이 증가하게 되었고 수많은 오디오 데이터베이스로부터 특정한 오디오 컨텐츠를 찾아내는 오디오 검색 시스템의 필요성이 증가했다. 본 논문에서는 효율적인 오디오 검색 시스템을 위해 사용자들이 질의하는 멜로디 패턴을 이용해서 FAI(Frequently Accessed Index)라는 새로운 인덱싱 메카니즘을 제안하고 이 FAI를 기반으로 구현한 프로토타입 시스템의 구조와 원리에 대해서 설명한다. 실험을 통해서 FAI 기반 오디오 검색 시스템의 성능을 일반적인 오디오 검색 방법과 비교해 보았다.
PDF

Search Result 1,670, Processing Time 0.063 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)