• 제목/요약/키워드: 실감 오디오

검색결과 45건 처리시간 0.029초

입체방송을 위한 입체음향 제작기법 연구 (A study on 3-D sound design for 3-D broadcast)

  • 이신렬;이준수;성굉모
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2001년도 추계학술발표대회 논문집 제20권 2호
    • /
    • pp.259-262
    • /
    • 2001
  • 인간이 실제 생활에서 느끼는 입체음향을 녹음해서 재생기를 통해 듣고자하는 시도는 역사적으로 이미 한 세기가 지났으나 아직도 실감 있는 입체음향 녹음 및 재생기법 연구는 계속진행 중에 있다. 스피커 혹은 헤드폰으로 전후, 좌우, 상하의 모든 방향 및 거리감까지도 재생시킬 수 있는 있어야 진정한 입체음향이라 말할 수 있겠지만 많은 오디오 기기 제조업체들이 홍보효과를 위해 입체음향을 부적절하게 사용함으로써 일반 사용자들은 입체음향에 대해 많이 혼돈하고 있는 실정이다. 정확한 의미로 오늘날 대부분의 오디오 기기를 차지하고 있는 스테레오 사운드는 1차원(좌우 축)사운드라고 말할 수 있으며, 극장 사운드는 2차원(좌우, 전후 축)사운드이며 상용화된 3차원 사운드 제품은 아직 존재하지 않는다고 말할 수 있다 본 논문에서는 현재 연구 중인 "방송을 위한 입체음향 생성 및 재생 기법" 중 대표적인 바이노럴 기법과 Ambisonic 기법 및 문제점에 대해 알아보았다

  • PDF

실감 음향 재생을 위한 영상기반의 실시간 화자 위치 검출 (Real-Time Vision Based Speaker Location Detection for Realistic Audio Reproduction)

  • 임재현;이철희
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.143-146
    • /
    • 2004
  • 일반적으로, 화상회의에서 화자의 위치를 검출하는 것은 음향 신호를 기반으로 이루어져 왔다. 그러나 물리적인 환경의 제약이나 화자 검출 시스템의 한계를 벗어나는 노이즈가 발생하는 경우에는 검출 시스템의 성능저하를 초래하게 된다. 본 논문에서는 음향 기반의 검출 시스템과 독립적으로, 혹은 상호 보완적으로 사용될 수 있는 영상 기반의 화자 검출 알고리즘에 대하여 제안하고자 한다. 화자의 위치에 관한 정보는 화상회의에 한층 사실감을 부여하는 3 차원 오디오 재생에 사용될 수 있다.

  • PDF

VR 영상의 회전각도에 따른 오디오 데이터 변화에 관한 연구 (A Study for Change of Audio Data according to Rotation Degree of VR Video)

  • 고은지;양지희;김영애;박구만;김성권
    • 한국전자통신학회논문지
    • /
    • 제12권6호
    • /
    • pp.1135-1142
    • /
    • 2017
  • 본 논문에서는 개인방송서비스에서 실감 음향을 구현할 수 있도록, 화면 변화에 따른 음향 데이터의 변화를 추적하여, 자동적으로 화면과 음향을 믹싱하도록 도와주는 알고리즘을 제안하고자 한다. 실험을 통하여 화면의 회전각도 변화에 따른 음원에서의 고주파 대역에서의 음압 변화를 확인하였고, 소리의 명료도와 관련되는 주파수 대역인 2kHz, 4kHz, 8kHz에서의 음압 변화를 회귀분석을 통하여 각각 -1.17 dB/degree, -2.0 dB/degree, -2.44 dB/degree로 음압의 감쇄 변화 추세를 파악하였다. 이 실험결과는 음압열화를 보완하여 실감음향을 향상시키는 믹싱 알고리즘에 사용되어, 실감 개인방송 서비스 보급에 유용할 것으로 기대된다.

MPEG-I AEP 기반 실시간 6 자유도 공간음향 렌더링 시스템 (A Real Time 6 DoF Spatial Audio Rendering System based on MPEG-I AEP)

  • 강경옥;유재현;장대영;이용주;이태진
    • 방송공학회논문지
    • /
    • 제28권2호
    • /
    • pp.213-229
    • /
    • 2023
  • 본 논문에서는 가상환경에 위치한 청취자의 움직임에 대응하여 실시간으로 6DoF 공간음향을 제공하는 공간음향 렌더링 시스템에 대해 소개한다. 본 시스템은 MPEG-I Immersive Audio CfP 대응을 위하여 MPEG-I AEP를 개발환경으로 사용하여 구현되었으며 인코더와, 디코더를 포함하는 렌더러로 구성된다. 인코더는 인코더 입력 포맷(EIF) 파일에 포함된 가상공간 장면의 공간적 오디오 파라미터와, SOFA 파일로 제공되는 음원의 지향성 정보 등의 메타데이터를 오프라인으로 부호화하여 비트스트림으로 전달하는 역할을 하며, 렌더러는 전달된 비트스트림을 수신하여 청취자의 위치에 따라 실시간으로 6DoF 공간음향 렌더링을 수행한다. 개발된 렌더링 시스템에 적용한 주요 공간음향 처리 기술로는 음원 효과 및 장애물 효과 처리 기술이 있으며, 그 외 시스템 동작에 필요한 기술로는 도플러 효과 및 음장효과 처리 기술 등이 있다. 개발된 시스템에 대한 성능평가 결과로서 자체 주관평가 결과를 소개한다.

MPEG-H 3D 오디오 표준 복호화기 구조 및 연산량 분석 (MPEG-H 3D Audio Decoder Structure and Complexity Analysis)

  • 문현기;박영철;이용주;황영수
    • 한국통신학회논문지
    • /
    • 제42권2호
    • /
    • pp.432-443
    • /
    • 2017
  • MPEG-H 3D 오디오 표준은 UHDTV 등의 초고해상도 방송서비스에 대응하는 실감음향 서비스의 제공을 목표로 한다. 이를 위해 본 표준은 다채널 신호, 객체 신호, 장면 기반 신호의 부호화/복호화 기술과 다양한 재생 환경에서 3차원 오디오 제공을 위한 렌더링 기술, 후처리 기술 등 방대한 기술을 통합하였다. 본 표준의 참조 소프트웨어 복호화기는 여러 모듈들이 결합된 구조로 다양한 모드에서 동작이 가능하며, 각 모듈들이 독립된 실행파일로 순차적으로 실행되어 실시간 처리가 불가능하다. 본 논문에서는 MPEG-H 3D 오디오의 코어 복호화기, 포맷 변환기, 객체 렌더러, 바이노럴 렌더러의 각 함수를 동적 라이브러리화 및 통합하여 프레임 기반 복호화가 가능하도록 하였다. 또한 MPEG-H 3D 오디오의 각 모드별 연산량을 측정하여 다양한 하드웨어 플랫폼에서 적합한 모드를 선택하기 위한 참고 자료를 제공한다. 연산량 분석 결과, 한국 방송 표준에 포함된 저연산량 프로파일은 채널 신호로 렌더링을 할 경우 QMF 합성 연산의 2.8배에서 12.4배의 연산량을 가지며, 바이노럴 렌더링을 할 경우 QMF 합성 연산의 4.1배에서 15.3배의 연산량을 가진다.

UHDTV를 위한 10.2 채널 기반 다채널 오디오 재현 기술 (Multichannel Audio Reproduction Technology based on 10.2ch for UHDTV)

  • 이태진;유재현;서정일;강경옥;김환우
    • 방송공학회논문지
    • /
    • 제17권5호
    • /
    • pp.827-837
    • /
    • 2012
  • 방송 환경이 점차 디지털로 발전해 나가면서, HDTV를 넘어서는 차세대 방송서비스에 관한 관심이 증대되고 있다. 차세대 방송 서비스는 2차원 영상 서비스에서 3차원 영상 서비스로, HD급 영상 서비스에서 UHD(Ultra High Definition)급 영상 시비스로, 5.1 채널 오디오 서비스에서 10 채널 이상의 다채널 오디오 서비스로 진화하여 고품질의 실감 방송 서비스를 제공하는 것을 목표로 하고 있다. 본 논문에서는 UHDTV 방송 서비스 환경에서 고품질의 오디오 서비스를 제공하기 위한 10.2 채널 기반의 다채널 오디오 재현 기술에 대해 설명한다. 10.2 채널 재현 시스템은 기존 5.1 채널 시스템을 기반으로 측면에 2개의 스피커를 추가하여 측면의 음상정위 성능을 향상시켰으며, 전면에 2개의 수직면 스피커와 후면에 1개의 천정 스피커를 추가하여 수평면 뿐 아니라 수직면에서의 음상정위가 가능하다. 10.2 채널 시스템에 대한 성능을 평가하기 위해 APM 모델을 활용한 객관적 음상정위 평가와 22.2 채널과 10.2 채널 재현시스템을 구축하여 청취자를 통한 실제 주관적 음상정위 평가를 수행하였다. 객관적, 주관적 음상정위 평가 결과 10.2 채널 시스템은 22.2 채널 시스템과 통계학적으로 동일한 음성정위 평가 결과를 보였고, 기존 5.1 채널 시스템 대비 우수한 음상정위 평가결과를 보여주었다.

초광대역 음성통화 서비스를 위한 압축 기술 및 표준화 (Speech Codec Standardization for Super-wideband Communication)

  • 오은미
    • 방송과미디어
    • /
    • 제19권1호
    • /
    • pp.48-55
    • /
    • 2014
  • 오디오 신호 압축 기술 관점에서 최근 모바일 통신 시장의 가장 큰 변화 중에 하나는 광대역 음성 코덱인 AMR-WB가 HD voice 또는 VoLTE(Voice over Long Term Evolution) 서비스에 사용된다는 것이다. 모바일 방송 및 음악 재생뿐만 아니라, 통화에서도 다양한 신호를 고음질로 압축해야 하는 필요성이 대두되어 3GPP에서 EVS(Enhanced Voice Service) Codec이 표준화 진행 중이다. 본 논문에서는 실감 통화를 위해 초광대역 신호까지 압축하는 음성 통화 코덱 기술 및 3GPP표준화 현황을 소개한다. 3GPP 표준 기수에서 정의한 디자인 및 성능 요구사항과 더불어 이전 음성 압축기술과의 차이점 등을 논의한다. 또한, 향후 표준화 계획 및 시장 전망에 대해서 논의한다.

터치 스크린에서의 촉각 기술 동향

  • 임정묵;이종욱;박준석
    • 정보와 통신
    • /
    • 제29권7호
    • /
    • pp.16-24
    • /
    • 2012
  • Apple의 iPod Touch가 등장한 이래로, 다양한 모바일 디바이스에서 터치 인터페이스가 사용자 입력 수단으로서 사용되고 있다. 또한 최근 터치 인터페이스 기술은 터치할 때 사용자에게 실감나는 촉각 피드백을 제공하기 위한 다양한 방법을 시도하고 있다. 촉각 피드백의 유용성은 터치 입력에 대한 즉각적인 피드백, 오디오나 그래픽과 융합하여 사실적이고 직관적인 피드백 제공 등으로 요약할 수 있다. 이러한 장점은 터치 인터페이스 사용에 대한 사용자 경험 (User Experience)을 차별화 할 수 있기 때문에 제품 경쟁력에도 도움이 된다. 본 고에서는 촉각 피드백을 제공하는 햅틱 시스템에 대해 일반적인 내용을 알아보고, 특히 터치 인터페이스를 갖는 모바일 디바이스에서 사용될 수 있는 촉각 제 시 방법 및 촉각 액추에이터의 최근 기술동향에 대해 살펴본다.

3차원 TV 콘텐츠 기술 동향 (Research Trends in 3DTV Contents)

  • 이상광;윤영석;서영호;유원영;호요성
    • 전자통신동향분석
    • /
    • 제26권1호
    • /
    • pp.1-12
    • /
    • 2011
  • 미국과 일본, 그리고 유럽의 일부 선진국에서는 이미 1990년대 초부터 3차원 TV에 대한 연구를 시작하였고 국내에서도 이와 관련하여 일부 대학 및 연구소를 중심으로 3차원 입체영상 방식과 3차원 정보처리 기술에 대한 기초 연구가 진행되고 있다. 3차원 TV 및 실감방송 서비스를 제공하기 위해서는 다양한 멀티미디어 처리 기술이 필요하다. 다시점 카메라 시스템, 깊이 카메라, 다채널 오디오 획득 장치를 이용하여 미디어를 획득하여 편집한 후, 이를 부호화하여 전송하고 디스플레이 단에서 재현하는 기술 개발이 진행되고 있다. 현재, 국제 표준화 기구인 MPEG에서는 이런 멀티미디어 처리 기술을 바탕으로 3차원 TV에 관한 표준화 작업을 진행하고 있다. 본 고에서는 3차원 TV의 개념 및 세계 동향 그리고 현재 사용되고 있는 다양한 3차원 비디오 부호화 기술에 관하여 기술하고자 한다.

  • PDF

사용자의 음장선호도에 따른 오디오 콘텐츠 적응 기술 (Audio Contents Adaptation Technology According to User′s Preference on Sound Fields)

  • 강경옥;홍재근;서정일
    • 한국음향학회지
    • /
    • 제23권6호
    • /
    • pp.437-445
    • /
    • 2004
  • 본 논문에서는 사용자의 음장 선호도를 이용하여 오디오 콘텐츠를 사용자가 원하는 음장으로 변환하는 기술에 대하여 설명한다. 오디오 신호가 재생되는 공간의 음장을 사용자가 원하는 음장으로 변환시켜주는 음장효과 기술은 실감있고 현장감있는 음악재생에 필수적인 요소이다. 그러나, 음장효과를 실시간으로 처리하기 위해서는 막대한 연산량이 필요하므로 MP3 플레이어와 같은 휴대용 오디오 단말에서는 구현하기 힘들다. 본 논문에서는 사용자로부터 전달된 음장 선호도를 이용하여 서버에서 음장효과를 처리하도록 하여, 단말의 성능에 구애받지 않고 음장효과를 제공할 수 있는 기술을 제안한다. 사용자가 선호하는 음장을 표현하기 위하여 선호하는 음장을 실내응답신호의 URI 주소를 이용하여 표현하는 방법 뿐만 아니라 음향공간에 대한 심리적 파라미터를 이용할 수 있게 하였다. 또한, 실내응답신호와 복적분 연산을 통한 음장효과 처리 방법을 실시간 응용에 적용하기 위하여 고속 복적분 알고리즘을 제안하였으며, 실험을 통하여 실시간 응용에도 적용이 가능함을 확인하였다. 본 논문에서 제안한 음장 선호도 서술구조의 효용성을 검증하기 위하여, 일반인을 대상으로 음장을 구분하는 능력과 음장효과가 처리된 음악에 대한 선호도에 대한 주관듣기평가를 실시하여 제안된 음장 선호도가 일반인들에게 적용이 가능함을 확인하였다.