• 제목/요약/키워드: 실감 오디오

검색결과 45건 처리시간 0.034초

Weakly labeled 데이터 기반 음향 이벤트 인식 알고리즘 성능 분석 (Performance analysis of acoustic event detection algorithm using weakly labeled data)

  • 임우택;서상원;박수영;정영호;이태진
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 하계학술대회
    • /
    • pp.160-162
    • /
    • 2019
  • 음향 이벤트 인식 기술은 오디오 신호에서 음향 이벤트를 예측하는 기술로, 최근 대용량 데이터베이스의 배포, 인식 알고리즘과 하드웨어의 발전, 관련 인식 대회 등에 힘입어 많은 연구가 이루어지고 있는 분야이다. 본 논문에서는 음향 장면 및 이벤트 인식 관련 대회인 DCASE 챌린지에 대하여 기술하고, 약한 레이블 기반의 데이터를 학습해 강한 레이블을 예측하는 DCASE 챌린지 과제 4에 대하여 설명한다. 또한 DCASE 챌린지 과제 4에 제출된 다양한 음향 이벤트 인식 알고리즘과 데이터베이스의 종류에 따른 성능을 비교하여 음향 이벤트 인식 성능을 분석한다.

  • PDF

다시점 방송 서비스를 위한 사용자 위치추적 기반 다채널 오디오 패닝 시스템 구현 (Implementation of a Person Tracking Based Multi-channel Audio Panning System for Multi-view Broadcasting Services)

  • 김용국;양종열;이영한;김홍국
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.150-157
    • /
    • 2009
  • 본 논문에서는 다시점 방송 서비스(multi-view broadcasting service)를 위한 사용자 위치추적 기반 다채널 오디오 패닝 시스템을 제안한다. 다시점 방송이란 각기 다른 시점에 해당하는 카메라들을 이용하여 촬영한 영상을 렌더링 해주는 방송 서비스이며 다채널 오디오 패닝 기법은 이러한 다시점 방송의 실감효과를 증대시키기 위한 오디오 렌더링에 필요한 기술이다. 이런 실감 오디오 기술을 다시점 방송 서비스에 적용하기 위해서 사용자의 시점정보를 얻을 수 있는 사용자 추적 기술 역시 필요하다. 이를 위해서 본 논문에서 제안한 기술은 크게 두 가지로 나눌 수 있다. 첫째로, 초음파 위성 및 수신기를 이용하는 사용자 추적 기술을 제안한다. 제안한 사용자 추적 기술을 이용해 약 10 mm 근방의 높은 해상도와 약 0.15초의 빠른 간격으로 사용자의 위치정보를 얻을 수 있었다. 둘째로, 공간 파라메터 기반 다채널 오디오 패닝 기술을 제안한다. 제안한 오디오 패닝 기법은 MPEG Surround로 압축된 오디오에 대해 MPEG Surround의 공간 파라메터를 이용하여 복호화 시 패닝된 오디오를 얻는 방법이다. 제안된 방법의 성능을 평가하기위해 음질 측면과 음상 정위 측면에서 성능을 평가하였다. 음질 측정은 MUSHRA 방법으로 이루어졌으며, 제안된 방식은 약 90점에 해당하는 MUSHRA점수로 평가되었다. 또한, 음상 정위 성능은 더미헤드를 이용하여 각 패닝 오디오에 대한 각도별 주파수응답을 측정하여 방사패턴을 분석하였다. 그 결과 본 논문에서 제안된 방식은 기존 파라메터 기반 오디오 패닝 방식에 비해 향상된 음질을 보임과 동시에 음상이 올바른 위치에 정위됨을 보일 수 있었다. 마지막으로 제안된 사용자 추적 기법 및 오디오 패닝 기법을 다시점 영상 재생 시스템과 결합시킴으로써, 사용자 추적 기반 다시점 방송 시스템의 프로토타입을 구현하였다.

  • PDF

UHDTV를 위한 실감 오디오 재현 기술 (A Study on Realistic Sound Reproduction for UHDTV)

  • 장대영;서정일;이용주;유재현;박태진;이태진
    • 방송공학회논문지
    • /
    • 제20권1호
    • /
    • pp.68-81
    • /
    • 2015
  • 최근 부품기술 및 미디어 처리기술의 발전과 함께 HDTV를 이을 UHDTV 서비스가 곧 도래할 것이라는 예상이 기정사실화되고 있다. 이에 따라 HDTV에서 5.1채널 서라운드 사운드를 제공했던 오디오 기술도 UHDTV 시대의 도래와 함께 어떠한 서비스를 제공하여야 할지 고민하여야 할 시점에 와 있다. 그러나 현실은 HDTV의 5.1채널 사운드 포맷조차도 가정에서의 설치 및 유지의 어려움으로 인해 시장에서의 고전을 면치 못하고 있다. 한편, 영화 사운드 시장에서는 오랫동안 사용되고 있던 5.1, 7.1 채널 사운드 포맷이 돌비 ATMOS, IOSONO, AURO3D 등 천정 사운드와 객체기반 오디오를 포함하는 하이브리드 오디오 기술이 잇달아 도입되면서 일대 격변기를 맞이하고 있다. 이러한 객체기반 오디오 기술은 홈씨어터 및 방송 오디오 시장에서도 도입이 확실시되고 있는 실정이며, 이러한 오디오 기술의 변화는 유연성이 결여된 채널기반 오디오의 기술 발전 및 시장 성장의 활로를 개척하는 호기가 될 것으로 전망된다. 따라서 본 논문에서는 UHDTV 방송에 적합한 실감 오디오 기술에 대한 고찰과 이와 관련된 하이브리드 오디오 기술의 콘텐츠 포맷 및 가정에서의 재현 방안에 대해서 기술하고 향후 전망을 고찰해 보고자 한다.

헤드폰 청취환경에서의 실감 오디오 재현을 위한 음상 외재화 기법 (A Sound Externalization Method for Realistic Audio Rendering in a Headphone Listening Environment)

  • 김용국;전찬준;김홍국;이용주;장대영;강경옥
    • 대한전자공학회논문지SP
    • /
    • 제47권5호
    • /
    • pp.1-8
    • /
    • 2010
  • 본 논문에서는 헤드폰 재생 환경에서의 머리 밖 음상정위를 위한 음상 외재화(externalization) 기법을 제안한다. 제안된 기법에서는 기존의 머리전달함수(HRTF) 또는 초기 반사음 등을 이용한 외재화 기법들에서 발생하는 정위된 음성의 음색 왜곡을 줄이는 것에 그 초점을 맞춘다. 즉, 제안된 음상 외재화 기법은 모델 기반의 HRTF와 잔향 기법을 결합하고, 전방 음상 외재화의 성능 향상을 위하여 decorrelation 및 spectral notch 필터링 기법 등을 포함한다. 제안된 음상 외재화 기법의 성능을 평가하기 위하여 백색잡음, 효과음, 음성 및 오디오 등 다양한 장르의 음원을 이용하여, 평가자의 주관에 의한 청취평가를 수행하였다. 제안된 음상 외재화 알고리즘은 성능평가 결과에서 기존의 방법에 비해 더 좋은 외재화 거리 성능을 보였다.

스마트 모바일 기기에서의 객체 기반 실감 음원 서비스 구현 (A Desigin of real sound service based-on object in Smart mobile devices)

  • 정종진;임태범;이석필
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.685-688
    • /
    • 2011
  • 앞으로의 멀티미디어 기기시장은 기존의 단순 복합 디지털 기기들이 아닌 사용자 감성 및 취향 제어가 가능한 인간 친화적 지능형 멀티미디어 기기가 주류를 이룰 것이다. 이미 IT 기능이 기존의 '정보의 소통'에서 '감성의 소통'으로 진화 중에 있으며, 미래시대에는 느낌까지 디지털 신호로 전달 가능한 기술이 발달 될 것이다. 이에 맞추어 사람의 감성, 주변 분위기, 섬세한 공간 정보를 전달하는 사실적인 오디오 개발 및 인프라가 구축되어 모든 멀티미디어 제품에 적용된다면, 사용자는 보다 현장감 있게 멀티미디어를 즐길 수 있을 것이다. 최근 스마트폰의 확산과 더불어 각종 다양한 음악서비스를 제고하는 웹/앱 형태의 어플리케이션이 증대되고 있는 바, 본 논문에서는 안드로이드 기반 스마트 모바일 기기에서 다양한 오디오 정보를 청취자에게 제공하고 이를 활용하여 청취자가 다양하게 오디오 재생 / 제어하여, 일방적으로 청취자가 오디오를 듣는 수준이 아니라 청취자 취향에 따라 다양하게 오디오를 감상 할 수 있는 서비스를 구현하였다.

3차원 입체 음향 핵심 알고리즘 평가를 위한 DB 설계 (An Architecture for 3D Audio Core Algorithm Evaluation DB)

  • 황재민;김정혁;강상길
    • 정보화연구
    • /
    • 제11권2호
    • /
    • pp.225-233
    • /
    • 2014
  • 오디오 산업은 프리미엄 산업으로써 나날이 발전 하고 있다. 입체 음향 시스템에 관한 연구는 많이 진행 되고 있다. 하지만 Audio database, algorithm, evaluation, metadata scheme 이 모두 각각 이루어지고 있다. 하나의 시스템에서 만들어진 audio 알고리즘을 평가 하고, 저장 할 수 있다면 입체 음향 오디오 연구 발전에 도움이 될 것이다. 그래서 이 논문 에서는 실감형 3D 오디오의 알고리즘을 시스템 적으로 평가 할 수 있는 Database Architecture 제안 하고, 이 Database system 구현을 위하여 XML metadata scheme를 정의 하였다. 본 논문에서는 새로운 오디오 평가 DB를 제시하고, 이를 체계적으로 구현하기 위한 설계를 제시하고자 한다.

실감음향 체험을 통한 통섭의 요가 (Yoga of Consilience through Immersive Sound Experience)

  • 현진오
    • 방송공학회논문지
    • /
    • 제26권5호
    • /
    • pp.643-651
    • /
    • 2021
  • 현대인들의 정보습득은 대부분 시각을 통해 이루어진다. 컴퓨터, 스마트폰 등의 스크린은 사람들의 시각을 끊임없이 자극하여 피로감을 증가시킨다. 이러한 사회 현상 속에서 21세기의 최첨단 사운드 시스템의 실감 나고 풍부한 소리는 사람들의 몸과 마음에 다양한 방법으로 영향을 미칠 수 있다. 소리를 통해 인간은 마음을 안정시키고 자신을 관찰할 여지를 제공받게 되는 것이다. 본 논문에서는 ALgruppe와 Rory's PranaLab이 공동으로 실시한 실감음향을 기반으로 한 입체음향요가 수련을 소개하고 실감오디오 시스템에 관한 이해를 도모하고자 하는 목적을 가진다. 실감음향으로 체험하는 입체음향 요가는 단순히 소리의 효과를 누리는 것이 아니라 요가 수련자들이 내면을 들여다보는 자의식을 갖게 하는 강력한 에너지가 됨을 알 수 있었다. 이는 현대사회의 지식의 지평이 요구하는 다학문적 교류에 대한 응답임과 동시에 새로운 문화콘텐츠의 가능성을 알리는 것이다.

초고선명 디지털 TV 를 위한 차세대 라우드스피커 레이아웃 (Next-generation loudspeaker layout for Ultra High Definition (UHD) Digital TV)

  • 이영우;김선민
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 하계학술대회
    • /
    • pp.57-60
    • /
    • 2011
  • 본 논문에서는 초고선명 디지털 TV 를 위한 차세대 멀티채널 사운드 시스템의 최적의 라우드스피커 레이아웃을 도출하기 위해 다양한 라우드스피커 배치 환경에서 인지 관점의 오디오 음질 주관평가를 실시하였다. NHK 22.2 채널 시스템, ITU-R BS.775-2 표준의 7.1 채널 시스템과, 실감 음향에 가장 중요한 역할을 하는 Top Layer 라우드스피커에 중점을 두고 다양한 신규 레이아웃 구성들을 비교하였으며, 스튜디오에서 믹싱된 컨텐츠와 B-format 레코딩을 멀티채널로 생성한 컨텐츠를 이용하여 주관 평가를 실시하였다. 주관 평가 결과, Top Layer 에 3 개의 라우드스피커를 가지는 10.2 채널 라우드스피커 레이아웃이 평가에서 사용된 전체적인 오디오 음질의 등급에서 NHK 22.2 채널 시스템과 차이를 인지하기 어렵다는 결과를 도출하였다.

  • PDF

헤드폰을 이용한 음상 정위 변화 연구 (Sound Localization Change Research Using a Headphone)

  • 박윤정;장달원;신사임;이종설;장세진
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 하계학술대회
    • /
    • pp.153-154
    • /
    • 2015
  • 최근 영상 및 음향 기술이 발전함에 따라서 실감 오디오에 대한 기술이 촉구 되고 있으며 커넥티드 오디오에 대한 수요와 공급이 매년 증가하고 있다. 본 논문은 헤드폰을 이용해서 사용자에게 제공되는 일반적인 스테레오 신호 및 모노 신호를 음상 정위을 변화시키기 위해서 HRTF (Head response transfer function)을 적용하였으며 인공 잔향을 이용해서 공간감을 구현하였다. 실제 실험을 위해서 MATLAB을 이용하여 시물레이션을 구현하였으며 MATLAB의 GUI를 통해서 사용자에게 음상의 위치를 입력받게 된다. 이를 통해 음상이 사용자가 입력한 순서의 경로를 따라서 음상 정위가 변화에 대해서 입증하였다.

  • PDF