• 제목/요약/키워드: 오디오

검색결과 1,670건 처리시간 0.036초

깊은 신경망을 이용한 오디오 이벤트 검출 (Audio Event Detection Using Deep Neural Networks)

  • 임민규;이동현;박호성;김지환
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권1호
    • /
    • pp.183-190
    • /
    • 2017
  • 본 논문에서는 깊은 신경망을 이용한 오디오 이벤트 검출 방법을 제안한다. 오디오 입력의 매 프레임에 대한 오디오 이벤트 확률을 feed-forward 신경망을 적용하여 생성한다. 매 프레임에 대하여 멜 스케일 필터 뱅크 특징을 추출한 후, 해당 프레임의 전후 프레임으로부터의 특징벡터들을 하나의 특징벡터로 결합하고 이를 feed-forward 신경망의 입력으로 사용한다. 깊은 신경망의 출력층은 입력 프레임 특징값에 대한 오디오 이벤트 확률값을 나타낸다. 연속된 5개 이상의 프레임에서의 이벤트 확률값이 임계값을 넘을 경우 해당 구간이 오디오 이벤트로 검출된다. 검출된 오디오 이벤트는 1초 이내에 동일 이벤트로 검출되는 동안 하나의 오디오 이벤트로 유지된다. 제안된 방법으로 구현된 오디오 이벤트 검출기는 UrbanSound8K와 BBC Sound FX자료에서의 20개 오디오 이벤트에 대하여 71.8%의 검출 정확도를 보였다.

멀티채널 오디오 서비스를 위한 지상파 DMB 미디어처리기 설계 (The Design of Terrestrial DMB Media Processor for Multi-Channel Audio Services)

  • 강경옥;홍재근;서정일
    • 한국음향학회지
    • /
    • 제24권4호
    • /
    • pp.186-193
    • /
    • 2005
  • 지상파 디지털멀티미디어방송 (Terrestrial Digital Multimedia Broadcasting, T-DMB)은 7인치 화면에서 VCD급의 고화질 비디오와 CD급의 고품질 오디오를 이동수신 환경에서 제공하는 기술로서, 2005년도 중반부터 상용 서비스가 시작될 예정이다. 그러나, T-DMB 규격에서는 가용 대역폭의 제한으로 인하여 오디오 신호를 위한 대역폭이 128kbps로 제한되어 있으며, 모노와 스테레오 채널 서비스만이 가능하도록 하고 있다. 본 논문은 기존의 T-DMB 수신기과 역호환성 (Backward Compatibility)을 유지하면서 멀티채널 오디오 콘텐츠를 제공할 수 있는 미디어처리기와 재생기 구조를 제안한다. 또한, T-DMB수신기의 다양한 스피커 환경에서도 최적의 오디오 콘텐츠를 제공할 수 있도록, 멀티채널 오디오 콘텐츠를 재생환경에 맞게 적응시킬 수 있는 수신기 구조를 제안한다. 기존의 T-DMB 수신기와 호환성을 유지하면서 멀티채널 오디오 콘텐츠를 제공하기 위하여 멀티채널 오디오를 위한 부가데이터를 메인 오디오 스트림의 종속 스트림으로 정의하였으며, 기존 T-DMB 시스템의 BIFS (Binary Format for Scene)를 수정하지 않고 부가되는 오디오 객체를 제어할 수 있는 OD (Object Descriptor) 구조를 제안한다.

오디오 기반 SNS의 인터페이스 디자인 요소 연구 (A Study on the Elements of Interface Design of Audio-based Social Networking Service)

  • 김연수;최종훈
    • 한국융합학회논문지
    • /
    • 제13권2호
    • /
    • pp.143-150
    • /
    • 2022
  • 오디오 기반 SNS 또한 사용자가 원하는 콘텐츠에 도달하기 위한 시각적 가이드가 필요하다. 이에 본 연구는 오디오 기반 SNS에서 오디오 콘텐츠의 사용 경험에 영향을 미치는 시각적 인터페이스 디자인 요소에 대해 연구하였다. 선행연구를 통해 기존의 일반적인 인터페이스 디자인 요소가 오디오 콘텐츠의 사용성에 중요함을 파악하였다. 현재 출시된 오디오 기반 SNS의 분석을 통해 기존 인터페이스 요소의 의미와 영향을 확인하였고, 기타 오디오 콘텐츠 서비스의 분석을 통해 오디오 SNS에 있어 고려할 새로운 기준의 인터페이스 평가 속성을 도출하였다. 이에 일반적인 다섯 가지 인터페이스 평가 요소인 레이아웃, 컬러, 아이콘, 타이포그래피, 그래픽 이미지에 멀티미디어 요소를 새롭게 정의하며, 오디오 기반 SNS의 UI를 고려할 요소로 제안한다.

고현장감 오디오 서비스를 위한 하이브리드 오디오 기술동향 (Hybrid Audio Technology Trends for Immersive Sound Service)

  • 장대영;이용주;유재현;이태진
    • 전자통신동향분석
    • /
    • 제31권3호
    • /
    • pp.81-90
    • /
    • 2016
  • 현재, 극장 사운드를 중심으로 객체기반 오디오 기술을 포함하는 하이브리드 포맷의 사운드 서비스가 점차 확산되고 있으며, 미국, 유럽, 한국 등에서는 차세대 방송용 오디오에 객체기반 오디오 기술의 도입을 적극적으로 고려하고 있다. 객체기반 오디오 기술은 콘텐츠의 제작단계에서 재생환경을 고려할 필요가 없고, 현장의 음향을 신호와 3차원 공간정보로 구분하여 음향공간의 정보를 그대로 표현함으로써, 재생단말에서 3차원 공간정보를 활용하여 재생할 수 있게 한다. 이러한 객체기반 실감음향 기술개발을 위해서는 편리한 제작 및 3차원 공간정보 표현 기술이 필요하며, 청취환경에서는 객체기반 실감음향 콘텐츠를 제작자의 의도대로 렌더링할 수 있는 재생 및 제어 기술이 필요하다. 이에 객체기반 실감음향 기술이 포함되는 하이브리드 오디오 기술의 현황에 대하여 살펴보고자 한다.

  • PDF

반향 신호를 이용한 오디오 워터마킹에 관한 연구 (Study for Audio Watermarking Using Echo Signal)

  • 오현오;김현욱;윤대희;차일환
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.767-770
    • /
    • 2000
  • 본 논문에서는 고음질 오디오 신호에 임의로 삽입된 반향(Echo)신호가 음질에 미치는 영향을 조사하고, 이를 이용한 오디오 워터마킹 기법에 대해 다룬다. 일반적으로 오디오 신호에 반향을 첨가하게 되면 음색이 더욱 풍부해지는 효과를 얻을 수 있지만. 이 때 삽입된 반향신호의 시간 지연과 크기가 충분히 작을 경우에는 심리 음향모델의 시간영역 마스킹 효과에 의해 지각되지 않을 수도 있다 한편 오디오 신호의 구간별로 임의 삽입된 반향의 시간지연을 검출할 수 있다면, 이를 이용한 정보 감춤(data hiding)및 워터마킹 기법에 활용할 수 있다. 반향신호를 이용하여 원 신호에 정보를 삽입하게 되면 가우시안 잡음이나 PN 시퀸스를 이용하는 경우처럼 오디오 신호에 이질적인 잡음을 첨가하지 않기 때문에 청감 특성상 유리하며, 오디오 신호 고유의 통계적 특성을 유지 할수 있는 장점이 있다. 그러나 반향의 첨가가 음질의 왜곡은 초래하지 않으면서 정보의 검출이 가능하도록 하기위해서는 원 신호의 특성에 따른 반향 첨가 기술이 요구된다.

  • PDF

재난경보방송시스템을 위한 디지털 오디오 동시방송 솔루션 개발 (Solution Development of Digital Audio Simultaneous Broadcasting for Disaster Alarm Broadcasting System)

  • 이승형;안병덕;오정택;최종인;최병욱
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2017년도 하계학술대회
    • /
    • pp.223-226
    • /
    • 2017
  • 재난경보방송시스템에서 오디오 방송은 여러 가지 형태의 통신망을 이용하여 서비스되고 있다. 상용전화망, 이동통신망, 무선자가망 등이 있으나 오디오 동시방송이라는 요구는 충족하지 못하는 것이 사실이다. 또한, 아날로그 기반의 통신으로 오디오 품질이 만족스럽지 못한 편이다. 본 논문에서는 다양한 통신망에서 재난정보 서비스를 수행할 수 있는 재난경보방송시스템 모델을 제시하며, 이더넷과 같은 디지털 통신망 기반의 오디오 동시방송을 위한 솔루션을 연구 개발하였다. 방송송신설비 및 IP 교환기와 같은 하드웨어 요소를 제외하여 구축비용에 대한 부담을 줄이고, 통신 대역폭이 보장될 경우 실시간 동시방송이 가능하도록 설계하였다. 오디오 송신은 공개된 라이브러리를 사용하여 윈도우 기반의 소프트웨어 구조를 가지며, 오디오 수신은 임베디드 장치 기반으로 임베디드 리눅스에서 수신하고 재생할 수 있도록 구현하였다.

  • PDF

사용자의 다채널 입력 오디오 음원 선택 및 재생 모듈 개발에 관한 연구 (A Study on Deveopment of User's Contort or Play of Multichannel input Audio Source)

  • 정종진;임태범;이석필
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2008년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.270-271
    • /
    • 2008
  • 고품질, 고기능 오디오에 대한 대중적인 수요가 증대되고 있는데, 이는 첫째로 레코딩 기술의 발달, 둘째로 저장매체와 발달과 코딩기술의 발달에 의한 오디오 저장 데이터 량의 증가, 또한 디지털 출력회로에 의해 가능해진 저렴한 고음질 오디오 출력장치에 그 원인이 있다고 할 수 있다. 더구나, 발달된 디지털 신호처리 기술로 각종 필터의 구현, 음장제어, 3차원 사운드 효과 등이 가능해져서 시장에서의 수요를 견인하는 새로운 오디오 장치의 개발이 필요한 상황이다. 이러한 요구에 부응하여 디지털 음원들을 입력받아 임의의 필터링을 실행하고, 출력 유닛의 공간적, 음향적 특성을 상위제어기로부터 입력받아 전 신호경로 상에 디지털 신호처리 하여 출력신호를 생성하는 장치가 요구된다. 이는 단순히 청취만 가능했던 기존의 수동적이고 일방적인 오디오 서비스와 달리 청취자가 자신의 취향에 따라 음악을 들을 수 있는 능동적인 오디오 서비스가 가능해졌다.

  • PDF

인터액티브 스마트 TV 적용을 위한 사운드트랙 검색 시스템 (Soundtrack Search System for Interactive-Smart-Television)

  • 류상현;조재만;김형국
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 하계학술대회
    • /
    • pp.202-203
    • /
    • 2011
  • 본 논문에서는 인터액티브 스마트 TV 적용을 위한 사운드트랙 검색 시스템을 제안한다. 제안하는 시스템은 동영상을 오디오와 비디오특징을 구분한 후, 각 오디오와 비디오 신호를 분석한다. 비디오 신호의 분석은 MPEG-2 비디오 인코더로부터 영상의 장면전환과 시작과 끝 위치를 검출하고, 오디오 신호의 분석은 AC-3 오디오 인코더로부터 오디오 특징을 추출한 후, 오디오 정보의 비트 벡터를 추출하여 데이터베이스를 생성한다. 생성된 데이터베이스와 사용자가 북마크를 하여 요청한 쿼리와 비교를 통하여 오디오 특징정보가 유사한 부분의 장면을 검색하고, 검색된 장면을 사용자에게 제공한다. 제안된 시스템의 성능 측정을 위해서 뉴스, 패널토론, 음악방송, 광고, 드라마 등 50개 TV 방송 프로그램의 데이터베이스를 이용해서 정확성을 측정하였다.

  • PDF

스마트 TV의 골프동영상 썸네일 생성을 위한 오디오기반 경계영역 검출 기법 (Thumbnail Generation of Golf Videos Using Audio-Based Boundary Detection for Smart TV)

  • 최희민;이진호;김형국
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 하계학술대회
    • /
    • pp.494-495
    • /
    • 2011
  • 본 논문에서는 스마트 TV 시청시에 녹화하는 골프 동영상에서 오디오기반의 경계영역 검출를 이용하여 썸네일을 고속으로 생성하는 방법을 제안한다. 제안된 방법은 녹화되는 골프동영상의 인코딩된 오디오 정보로 부터 추출된 MDCT계수를 이용하여 온셋 구간 검출 및 오디오 세그먼테이션을 수행함으로써 골프 동영상을 6개의 오디오 클래스로 자동 분할한다. 분할된 오디오 세그먼트와 상응하는 비디오 프레임을 맵핑하여 골프 동영상의 썸네일을 생성한다. 제안된 오디오기반 경계영역 검출방법의 성능 측정 결과, 97.4%의 Recall과 96.85%의 Precision의 우수한 분류 성능을 나타내었다.

  • PDF

오디오 사운드 크기 경쟁 속 오디오 사운드 크기 측정 방법 및 컨트롤 기술

  • 조충상;장규식;김제우
    • 정보와 통신
    • /
    • 제29권4호
    • /
    • pp.15-21
    • /
    • 2012
  • 디지털 오디오 기술 중 하나인 MP3(MPEG-1 Layer III) 기술을 이용한 음원(음악, 노래 등) 파일이 대중화되면서 휴대용 멀티미디어 기기는 현대인들의 필수 아이템이 되고 있다. 반면 현대인은 휴대용 기기뿐만 아니라 다양한 소음으로 인해 청각적인 피로도가 크게 증가하고 있다. 또한 상업 음악은 사용자의 관심을 얻기 위하여 오디오 음원의 사운드 크기를 지속적으로 증가시키고 있다. 이러한 요인은 사람들의 청각 기능에 악영향을 미치고 있다. 본고에서는 휴대용 멀티미디어 기기의 대중화 및 오디오 사운드 크기(loudness)의 증가에 따라서 발생하고 있는 문제점을 설명하고, 문제점을 해결하기 위해 제안된 오디오 사운드 크기 측정 기술 및 오디오 사운드 크기 컨트롤 기술에 대해서 알아본다.