• Title/Summary/Keyword: 오디오

Search Result 1,669, Processing Time 0.034 seconds

Audio Event Detection Using Deep Neural Networks (깊은 신경망을 이용한 오디오 이벤트 검출)

  • Lim, Minkyu;Lee, Donghyun;Park, Hosung;Kim, Ji-Hwan
    • Journal of Digital Contents Society
    • /
    • v.18 no.1
    • /
    • pp.183-190
    • /
    • 2017
  • This paper proposes an audio event detection method using Deep Neural Networks (DNN). The proposed method applies Feed Forward Neural Network (FFNN) to generate output probabilities of twenty audio events for each frame. Mel scale filter bank (FBANK) features are extracted from each frame, and its five consecutive frames are combined as one vector which is the input feature of the FFNN. The output layer of FFNN produces audio event probabilities for each input feature vector. More than five consecutive frames of which event probability exceeds threshold are detected as an audio event. An audio event continues until the event is detected within one second. The proposed method achieves as 71.8% accuracy for 20 classes of the UrbanSound8K and the BBC Sound FX dataset.

The Design of Terrestrial DMB Media Processor for Multi-Channel Audio Services (멀티채널 오디오 서비스를 위한 지상파 DMB 미디어처리기 설계)

  • Kang Kyeongok;Hong Jaegeun;Seo Jeongil
    • The Journal of the Acoustical Society of Korea
    • /
    • v.24 no.4
    • /
    • pp.186-193
    • /
    • 2005
  • The Terrestrial Digital Multimedia Broadcasting (T-DMB) system supplies high quality audio comparable with VCD in 7 inch display and high quality audio comparable CD at the mobile reception environment T-DMB will launch commercial service at the middle of 2005. However the bandwidth for audio data and the number of channels are restricted to 128 kbps and 2 respectively in the current T-DMB standard because of the limitation of available bandwidth for multimedia data. This Paper Proposes a novel media processor structure for providing multi-channel audio contents oyer T-DMB system allowing backward compatibility with the legacy T-DMB receiver. Furthermore. we also Propose an adaptive receiver structure to supply optimal audio contents on various speaker configuration in T-DMB receiver. To provide multi-channel audio contents allowing backward comaptilbity with the legacy T-DMB receiver, the additional data for multi-channel audio are defined as a dependent stream of main audio stream. The OD strucure for control an additional multi-channel audio elementary stream is proposed without changing the BIFS of the legacy T-DMB system.

A Study on the Elements of Interface Design of Audio-based Social Networking Service (오디오 기반 SNS의 인터페이스 디자인 요소 연구)

  • Kim, Yeon-Soo;Choe, Jong-Hoon
    • Journal of the Korea Convergence Society
    • /
    • v.13 no.2
    • /
    • pp.143-150
    • /
    • 2022
  • Audio-based SNS also needs a visual guide to reach the contents desired by the users. Therefore, this study investigates visual interface design elements that influence the experience of using audio contents in audio-based SNS. Prior researches have identified that the generally acknowledged interface design elements are important for the usability of audio contents. Through the analysis of the currently launched audio-based SNS, the influence of general interface elements were again confirmed, and via the analysis of other audio content services, a new interface evaluation element was explored. Accordingly, with five general interface evaluation elements-layout, color, icon, typography, graphic image, multimedia elements are newly defined and proposed as crucial factors in evaluating the UI of audio-based SNS.

Hybrid Audio Technology Trends for Immersive Sound Service (고현장감 오디오 서비스를 위한 하이브리드 오디오 기술동향)

  • Jang, D.;Lee, Y.J.;Yoo, J.;Lee, T.
    • Electronics and Telecommunications Trends
    • /
    • v.31 no.3
    • /
    • pp.81-90
    • /
    • 2016
  • 현재, 극장 사운드를 중심으로 객체기반 오디오 기술을 포함하는 하이브리드 포맷의 사운드 서비스가 점차 확산되고 있으며, 미국, 유럽, 한국 등에서는 차세대 방송용 오디오에 객체기반 오디오 기술의 도입을 적극적으로 고려하고 있다. 객체기반 오디오 기술은 콘텐츠의 제작단계에서 재생환경을 고려할 필요가 없고, 현장의 음향을 신호와 3차원 공간정보로 구분하여 음향공간의 정보를 그대로 표현함으로써, 재생단말에서 3차원 공간정보를 활용하여 재생할 수 있게 한다. 이러한 객체기반 실감음향 기술개발을 위해서는 편리한 제작 및 3차원 공간정보 표현 기술이 필요하며, 청취환경에서는 객체기반 실감음향 콘텐츠를 제작자의 의도대로 렌더링할 수 있는 재생 및 제어 기술이 필요하다. 이에 객체기반 실감음향 기술이 포함되는 하이브리드 오디오 기술의 현황에 대하여 살펴보고자 한다.

  • PDF

Study for Audio Watermarking Using Echo Signal (반향 신호를 이용한 오디오 워터마킹에 관한 연구)

  • 오현오;김현욱;윤대희;차일환
    • Proceedings of the IEEK Conference
    • /
    • 2000.09a
    • /
    • pp.767-770
    • /
    • 2000
  • 본 논문에서는 고음질 오디오 신호에 임의로 삽입된 반향(Echo)신호가 음질에 미치는 영향을 조사하고, 이를 이용한 오디오 워터마킹 기법에 대해 다룬다. 일반적으로 오디오 신호에 반향을 첨가하게 되면 음색이 더욱 풍부해지는 효과를 얻을 수 있지만. 이 때 삽입된 반향신호의 시간 지연과 크기가 충분히 작을 경우에는 심리 음향모델의 시간영역 마스킹 효과에 의해 지각되지 않을 수도 있다 한편 오디오 신호의 구간별로 임의 삽입된 반향의 시간지연을 검출할 수 있다면, 이를 이용한 정보 감춤(data hiding)및 워터마킹 기법에 활용할 수 있다. 반향신호를 이용하여 원 신호에 정보를 삽입하게 되면 가우시안 잡음이나 PN 시퀸스를 이용하는 경우처럼 오디오 신호에 이질적인 잡음을 첨가하지 않기 때문에 청감 특성상 유리하며, 오디오 신호 고유의 통계적 특성을 유지 할수 있는 장점이 있다. 그러나 반향의 첨가가 음질의 왜곡은 초래하지 않으면서 정보의 검출이 가능하도록 하기위해서는 원 신호의 특성에 따른 반향 첨가 기술이 요구된다.

  • PDF

Solution Development of Digital Audio Simultaneous Broadcasting for Disaster Alarm Broadcasting System (재난경보방송시스템을 위한 디지털 오디오 동시방송 솔루션 개발)

  • Lee, Seung-Hyung;Ahn, Byung-Dug;Oh, Jung-Taek;Choi, Jong-In;Choi, Byoung-Wook
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2017.06a
    • /
    • pp.223-226
    • /
    • 2017
  • 재난경보방송시스템에서 오디오 방송은 여러 가지 형태의 통신망을 이용하여 서비스되고 있다. 상용전화망, 이동통신망, 무선자가망 등이 있으나 오디오 동시방송이라는 요구는 충족하지 못하는 것이 사실이다. 또한, 아날로그 기반의 통신으로 오디오 품질이 만족스럽지 못한 편이다. 본 논문에서는 다양한 통신망에서 재난정보 서비스를 수행할 수 있는 재난경보방송시스템 모델을 제시하며, 이더넷과 같은 디지털 통신망 기반의 오디오 동시방송을 위한 솔루션을 연구 개발하였다. 방송송신설비 및 IP 교환기와 같은 하드웨어 요소를 제외하여 구축비용에 대한 부담을 줄이고, 통신 대역폭이 보장될 경우 실시간 동시방송이 가능하도록 설계하였다. 오디오 송신은 공개된 라이브러리를 사용하여 윈도우 기반의 소프트웨어 구조를 가지며, 오디오 수신은 임베디드 장치 기반으로 임베디드 리눅스에서 수신하고 재생할 수 있도록 구현하였다.

  • PDF

A Study on Deveopment of User's Contort or Play of Multichannel input Audio Source (사용자의 다채널 입력 오디오 음원 선택 및 재생 모듈 개발에 관한 연구)

  • Jung, Jong-Jin;Lim, Tae-Bum;Lee, Seok-Pil
    • Proceedings of the KIEE Conference
    • /
    • 2008.10b
    • /
    • pp.270-271
    • /
    • 2008
  • 고품질, 고기능 오디오에 대한 대중적인 수요가 증대되고 있는데, 이는 첫째로 레코딩 기술의 발달, 둘째로 저장매체와 발달과 코딩기술의 발달에 의한 오디오 저장 데이터 량의 증가, 또한 디지털 출력회로에 의해 가능해진 저렴한 고음질 오디오 출력장치에 그 원인이 있다고 할 수 있다. 더구나, 발달된 디지털 신호처리 기술로 각종 필터의 구현, 음장제어, 3차원 사운드 효과 등이 가능해져서 시장에서의 수요를 견인하는 새로운 오디오 장치의 개발이 필요한 상황이다. 이러한 요구에 부응하여 디지털 음원들을 입력받아 임의의 필터링을 실행하고, 출력 유닛의 공간적, 음향적 특성을 상위제어기로부터 입력받아 전 신호경로 상에 디지털 신호처리 하여 출력신호를 생성하는 장치가 요구된다. 이는 단순히 청취만 가능했던 기존의 수동적이고 일방적인 오디오 서비스와 달리 청취자가 자신의 취향에 따라 음악을 들을 수 있는 능동적인 오디오 서비스가 가능해졌다.

  • PDF

Soundtrack Search System for Interactive-Smart-Television (인터액티브 스마트 TV 적용을 위한 사운드트랙 검색 시스템)

  • Ryu, Sang-Hyeon;Cho, Jea-Man;Kim, Hyoung-Gook
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2011.07a
    • /
    • pp.202-203
    • /
    • 2011
  • 본 논문에서는 인터액티브 스마트 TV 적용을 위한 사운드트랙 검색 시스템을 제안한다. 제안하는 시스템은 동영상을 오디오와 비디오특징을 구분한 후, 각 오디오와 비디오 신호를 분석한다. 비디오 신호의 분석은 MPEG-2 비디오 인코더로부터 영상의 장면전환과 시작과 끝 위치를 검출하고, 오디오 신호의 분석은 AC-3 오디오 인코더로부터 오디오 특징을 추출한 후, 오디오 정보의 비트 벡터를 추출하여 데이터베이스를 생성한다. 생성된 데이터베이스와 사용자가 북마크를 하여 요청한 쿼리와 비교를 통하여 오디오 특징정보가 유사한 부분의 장면을 검색하고, 검색된 장면을 사용자에게 제공한다. 제안된 시스템의 성능 측정을 위해서 뉴스, 패널토론, 음악방송, 광고, 드라마 등 50개 TV 방송 프로그램의 데이터베이스를 이용해서 정확성을 측정하였다.

  • PDF

Thumbnail Generation of Golf Videos Using Audio-Based Boundary Detection for Smart TV (스마트 TV의 골프동영상 썸네일 생성을 위한 오디오기반 경계영역 검출 기법)

  • Choi, Hee-Min;Lee, Jin-Ho;Kim, Hyoung-Gook
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2011.07a
    • /
    • pp.494-495
    • /
    • 2011
  • 본 논문에서는 스마트 TV 시청시에 녹화하는 골프 동영상에서 오디오기반의 경계영역 검출를 이용하여 썸네일을 고속으로 생성하는 방법을 제안한다. 제안된 방법은 녹화되는 골프동영상의 인코딩된 오디오 정보로 부터 추출된 MDCT계수를 이용하여 온셋 구간 검출 및 오디오 세그먼테이션을 수행함으로써 골프 동영상을 6개의 오디오 클래스로 자동 분할한다. 분할된 오디오 세그먼트와 상응하는 비디오 프레임을 맵핑하여 골프 동영상의 썸네일을 생성한다. 제안된 오디오기반 경계영역 검출방법의 성능 측정 결과, 97.4%의 Recall과 96.85%의 Precision의 우수한 분류 성능을 나타내었다.

  • PDF

오디오 사운드 크기 경쟁 속 오디오 사운드 크기 측정 방법 및 컨트롤 기술

  • Jo, Chung-Sang;Jang, Gyu-Sik;Kim, Je-U
    • Information and Communications Magazine
    • /
    • v.29 no.4
    • /
    • pp.15-21
    • /
    • 2012
  • 디지털 오디오 기술 중 하나인 MP3(MPEG-1 Layer III) 기술을 이용한 음원(음악, 노래 등) 파일이 대중화되면서 휴대용 멀티미디어 기기는 현대인들의 필수 아이템이 되고 있다. 반면 현대인은 휴대용 기기뿐만 아니라 다양한 소음으로 인해 청각적인 피로도가 크게 증가하고 있다. 또한 상업 음악은 사용자의 관심을 얻기 위하여 오디오 음원의 사운드 크기를 지속적으로 증가시키고 있다. 이러한 요인은 사람들의 청각 기능에 악영향을 미치고 있다. 본고에서는 휴대용 멀티미디어 기기의 대중화 및 오디오 사운드 크기(loudness)의 증가에 따라서 발생하고 있는 문제점을 설명하고, 문제점을 해결하기 위해 제안된 오디오 사운드 크기 측정 기술 및 오디오 사운드 크기 컨트롤 기술에 대해서 알아본다.