• Title/Summary/Keyword: 오디오신호

Search Result 438, Processing Time 0.023 seconds

An Analysis on Audio Quality Deterioration of Acoustic OFDM (음향 OFDM의 음질 저하 원인 분석)

  • Cho, Ki-Ho;Yu, Hwan-Sik;Chang, Jun-Hyuck;Kim, Nam-Soo
    • The Journal of the Acoustical Society of Korea
    • /
    • v.28 no.2
    • /
    • pp.107-111
    • /
    • 2009
  • Acoustic OFDM is used for audible frequency band acoustic communication which employs loudspeaker as transmitter and microphone as the receiver antenna. Since acoustic OFDM can transmit about 1 kbps using 1600 Hz band. acoustic OFDM signal is inserted into the audio signal like music or speech, However. audio quality deteriorates definitely during the inserting process. This paper introduces a reason for audio quality deterioration and discuss how to reduce this phenomenon.

A New Wideband Speech/Audio Coder Interoperable with ITU-T G.729/G.729E (ITU-T G.729/G.729E와 호환성을 갖는 광대역 음성/오디오 부호화기)

  • Kim, Kyung-Tae;Lee, Min-Ki;Youn, Dae-Hee
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.45 no.2
    • /
    • pp.81-89
    • /
    • 2008
  • Wideband speech, characterized by a bandwidth of about 7 kHz (50-7000 Hz), provides a substantial quality improvement in terms of naturalness and intelligibility. Although higher data rates are required, it has extended its application to audio and video conferencing, high-quality multimedia communications in mobile links or packet-switched transmissions, and digital AM broadcasting. In this paper, we present a new bandwidth-scalable coder for wideband speech and audio signals. The proposed coder spits 8kHz signal bandwidth into two narrow bands, and different coding schemes are applied to each band. The lower-band signal is coded using the ITU-T G.729/G.729E coder, and the higher-band signal is compressed using a new algorithm based on the gammatone filter bank with an invertible auditory model. Due to the split-band architecture and completely independent coding schemes for each band, the output speech of the decoder can be selected to be a narrowband or wideband according to the channel condition. Subjective tests showed that, for wideband speech and audio signals, the proposed coder at 14.2/18 kbit/s produces superior quality to ITU-T 24 kbit/s G.722.1 with the shorter algorithmic delay.

The Layered Digital Audio Watermark (디지털 오디오의 계층적 워터마크)

  • 정사라;홍진우
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2001.11b
    • /
    • pp.175-179
    • /
    • 2001
  • 본 논문에서는 디지털 오디오 데이터에 부가 정보를 삽입하는 기술로써 계층적 워터마크를 사용하여 시간 변형을 감지할 수 있고, 필요에 따라 검출 복잡도를 조절할 수 있는 기법을 제안한다. 1계층 워터마크는 오디오 데이터의 시간축 변형을 감지할 수 있도록 오디오 데이터의 반향을 이용하고, 2계층 워터마크는 1계층 워터마크된 오디오 데이터를 기준으로 대역 확산 기법을 이용하여 저작권 정보 등의 요구량이 많은 부가 정보를 삽입한다. 이 때, 2계층 워터마크는 프레임의 동기 확보를 위한 동기 수열, 부가 정보 삽입을 위한 데이터 수열, 두 개를 이용한다. 검출기에서는 시스템의 요구 사항에 따라 1계층, 2계층 전단계, 2계층 본 단계 등의 계층적 순서로 검출할 수 있으며, 각 계층은 데이터에 가해진 변형 정도를 추정하여 다음 계층의 검출단에 정보를 제공한다. 여러 가지 실험 결과를 통하여 제안한 방식이 다양한 신호 처리에 강인함을 보였다.

  • PDF

Pro-Logic Audio의 소개

  • 이상근;조재문
    • Broadcasting and Media Magazine
    • /
    • v.3 no.1
    • /
    • pp.20-27
    • /
    • 1998
  • 종래에는 2개의 오디오 채널을 이용한 음향의 재생방법이 널리 퍼져 있었으나 다채널 음향의 재생에 대한 관심이 많아지면서 다중 채널의 오디오를 전송하고 재생하는 방법이 연구되었다. 이 중에서 2개 채널의 전송으로 4개 채널의 출력을 얻을 수 있는 돌비랩(Dolby Laboratories)의 프로로직(Prologic) 오디오가 많은 대중적인 관심을 끌었다. 이 기술은 전송측에서 2 개채널에 해당하는 신호만을 전송하지만 수신측에 있는 디코더에서는 4 개 채널의 데이터를 재생할 수 있는 압축 기법으로서 대중적으로 많은 시장을 가지고 있다. 따라서 Prologic 오디오 기술을 이해하고 이를 제품에 연결하는 방법을 찾는 것은 앞으로 성장하게 될 다중채널 재생 방법에 성공적으로 대처하기 위해서 필요한 일이다. 본 논고에서는 다중 채널 재생 기법의 하나인 Prologic 에 관한 기술과 이와는 별도의 압축기법인 AC-3 와의 비교를 통해서 Prologic 오디오 기술의 특징을 기술하기로 한다. 그리고 프로로직의 구현을 위한 하드웨어적인 관점에서 필요한 로직과 그 로직을 구현하기 위한 칩의 설계에 대해서도 간략히 기술하기로 한다.

  • PDF

A sturdy on the blind audio source separation based on multi-step NMF-EM algorithm (다중 단계 NMF-EM 알고리즘 기반의 오디오 소스 분리 방법에 대한 연구)

  • Cho, Choongsang;Kim, Jewoo
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2014.06a
    • /
    • pp.9-11
    • /
    • 2014
  • 본 논문에서는 오디오 신호의 특성 표현에 유용한 nonnegative matrix factorization(NMF)에 대해 설명하였으며, expectation maximization (EM)을 이용한 NMF 파라미터 추출 및 EM-NMF 기반한 오디오 소스 분리 기술에 대해서 설명했다. 또한, 다중 단계 NMF-EM 구조의 객체 분리를 통해서 객체 분리 성능을 향상시키기 위한 알고리즘을 제안하며, 제안된 알고리즘은 K-pop 음원과 SDR(source distortion ratio)를 통해서 객체 분리 성능을 평가한다. 성능 평가 결과 제안된 알고리즘은 다중 단계를 통해 약 3dB 의 보컬 분리 성능이 향상되며, 상업적 음원 제작에서 사용되는 가상 오디오 효과가 많이 적용된 음원에서 약 5dB 의 분리 성능을 향상시켰다. 그러므로 제안된 방식은 오디오 객체 분리에 유용한 방법이 될 것으로 생각된다.

  • PDF

Quick Audio Retrieval Using Multiple Featrue Vector (다중 특징 벡터를 이용한 고속 오디오 검색)

  • Ban Ji-hye;Kim Ki-man;Park Kyu-sik
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.351-354
    • /
    • 2004
  • 최근 MPEG-7 등에서 컨텐츠 내용 기반 검색에 대한 연구가 이루어지고 있다. 내용 기반 검색은 기존의 키워드기반 검색이 아닌 컨텐츠 내의 특징 벡터를 추출하여 이와 일치하는 것을 찾는 작업으로써 차세대 디지털 방송 등에 적응될 예정이다. 본 논문은 긴 오디오 stream에서 찾고자 하는 오디오의 위치를 빨리 찾을 수 있는 고속 검객 방법을 제시한다. 기존의 방법에서는 zero-crossing rate만을 이용하여 검색을 했었으나 본 논문에서는 오디오 신호의 특성을 표현할 수 있는 여러 가지 특징 벡터들을 이용한 고속 검색 방법을 고찰 한다. 본 논문의 가장 중요만 부분은 active search 알고리즘과 히스토그램, 그리고 적절하게 조합된 다중 특징 벡터들을 이용한 오디오 검색의 정확도와 속도를 향상시키는데 있다.

  • PDF

SmartLink TV: Content Scene-based $2^{nd}$ Screen Service Platform (스마트링크 TV: 콘텐츠 장면기반 $2^{nd}$ 스크린 서비스 플랫폼)

  • Choi, Daehoon;Lee, Jaeho;Park, Sungchoon;Lee, Dongjune
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2013.06a
    • /
    • pp.193-195
    • /
    • 2013
  • 오디오 핑거프린트는 콘텐츠의 오디오 신호의 특색을 요약한 서명(signature)으로 2nd 스크린 서비스의 기반 기술로 주목 받고 있다. 이를 이용한 오디오 핑거프린트 시스템은 콘텐츠의 오디오를 인식하고 해당 콘텐츠와 연관된 메타 데이터를 2nd 디바이스와 웹을 통해 연결시키는 기능을 제공한다. 스마트링크 TV 는 이러한 오디오 핑거프린트를 이용한 KBS 의 콘텐츠 장면(scene) 기반 2nd 스크린 서비스 플랫폼이다. 본 논문에서는 한국의 방송환경에 적용된 스마트링크 TV 의 전반적인 플랫폼 구조와 활용방법에 대해 살펴본다.

  • PDF

Implementation of The Audio for HiMCS System (지능형 고품질 서비스를 위한 오디오 개발)

  • 송재종;이석필;장세진
    • Proceedings of the IEEK Conference
    • /
    • 2003.11a
    • /
    • pp.77-80
    • /
    • 2003
  • 본 논문에서는 디지털방송과 인터넷의 융합에 따른 MPEG-2/4/7 방송 및 인터넷 콘텐츠를 비롯한 게임등과 같은 다양한 멀티미디어 서비스를 제공하기 위한 차세대 지능형 고품질 홈 엔터테인먼트 시스템 Platform 개발에서 사용될 MPEG-4 오디오를 개발한다. 인터넷 상에서의 스트리밍 서비스를 위해서는 저 전송률과 고 품질의 비디오/오디오 알고리즘이 필요하다. 이러한 서비스를 제공하기 위하여 MPEG-4 오디오는 음성에서 고품질의 다중 채널의 오디오까지, 그리고 자연음(Natural Sound)에서 합성음에 이르기까지 다양한 알고리즘을 제공한다. 본 논문에서는 지능형 고품질 미디어 에이전트 시스템에 적합한 MPEG-4 AAC, MPEG-1 Layer-3인 MP3, G.723.1을 구현하고, 이 시스템에 알맞은 7㎑ 대역폭을 가지는 광대역(Wideband) 음성신호를 16kbps로 압축하는 음성 압축기를 제안 및 개발한다.

  • PDF

A Study on Object-based Realistic Audio (객체기반 실감음향 기술 개발)

  • Jang, Daeyoung;Lee, Taejin
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2015.07a
    • /
    • pp.429-432
    • /
    • 2015
  • 본 논문에서는 기존의 채널기반의 오디오 기술에 대해 다양한 서비스가 가능하고, 재생환경에 독립적인 객체기반 실감음향 기술에 대해 논하고자 한다. 현재, 극장 사운드를 중심으로 객체기반 오디오 기술이 적용된 사운드가 점차 확산되고 있으며, 미국, 유럽 등 차세대 방송용 오디오에 객체기반 오디오 기술의 도입을 적극적으로 고려하고 있다. 객체기반 오디오 기술은 콘텐츠의 제작단계에서 재생환경을 고려할 필요가 없고, 현장의 음향을 신호와 3 차원 공간 정보로 구분하여 음향 공간의 정보를 그대로 표현함으로써, 재생환경에서는 3 차원 공간 정보를 활용하여 다양한 3 차원 음향 재생 기술을 활용하여 재생할 수 있다. 이러한 객체기반 실감음향 기술 개발을 위해서는 편리한 제작 및 3 차원 공간 정보 표현 기술이 필요하며, 청취환경에서는 객체기반 실감음향 콘텐츠를 제작자의 의도대로 렌더링할 수 있는 재생 및 제어 기술이 필요하다. 이에 객체기반 실감음향 기술의 기술동향과 객체기반 실감음향 서비스를 위한 콘텐츠 표현/제작 및 재생 기술에 대하여 고찰해 보고자 한다.

  • PDF

개선된 시간축 정보량 감축 기술 기반 오디오 부호화 기술

  • Beack, Seungkwon;Lim, Wootaek;Lee, Taejin
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2021.06a
    • /
    • pp.32-35
    • /
    • 2021
  • 본 논문에서는 시간축 정보량을 감축하여 오디오 부호화 효율을 개선하기 위한 기술을 제안한다. 시간축 정보량 감축 방법은 종전의 오디오 코덱에서도 활용되었던 대표적인 기술로 TNS(temporal noise shaping) 기술이 있다. 그러나 TNS 기술은 오디오 신호의 천이구간에서 선별적으로 유효하게 동작하며 그 효율성도 간헐적으로 나타나는데 이는 MDCT(modified discrete cosine transform)에서 예측 과정을 수행하는 구조적인 문제를 갖고 있기 때문이다. 본 논문에서는 종전의 TNS 기술의 취약점을 보완한 ITES(intensive temporal envelope shaping) 기술을 제안하였다. 제안 기술은 TNS 보다 유효한 오디오 시간영역 정보량을 예측하고 감축하였으며, 개선된 음질을 나타냄을 주관적 평가를 수행하여 검증하였다.

  • PDF