• 제목/요약/키워드: 오디오신호처리

검색결과 148건 처리시간 0.026초

멀티채널 오디오 서비스를 위한 지상파 DMB 미디어처리기 설계 (The Design of Terrestrial DMB Media Processor for Multi-Channel Audio Services)

  • 강경옥;홍재근;서정일
    • 한국음향학회지
    • /
    • 제24권4호
    • /
    • pp.186-193
    • /
    • 2005
  • 지상파 디지털멀티미디어방송 (Terrestrial Digital Multimedia Broadcasting, T-DMB)은 7인치 화면에서 VCD급의 고화질 비디오와 CD급의 고품질 오디오를 이동수신 환경에서 제공하는 기술로서, 2005년도 중반부터 상용 서비스가 시작될 예정이다. 그러나, T-DMB 규격에서는 가용 대역폭의 제한으로 인하여 오디오 신호를 위한 대역폭이 128kbps로 제한되어 있으며, 모노와 스테레오 채널 서비스만이 가능하도록 하고 있다. 본 논문은 기존의 T-DMB 수신기과 역호환성 (Backward Compatibility)을 유지하면서 멀티채널 오디오 콘텐츠를 제공할 수 있는 미디어처리기와 재생기 구조를 제안한다. 또한, T-DMB수신기의 다양한 스피커 환경에서도 최적의 오디오 콘텐츠를 제공할 수 있도록, 멀티채널 오디오 콘텐츠를 재생환경에 맞게 적응시킬 수 있는 수신기 구조를 제안한다. 기존의 T-DMB 수신기와 호환성을 유지하면서 멀티채널 오디오 콘텐츠를 제공하기 위하여 멀티채널 오디오를 위한 부가데이터를 메인 오디오 스트림의 종속 스트림으로 정의하였으며, 기존 T-DMB 시스템의 BIFS (Binary Format for Scene)를 수정하지 않고 부가되는 오디오 객체를 제어할 수 있는 OD (Object Descriptor) 구조를 제안한다.

시간축 공격에 강인한 오디오 저작권보호 기술 (Robust Audio Copyright Protection Technology to the Time Axis Attack)

  • 배경율
    • 지능정보연구
    • /
    • 제15권4호
    • /
    • pp.201-212
    • /
    • 2009
  • 확산 스펙트럼 방식 워터마킹 기술은 일반적인 공격에 매우 강인한 알고리즘으로 알려져있으나 시간 축 변형 공격에 대해서 만큼은 취약성을 드러내고 있다. 본 연구에서는 확산 스펙트럼 방식 워터마킹 기술의 장점을 살리면서 시간 축 공격에도 강인한 알고리즘을 제안한다. 시간 축 공격은 오디오 신호의 주파수 성분을 변화시키거나 피치성분은 유지하면서 오디오 신호의 길이를 변화시키는 등의 공격을 포함하고 있다. 확산 스펙트럼 방식에 의해서 삽입된 워터마크를 검출하기 위해서는 시간 축 공격의 비율을 정확히 알아야만 한다는 어려움이 있으며, 그 비율을 알기 위해서는 많은 알고리즘의 처리가 필요하고 현실적으로 구현이 불가능한 등의 어려움이 있다. 본 연구에서는 이러한 문제점을 해결하기 위해서 오디오 신호를 시 불변 영역(time-invariant domain)으로 변환하고, 이 영역에서 확산 스펙트럼 방식의 워터마크를 삽입함으로써 확산 스펙트럼 방식의 장점을 유지하고 시간 축 공격에 대해서도 강인한 알고리즘을 제안하였다. 이를 위해서 오디오 신호에 대해 log scale time axis를 사용하고, log scale time axis 신호를 Fourier 변환함으로써 시 불변 영역을 얻을 수 있었다.

  • PDF

항공용 인터콤의 백업 모드 운용을 위한 디지털 방식의 이중화 설계 (The Digital Redundancy Design for Back-up Mode Operation of Aviation Intercom)

  • 정성재;조경학;김동혁;이성우
    • 한국항행학회논문지
    • /
    • 제26권5호
    • /
    • pp.358-364
    • /
    • 2022
  • 항공용 인터콤 시스템은 정/부조종사 간 내부 통화 및 조종사와 승무원 간 내부 통화, 초고주파 무전기(U/VHF)와 같은 통신 장비를 통한 외부 통화, 초단파전방향거리탐지기/계기착륙장치(VOR/ILS), 전술 항법 장치(TACAN)와 같은 항법 및 임무 장비 오디오 신호 모니터링, 비행 데이터기록장치(FDR) 및 자료전송 시스템(DTS)으로의 음성 녹음용 오디오 신호 출력, 항공기의 상태와 위협 등에 대한 오디오 경고음/경고 음성 발생 등 항공기 내의 모든 음성 신호에 대한 처리를 담당하는 장비이다. 이러한 항공용 인터콤은 아날로그 오디오 신호의 경우 노이즈에 민감하기 때문에 조종사 및 승무원의 임무 수행을 위해 항공기 내/외부의 전자파 노이즈로부터 오디오 신호를 보호할 수 있는 이중화 설계가 필요하다. 본 논문에서는 항공용 디지털 인터콤의 이중화를 위한 정상/백업 운용모드 및 디지털 방식의 이중화 설계 방안과 제작 및 검증 결과에 대하여 기술한다.

토널 마스커 특성을 이용한 오디오 워터마킹 (An Audio Watermarking Method Using the Attribute of the Tonal Masker)

  • 이희숙;이우선
    • 한국음향학회지
    • /
    • 제22권5호
    • /
    • pp.367-374
    • /
    • 2003
  • 본 논문에서는 토널 마스커 특성을 이용한 오디오 워터마킹 기법을 제안한다. 먼저 오디오 워터마킹 특성으로서의 토널 마스커 특성을 분석한다. 기존의 심리음향 연구들에 의하여 토널 마스커를 구성하는 주파수 신호들에 대해 비지각적인 변조가 가능하다. 그리고 여러 신호처리에 대해 처리 전, 후의 톤과 좌, 우 주파수 신호의 에너지 관계를 비교하면 매우 적은 변화를 보인다. 이러한 토널 마스커 특성을 이용한 워터마킹 기법을 제안한다. 제안하는 기법은 톤의 좌, 우 주파수의 에너지 차이를 변조하여 하나의 워터마크 비트를 내장하고, 원음 없이 내장시의 비밀키를 이용하여 변조된 토널 마스커를 찾은 후 내장된 워터마크 비트를 판단하는 기법이다. 제안한 기법은 잡음 삽입과 압축, 대역 통과 필터링, 샘플링 변환, 반향처리, 주파수 등화의 공격 후, 클래식과 팝에 대해 각각 평균 오류율 0.11%, 1.26%를 보였다. 그리고 주관적인 음질 평가를 통하여 평균 SDG (Subjective Diff-Grades) -0.31의 결과를 얻었다.

강인한 오디오 워터마킹을 위한 새로운 반향 커널 설계 (New Echo Embedding Technique for Robust Audio Watermarking)

  • 오현오;김현욱;윤대희;석종원;홍진우
    • 한국음향학회지
    • /
    • 제20권2호
    • /
    • pp.66-76
    • /
    • 2001
  • 반향을 이용한 워터마킹에서는 오디오 신호에 청각적으로 지각되지 않는 작은 크기의 반향을 첨가함으로써 워터마크 정보를 은닉한다. 그러나 기존의 방법으로 반향을 삽입하게 되면 음질의 왜곡은 초래하지 않으면서 동시에 외부 공격에 대한 강인성을 보장하기에는 어려운 한계를 가지고 있다. 본 논문은 반향 (Echo) 신호에 대한 심리음향학적 분석을 통해 비지각성을 유지하면서 강인성을 높일 수 있는 새로운 반향 커널 설계 방법을 제안하고 이를 이용한 오디오 워터마킹 시스템의 성능을 평가한다. 제안한 반향 커널은 인간의 반향 지각 특성을 반영한 주파수 응답의 왜곡을 최소화하는 방향으로 설계되었기 때문에 기존의 방법에 비해 월등히 큰 에너지의 반향을 삽입할 수 있으며 따라서 공격에 강인하고 신뢰성 높은 복호화가 가능하다. 또한 몇 가지 신호처리 공격에 대한 분석을 통해 강인성을 보다 향상시키기 위한 기술들을 제안하고 적용하였으며 주관적 음질 평가 및 복호화 성능 평가를 통해 제안된 시스템의 성능을 검증하였다.

  • PDF

실시간 MPEG-1 오디오 인코더의 설계 및 구현 (A Design and Implementation of the Real-Time MPEG-1 Audio Encoder)

  • 전기용;이동호;조성호
    • 방송공학회논문지
    • /
    • 제2권1호
    • /
    • pp.8-15
    • /
    • 1997
  • 본 논문에서는 하나의 TMS320C31 Digital Signal Processor (DSP)를 사용하여 실시간으로 동작하는 Motion Picture Experts Group-1 (MPEG-1) 오디오 인코더 시스템을 구현하였다. 우선 MPEG-1 Audio Layer-2 및 심리음향모델-1 관련 기본 알고리듬을 C-언어로 구현하여 기본 동작을 확인하였다. 그리고 전체실행 시간을 줄이기 위하여, 이를 다시 Texas Instruments (Tl) 어셈블리어로 작성하였다. 마지막으로, MPEG-1 오디오 인코더 시스템을 위한 실제 DSP 하드웨어 회로 보드를 설계, 제작하였다. Analog-to-Digital Converter (ADC) 제어, 입출력 제어, 그리고 DSP 보드에서 PC로의 비트열 전송과 같은 주변 모듈들은 Very High Speed Hardware Description Language (VHDL)을 사용하여 Field Programmable Gate Array (FPGA)로 구현하였다. 제작된 시스템은 48 KHz로 샘플링 되는 스테레오 오디오 신호를 실시간으로 처리하여 192 kbps 비트율로 부호화된 비트열을 출력시킨다. 다양한 형태의 스테레오 오디오 신호를 통해, 제작된 오디오 인코더 시스템의 실시간 동작과 양질의 오디오 신호가 복원됨을 확인하였다.

  • PDF

미디어 오디오에서의 DNN 기반 음성 검출 (DNN based Speech Detection for the Media Audio)

  • 장인선;안충현;서정일;장윤선
    • 방송공학회논문지
    • /
    • 제22권5호
    • /
    • pp.632-642
    • /
    • 2017
  • 본 논문에서는 미디어 오디오의 음향 특성 및 문맥 정보를 활용한 DNN 기반 음성 검출 시스템을 제안한다. 미디어 오디오 내에 포함되어 있는 음성과 비음성을 구분하기 위한 음성 검출 기법은 효과적인 음성 처리를 위해 필수적인 전처리 기술이지만 미디어 오디오 신호에는 다양한 형태의 음원이 복합적으로 포함되어 있으므로 기존의 신호처리 기법으로는 높은 성능을 얻기에는 어려움이 있었다. 제안하는 기술은 미디어 오디오의 고조파와 퍼커시브 성분을 분리하고, 오디오 콘텐츠에 포함된 문맥 정보를 반영하여 DNN 입력 벡터를 구성함으로써 음성 검출 성능을 개선할 수 있다. 제안하는 시스템의 성능을 검증하기 위하여 20시간 이상 분량의 드라마를 활용하여 음성 검출용 데이터 세트를 제작하였으며 범용으로 공개된 8시간 분량의 헐리우드 영화 데이터 세트를 추가로 확보하여 실험에 활용하였다. 실험에서는 두 데이터 세트에 대한 교차 검증을 통하여 제안하는 시스템이 기존 방법에 비해 우수한 성능을 보임을 확인하였다.

오디오의 파형과 FFT 분석을 이용한 대표 선율 검색 (Representative Melodies Retrieval using Waveform and FFT Analysis of Audio)

  • 정명범;고일주
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권12호
    • /
    • pp.1037-1044
    • /
    • 2007
  • 최근 내용 기반 음악 검색 시스템에서는 사용자의 응답 시간을 단축시키기 위해 음악의 대표성을 갖는 선율을 추출하여 색인하고, 검색 시 이를 사용한다. 기존 연구에서는 미디(midi) 데이타를 이용하여 대표 선율을 추출하는 방법이 제안되었으나, 미디 데이타에 한정되는 단점이 있었다. 따라서 본 논문에서는 디지털 신호처리를 이용하여 모든 오디오 파일 포맷에 적용 가능한 대표 선율 검색을 제안한다. 대표 선율 검색을 위해 FFT(Fast Fourier Transform)을 이용하여 박자와 마디를 찾고 각 마디들의 PCM 데이타로부터 높은 수치가 나타나는 빈도를 측정한다. 이때 높은 수치들이 가장 많이 뭉쳐 있는 영역에서 여덟 마디 간격이 오디오 데이타의 대표 선율 영역이다. 제안 방법의 유효성을 검증하기 위한 실험으로 총 1000곡을 선택하여 대표 선율을 추출하였고, 그 결과 템포를 찾아낸 737곡 중 79.5%의 정확성을 보였다.