• 제목/요약/키워드: Audio Signal Processing

검색결과 157건 처리시간 0.023초

강인한 오디오 워터마킹을 위한 새로운 반향 커널 설계 (New Echo Embedding Technique for Robust Audio Watermarking)

  • 오현오;김현욱;윤대희;석종원;홍진우
    • 한국음향학회지
    • /
    • 제20권2호
    • /
    • pp.66-76
    • /
    • 2001
  • 반향을 이용한 워터마킹에서는 오디오 신호에 청각적으로 지각되지 않는 작은 크기의 반향을 첨가함으로써 워터마크 정보를 은닉한다. 그러나 기존의 방법으로 반향을 삽입하게 되면 음질의 왜곡은 초래하지 않으면서 동시에 외부 공격에 대한 강인성을 보장하기에는 어려운 한계를 가지고 있다. 본 논문은 반향 (Echo) 신호에 대한 심리음향학적 분석을 통해 비지각성을 유지하면서 강인성을 높일 수 있는 새로운 반향 커널 설계 방법을 제안하고 이를 이용한 오디오 워터마킹 시스템의 성능을 평가한다. 제안한 반향 커널은 인간의 반향 지각 특성을 반영한 주파수 응답의 왜곡을 최소화하는 방향으로 설계되었기 때문에 기존의 방법에 비해 월등히 큰 에너지의 반향을 삽입할 수 있으며 따라서 공격에 강인하고 신뢰성 높은 복호화가 가능하다. 또한 몇 가지 신호처리 공격에 대한 분석을 통해 강인성을 보다 향상시키기 위한 기술들을 제안하고 적용하였으며 주관적 음질 평가 및 복호화 성능 평가를 통해 제안된 시스템의 성능을 검증하였다.

  • PDF

Automated Classification of Audio Genre using Sequential Forward Selection Method

  • Lee Jong Hak;Yoon Won lung;Lee Kang Kyu;Park Kyu Sik
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2004년도 학술대회지
    • /
    • pp.768-771
    • /
    • 2004
  • In this paper, we propose a content-based audio genre classification algorithm that automatically classifies the query audio into five genres such as Classic, Hiphop, Jazz, Rock, Speech using digital signal processing approach. From the 20 second query audio file, 54 dimensional feature vectors, including Spectral Centroid, Rolloff, Flux, LPC, MFCC, is extracted from each query audio. For the classification algorithm, k-NN, Gaussian, GMM classifier is used. In order to choose optimum features from the 54 dimension feature vectors, SFS (Sequential Forward Selection) method is applied to draw 10 dimension optimum features and these are used for the genre classification algorithm. From the experimental result, we verify the superior performance of the SFS method that provides near $90{\%}$ success rate for the genre classification which means $10{\%}$-$20{\%}$ improvements over the previous methods

  • PDF

범용 DSP를 이용한 MPEG-2 오디오 부호화기의 성능 개선 (An Enhancement of the MPEG-2 Audio Encoder Using General DSPs)

  • 오현오;김성윤;윤대희;차일환;이준용
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1997년도 학술대회
    • /
    • pp.63-67
    • /
    • 1997
  • The ISO(International Standard Organization) has standardized MPEG-2 audio. The MPEG-2 audio compression algorithm is based upon subband analysis and exploits the human auditory characteristics to achieve a low bit rate with minimum perceptual loss of audio signal quality. This thesis presents an enhanced MPEG-2 audio encoder using multiple TMS320C30 general purpose DSP's. The developed system is made up of five slave boards and one master board. Each slave board performs susband analysis psychoacoustic parameter calculation for one channel, and the master board manages bit allocation, quantization, and bit-stream formatting for all channels. Parallel processing and pipelining techniques are used in hardware structure and fast algorithms are applied in each subroutine to implement a real-time process. The implemented system supports multichannel up to 5.1 and various bitrates.

  • PDF

디지탈/아날로그 겸용 이동통신 단말기를 위한 오디오/데이타 프로세서의 실시간 구현에 관한 연구 (A Study of Real-Time Implementation of Audio/Data Processor for Digital/Analog Dual mode Mobile Phone)

  • 변경진;김종재;한기천;유하영;차진종;김경수
    • 한국음향학회지
    • /
    • 제16권2호
    • /
    • pp.80-88
    • /
    • 1997
  • 본 연구는 현재 디지탈 방식의 이동통신에서 사용되는 디지탈/아날로그 겸용 단말기에서 아날로그 방식을 지원하기 위한 오디오/데이타 프로세서를 ETRI DSP를 이용하여 실시간 구현하는 것에 대한 것이다. 오디오/데이타 프로세서는 단말기가 아날로그 방식으로 동작할 때 광대역 데이타 처리, 오디오신호 처리 및 demodulation, data rate conversion 기능을 수행한다. 이와같은 기능은 어셈블리 언어로 프로그램되어 디지탈 방식에서 사용되는 보코더 프로그램과 함께 ETRI DSP에 탑재되었다. 즉 하나의 하드웨어를 이용하여 디지탈 방식의 보코더와 아날로그 방식의 오디오/데이타 프로세서를 함께 구현 함으로써 하드웨어의 효율성을 극대화 하여 기존의 아날로그 전용의 단말기와의 경쟁력을 가질 수 있도록 하였다.

  • PDF

부동 소수점 DSP를 이용한 MPEG-2 AAC 부호차기 구현 (MPEG-2 AAC Encoder Implementation Using a floating-Point DSP)

  • 김승우
    • 한국멀티미디어학회논문지
    • /
    • 제8권7호
    • /
    • pp.882-888
    • /
    • 2005
  • MPEG-2 AAC는 이미 보다 진보한 차세대 기술로 표준화가 이루어 졌다. AAC는 96-128kbps/stereo에서 CD 음질의 오디오 신호를 표현한다. 본 논문은 고음질의 MPEG-2 AAC LC Profile 부호화기 구현에 관하여 논하였다. 공통 스케일펙터와 무손실코딩은 각각 $45\%$$27\%$의 TMS320C30 명령어 이득을 가져왔다. 구현된 부호화기는 프로그램 메모리 7.5 kWords, 데이터 롬 18kWords, 데이터 램 92kBytes를 사용한다. 주관적 음질평가결과는 96kbps 스테레오에서 얻어진 AAC 부호화기 음질이 MP3 128kbps 스테레오에서 얻어진 것과 동일한 음질을 가짐을 보여준다.

  • PDF

Collision Hazards Detection for Construction Workers Safety Using Equipment Sound Data

  • Elelu, Kehinde;Le, Tuyen;Le, Chau
    • 국제학술발표논문집
    • /
    • The 9th International Conference on Construction Engineering and Project Management
    • /
    • pp.736-743
    • /
    • 2022
  • Construction workers experience a high rate of fatal incidents from mobile equipment in the industry. One of the major causes is the decline in the acoustic condition of workers due to the constant exposure to construction noise. Previous studies have proposed various ways in which audio sensing and machine learning techniques can be used to track equipment's movement on the construction site but not on the audibility of safety signals. This study develops a novel framework to help automate safety surveillance in the construction site. This is done by detecting the audio sound at a different signal-to-noise ratio of -10db, -5db, 0db, 5db, and 10db to notify the worker of imminent dangers of mobile equipment. The scope of this study is focused on developing a signal processing model to help improve the audible sense of mobile equipment for workers. This study includes three-phase: (a) collect audio data of construction equipment, (b) develop a novel audio-based machine learning model for automated detection of collision hazards to be integrated into intelligent hearing protection devices, and (c) conduct field experiments to investigate the system' efficiency and latency. The outcomes showed that the proposed model detects equipment correctly and can timely notify the workers of hazardous situations.

  • PDF

가변 임계값을 이용한 지각 필터의 적응적인 음질 개선 알고리즘 (Adaptive Enhancement Algorithm of Perceptual Filter Using Variable Threshold)

  • 차형태
    • 한국음향학회지
    • /
    • 제23권6호
    • /
    • pp.446-453
    • /
    • 2004
  • 본 논문에서는 잡음에 의해 열화된 오디오 신호를 가변 임계값을 이용한 적응 지각 필터를 사용하여 음질을 개선하는 알고리즘을 제안한다. 제안된 적응 지각 필터는 신호 구간마다 달라지는 신호의 세기와 잡음의 영향 정도를 고려하여 임계값을 가변적으로 조정함으로써 잔여 잡음을 효과적으로 제어하는 방식으로 지각적으로 개선된 음질의 신호를 얻을 수 있다 제안한 방식은 잡음에 의해 열화된 오디오 신호를 주파수 영역으로 변환한 후 임계 대역 기반의 임계 대역 에너지 (Critical intensity energy)와 마스킹 영향이 고려된 청각 자극 에너지 (Excitation energy)를 계산한 다음, 지각 필터를 기반으로 한 적응 지각 필터 알고리즘으로 각 단계별 지각 필터 응답을 임계값으로 이용하여 가변 임계값이 재조정되는 단계를 결정하게 된다. 신호의 구간별 에너지 크기에 의한 잡음에 의해 열화된 정도의 차이를 가변 임계값을 이용하여 고려함으로써 잔여 잡음의 효과적인 제어가 가능하게 된다. 제안한 방법은 다양한 신호대 잡음비에서 열화된 오디오 신호를 입력으로 사용하였다. 입력 신호대 잡음비가 15dB, 20dB, 25dB와 30dB의 각각의 경우에 대하여 잡음대 마스킹비 (Noise-to-mask ratio, NMR)와 청감 테스트 (Mean opinion score, MOS Test)를 시행하였다. 그 결과, 잡음대 마스킹비의 개선 측면에서 각각의 경우에 대해 17.4dB, 15.3dB, 12.8dB, 9.8dB의 개선을 확인할 수 있었고, 청감 테스트의 개선 측면에서는 각각 2.9, 2.5, 2.3, 1.7의 개선된 음질을 확인할 수 있었다.

CSL Computerized Speech Lab - Model 4300B Software version 5.X

  • Ahn, Cheol-Min
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 1995년도 제4회 학술대회 심포지움 및 워크샵
    • /
    • pp.154-164
    • /
    • 1995
  • CSL, Model 4300B is a highly flexible audio processing package designed to provide a wide variety of speech analysis operations for both new and sophisticated users. Operations include 1) Data acquisition 2) File management 3) Graphics 4) Numerical display 5) Audio output 6) Signal editing 7) A variety of analysis functions, External module include 1) Input control B) Output control 3) Jacks, Software include 1) Wide range of speech display manipulation 2) Editing 3) Analysis (omitted)

  • PDF

선박용 디지털 음향수신장치 연구 (A study on digital sound reception systems for ships)

  • 김형종;김정창
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제38권9호
    • /
    • pp.1125-1130
    • /
    • 2014
  • 본 논문에서는 디지털 신호처리 기술에 기반하여 주변잡음에 강건한 선박용 음향수신장치를 제안한다. 원하지 않는 주변 잡음을 억제하기 위하여 70Hz-820Hz의 통과대역을 갖는 디지털 대역통과 필터를 적용한다. 4개의 마이크로폰으로부터 입력된 음향 신호들이 디지털 대역통과 필터를 거친 후 8 방향의 방향 탐지가 가능한 방향 탐지 알고리즘을 제안한다. 또한, DSP 칩과 오디오 코덱을 이용한 프로토타입 시스템을 구현하여 본 알고리즘의 동작을 테스트한다.

KZK 모델을 이용한 파라메트릭 어레이 음향 신호 처리 (Audio Signal Processing using Parametric Array with KZK Model)

  • 이종현;;이재일;김원호;배진호
    • 한국인터넷방송통신학회논문지
    • /
    • 제9권5호
    • /
    • pp.139-146
    • /
    • 2009
  • 본 논문에서는 파라메트릭 어레이를 이용한 음향신호에 대한 수치 모델링 기법 및 분석 결과를 제시한다. 사용된 음성 파라메트릭 배열의 분석 수치모델은 KZK(Khokhlov-Zabolotskaya-Kuznetsov)로서 KZK수치모델은 시간영역의 차분방정식 알고리즘을 사용하며 파라메트릭배열의 정확한 응답특성이 분석이 가능하다. 시간영역기반의 KZK모델은 음원의 크기와 전송주파수의 영향을 받으며, 가청신호응답은 출력레벨과 빔폭의 크기를 포함한다. 음성신호에 대하여 파라메트릭 배열을 효율적으로 적용시키기 위해서는 고려해야할 요소는 표본화 주파수, 트랜스듀서의 반경 및 변조방식 파라미터 등이 있다. 본 논문에서는 다양한 요소 중 표본화 주파수에 따른 응답신호의 왜곡 분석 및 실험 결과를 시뮬레이션을 통해 제시하였다.

  • PDF