• Title/Summary/Keyword: 심리음향모델

Search Result 71, Processing Time 0.024 seconds

Time-Scale Modification of Polyphonic Audio Signals Using Sinusoidal Modeling (정현파 모델링을 이용한 폴리포닉 오디오 신호의 시간축 변화)

  • 장호근;박주성
    • The Journal of the Acoustical Society of Korea
    • /
    • v.20 no.2
    • /
    • pp.77-85
    • /
    • 2001
  • This paper proposes a method of time-scale modification of polyphonic audio signals based on a sinusoidal model. The signals are modeled with sinusoidal component and noise component. A multiresolution filter bank is designed which splits the input signal into six octave-spaced subbands without aliasing and sinusoidal modeling is applied to each subband signal. To alleviate smearing of transients in time-scale modification a dynamic segmentation method is applied to subbands which determines the analysis-synthesis frame size adaptively to fit time-frequency characteristics of the subband signal. For extracting sinusoidal components and calculating their parameters matching pursuit algorithm is applied to each analysis frame of subband signal. In accordance with spectrum analysis a psychoacoustic model implementing the effect of frequency masking is incorporated with matching pursuit to provide a resonable stop condition of iteration and reduce the number of sinusoids. The noise component obtained by subtracting the synthesized signal with sinusoidal components from the original signal is modeled by line-segment model of short time spectrum envelope. For various polyphonic audio signals the result of simulation shows suggested sinusoidal modeling can synthesize original signal without loss of perceptual quality and do more robust and high quality time-scale modification for large scale factor because of representing transients without any perceptual loss.

  • PDF

Study for A Robust Digital Audio Watermarking System (공격에 강인한 고음질 디지털 오디오 워터마킹 시스템에 관한 연구)

  • 김현욱;오현오;윤대희;차일환
    • Proceedings of the IEEK Conference
    • /
    • 2000.09a
    • /
    • pp.771-774
    • /
    • 2000
  • 디지털 워터마킹은 오디오, 이미지, 영상과 같은 고품질 디지털 멀티미디어 컨텐츠의 불법적인 복제와 유통을 막고 저작권을 보호하기 위한 최후의 방어 수단으로 인식되고 있는 신호처리 기술이다. 오디오 신호에 삽입되는 워터마크 신호는 들리지 않아야 하는 특성과 함께, 압축이나 필터링과 같은 신호처리 과정 후에도 추출이 가능한 강인성을 지녀야 한다 본 연구에서는 현재 제안되고 있는 여러가지 오디오 워터마킹 방법 중에서 대역확산을 기반으로 한 PN 시퀸스 오디오 워터마킹 시스템에 대해서 다루었다. 삽입된 워터마크 신호가 들리지 않도록 하기 위해 인간의 청각 시스템에 기반한 심리음향모델을 적용하였으며, 효율적인 검출과 청각상의 특성을 고려한 여러 가지 실험을 수행하였다. 워터마크 정보의 검출에 있어서는 원 신호가 필요하지 않은Blind Detection 방법을 제안하여 효율적인 워터마킹 시스템을 구현할 수 있도록 하였다.

  • PDF

Wireless Speech Recognition System using Psychoacoustic Model (심리음향 모델을 이용한 무선 음성인식 시스템)

  • Noh, Jin-Soo;Rhee, Kang-Hyeon
    • Journal of the Institute of Electronics Engineers of Korea CI
    • /
    • v.43 no.6 s.312
    • /
    • pp.110-116
    • /
    • 2006
  • In this paper, we implement a speech recognition system to support ubiquitous sensor network application services such as switch control, authentication, etc. using wireless audio sensors. The proposed system is consist of the wireless audio sensor, the speech recognition algorithm using psychoacoustic model and LDPC(low density parity check) for correcting errors. The proposed speech recognition system is inserted in a HOST PC to use the sensor energy effectively mil to improve the accuracy of speech recognition, a FEC(Forward Error Correction) system is used. Also, we optimized the simulation coefficient and test environment to effectively remove the wireless channel noises and correcting wireless channel errors. As a result, when the distance between sensor and the source of voice is less then 1.0m FAR and FRR are 0.126% and 7.5% respectively.

Audio Forensic Marking using Psychoacoustic Model II and MDCT (심리음향 모델 II와 MDCT를 이용한 오디오 포렌식 마킹)

  • Rhee, Kang-Hyeon
    • Journal of the Institute of Electronics Engineers of Korea CI
    • /
    • v.49 no.4
    • /
    • pp.16-22
    • /
    • 2012
  • In this paper, the forensic marking algorithm is proposed using psychoacoustic model II and MDCT for high-quality audio. The proposed forensic marking method, that inserts the user fingerprinting code of the audio content into the selected sub-band, in which audio signal energy is lower than the spectrum masking level. In the range of the one frame which has 2,048 samples for FFT of original audio signal, the audio forensic marking is processed in 3 sub-bands. According to the average attack of the fingerprinting codes, one frame's SNR is measured on 100% trace ratio of the collusion codes. When the lower strength 0.1 of the inserted fingerprinting code, SNR is 38.44dB. And in case, the added strength 0.5 of white gaussian noise, SNR is 19.09dB. As a result, it confirms that the proposed audio forensic marking algorithm is maintained the marking robustness of the fingerprinting code and the audio high-quality.

A Study on the Transaural Filter Implementation for 5.1 Channel Speaker System (5.1채널 스피커 시스템에서 트랜스오럴 필터 구현에 관한 연구)

  • 최갑근;방승범;김순협;정완섭
    • The Journal of the Acoustical Society of Korea
    • /
    • v.21 no.3
    • /
    • pp.245-255
    • /
    • 2002
  • This thesis deals a method to deliver more realistic sound by cancelling the cross-talk which is inherent to the 5.1 channel speaker system. The acoustical model for cross-talk cancellation is the free field model. This model minimizes distortion of sound. I used the bark scale sound quality compensation which based on psycho-acoustic. For the surround channels, band-limited sound quality compensation is performed in the frequency domain. I also performed the sound quality assessment test on the traditional 2 channel stereo and 5.1 channel system. This test is performed in the test chamber which satisfies the ITU-R specifications. I uses the IACC (Inter-Aural Cross-Correlation) to determine the preferences of the amateur and the golden ear experts to asses the trans-aural filter. According to the result from the proposed method, I got more the 38 dB separation rates with the Dolby standard speaker array. The results on the diffusion by the subjective test with the experts shows 0.4 point increased then before.

Enhanced Adjustment Strategy of Masking Threshold for Speech Signals in Low Bit-Rate Audio Coding (저전송률 오디오 부호화에서 음성 신호의 성능 개선을 위한 마스킹 임계값 적응기법 향상)

  • Lee, Chang-Heon;Kang, Hong-Goo
    • The Journal of the Acoustical Society of Korea
    • /
    • v.29 no.1
    • /
    • pp.62-68
    • /
    • 2010
  • This paper proposes a new masking threshold adjustment strategy to improve the performance for speech signals in low bit-rate audio coding. After determining formant regions, the masking threshold is adjusted by using the energy ratio of each sub-band to the average energy of each formant. More quantization noises are added to the bands that have relatively large energy, but less distortion is allowed in spectral valley regions by allocating more bits, which reflects the concept of perceptual weighting widely used in speech coding. From the results of objective speech quality measure, we verified that the proposed method improves quality for the speech input signals compared to the conventional one.

Sound Sensation and Its Related Objective Parameters of Nylon Fabrics for Sports Outerwear (스포츠 아우터웨어용 나일론 직물의 소리 감각과 이와 관련된 객관적 파라미터들)

  • Yi, Eunjou;Cho, Gilsoo
    • Journal of the Korean Society of Clothing and Textiles
    • /
    • v.25 no.9
    • /
    • pp.1593-1602
    • /
    • 2001
  • 본 연구는 스포츠 아우터웨어용 나일론 직물의 소리에 대한 주관적 감각과 이에 관련된 객관적 측정치를 규명하기 위하여, 서로 다른 8종의 나일론 직물의 소리의 스펙트럼 파형을 고찰하였으며, 소리 파라미터로 총음압(level pressure of total sound, LPT),세 가지 AR (autoregressive)계수, Zwicker의 심리음향학적 모델에 따른 크기(Z)와 날카로움(Z)를 계산하였고, Kawabata Evaluation System(KES)으로 직물의 물리적 성질을 측정하였다. 주관적 감각 평가를 위하여 피험자에게 녹음된 각 직물소리를 들려주어 7개 소리 감각 (부드러움, 시끄러움, 날카로움, 맑음, 거 침, 높음, 유쾌함)을 의미분별척도로 답하게 한 후, 단계적 선형 회귀식을 이용하여 직물 소리의 주관적 감각에 대한 예측 모델을 제시하였다. 울트라스웨이드를 제외한 태피터 나일론 직물들은 스펙트럼 파형 에서 다른 조성 섬유의 직물들보다 음압 값이 높고, 총음압이 60dB 안팎의 값을 보여, 착용자에게 불쾌감을 줄 것으로 예상되었으며, 주관적 감각 평가에서도 소리의 부드러움과 맑음, 유쾌함에서 음의 점수를, 시끄러움과 날카로움, 거침, 높음에서 양의 점수를 얻었다. 주관적 감각의 예측모델에서 총음압은 시끄러움과 거침에 정적 영향을, 유쾌함에 부적 영향을 미쳐서 나일론 직물 소리의 총음압이 50dB 이하일 때 주관적으로 유쾌하게 느껴지는 것으로 나타났다.

  • PDF

Digital Audio Watermarking Scheme Using Perceptual Modeling (지각 모델링을 이용한 디지털 오디오 워터마킹 방법)

  • 석종원;홍진우
    • Journal of Broadcast Engineering
    • /
    • v.6 no.2
    • /
    • pp.195-202
    • /
    • 2001
  • As a solution for copyright protection of digital multimedia contents, digital watermark technology is now drawing the attention. In this paper, we presented two novel audio watermarking algorithms as a solution for protecting unauthorized copy of digital audio. Proposed watermarking schemes include the psychoacoustic model of MPEG audio coding to achieve the perceptual transparency after watermark embedding and preprocessing procedure before correlation in watermark detection to extract copyright information without access to the original audio signal. Experimental results show that our watermarking scheme is robust to common signal Processing attacks and it Introduces no audible distortion after watermark insertion.

  • PDF

Effect of Visual Factor on Subjective Evaluation of Frictional Fabric Sounds (직물 마찰음의 주관적 평가에 시각적 변수가 미치는 영향)

  • Han, A-Reum;Yang, Yun-Jeong;Jo, Gil-Su
    • Proceedings of the Korean Society for Emotion and Sensibility Conference
    • /
    • 2009.11a
    • /
    • pp.62-65
    • /
    • 2009
  • 본 연구는 동작 속도별 마찰음의 주관적 평가에 있어서 시각적 변수의 영향을 분석하는 것을 목적으로 한다. 현재 유통되고 있는 79 종의 스포츠웨어용 투습발수직물 중 음향 특성으로 계층적 군집분석에 의해 나누어진 3 개의 군집에서 각각 하나씩 추출한 총 3가지 시료를 대상으로 walking, jogging, running의 속도로 마찰시켜 총 9가지의 소리에 대하여 실험하였다. 직물 소리에 대한 주관적 평가 시 시각적 변수의 영향을 분석하기 위하여 두 가지 방법으로 직물 소리에 대한 주관적 반응을 평가하였다. 첫 번째는 기존의 연구에서 주로 이루어진 방법으로, 실험 진행자가 피험자에게 직물소리를 들려주면서 설문을 하게 하였다. 두 번째는 녹음된 직물의 소리와 함께 모니터를 통해 해당 자극물의 마찰 속도에 따라 인체 모델이 움직이는 동작을 보여줌으로써 청각과 시각 자극을 동시에 제시하여 주관적 평가의 자극물로 사용하였다. 주관적 평가는 8개의 형용사 쌍에 대해 의미미분척도로 평가되었고, 두 가지 방법을 비교하기 위하여 '실제 옷을 착용하고 움직일 때 발생하는 직물 소리와 유사하게 들린다.' 와 '옷을 착용하고 움직일 때 발생하는 소리라고 느껴진다.' 두 문항을 추가하여 평가하였다. 그 결과 시각 자극의 유무에 의한 감성평가 결과에는 큰 영향을 미치지는 않았지만, 피험자가 소리만으로 직물이 마찰되는 장면을 의식적으로 상상해야 하는 심리적 부담을 줄여주었고, 주관적 평가 몰입도를 향상시켰다고 사료된다.

  • PDF

Objective Assessment Model for Refrigerator Noises (냉장고 소음의 객관적 평가 모델)

  • Park, Jong-Geun;Cho, Youn;Lee, Sang-Wook;Hwang, Dae-Sun;Lee, Chul-Hee
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.46 no.5
    • /
    • pp.80-90
    • /
    • 2009
  • This paper presents objective methods which predict perceptual noise levels caused by refrigerators. Eight home refrigerators are chosen and their noises are recorded in an anechoic-chamber and a real-life apartment. In order to obtain perceptual noise levels of the refrigerators, subjective quality assessment tests were performed by 100 evaluators Then, we compute 5 sound quality metrics (SQM) which reflect psychoacoustics characteristics. Finally, objective assessment model for refrigerator noises is developed by linear combination of SQMs.