• Title/Summary/Keyword: 청각신호

Search Result 211, Processing Time 0.028 seconds

The Study of the Sensorineural Hearing Loss Compensation Algorithm using Psychoacoustics Model (심리음향모델을 적용한 난청 보정 알고리즘의 연구)

  • 노형철;김헌중;한헌수;차형태
    • Proceedings of the IEEK Conference
    • /
    • 2000.09a
    • /
    • pp.189-192
    • /
    • 2000
  • 본 논문에서는 청각 장애인의 보다 향상된 보청 환경을 조성하고자 청각손실을 심리음향 모델을 적용하여 감음 신경성 난청을 보정하는 알고리즘을 제안한다. 제안한 알고리즘에서는 난청의 유형은 내이에서부터 중추 뇌에 걸친 감음계와 신경계의 장애에서 비롯되는 감음신경성 난청(sensorineural hearing loss)으로 주파수 영역상에서 MTH(minimum hearing threshold)가 균일하지 않게 상승하게되어 가청영역이 좁아지는 문제점을 해결하기 위한 방법으로 각각의 주파수 밴드마다 멀티밴드 압축 알고리즘을 적용하였다. 그러나 이 경우 각각의 주파수 밴드에 따른 서로 다른 가청 영역의 영향에 의한 변형된 스펙트럼 모양으로 인해 spectral contrast reduction과 변형된 마스킹 특성으로 인해 음성 변별력에 제한을 가하게 된다. 이것은 주변 주파수 성분들에 의한 마스킹 효과에 의한 것으로, 신호에 대한 난청인이 느끼는 지각 영역(perceptual domain)에서의 해석과 심리음향 모델 파라미터를 통한 보청기의 개발이 이루어져야 하며, 본 논문에서 그 알고리즘을 적용하였다.

  • PDF

A Study on Development Ship Alarm Sound and Ship Bridge Alarm Management System (선교경보관리시스템의 제작 및 선박 경보음 개발을 위한 연구)

  • Ha, Wook-Hyun;Jang, Jun-Hyuk;Kim, Hong-Tea
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2012.06a
    • /
    • pp.452-454
    • /
    • 2012
  • 현대 기술의 발전에 따라 다양한 항해 장비들이 개발되고 있으나, 인적 오류에 의한 해양사고는 지속적으로 발생하고 있다. 인적 오류에 의한 해양사고는 항해사의 상황 인지오류 또는 현상 착각 등 많은 상황에서 일어나고 있다. 선교에는 각종 항해 장비로부터 나오는 많은 물리적 음향 신호들이 존재하며, 위험을 전파하는 경보음은 항해사에게 위험상황을 정확하게 전달하지 못하고 있는 실정이다. 따라서 본 연구에서는 경보음을 항해사가 직관적으로 인지할 수 있는 선교경보관리시스템의 경보음 개발을 위한 연구를 실시하였다. 연구를 위해 기존에 선교에서 사용하는 경보음에 대해 음향학적 분석을 수행하였으며, 음성 경보음과 청각아이콘을 활용한 경보음 개발에 대한 실험적 연구를 수행하였다. 그리고 현재 해양연구원에서 제작한 선교경보관리시스템(BAMS)을 간략히 소개하고자 한다.

  • PDF

Sound Reinforcement Based on Context Awareness for Hearing Impaired (청각장애인을 위한 상황인지기반의 음향강화기술)

  • Choi, Jae-Hun;Chang, Joon-Hyuk
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.48 no.5
    • /
    • pp.109-114
    • /
    • 2011
  • In this paper, we apply a context awareness based on Gaussian mixture model (GMM) to a sound reinforcement for hearing impaired. In our approach, the harmful sound amplified through the sound reinforcement algorithm according to context awareness based on GMM which is constructed as Mel-frequency cepstral coefficients (MFCC) feature vector from sound data. According to the experimental results, the proposed approach is found to be effective in the various acoustic environments.

The present state of acoustic barrier-free in Japan (음향분야에서의 배리어 프리(barrier-free)의 현황 -일본 사례를 중심으로-)

  • Ryu, Jong-Gwan;Hiroshi, Sato;Kenji, Kurakata
    • Proceedings of the Korean Society for Emotion and Sensibility Conference
    • /
    • 2009.05a
    • /
    • pp.83-86
    • /
    • 2009
  • 음 배리어 프리(acoustic barrier-free)는 '음과 관련하여 장애인과 고령자의 생활에 불편을 주는 장벽을 제거하는 방안'이라고 정의 된다. 음 배리어프리는 건축, 도시 공간 및 교통 수단에서의 시각 또는 청각약자를 위한 안내, 유도, 경보 및 피난 시설에 대한 설계와 관련된다. 또한 보청기 등의 청각지원기기, 전자기기 등의 신호음 및 안내음과 음성 전송 장치와 같은 제품 디자인에도 음 배리어프리 개념은 요구된다. 본고에는 일본사례를 중심으로 음 배리어프리의 현황을 소개하고자 한다.

  • PDF

MPEG-21 Digital Item Adaptation for User's Audio and Visual Accessibilities (사용자 청각특성 및 시각특성에 따른 MPEG-21 디지털 아이템 적응)

  • 남제호;김해광;노용만;홍진우
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2002.11a
    • /
    • pp.145-150
    • /
    • 2002
  • 디지털방송 서비스 기술의 급속한 발전은 시청자 취향 및 특성을 고려한 시청자 중심의 맞춤형 방송 서비스 제공을 가능하게 한다. 방송컨텐츠는 시청자의 특성 및 사용환경 정보들을 기반으로, 방송컨텐츠를 구성하는 오디오 및 비주얼 신호를 적응(adaptation) 변환하여 보다 개인화 된 형태로 가공된 후 시청자에게 제공되어질 수 있다. 본 논문에서는 현재 표준화 작업이 진행 중인 MPEG-21 Digital Item Adaptation (DIA) 표준기술에서 정의된 사용자 특성 정보들 중에서 '접근성(accessibility)'에 해당하는 사용자의 청각특성 및 시각특성 정보의 기술개요를 설명한다.

  • PDF

A research on the media player transferring vibrotactile stimulation from digital sound (디지털 음원의 촉각 자극 전이를 위한 미디어 플레이어에 대한 연구)

  • Lim, Young-Hoon;Lee, Su-Jin;Jung, Jong-Hwan;Ha, Ji-Min;Whang, Min-Cheol;Park, Jun-Seok
    • 한국HCI학회:학술대회논문집
    • /
    • 2007.02a
    • /
    • pp.881-886
    • /
    • 2007
  • This study was to develope a vibrotactile display system using windows media player from digital audio signal. WMPlayer10SDK system which was plug-in tool by microsoft windows media player provided its video and audio signal information. The audio signal was tried to be change into vibrotactile display. Audio signal had 4 sections such as 8bit, 16bit, 24bit, and 32bit. Each section was computed its frequency and vibrato scale. And data was transferred to 38400bps network port(COM1) for vibration. Using this system was able to develop the music suit which presented tactile feeling of music beyond sound. Therefore, it may provide cross modal technology for fusion technology of human senses.

  • PDF

Speech Feature Extraction based on Spikegram for Phoneme Recognition (음소 인식을 위한 스파이크그램 기반의 음성 특성 추출 기술)

  • Han, Seokhyeon;Kim, Jaewon;An, Soonho;Shin, Seonghyeon;Park, Hochong
    • Journal of Broadcast Engineering
    • /
    • v.24 no.5
    • /
    • pp.735-742
    • /
    • 2019
  • In this paper, we propose a method of extracting speech features for phoneme recognition based on spikegram. The Fourier-transform-based features are widely used in phoneme recognition, but they are not extracted in a biologically plausible way and cannot have high temporal resolution due to the frame-based operation. For better phoneme recognition, therefore, it is desirable to have a new method of extracting speech features, which analyzes speech signal in high temporal resolution following the model of human auditory system. In this paper, we analyze speech signal based on a spikegram that models feature extraction and transmission in auditory system, and then propose a method of feature extraction from the spikegram for phoneme recognition. We evaluate the performance of proposed features by using a DNN-based phoneme recognizer and confirm that the proposed features provide better performance than the Fourier-transform-based features for short-length phonemes. From this result, we can verify the feasibility of new speech features extracted based on auditory model for phoneme recognition.

Selective Quantization Based on Band Property for Wideband Signal Codec (광대역 신호 압축기를 위한 주파수 대역 특성에 선택적인 양자화 방법)

  • 송재종;박호종;김무영;김도석;김정수
    • The Journal of the Acoustical Society of Korea
    • /
    • v.20 no.7
    • /
    • pp.76-82
    • /
    • 2001
  • In this paper, a novel quantization method for wideband signal codec with 7 kHz bandwidth is proposed. In the transform-based wideband signal codecs, the signal is transformed to frequency domain and the spectral coefficients in each frequency band are quantized based on human perceptual model, followed by Huffman coding. However, the property of each band varies with frequency, and the codec has poor performance when all bands are quantized with the same method. Therefore, a selective quantization method is proposed, which analyzes the band property and selects the quantization domain between frequency domain and time domain based on the quantization efficiency. It is confirmed that the proposed method has better performance than the quantizer of G722.1 codec.

  • PDF

A Speech Emotion Recognition System for Audience Response Collection (관객 반응정보 수집을 위한 음성신호 기반 감정인식 시스템)

  • Kang, Jin Ah;Kim, Hong Kook
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2013.06a
    • /
    • pp.56-57
    • /
    • 2013
  • 본 논문에서는 연극공연을 관람하는 관객의 반응정보를 수집하기 위하여, 청각센서를 통해 관객의 음성을 획득하고 획득된 음성에 대한 감정을 예측하여 관객 반응정보 관리시스템에 전송하는 음성신호 기반 감정인식 시스템을 구현한다. 이를 위해, 관객용 헤드셋 마이크와 다채널 녹음장치를 이용하여 관객음성을 획득하는 인터페이스와 음성신호의 특징벡터를 추출하여 SVM (support vector machine) 분류기에 의해 감정을 예측하는 시스템을 구현하고, 이를 관객 반응정보 수집 시스템에 적용한다. 실험결과, 구현된 시스템은 6가지 감정음성 데이터를 활용한 성능평가에서 62.5%의 인식률을 보였고, 실제 연극공연 환경에서 획득된 관객음성과 감정인식 결과를 관객 반응정보 수집 시스템에 전송함을 확인하였다.

  • PDF

Efficient Representation method of Spatial cues for audio coding (오디오 채널 신호의 압축을 위한 공간 큐의 효율적 표현 방법)

  • Beack, Seung-Kwon;Kim, Min-Je;Lee, Tae-Jin;Jang, Dae-Young;Kang, Kyeong-Ok
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2008.02a
    • /
    • pp.183-186
    • /
    • 2008
  • 본 논문은 공간영역에서의 오디오 채널 신호의 압축 방법에 있어서, 공간 파라메터의 효율적인 표현 방법을 제안하려 한다. 대상이 되는 공간 파라메터는 인간청각의 ILD(Internaural Level Difference) 인지와 관련한 공간 파라메터에 관한 것으로 ICLD(Inter-Channel Level Difference) 파라메터의 표현방법 관한 것이다. 본 논문의 목적은, ICLD 의 통계적 특성을 분석하고 이에 충실한 표현방법을 제안함으로써, 양자화 시 기존 표현 방법보다 왜곡율을 개선시킴으로써 복원된 오디오 신호의 충실도를 높이는 것을 목적으로 한다. 따라서 본 논문에서는, 새로운 ICLD 표현 방법을 소개하고 이에 대한 이론적 통계적 근거를 제시하며, 실험결과로써 기존 방법과 비교된 왜곡율 측정(distortion measure) 결과를 제시하여 제안된 방법의 우수성을 입증한다.

  • PDF