• 제목/요약/키워드: human auditory model

검색결과 39건 처리시간 0.033초

MPEG Audio을 위 한 MDCT/IMDCT의 설계에 관한 연구 (A Study on the Design of MDCT/IMDCT for MPEG Audio)

  • 김정태;방기천;이강현
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1999년도 하계종합학술대회 논문집
    • /
    • pp.530-533
    • /
    • 1999
  • During the last decade, high quality digital audio has essentially replaced analog audio. During this period, digital audio have applied many application areas of the info-industry. These applications have created a demand for high quality digital audio. In audio compression, the methods using human auditory nervous properties are used and introduced from psychoacoustical model utilized perceptual audio coding unable to code above the limitation of human perception. The discussion concentrates on architectures and applications of those techniques which utilize psychoacoustical models to exploit efficiently masking characteristics of the human receiver. In this paper, the designed MDCT/IMBCT as a standard of current MPEG is implemented onto FPGA.

  • PDF

A Comparison of Front-Ends for Robust Speech Recognition

  • Kim, Doh-Suk;Jeong, Jae-Hoon;Lee, Soo-Young;Kil, Rhee M.
    • The Journal of the Acoustical Society of Korea
    • /
    • 제17권3E호
    • /
    • pp.3-11
    • /
    • 1998
  • Zero-crossings with Peak amplitudes (ZCPA) model motivated by human auditory periphery was proposed to extract reliable features form speech signals even in noisy environments for robust speech recognition. In this paper, the performance of the ZCPA model is further improved by incorporating conventional speech processing techniques into the model output. Spectral and cepstral representations of the ZCPA model output are compared, and the incorporation of dynamic features with several different lengths of time-derivative window are evaluated. Also, comparative evaluations with other front-ends in real-world noisy environments are performed, and result in the superiority of the ZCPA model.

  • PDF

Cross-matching과 AAS에 의한 바닥충격음 평가기술에 관한 연구 (A study on the evaluation technique of floor impact noises using Cross-matching and AAS)

  • 정영;김정미;전진용
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2000년도 춘계학술대회논문집
    • /
    • pp.172-176
    • /
    • 2000
  • A series of preliminary experiments were carried out to quantify the annoyance are noisiness caused by floor impact noise. From the results of the experiments. the heavy impact source was found to be felt louder and noisier than the light impact source. Measurements of noise were also conducted by a diagnostic system based on the model(the model consists of the autocorrelators and the cross-correlation for signals arriving at two ear entrants) of the human auditory-brain system. Physical factors in the model were calculated by use of the ACF(autocorrelation function) and IACF(interaural cross correlation function) of binaural signals. From the ACF/IACF analysis, it was found that perceived loudness of floor impact noise could be represented by the factors of the ACF/IACF model.

  • PDF

인간의 청각 시스템을 응용한 음원위치 추정에 관한 연구 (A study imitating human auditory system for tracking the position of sound source)

  • 배진만;조선호;박종국
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2003년도 학술회의 논문집 정보 및 제어부문 B
    • /
    • pp.878-881
    • /
    • 2003
  • To acquire an appointed speaker's clear voice signal from inspect-camera, picture-conference or hands free microphone eliminating interference noises needs to be preceded speaker's position automatically. Presumption of sound source position's basic algorithm is about measuring TDOA(Time Difference Of Arrival) from reaching same signals between two microphones. This main project uses ADF(Adaptive Delay Filter) [4] and CPS(Cross Power Spectrum) [5] which are one of the most important analysis of TDOA. From these analysis this project proposes presumption of real time sound source position and improved model NI-ADF which makes possible to presume both directions of sound source position. NI-ADF noticed that if auditory sense of humankind reaches above to some specified level in specified frequency, it will accept sound through activated nerve. NI-ADF also proposes practicable algorithm, the presumption of real time sound source position including both directions, that when microphone loads to some specified system, it will use sounds level difference from external system related to sounds of diffraction phenomenon. In accordance with the project, when existing both direction adaptation filter's algorithm measures sound source, it increases more than twice number by measuring one way. Preserving this weak point, this project proposes improved algorithm to presume real time in both directions.

  • PDF

뇌과학 기반의 디즈니 애니메이션 흥행 예측 AI 모형 개발 연구 (A Study on Development of Disney Animation's Box-office Prediction AI Model Based on Brain Science)

  • 이종은;양은영
    • 디지털융복합연구
    • /
    • 제16권9호
    • /
    • pp.405-412
    • /
    • 2018
  • 영화 흥행의 예측이 필요한 시점은 영화 제작 전에 시나리오에 대한 투자를 결정하는 시점이다. 이런 요구에 따라 최근 인공지능 기반 시나리오 분석 서비스가 출시되었으나, 아직 그 알고리즘이 완벽하지는 않다. 본 연구의 목적은 인간의 뇌 작동 기작에 기반 하여, 영화 시나리오 흥행 예측 모형을 제시하는 것이다. 이를 위해 베버의 자극 반응 법칙과 뇌의 자극 기작 이론 등을 적용하여, 디즈니 애니메이션 흥행작의 시각, 청각, 인지적 자극의 타임 스펙트럼 패턴 도출을 시도한 결과는 다음과 같다. 첫째, 흥행작에서 나타난 뇌 자극의 빈도가 비 흥행작보다 약 1.79배가 많았다. 둘째로, 흥행작에서는 지각 자극 코드들이 타임 스펙트럼 상에 고른 분포를 보인 반면에 비흥행작에서는 집중 분포를 보였다. 셋째로, 흥행작에서는 인지적 부담이 큰 인지적 자극은 주로 단독적으로 등장한 반면에, 인지적 부담이 적은 시각적, 청각적 자극은 두 가지가 동시에 등장하였다.

웨어러블 디바이스 기반 근감각-색·음 변환 시스템의 구현 (Implementation of Muscular Sense into both Color and Sound Conversion System based on Wearable Device)

  • 배명진;김성일
    • 한국멀티미디어학회논문지
    • /
    • 제19권3호
    • /
    • pp.642-649
    • /
    • 2016
  • This paper presents a method for conversion of muscular sense into both visual and auditory senses based on synesthetic perception. Muscular sense can be defined by rotation angles, direction changes and motion degrees of human body. Synesthetic interconversion can be made by learning, so that it can be possible to create intentional synesthetic phenomena. In this paper, the muscular sense was converted into both color and sound signals which comprise the great majority of synesthetic phenomena. The measurement of muscular sense was performed by using the AHRS(attitude heading reference system). Roll, yaw and pitch signals of the AHRS were converted into three basic elements of color as well as sound, respectively. The proposed method was finally applied to a wearable device, Samsung gear S, successfully.

캡쳐링 공격에 강인한 오디오 워터마킹 방법 (Robust Audio Watermarking Method Under Capturing Attacks)

  • 이승재;이상광;서진수
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2006년도 하계종합학술대회
    • /
    • pp.375-376
    • /
    • 2006
  • In this paper, we propose a wavelet-based audio watermarking algorithm to be robust against capturing attack. Commercial capturing tools enable us to obtain audio contents without noticeable degradation in audio quality, and it is possible to be a source of illegal distribution. By adjusting mean values of the lowest subband in audio, the proposed method can survive after capturing attack including sampling rate conversion, random cropping and compression. By applying a simple human auditory model, the inaudibility of the watermark is achieved, and detection probability is improved based on the difference information. This is confirmed by experimental results.

  • PDF

차량 구조 강성과 소음 음질간의 상관도 연구 (A Study on the Relationship between Sound Quality and Structural Mechanics in Automobiles)

  • 최종대;김상만
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 학술발표대회 논문집 제19권 2호
    • /
    • pp.239-242
    • /
    • 2000
  • In the present study, the influence of car body structures to the noise and vibration characteristics has been sought. The numerical modal analysis for the body-in-white is employed to predict the vibratory response of structure, and then followed by the experimental modal testing to confirm the validity of the model. Using the results of numerical simulations with the designated modal parameters, the optimal structural configuration has been deduced. Special interests have been paid to the sensitivity of sound quality to the structural integrity. Since the structural integrity has a close relationship to the structure-born noise, the substantially low frequency range, which is far below the frequency range almost barely sensible by human auditory organ but still quite influential to overall impression, is especially examined. The subjective assessment agrees with the objective evaluation by means of traditional sound measures as well as psychoacoustic metrics.

  • PDF

음원 위치 검출기의 구현 (Implementation of Sound Source Location Detector)

  • 이종혁;김진천
    • 한국정보통신학회논문지
    • /
    • 제4권5호
    • /
    • pp.1017-1025
    • /
    • 2000
  • 인간의 청각시스템은 두 가지 요소 즉, ITD(Interaural Time Difference)와 IID(Interaural Intensity Difference)를 처리하여 음원의 위치와 추적을 하고 있다. 본 연구에서는 음원의 위치 검출을 위하여 ITD와 IID 뿐만 아니라 이전의 위치 정보를 이용하여 정확한 음원의 방향을 결정할 수 있는 TEPILD(Time Energy Previous Integration Location Detector) 모델을 제안하였다. TEPILD 모델에서 time function generator는 ITD, energy function generator는 IID를 처리할 수 있도록 하였다. 음원은 정현파(500Hz,1kHz, 2kHz, 3kHz), White noise, Pink noise, News, Music으로 하고 음원의 방향은 right, front right, front, front left, left로 하였다. 실험 결과 전체 평균 정확도가99.2로 좋은 결과를 얻을 수 있었으며, TEPILD가 음원 위치 검출기에 이용될 수 있음을 확인하였다.

  • PDF

시간-주파수 구조에 근거한 지각적 오디오 부호화기 (A Perceptual Audio Coder Based on Temporal-Spectral Structure)

  • 김기수;서호선;이준용;윤대희
    • 방송공학회논문지
    • /
    • 제1권1호
    • /
    • pp.67-73
    • /
    • 1996
  • 일반적으로 고음질 오디오 부호화 방법은 전통적인 데이터 압축 기법과 인간의청각 모델을 결합한 구조를 갖고 있다. 고음질 오디오 부호화에 사용되는 주요한 청각 특성은 주파수 영역에서의 마스킹 현상이므로 서브밴드 부호화나 변환 부호화와 같은 주파수 영역 방법들이 널리 사용된다[1][2]. 그러나 지금까지의 고음질 오디오 부호화에서 시간 영역 마스킹과 시간 영역 중복성을 제거하는 방법은 적용되지 않았다. 본 논문에서 제안한 오디오 데이터 압축 방법은 시간 및 주파수 영역에서 통계적, 지각적 중복성을 제거한다. 주파수 영역으로 변환된 오디오 신호는 6프레임으로 구성된 패킷으로 나뉘어진다. 한 패킷은 1536 샘플 ($256{\times}6$)로 되어 있으며 패킷 내에서의 중복성은 시간 및 주파수 영역에서 존재한다. 각 패킷에서 두 중복성이 동시에 제거되어진다. 심리음향 모델에 있어서도 세밀한 주파수 마스킹과 함께 시간 영역 마스킹을 고려하여 보다 정확한 결과를 얻을 수 있도록 향상되었다. 양자화를 위해서 각 패킷은 비선형적인 임계 대역과 시간적인 청각 특성을 반영할 수 있도록 설계된 부블럭으로 분할되었다. 따라서 낮은 비트율에서 고음질의 복원음을 얻을 수 있었다.

  • PDF