• 제목/요약/키워드: Auditory Signal Design

검색결과 14건 처리시간 0.021초

생리음향을 이용한 도어 닫힘음의 정량적 평가를 위한 새로운 음질요소의 개발 (Sound Metric Design for Quantification of Door Closing Sound Utilizing Physiological Acoustics)

  • 신태진;이승민;이상권
    • 한국소음진동공학회논문집
    • /
    • 제23권1호
    • /
    • pp.73-83
    • /
    • 2013
  • In previous works, psychoacoustic parameters have been used for objective quantification. However, these parameters do not agree well with subjective assessment. Therefore, the correlation between psychoacoustic parameters and the subjective rating of door closing sounds of sampled cars is low, and it is not sufficient to use psychoacoustic parameters as an objective metric to quantify the sound quality of door closing sounds. In this paper, a new method is proposed to objectively quantify the sound quality based on physiological acoustics and statistical signal processing. The gammatone filter, as a pre-processing, is used in models of the auditory system and kurtosis, which is the fourth-order moment of temporal signal, and is used to extract information about sound quality quantification for door closing sounds. The new metric obtained through the proposed method is highly correlated with subjective rating, and it is successfully applied to the quantification of the sound quality of door closing sounds.

음향 신호의 양방향적 연관성을 고려한 유해 콘텐츠 검출 기법 (Pornographic Content Detection Scheme Using Bi-directional Relationships in Audio Signals)

  • 송광호;김유성
    • 한국콘텐츠학회논문지
    • /
    • 제20권5호
    • /
    • pp.1-10
    • /
    • 2020
  • 본 논문에서는, 최근 인터넷을 통해 빠르게 확산하고 있는 음향 중심의 음란 콘텐츠를 정확하게 검출하기 위해, 음향의 이웃 신호들 사이에 존재하는 양방향적 연관성을 기반으로 콘텐츠의 유해성을 판단하는 기법을 제안한다. 이웃한 음향 신호들간의 양방향적 연관성을 추출하기 위하여, 양방향 확장-인과 컨벌루션 연산(bi-directional dilated-causal convolution operation)들을 수행하는 확장-인과 컨벌루션 블록을 쌓아 만든 다층구조 양방향 확장-인과 컨벌루션 네트워크를 제안한다. 제안된 유해 콘텐츠 검출 기법의 효용성 검증을 위한 실험에서는 음향 신호의 각 시점으로부터 추출한 단순 특징 벡터를 기계학습 모델로 분류하는 기존 방법, 기존의 확장-인과 컨벌루션 블록을 적용해 음향 시계열 데이터의 순 방향 연관성만을 이용하는 기법, 그리고 본 연구에서 제안한 음향 시계열 데이터의 양방향 연관성까지 이용하여 유해성을 판단하는 기법의 분류 정확성을 비교하였다. 실험 결과에 의하면 본 연구에서 제안한 기법이 최대 84.38%의 인식 정확도를 가지며 이는 기존의 단순 특징 벡터를 이용하는 방법보다 약 25.80% 높고 순 방향 연관성만을 이용하는 기법보다 약 3.10% 높은 것으로 분석되었다.

피치동기 다중 스펙트럼을 이용한 청각보철장치의 음성신호처리 및 DSP 시스템 설계 (Speech Signal Processing using Pitch Synchronous Multi-Spectra and DSP System Design in Cochlear Implant)

  • 신중인;박석준;신대규;이재혁;박상희
    • 대한의용생체공학회:의공학회지
    • /
    • 제20권4호
    • /
    • pp.495-502
    • /
    • 1999
  • 본 연구에서는 내이의 손상에 의한 감각성 난청환자들의 청력회복을 위한 청각보철장치내의 가장 중요한 부분인 어음발췌기의 음성신호처리 알고리즘 및 하드웨어를 개발하였다. 증폭, 저역통과 필터, AGC의 역할을 수행하는 외이 및 중이는 아날로그 시스템으로 모델링하였고, 시간 지연된 다중 필터 및 변환기의 역할을 수행하는 내이는 실시간 처리가 가능한 고속 DSP 회로로 구현되었다. 특히 내이의 기저막특성은 비선형 자중 필터뱅크로 모델링한후, 피치와 동기화된 다중 스펙트럼을 출력할 수 있는 (pitch-synchronous multi-spectra : PSMS) 전략을 이용함으로서 청각계의 tonotopy와 periodicity를 만족시킬 수 있었다. 또한 주요, 음성신호처리의 대부분이 S/W로 수행되므로 다양한 실험을 위한 시스템 수정이 용이하며, C 언어로 프로그램이 개발되었기 때문에 다른 프로세스를 사용하는 H/W에도 쉽게 이식될 수 있다는 장점을 가진다.

  • PDF

k-clustering 부공간 기법과 판별 공통벡터를 이용한 고립단어 인식 (Isolated Word Recognition Using k-clustering Subspace Method and Discriminant Common Vector)

  • 남명우
    • 대한전자공학회논문지TE
    • /
    • 제42권1호
    • /
    • pp.13-20
    • /
    • 2005
  • 본 논문에서는 M. Bilginer 등이 제안한 CVEM(common vector extraction method)을 이용하여 한국어 화자독립 고립단어 인식실험을 수행하였다. CVEM은 학습용 음성신호들로부터 공통된 특징의 추출이 비교적 간단하고, 많은 계산 량을 필요로 하지 않을 뿐만 아니라 높은 인식 결과를 보여주는 알고리즘이다. 그러나 학습 음성의 개수를 일정 한도 이상으로 늘릴 수 없고, 추출된 공통벡터들 간의 구별정보(discriminant information)를 가지고 있지 않다는 문제점을 가지고 있다. 임의의 음성군으로부터 최적의 공통벡터를 추출하기 위해서는 다양한 음성들을 학습에 사용해야만 하는데 CVEM은 학습용 음성 개수에 제한이 있으므로 지속적인 인식률 향상을 기대하기 어렵다. 또한 공통벡터들 간의 구별정보 부재는 단어 결정에 있어서 치명적인 오류의 원인이 될 수 있다. 본 논문에서는 CVEM이 가지고 있는 이러한 문제점들을 보완하면서 인식률을 향상시킬 수 있는 새로운 방법인 KSCM(k-clustering subspace method)과 DCVEM(discriminant common vector extraction method)을 제안하였고 이 방법을 사용하여 고립단어를 인식하였다. 그리고 제안한 방법들의 우수성을 입증하기 위해 ETRI에서 제작한 음성 데이터베이스를 사용, 다양한 방법으로 실험을 수행하였다. 실험 결과 기존 방법의 문제점들을 모두 극복할 수 있었을 뿐 아니라 기존에 비해 계산량의 큰 증가 없이 향상된 결과를 얻을 수 있었다.