• 제목/요약/키워드: acoustic features

검색결과 322건 처리시간 0.021초

클래스 히스토그램 등화 기법에 의한 강인한 음성 인식 (Robust Speech Recognition by Utilizing Class Histogram Equalization)

  • 서영주;김회린;이윤근
    • 대한음성학회지:말소리
    • /
    • 제60호
    • /
    • pp.145-164
    • /
    • 2006
  • This paper proposes class histogram equalization (CHEQ) to compensate noisy acoustic features for robust speech recognition. CHEQ aims to compensate for the acoustic mismatch between training and test speech recognition environments as well as to reduce the limitations of the conventional histogram equalization (HEQ). In contrast to HEQ, CHEQ adopts multiple class-specific distribution functions for training and test environments and equalizes the features by using their class-specific training and test distributions. According to the class-information extraction methods, CHEQ is further classified into two forms such as hard-CHEQ based on vector quantization and soft-CHEQ using the Gaussian mixture model. Experiments on the Aurora 2 database confirmed the effectiveness of CHEQ by producing a relative word error reduction of 61.17% over the baseline met-cepstral features and that of 19.62% over the conventional HEQ.

  • PDF

재발량 분석을 이용한 음향 상황 인지 (Acoustic scene classification using recurrence quantification analysis)

  • 박상욱;최우현;고한석
    • 한국음향학회지
    • /
    • 제35권1호
    • /
    • pp.42-48
    • /
    • 2016
  • 동일한 장소에서도 매우 다양한 음향이 발생하고, 서로 다른 장소에서도 유사한 음향이 발생하기 때문에 훈련 데이터가 적거나, 훈련 단계에서 일부 음향만 고려된 경우 음향 상황 인지 성능을 보장할 수 없다. 이러한 문제점을 해결하기 위한 방법으로 Bag of Words (BOW) 기반 히스토그램 특징이 소개되었다. 하지만 BOW 기반 히스토그램 특징은 일정 시간동안 발생한 음향의 분포를 이용하기 때문에 음향이 발생한 순차적인 정보는 고려할 수 없다. 음향 상황 인지에서 일정 시간 동안 발생한 음향의 주기성과 지속성은 상황을 인지하는데 중요한 정보가 될 수 있다. 따라서 본 논문에서는 재발량 분석을 이용하여 주기성과 지속성에 대한 특징을 추출하였다. 인식 실험에서 재발량 분석을 통해 추출된 특징을 함께 사용한 경우 기존 방법들 보다 향상된 성능을 확인했다.

음성인식 성능 개선을 위한 다중작업 오토인코더와 와설스타인식 생성적 적대 신경망의 결합 (Combining multi-task autoencoder with Wasserstein generative adversarial networks for improving speech recognition performance)

  • 고조원;고한석
    • 한국음향학회지
    • /
    • 제38권6호
    • /
    • pp.670-677
    • /
    • 2019
  • 음성 또는 음향 이벤트 신호에서 발생하는 배경 잡음은 인식기의 성능을 저하시키는 원인이 되며, 잡음에 강인한 특징을 찾는데 많은 노력을 필요로 한다. 본 논문에서는 딥러닝을 기반으로 다중작업 오토인코더(Multi-Task AutoEncoder, MTAE) 와 와설스타인식 생성적 적대 신경망(Wasserstein GAN, WGAN)의 장점을 결합하여, 잡음이 섞인 음향신호에서 잡음과 음성신호를 추정하는 네트워크를 제안한다. 본 논문에서 제안하는 MTAE-WGAN는 구조는 구배 페널티(Gradient Penalty) 및 누설 Leaky Rectified Linear Unit (LReLU) 모수 Parametric ReLU (PReLU)를 활용한 변수 초기화 작업을 통해 음성과 잡음 성분을 추정한다. 직교 구배 페널티와 파라미터 초기화 방법이 적용된 MTAE-WGAN 구조를 통해 잡음에 강인한 음성특징 생성 및 기존 방법 대비 음소 오인식률(Phoneme Error Rate, PER)이 크게 감소하는 성능을 보여준다.

An Acoustic Investigation of Post-Obstruent Tensification Phenomena

  • Ahn, Hyun-Kee
    • 음성과학
    • /
    • 제11권4호
    • /
    • pp.223-232
    • /
    • 2004
  • This study investigated and compared the acoustic characteristics of the Korean stop sound [k'] in three different phonological environments: the tensified lenis stop [k'] as observed in /prek+kaci/, the fortis stop /k'/ as in /pre+k'aci/, and the fortis stop /k'/ following an obstruent as in /prek+k'aci/. The specific research question was whether or not the tensified lenis stop shares all the acoustic features with the other two kinds of fortis stops. The acoustic measures adopted in this study were H1*-H2*, VOT, length of stop closure, and $F_0$. The major findings were that the three stops showed no significant difference in all the acoustic measures except the length of stop closure. The fortis stop /k'/ following an obstruent showed significantly longer duration of stop closure than the other two stops, both of which showed no significant difference. Based on these phonetic results, this study argued that, for the proper phonological description of post-obstruent tensification, the phonological feature [slack vocal folds] of a lenis stop should be changed into [stiff vocal folds, constricted glottis] that the fortis stops should have.

  • PDF

Damage progression study in fibre reinforced concrete using acoustic emission technique

  • Banjara, Nawal Kishor;Sasmal, Saptarshi;Srinivas, V.
    • Smart Structures and Systems
    • /
    • 제23권2호
    • /
    • pp.173-184
    • /
    • 2019
  • The main objective of this study is to evaluate the true fracture energy and monitor the damage progression in steel fibre reinforced concrete (SFRC) specimens using acoustic emission (AE) features. Four point bending test is carried out using pre-notched plain and fibre reinforced (0.5% and 1% volume fraction) - concrete under monotonic loading. AE sensors are affixed at different locations of the specimens and AE parameters such as rise time, AE energy, hits, counts, amplitude and duration etc. are obtained. Using the captured and processed AE event data, fracture process zone is identified and the true fracture energy is evaluated. The AE data is also employed for tracing the damage progression in plain and fibre reinforced concrete, using both parametric- and signal- based techniques. Hilbert - Huang transform (HHT) is used in signal based processing for evaluating instantaneous frequency of the acoustic events. It is found that the appropriately processed and carefully analyzed acoustic data is capable of providing vital information on progression of damage on different types of concrete.

지선낭종의 초음파 소견: 조직학적으로 진단된 14개 병변의 분석 (Sonographic Appearance of Steatocystoma: An Analysis of 14 Pathologically Confirmed Lesions)

  • 윤혜영;강유선;박휘룡;안중모;이영준;이준우;강흥식
    • 대한영상의학회지
    • /
    • 제82권2호
    • /
    • pp.382-392
    • /
    • 2021
  • 목적 지선낭종의 초음파 소견을 분석하고, 표피낭종 및 지방종과의 감별진단에 도움이 되는 소견을 알아보고자 하였다. 대상과 방법 10명의 환자에서 14개의 조직학적으로 확진된 지선낭종의 초음파 소견을 후향적으로 검토하였다. 병변의 위치, 모양, 경계, 에코 발생 정도, 후방 음향 특징 및 테두리 벽 또는 병변 내 줄무늬의 존재 여부를 평가하였다. 지선낭종의 초음파 소견을 분석하고, 표피낭종 및 지방종과의 감별진단에 도움이 되는 소견을 알아보고자 하였다. 결과 지선낭종의 대부분은 피하 종괴(n = 6, 42.9%) 또는 피부층과 피하층을 함께 침범한 종괴로(n = 6, 42.9%) 나타났다. 병변은 대부분 경계가 잘 지어지고(n = 12, 85.7%) 균질한 에코 발생을 보였으며(n = 9, 64.3%), 후방 음향 특징을 나타내지 않았다(n = 9, 64.3%). 표피낭종을 지선낭종과 구별하는 가장 중요한 소견은 균질한 내부 에코 발생과(p = 0.009), 현저하지 않은 후방 음향 향상이다(p < 0.001). 지선낭종과 지방종의 구별되는 특징은 경계(p < 0.001), 에코 발생성(p = 0.034), 내부 에코 성상(p = 0.004) 및 병변 내 줄무늬의 부재였다(p < 0.001). 결론 지선낭종은 초음파 검사상 경계가 좋고 균질하며, 후방 음향 향상이 경도로 있거나 없는 종괴로 관찰되었다.

Scanning acoustic microscopy for material evaluation

  • Hyunung Yu
    • Applied Microscopy
    • /
    • 제50권
    • /
    • pp.25.1-25.11
    • /
    • 2020
  • Scanning acoustic microscopy (SAM) or Acoustic Micro Imaging (AMI) is a powerful, non-destructive technique that can detect hidden defects in elastic and biological samples as well as non-transparent hard materials. By monitoring the internal features of a sample in three-dimensional integration, this technique can efficiently find physical defects such as cracks, voids, and delamination with high sensitivity. In recent years, advanced techniques such as ultrasound impedance microscopy, ultrasound speed microscopy, and scanning acoustic gigahertz microscopy have been developed for applications in industries and in the medical field to provide additional information on the internal stress, viscoelastic, and anisotropic, or nonlinear properties. X-ray, magnetic resonance, and infrared techniques are the other competitive and widely used methods. However, they have their own advantages and limitations owing to their inherent properties such as different light sources and sensors. This paper provides an overview of the principle of SAM and presents a few results to demonstrate the applications of modern acoustic imaging technology. A variety of inspection modes, such as vertical, horizontal, and diagonal cross-sections have been presented by employing the focus pathway and image reconstruction algorithm. Images have been reconstructed from the reflected echoes resulting from the change in the acoustic impedance at the interface of the material layers or defects. The results described in this paper indicate that the novel acoustic technology can expand the scope of SAM as a versatile diagnostic tool requiring less time and having a high efficiency.

양성 성대 점막 질환의 음향학적 특성에 관한 연구 (A Study for Acoustic Features of Benign Laryngeal Disease)

  • 이재석;김진평;박정제;권오진;우승훈
    • 대한후두음성언어의학회지
    • /
    • 제24권1호
    • /
    • pp.47-50
    • /
    • 2013
  • Background and Objectives:The purpose of this study is to find features in acoustics and to learn useful features of parameters in order to distinguish laryngeal diseases through many acoustic variables. Materials and Methods:The subjects of this study were 125-male patients who had been diagnosed with vocal nodule, vocal polyp, vocal cyst, Reinke's edema, leukoplakia. To research the features of each disease in acoustics, they are measured 34 parameters by using MDVP. Results:It is clear that in order to see a meaning result when distinguishing laryngeal diseases, $F_0$, $MF_0$, $T_0$, Fhi, Flo, PER variables are significant (p<.05). It means that variables related to fundamental frequency are important to anticipate which group will be diagnosed with Reinke's edema and leukoplakia. vAm had an effect on getting a significant result in terms of amplitude perturbation parameters, which is useful to distinguish between laryngeal polyp/cyst and other laryngeal disease (p<.05). ATRI made a significant result in related to tremor parameters, which is useful to distinguish between laryngeal polyp and other laryngeal disease (p<.05). Conclusion:$F_0$, $MF_0$, $T_0$, Fhi, Flo, PER, vAm, ATRI might be meaningful parameters distinguishing pathologic from benign laryngeal diseases. Especially, the vAm and ATRI are an important factor when forecasting which group would be diagnosed with vocal polyp.

  • PDF

음향 방출 신호와 히스토그램 모델링을 이용한 유도전동기의 베어링 결함 검출 (Bearing Faults Identification of an Induction Motor using Acoustic Emission Signals and Histogram Modeling)

  • 장원철;서준상;김종면
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권11호
    • /
    • pp.17-24
    • /
    • 2014
  • 본 논문에서는 저속으로 회전하는 유도 전동기의 베어링 결함을 검출하기 위해 음향 방출 신호와 히스토그램 모델링을 이용하는 방법을 제안한다. 제안한 방법은 정규화된 결함 신호가 구성하는 히스토그램의 포락선을 모델링하여, 부분 상관 계수와 DET(Distance Evaluation Technique) 기법을 이용하여 결함 유형별 고유한 특징을 추출 및 선택한다. 추출된 특징을 SVR(Support Vector Regression) 분류기의 입력으로 사용하여 베어링의 내륜, 외륜 및 롤러 결함을 분류한다. 최적의 분류 성능을 위해 SVR 커널함수의 매개변수를 0.01에서 1.0까지 변화시키고, 특징 개수는 2에서 150까지 변화시키면서 실험한 결과, 0.64-0.65의 매개변수와 75개의 특징 개수에서 제안한 방법은 약 91%의 분류 성능을 보였고, 또한 기존의 결함 분류 알고리즘보다 높은 분류 성능을 보였다.

Voice Coding Using Only the Features of the Face Image

  • Cho, Youn-Soo;Jang, Jong-Whan
    • The Journal of the Acoustical Society of Korea
    • /
    • 제18권3E호
    • /
    • pp.26-29
    • /
    • 1999
  • In this paper, we propose a new voice coding using only the features of the face image such as mouth height(H), width(W), rate(R=W/H), area(S), and ellipse's feature(P). It provides high security and is not affected by acoustic noise because we use only the features of face image for speech. In the proposed algorithm, the mean recognition rate for the vowels approximately rises between 70% and 96% after many tests.

  • PDF