• 제목/요약/키워드: 음성검출기

검색결과 137건 처리시간 0.028초

잡음 환경에서의 음성 인식을 위한 청각 표현 (Auditory Representations for Robust Speech Recognition in Noisy Environments)

  • 김도석;이수영;길이만
    • 한국음향학회지
    • /
    • 제15권5호
    • /
    • pp.90-98
    • /
    • 1996
  • 본 논문에서는 잡음 환경에서의 음성 인식을 위한 전처리기로서 청각 모델을 제안하였다. 제안된 청각 모델은 와우각 대역 통과 필터와 비선형단으로 구성되어 있으며, 잡음 환경에서도 신호의 주파수 정보와 강도 정보를 효과적으로 표현할 수 있다. 주파수 정보는 신호의 영교차 간격에 의해서, 또 강도 정보는 피크 검출기와 포화 비선형 함수에 의해서 구해진다. 영교차 간격이 교란되는 양의 분산을 교차 레벨 값의 함수로 표현함으로써 영교차 간격을 사용하는 것이 레벨 교차간격에 비해 잡음에 둔감한 특성이 있음을 보였다. 제안된 청각 모델은 다른 청각 모델에 비해 계산량이 적고, 미리 많은 파라미터를 정해줄 필요가 없다. 화자 독립 격리단어 인식 실험 결과 제안된 방법은 잡음 환경에서 우수한 성능을 보였다.

  • PDF

화자 인식을 통한 등장인물 기반의 비디오 요약 (Character-Based Video Summarization Using Speaker Identification)

  • 이순탁;김종성;강찬미;백중환
    • 융합신호처리학회논문지
    • /
    • 제6권4호
    • /
    • pp.163-168
    • /
    • 2005
  • 본 논문에서는 인물 기반의 비디오 요약 방법으로써 비디오 내 음성정보를 이용하여 화자 인식 기법을 통한 등장인물 중심의 요약 기법을 제안한다. 먼저, 얼굴 영역을 포함하는 장면을 중심으로 비디오로부터 배우의 대사에 해당하는 음성 정보를 분리하고, 화자 인식 기법을 수행하여 등장인물 별로 분류하였다. 화자인식 기법은 각 화자별로 MFCC(Mel Frequency Cepstrum Coefficient) 값을 추출하고 GMM(Gaussian Mixture Model)을 이용하여 분류한다. 본 논문에서는 4명의 등장인물에 대해 GMM을 학습시키고 4명 중 1명을 검출하는 실험을 통해 학습된 GMM 분류기가 실험 비디오에 대해 0.138 정도의 오분류율을 보임을 확인하였다.

  • PDF

실시간 윈도우 환경에서 DMS모델을 이용한 자동 음성 제어 시스템에 관한 연구 (A Study on the Automatic Speech Control System Using DMS model on Real-Time Windows Environment)

  • 이정기;남동선;양진우;김순협
    • 한국음향학회지
    • /
    • 제19권3호
    • /
    • pp.51-56
    • /
    • 2000
  • 본 논문은 음성인식을 이용한 실시간 윈도우 자동 제어 시스템에 관한 연구이다. 사용된 음성 모델은 수행 속도를 높이기 위해 제안된 가변 DMS 모델을 이용하였으며, 인식 알고리즘으로 이를 이용한 One-Stage DP 알고리즘을 사용한다. 인식 대상단어는 윈도우에서 자주 사용되는 66개의 윈도우 제어 명령어들로 구성한다. 본 연구에서 온라인으로 음성을 처리하기 위해 음성 검출 알고리즘을 구현하였으며, 기존 DMS(Dynamic Multi Section)모델 생성시 고정적으로 적용하던 섹션의 수를 입력 신호의 지속 시간을 고려하여 가변적으로 적용한 가변 DMS 모델을 제안하였다. 또한 윈도우에서 사용자 작업에 의해 현재 상태에 인식 대상으로 불필요한 인식 대상단어가 발생하게 되는데 이를 효율적으로 처리하기 위해 사용 모델을 재구성하여 사용하도록 제안하였으며, 인간의 청각적 특성을 고려하여 음성신호에서 개인의 특성은 제외하고 음성 자체의 특징만을 추출하여 특징 벡터를 생성하는 인지 선형 예측(Perceptual Linear Predictive)분석 방법을 이용하였다. 시스템 성능 평가 결과 가변 동적 다중 섹션 모델(Variable DMS model)과 기존의 DMS 모델은 인식률 면에서는 거의 동일하지만 인식 수행 속도는 제안된 모델의 계산량이 기존 모델보다 작기 때문에 향상되었고, 다중 화자 독립 인식률은 99.08%, 다중 화자 종속 인식률은 99.39%의 인식률을 나타내었으며, 실제 노이즈가 있는 환경에서 화자독립실험의 경우 96.25%의 인식률을 보여 주었다.

  • PDF

우도비를 이용한 적응 밴드 분할 기반의 음성 검출기 (Voice Activity Detection based on Adaptive Band-Partitioning using the Likelihood Ratio)

  • 김상균;심현민;이상민
    • 한국멀티미디어학회논문지
    • /
    • 제17권9호
    • /
    • pp.1064-1069
    • /
    • 2014
  • In this paper, we propose a novel approach to improve the performance of a voice activity detection(VAD) which is based on the adaptive band-partitioning with the likelihood ratio(LR). The previous method based on the adaptive band-partitioning use the weights that are derived from the variance of the spectral. In our VAD algorithm, the weights are derived from LR, and then the weights are incorporated with the entropy. The proposed algorithm discriminates the voice activity by comparing the weighted entropy with the adaptive threshold. Experimental results show that the proposed algorithm yields better results compared to the conventional VAD algorithms. Especially, the proposed algorithm shows superior improvement in non-stationary noise environments.

저전송율 보코더의 성능개선에 관한 연구 (On an Improving Performance of Low Bit-Rate Speech Coder)

  • 박영호;홍성훈;배명진
    • 한국음향학회지
    • /
    • 제17권7호
    • /
    • pp.101-107
    • /
    • 1998
  • 본 논문에서는 잔차신호를 모델링하기 위해 사용되는 동적희박대수코드북에 대해 분석하고 성능이 향상된 새로운 대수코드북 구조 및 검색과정을 제안하였다. 제안된 알고리 즘은 대수 코드북의 단점을 계산량의 증가 없이 개선시켰다. 먼저 기존에 단순히 부호비트 만을 검색하는 것에 대해 다양한 펄스 진폭의 선택을 가능하게 하였다. 그리고 동일 트랙상 에서 두 펄스를 선택하게 하였으며 추가 계산량이 필요없는 무성음에서 유성음으로의 천이 구간 검출기를 이용하여 LSF 보간 시 발생하는 천이구간에서의 LP지연을 최소화하였다. 제 안된 알고리즘을 이용한 5.6kbps음성부호화기는 전화선상의 음질을 시료로 하여 주관적 음 질면에서 6.3kbps MP-MLQ와 동등하였으며 MNRU Q=15dB에서는 MP-MLQ에 비해 약간 의 음질열하가 발생하였다.

  • PDF

병렬 SOA 구조의 파장가변 레이저를 이용한 단면 영상획득 (Acquirement of cross-sectional image by using wavelength swept laser within the two SOAs parallel configuration)

  • 김훈섭;엄진섭
    • 산업기술연구
    • /
    • 제28권B호
    • /
    • pp.239-244
    • /
    • 2008
  • We have realized the swept source optical coherence tomography(SS-OCT) by using the self-fabricated wavelength swept laser(wavelength tuning range : 80nm, line-width : 0.12nm, wavelength sweeping rate : 50Hz). In addition, we have used the dual balanced detector that could make a mirror image in OCT display suppressed. We can also fabricate the comb filter of Michelson interferometer type for fast-signal processing in OCT. Using this SS-OCT system for measuring an mirror, a 1mm-depth glass and an onion, we confirmed that the in vivo epidermal cross-sectional images for them can be obtained appropriately.

  • PDF

주파수 영역에서 구간조건을 이용한 음향학적 반향 제거 (Frequency Domain Acoustic Echo Suppression Based on Boundary Condition)

  • 이규호;장준혁
    • 대한전자공학회논문지SP
    • /
    • 제46권5호
    • /
    • pp.162-166
    • /
    • 2009
  • 본 논문은 적응 반향 제거기인 parametric wiener filter (PWF)의 반향신호 제거 파라미터를 구간 조건에 따라 차등적으로 적용시키는 새로운 음향학적 반향제거 (Acoustic Echo Suppression, AES) 알고리즘을 제안한다. PWF는 반향 신호 추정의 부정확성을 보상하고자 반향신호 제거 파라미터를 사용한다. 기존의 방법은 단일통화 구간과 동시통화 구간에 관계없이 동일한 반향신호 제거파라미터 값을 적용하여 동시통화 환경에서 근단 신호의 왜곡을 발생 시킨다. 본 논문에서는 상관계수 (Correlation Coefficient)를 이용한 동시통화(Double-Talk) 검출 알고리즘과 음성구간검출기 (Voice Activity Detector, VAD)의 결과로부터, 원단 화자만 있는 구간과 동시통화 구간을 구분하고 각각의 경우에 반향제거 파라미터를 달리 적용하여 동일한 반향신호 제거 파라미터를 사용함에 따른 동시통화 구간내의 근단 화자신호의 음질 저하 없이 반향신호를 보다 효과적으로 제거하는 방법을 제안한다. 제안된 방법의 결과는 객관적인 실험을 통해 비교 평가한 결과 우수한 성능을 보였다.

사람치아에서 성별감정시 SOX9 과 SRY 유전자의 유용성 (Usefulness of SOX9 and SRY Gene on Sex Determination in Human Teeth)

  • 고남주;안종모;윤창륙
    • Journal of Oral Medicine and Pain
    • /
    • 제26권1호
    • /
    • pp.87-93
    • /
    • 2001
  • SOX9과 SRY 유전자는 척추동물에서 남성고환의 형성을 유도하는 요소로 알려졌다. SOX9 유전자는 SRY related HMG box gene중 하나로 유전질환의 XY성전환 및 성을 결정하는 데에 관여하며 성결정시기에 그 양에 따른 성전환 발생등 연구가 진행되고 있다. 그러나 이 유전자가 성별판정에 유용할 지는 확실치 않다. 반면 SRY 유전자는 포유동물에서의 배형성시기 고환형성을 결정하는 Y염색체 유전자로 남성에만 존재하고 여성에는 존재 않는다. 현재까지 이을 이용하여 법의학적 검체에서 남성판별에 유용하게 사용되고 있다. 본 실험에서는 X, Y와 같은 성염색체가 아닌 상동염색체상에 있으면서 SRY 유전자와 더불어 남성고환을 결정하는 또다른 요소로서의 기능을 가진 SOX9 유전자를 치아에서 검출하여 법의학적 성별판정에 유용할 수 있는지 알아보고자 본 연구를 수행하였다. 남녀각각 5개의 치아에서 치수와 상아질을 분리한 후 DNA를 추출하여 SOX9과 SRY 유전자의 특이적인 시발체를 제작하고 중합효소연쇄반응을 시행하여 증폭하고 전기영동을 시행하였다. 그 결과 SOX9 유전자는 남녀모두에서 유전자가 검출되었고, SOX9 유전자산물과 SRY 유전자를 혼합하여 사용시 남자에서만 유전자가 검출되었다. 이는 법의치과학적 성별판정에 있어 SOX9 유전자는 사람의 치아에서는 남녀 모두 존재하며 남녀 구별을 위한 성별판정에는 이용할 수 없으며 SRY 유전자와 함께 적용시 남성 특이적 SRY 유전자 검사중 발생할 수 있는 가성 음성 반응여부를 확인하는 데 유용할 것으로 사료된다.

  • PDF

증균배지에서의 Listeria Interspecies의 경쟁생육 비교 (Comparison of Growth Rates of Listeria Interspecies in Different Enrichment Broth)

  • 이다연;조용선
    • 한국식품위생안전성학회지
    • /
    • 제33권1호
    • /
    • pp.65-70
    • /
    • 2018
  • L. monocytogenes는 Listeriosis를 일으키는 중요한 식중독 균으로 현재 국내 식품공전에서는 증균배양을 기초로 검출하며, 규격은 불검출로 관리하고 있다. 그러나 Listeria종 간의 혼합오염시 증균 과정에서 경쟁생육이 존재하여 L. monocytogenes 위음성의 가능성이 있다고 보고되고 있다. 국내 식품공전은 L. monocytogenes 증균을 위한 1차 배지로 규정되어 있으나 LEB 배지에서의 Listeria 종 간의 생육 연구는 보고된 바 없다. 본 연구는 식품에서 주로 검출되는 Listeria 속 4종(L. monocytogenes, L. innocua, L. ivanovii, L. seeligeri)을 LEB배지에 혼합배양하며 증균과정에서 생육의 차이가 존재하는 것을 확인하였다. 특히, L. innocua에 의해 L. monocytogenes의 생육이 저해되며, L monocytogenes가 L. innocua보다 초기균수가 2.0 log CFU/mL 이상 오염이 되어있어야지만 L. innocua보다 생육이 잘 되는 것을 확인하였다. Listeria 종 간의 혼합오염이 있을 경우 현재 검출법으로는 L. monocytogenes의 검출이 어려울 수 있다고 판단된다. 따라서 L. monocytogenes 검출율을 높이는 새로운 증균배지 개발의 필요성을 확인하였다. 향후 본 연구는 L. monocytogenes 검출률을 높여 국내 식품의 식품 안전에 기여 할 수 있으며 국내 식품 관리 규격 개정 시 기초가 되는 참고 자료로 활용 할 수 있을 것으로 생각된다.

전기성문전도(EGG) 시스템의 개발 및 평가 (Implementation and Evaluation of Electroglottograph System)

  • 김기련;김광년;왕수건;허승덕;이승훈;전계록;최병철;정동근
    • 대한의용생체공학회:의공학회지
    • /
    • 제25권5호
    • /
    • pp.343-349
    • /
    • 2004
  • 전기성문전도는 발성시에 성문의 진동이 전기적 임피던스를 이용하여 검출되는 신호이다. 본 연구는 이러한 전기성문전도를 기록하기 위한 장비를 구현하고 음성분석 및 후두질환 진단에 대한 적용생을 평가하고자 하였다. 전기성문전도의 하드웨어는 2 쌍의 링전극, 동조증폭기, 검파기, 저역통과필터, 자동이득조절부 등으로 구성되며, 2.7MHz의 반송파 신호를 이용하고 진폭 변조 방식의 검파를 통해 임피던스 신호를 추출하도록 하였다. 추출된 신호는 PC 사운드 카드의 라인 입력을 통해 샘플링되고 양자화되었다. 검출 신호를 분석하기 위한 파라미터는 패래 시간을(CQ), 개폐 속도율(SQ), 개폐속도지수(SI), 성대진동 주파수(F0), 성대진동 주파수변동지수(Jitter), 성대진동 진폭변동지수(Shimmer) 등을 추출하였다. 전기성문전도를 분석한 결과, F0가 증가할수록 CQ는 커지고, SQ와 SI는 작아지는 경향을 보였으며, 전기성문전도와 음성 선호의 기본주파수가 일치함을 알 수 있었다. CQ, SQ, SI는 정상인과 후두암 환자를 비교한 결과 유의한 차이를 보였다. 이러한 결과는 성대의 운동을 관찰할 수 있는 휴대용 전기성문전도 계측기의 구현이 가능하게 하였고, 성대 기능 이상 검사가 가능함을 시사하였다.