• 제목/요약/키워드: VAD(VAD)

검색결과 217건 처리시간 0.027초

음소기반의 순환 신경망 음성 검출기를 이용한 음성 향상 (Speech Enhancement using RNN Phoneme based VAD)

  • 이강;강상익;권장우;이상민
    • 전자공학회논문지
    • /
    • 제54권5호
    • /
    • pp.85-89
    • /
    • 2017
  • 본 논문에서는 향상된 연산 능력을 가진 하드웨어와 알고리즘의 혼합을 통하여 음성 향상을 위한 정확한 음성 검출기 구현을 목적으로 하였다. 음성은 음소의 나열로 구성되어있으며 음성 모델을 세우는데 적합한 방법은 이전의 정보를 이용하는 순환 신경망 (recurrent neural network, RNN)을 사용하는 것이다. 실제 존재하는 모든 잡음에 대하여 학습한 모델을 제시하는 것은 사실상 불가능 하므로 이를 극복하고자 음소기반 학습을 진행하였다. 학습의 결과로 세워진 모델을 기반으로 새로운 음성 신호에서 음성을 검출하고 그 결과를 이용하여 음성 향상을 진행하였다. 순환 신경망과 음소기반 학습은 프레임 별 높은 상관성을 가진 음성 신호에서 좋은 성능을 얻을 수 있었으며 음성 검출기의 성능을 검증하기 위하여 라벨 데이터와 음성 검출결과를 비교하고 다양한 잡음 환경에서 객관적 음질 평가를 진행하여 기존의 음성 향상 알고리즘과 비교하였다.

Gemcitabine의 세포사멸 기전 연구 (Mechanism of gemcitabine-induced apoptosis)

  • 설재원;이유진;강동원;강형섭;김남수;김인식;박상열
    • 대한수의학회지
    • /
    • 제45권4호
    • /
    • pp.495-500
    • /
    • 2005
  • The nucleoside analogue gemcitabine (2', 2-difluorideoxycytide) is potential against a wide variety of solid tumors and considered to be one of the most active drugs in the treatment of non-small cell lung cancer (NSCLC). In this study, we investigated the signals of gemcitabine-induced apoptosis, especially in point of caspase pathway in A549. We exposed A549 cells to gemcitabine for dose/time dependent manner and the results showed that gemcitabine induced apoptotic cell death in a time/dose-dependent manner. We also treated to gemcitabine and Z-VAD-fmk as a pan-caspase inhibitor for 24 hours. Gemcitabine alone induced 35.3% cell death, and co-treatment with gemcitabine and Z-VAD-fmk induced 15.1% apoptotic cell death. Our results demonstrated that Z-VAD-fmk as a pan-caspase did not completely block the gemcitabine-induced apoptosis. Western blotting analysis showed that gemcitabine increased caspase-3, active caspase-8, p21 and p53 protein expressions in A549. Co-treatment with Z-VAD-fmk completely blocked caspase-3 and active caspase-8 protein expressions, but did not change the level of p21 and p53 protein expressions. Our data indicate that gemcitabine induced apoptosis through caspase-dependent and -independent pathways in A549.

우도비 특징 벡터를 이용한 SVM 기반의 음성 검출기 (Voice Activity Detection Based on SVM Classifier Using Likelihood Ratio Feature Vector)

  • 조규행;강상기;장준혁
    • 한국음향학회지
    • /
    • 제26권8호
    • /
    • pp.397-402
    • /
    • 2007
  • 본 논문에서는 기존의 통계적 모델 기반의 음성 검출기의 성능 향상을 위해 이진 분류에 우수한 support vector machine(SVM)을 도입한다. 기존의 통계적 모델 기반 음성 검출기의 경우 음성의 존재와 부재에 대한 가설로부터 각각의 통계적 모델을 세워 입력 데이타에 의해 결정된 각 주파수 채널별 우도비(likelihood ratio)를 단순히 기하 평균을 취하여 문턱값과 비교, 음성 검출 여부를 판단한다. 제안된 음성 검출기는 기존의 기하 평균을 이용한 결정식을 대신하여 분류 오류 확률이 최소화되도록 각 주파수 채널별 우도비를 SVM의 특징 벡터로 적용한다. 제안된 SVM 기반의 통계적 모델 음성 검출기는 기존의 LRT를 이용한 음성 검출기 및 SVM 기반의 음성 검출기들과 비교하여 다양한 잡음 환경에서 우수한 성능을 나타낸다.

잡음 환경에서 심리음향모델 기반 음성 에너지 최대화를 이용한 음성 검출 방법 (Voice Activity Detection Method Using Psycho-Acoustic Model Based on Speech Energy Maximization in Noisy Environments)

  • 최갑근;김순협
    • 한국음향학회지
    • /
    • 제28권5호
    • /
    • pp.447-453
    • /
    • 2009
  • 이 논문은 음성 에너지를 최대화 하여 낮은 SNR환경에서 음성 존재 여부를 판단하고 정확한 끝점을 검출하는 방법에 대한 것이다. 전통적인 VAD (Voice Activity Detection) 알고리듬은 잡음의 추정치를 이용해 음성과 비음성 구간을 선택하여 낮은 SNR환경이나 비안정 잡음환경에서는 정확하지 못한 문턱값으로 인해 부정확한 끝점검출을 하였다. 또한 잡음의 시간적 변화를 반영하기 위해 비교적 큰 분석 구간을 두어 계산량이 증가함에 따라 실제 응용에 적합하지 않은 단점이 있다. 이 논문은 잡음환경에서 정확한 음성 구간의 검출을 위해 심리음향 모델에 기반 한 바크 스케일 필터 뱅크를 이용하여 주어진 프레임에서 음성 에너지를 최대화 시키고 잡음을 억제하는 SEM-VAD (Speech Energy Maximization-Voice Activity Detection) 방법을 제안하였다. 다양한 잡음환경, SNR 15 dB, 10 dB 5 dB 0 dB 상황에서 실험한 결과 SNR의 변화에 안정적인 문턱값을 얻었고, 음성 검출을 위한 실험에서 자동차 잡음 환경에 대한 PHR (Pause Hit Rate)은 모든 잡음 환경에서 100%의 정확도를 보였고, FAR (False Alarm Rate)는 SNR 15 dB와 10 dB에서는 0%, SNR 5 dB에서 5.6% SNR 0 dB에서 9.5%의 성능을 보였다.

G.723.1 음성 활동 검출 장치 성능 향상에 관한 연구 (On a Research of Improving the Performance of Voice Activity Detector in G.723.1)

  • 장경아;김정진;장영오;홍성훈;배명진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.53-56
    • /
    • 1999
  • ITU-T 국제 표준화 기구에서 인터넷 폰과 화상회의를 목적으로 개발된 G.723.1 음성 부호화기는 잡음 구간에서의 전송률을 낮추기 위한 방법으로 VAD(Voice Activity Detector)와 CNG(Comfort Noise Generator)를 사용하고 있다 이중 VAD는 최종적으로 현재 프레임의 에너지 레벨을 비교하여 음성의 활동 유무를 판정하고 있다. 하지만 G.723.1 VAD에서는 보다 안정적인 판정을 위해 음성 활동 구간 사이에 삽입되어 있는 묵음 구간에 대해서는 거의 대부분 음성이 활동하는 영역으로 판정을 하고 있다. 따라서 본 논문에서는 묵음 구간에 대해 보다 정확한 판정을 통하여 기존의 방법에 비해 전송율을 더욱 감소시킬 수 있는 방법을 제안한다. 실험에서는 묵음구간을 길게 조절한 문장을 사용하여 측정한 결과 평균 $46.8\%$ 정도의 전송율을 감소시킬 수 있었으며, 주관적인 음질평가의 경우 음질의 열하는 거의 발생하지 않았다.

  • PDF

실시간 변별적 가중치 학습에 기반한 음성 검출기 (Voice Activity Detection Based on Real-Time Discriminative Weight Training)

  • 강상익;조규행;장준혁
    • 대한전자공학회논문지SP
    • /
    • 제45권4호
    • /
    • pp.100-106
    • /
    • 2008
  • 본 논문에서는 다양한 잡음 환경에서 음성의 통계적 모델에 기반한 음성 검출기의 성능향상을 위해 PSFM (Power Spectral Flatness Measure)을 이용하여 실시간으로 변별적 가중치 학습 (Discriminative Weight Training) 기반의 최적화된 우도비 테스트 (Likelihood Ratio Test, LRT)를 제안한다. 먼저, 기존의 통계모델기반의 음성 검출기를 분석하고, 이를 기반으로 MCE (Minimum Classification Error)방법을 도입하여 도출한 각 주파수 채널별 가중치를 PSFM 값에 기반하여 실시간 매 프레임마다 다른 가중치를 적용한 우도비 기반의 음성 검출 결정법을 제시한다. 제안된 알고리즘은 다양한 잡음 환경에서 기존에 제시된 음성 검출기와 비교하였으며, 우수한 성능을 보인다.

소아연령의 개심술후 시행한, 심장 혹은 심장-폐 순환보조장치의 임상적 고찰(Royal Children's Hospital, Australia의 경험) (Postcaroiomy Heart or Heart/Lung Assist Experiences in Children)

  • 한재진
    • Journal of Chest Surgery
    • /
    • 제27권12호
    • /
    • pp.977-983
    • /
    • 1994
  • From April 1989 to December 1993, total 39 patients who were unable to be weaned off CPB or expected fatal immediate postoperiatively, were treated with ventricular assist device [VAD] or extracorporeal membrane oxygenator[ECMO] at the Royal Children`s Hospital, Melbourne. Ages ranged from 3 day to 19.4 year old and body weights from 2.0Kg to 70Kg. Twenty-seven[69.2%] of 39 patients were weaned to be decannulated successfully and sixteen[41.0%] survived to hospital discharge and late survival rate was twelve[30.8%] of 39 patients. The total follow-up period was 4 to 56 months [32.92$\pm$20.77months] and most of the late survivals showed good myocardial recovery state. From the viewpoint of the assist modality, 29 patients were treated with VAD and among them, 23 were weaned from assist successfully, but among the 8 ECMO patients, only 3 could be weaned, and both modalities were performed to the 2 patients with one weaned. The total duration of assist was from 8 to 428 hours and there was a significant difference between hospital discharged group and hospital death group, which were 83.13$\pm$31.29 hours vs 147.52$\pm$112.03 hours[P=0.032]. Conclusively, at the critical postcardiotomy situation of the paediatrtic patients including various congenital complex disease and procedures, we can choose this VAD or ECMO treatment strategy as the reasonable life saving way except transplantation.

  • PDF

우도비를 이용한 DBN 기반의 음성 검출기 (Voice Activity Detection based on DBN using the Likelihood Ratio)

  • 김상균;이상민
    • 재활복지공학회논문지
    • /
    • 제8권3호
    • /
    • pp.145-150
    • /
    • 2014
  • 본 논문에서는 입력된 신호에 의해 결정되는 각 주파수 밴드별 우도비(likelihood ratio, LR)를 deep belief networks(DBN)의 입력층으로 이용하는 새로운 음성 검출기(voice activity detection, VAD) 알고리즘을 제안한다. 기존의 통계적 모델 기반의 음성 검출기는 음성 구간을 판단하기 위해 우도비를 기하 평균을 이용한 결정식을 사용한다. 제안된 음성 검출기는 이 결정식을 대신해 DBN을 이용하여, 오검출 확률을 최소화 하도록 학습을 한다. 제안된 DBN 기반의 음성 검출 알고리즘은 통계적 모델 기반의 음성 검출기의 성능을 개선한 support vector machine(SVM) 기반의 음성 검출기와 정상 및 비정상 잡음 환경에서 다양한 조건을 부과하여 비교하였다. 제안된 알고리즘이 기존의 SVM 기반의 알고리즘보다 전체 오분류 확률 [0.7, 2.7]의 향상 폭을 보였다.

  • PDF

음성활동영역검색을 사용하는 유색잡음에 오염된 음성의 향상을 위한 일반화 부공간 접근 (A Generalized Subspace Approach for Enhancing Speech Corrupted by Colored Noise Using Voice Activity Detector(VAD))

  • 손경식;김현태
    • 한국정보통신학회논문지
    • /
    • 제17권8호
    • /
    • pp.1769-1776
    • /
    • 2013
  • 본 논문에서는 유색잡음에 의해 오염된 음성신호의 음성향상 알고리즘인 YL 접근법에 VAD(voice activity detector)를 구현하는 수정된 알고리즘을 제안한다. 제안한 알고리즘을 YL 접근법 및 LS 접근법과 컴퓨터 시뮬레이션으로 성능을 비교하였다. 사용한 유색잡음은 자동차 잡음과 다중화자 배블 잡음으로 AURORA 데이터베이스로 부터 각각 발췌하였고, 음성신호는 TIMIT 데이터 베이스로부터 발췌하였다. 제안한 알고리즘을 실험했을 때 제안하는 방법이 신호대잡음비 및 스펙트럼 왜곡 측면에서 기존의 두 알고리즘 보다 개선됨을 확인하였다.

잔향제거를 이용한 음성통신 시스템 성능 향상 (Performance Enhancement of Speech Communication System using Reverberation Rejection)

  • 김세영;강석엽;김기만
    • 한국정보통신학회논문지
    • /
    • 제13권10호
    • /
    • pp.2211-2217
    • /
    • 2009
  • 본 논문에서는 잔향이 존재하는 환경에서 단일 마이크로폰을 사용한 음성 개선 방법을 제시한다. 스펙트럼 차감법(Spectral Subtraction)은 스펙트럼 상에서 잔향성분 및 잡음을 제거 할 수 있는 효과적인 방법이다. 스펙트럼 차감법은 음성과 비음성 구간의 정확한 구분을 필요로 하며 성능을 향상시키기 위해 본 논문에서는 엔트로피(Entropy) 기반의 음성 구간 검출법을 적용하였다. 제시된 방법을 기존의 에너지 검출 기반의 음성 검출법을 적용한 스펙트럼 차감법과 비교하여 성능 평가를 수행하였다. SNR 및 잔향시간에 따른 잔향 제거비율을 평가지표로 사용하였으며, 시뮬레이션 결과 기존의 스펙트럼 차감법과 비교하여 제시된 방법이 우수한 성능을 보였다.