• 제목/요약/키워드: Gaussian mixture models

검색결과 98건 처리시간 0.02초

심층신경망 기반의 음성인식을 위한 절충된 특징 정규화 방식 (Compromised feature normalization method for deep neural network based speech recognition)

  • 김민식;김형순
    • 말소리와 음성과학
    • /
    • 제12권3호
    • /
    • pp.65-71
    • /
    • 2020
  • 특징 정규화는 음성 특징 파라미터들의 통계적인 특성의 정규화를 통해 훈련 및 테스트 조건 사이의 환경 불일치의 영향을 감소시키는 방법으로서 기존의 Gaussian mixture model-hidden Markov model(GMM-HMM) 기반의 음성인식 시스템에서 우수한 성능개선을 입증한 바 있다. 하지만 심층신경망(deep neural network, DNN) 기반의 음성인식 시스템에서는 환경 불일치의 영향을 최소화 하는 것이 반드시 최고의 성능 개선으로 연결되지는 않는다. 본 논문에서는 이러한 현상의 원인을 과도한 특징 정규화로 인한 정보손실 때문이라 보고, 음향모델을 훈련 하는데 유용한 정보는 보존하면서 환경 불일치의 영향은 적절히 감소시켜 음성인식 성능을 최대화 하는 특징 정규화 방식이 있는 지 검토해보고자 한다. 이를 위해 평균 정규화(mean normalization, MN)와 평균 및 분산 정규화(mean and variance normalization, MVN)의 절충 방식인 평균 및 지수적 분산 정규화(mean and exponentiated variance normalization, MEVN)를 도입하여, 잡음 및 잔향 환경에서 분산에 대한 정규화의 정도에 따른 DNN 기반의 음성인식 시스템의 성능을 비교한다. 실험 결과, 성능 개선의 폭이 크지는 않으나 분산 정규화의 정도에 따라 MEVN이 MN과 MVN보다 성능이 우수함을 보여준다.

동적 베이지안 네트워크를 이용한 동영상 기반의 화재연기감지 (Fire-Smoke Detection Based on Video using Dynamic Bayesian Networks)

  • 이인규;고병철;남재열
    • 한국통신학회논문지
    • /
    • 제34권4C호
    • /
    • pp.388-396
    • /
    • 2009
  • 본 연구는 CCD카메라로부터 입력된 영상을 분석하여 특징값을 추출하고, 패턴인식기술을 이용하여 화재연기영상을 감지하는 방법을 제안한다. 우선 CCD카메라로부터 획득된 영상들간의 차영상을 이용하여 움직임 영역만을 검출하고, 이후 연기색상모델을 적용하여 후보영역을 생성한다. 연기영역은 유사색상의 군집화를 이루고, 주변에 비해 단순한 질감을 가지며, 시간에 따른 모션정보의 상승 방향성을 가지는 특징을 가진다. 본 논문에서는 연기영역의 이러한 특성을 이용하여 학습영상으로부터 연기의 밝기, 웨이블릿 고주파 성분, 모션 벡터 등의 특징 값을 추출하고 이들 특징 값들에 대해 가우시안 확률 모델을 생성한다. 이렇게 추출된 확률모델은 연기영역의 시간적 연속성을 고려하기 위해 본 논문에서 새롭게 구성한 동적 베이지안 네트워크의 관찰노드에 적용된다. 본 논문에서 제안하는 방법은 산불을 비롯한 다양한 연기를 감지하였으며, 기존의 알고리즘에 비해 우수한 성능을 보여주었다.

CTC를 적용한 CRNN 기반 한국어 음소인식 모델 연구 (CRNN-Based Korean Phoneme Recognition Model with CTC Algorithm)

  • 홍윤석;기경서;권가진
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권3호
    • /
    • pp.115-122
    • /
    • 2019
  • 지금까지의 한국어 음소 인식에는 은닉 마르코프-가우시안 믹스쳐 모델(HMM-GMM)이나 인공신경망-HMM을 결합한 하이브리드 시스템이 주로 사용되어 왔다. 하지만 이 방법은 성능 개선 여지가 적으며, 전문가에 의해 제작된 강제정렬(force-alignment) 코퍼스 없이는 학습이 불가능하다는 단점이 있다. 이 모델의 문제로 인해 타 언어를 대상으로 한 음소 인식 연구에서는 이 단점을 보완하기 위해 순환 신경망(RNN) 계열 구조와 Connectionist Temporal Classification(CTC) 알고리즘을 결합한 신경망 기반 음소 인식 모델이 연구된 바 있다. 그러나 RNN 계열 모델을 학습시키기 위해 많은 음성 말뭉치가 필요하고 구조가 복잡해질 경우 학습이 까다로워, 정제된 말뭉치가 부족하고 기반 연구가 비교적 부족한 한국어의 경우 사용에 제약이 있었다. 이에 본 연구는 강제정렬이 불필요한 CTC 알고리즘을 도입하되, RNN에 비해 더 학습 속도가 빠르고 더 적은 말뭉치로도 학습이 가능한 합성곱 신경망(CNN)을 기반으로 한국어 음소 인식 모델을 구축하여 보고자 시도하였다. 총 2가지의 비교 실험을 통해 본 연구에서는 한국어에 존재하는 49가지의 음소를 판별하는 음소 인식기 모델을 제작하였으며, 실험 결과 최종적으로 선정된 음소 인식 모델은 CNN과 3층의 Bidirectional LSTM을 결합한 구조로, 이 모델의 최종 PER(Phoneme Error Rate)은 3.26으로 나타났다. 이는 한국어 음소 인식 분야에서 보고된 기존 선행 연구들의 PER인 10~12와 비교하면 상당한 성능 향상이라고 할 수 있다.

알츠하이머 병의 검출을 위한 ML-SVM, PCA, VBM, GMM을 결합한 융합적 성능 비교 (Convergence performance comparison using combination of ML-SVM, PCA, VBM and GMM for detection of AD)

  • 사우라르 알람;권구락
    • 한국융합학회논문지
    • /
    • 제7권4호
    • /
    • pp.1-7
    • /
    • 2016
  • 구조적 MRI 영상은 여러 단 변량과 다변량 방법을 위해 그레이 메터 (GM), 화이트 메터 (WM), 뇌척수액 (CSF) 세션화 과정을 하고 난후 형태계측학적 특징을 추출하기 위해 사용한다. 새로운 접근 방법은 매우 가벼운 알츠하이머 병에서 가벼운 알츠하이머병의 진단을 위해 적용된다. 간이정신상태검사에 따른 형태계측학적 특징과 가우시안 복합 모델 파라미터를 결합하여 정상인으로부터 알츠하이머 병 환자로 분류하는 방법을 제안한다. 결합한 특징은 주성분 분석 기법을 이용한 고차원의 저주를 제거한 후 다중 커널 SVM 분류기에 공급한다. 제안한 진단 방법의 실험적 결과는 90%이상의 특성도와 고민감도에 따라 다중 커널 SVM을 가진 층화 정확도가 96%까지 최대 산출한다.

서브밴드 가중치를 이용한 잡음에 강인한 화자검증 (Noise Rabust Speaker Verification Using Sub-Band Weighting)

  • 김성탁;지미경;김회린
    • 한국음향학회지
    • /
    • 제28권3호
    • /
    • pp.279-284
    • /
    • 2009
  • 화자검증은 발성화자가 제시화자 (claimed speaker)인지 아닌지를 구별하는 것이다. 기존의 화자검증 시스템인 GMM-UBM 방식의 화자검증 시스템은 무잡음 환경에서는 높은 검증성능을 보이지만, 잡음환경에서는 성능이 급격히 떨어지는 단점이 있다. 이런 단점을 극복하기 위해 멀티밴드를 이용한 방법인 특징벡터 재결합방법이 제안되었지만, 특징벡터 재결합방법은 전체 서브밴드 특징벡터들을 사용하여 유사도를 계산하는 단점이 있다. 이런 단점을 극복하기 위해 기 발표된 이전 논문에서 각 서브밴드 유사도를 독립적으로 계산하는 변형된 특징벡터 재결합방법을 제안하였고, 본 논문에서는 변형된 특징벡터 재결합방법과 각 서브밴드들의 신뢰도를 나타내는 신호 대 잡음비를 이용한 가중치를 이용하여 잡음환경에서 기존의 특징벡터 재결합방법에 비해 에러를 28% 감소시켰다.

모바일 레이저 스캐닝 데이터로부터 철도 선로 추출에 관한 연구 (Railway Track Extraction from Mobile Laser Scanning Data)

  • 좌윤석;손건호;원종운;이원춘;송낙현
    • 한국측량학회지
    • /
    • 제33권2호
    • /
    • pp.111-122
    • /
    • 2015
  • 본 연구에서는 모바일 레이저 스캐닝 데이터로부터 철도 선로탐지 및 선로모델 추출을 위한 방법을 제시하였다. 제안된 방법은 크게 세 단계로 구성된다. 첫째, 레이저 포인트로부터 잠재적인 철도 선로지역을 탐지하고, 초기 철도 선로궤적 방향을 추정한다. 둘째, 철도 선로에 관한 선 지식을 이용하여 첫번째 스트립에서 초기 선로위치를 결정한다. 여기서, 스트립은 국부 탐색공간을 나타내며 철도 선로궤적에 수직인 방향으로 정의된다. 마지막으로, 초기 선로위치에서 GMM-EM기반 분류방법을 통해 선로 포인트들을 탐지한 후 초기 선로 모델을 생성하고 스트립을 데이터 처리 기본단위로 하여 tracking by detection관점에서 연속적으로 선로모델을 생성하였다. 제안된 방법의 주요 특징은 다음과 같다. 첫째, 이전 스트립에서 생성된 선로 모델을 가이드 라인으로 다음 스트립에 전파되어 국부 탐색영역을 예측하여 선로 포인트를 탐지하는 하는데 있어서 처리 복잡성을 줄일 수 있었다. 둘째, 선로 포인트 탐지와 선로 모델링을 동시에 진행 함으로써 데이터 처리 시간을 최소화 할 수 있었다. 개발된 알고리즘은 C++ 프로그램 언어로 구현되었고 도시지역에서 MMS 측량을 통해 취득된 LiDAR 데이터(경부선 일부 구간)를 이용하여 성능 테스트를 진행하였다.

노인 운전자의 공격적인 운전 상태 검출 기법 (A Method of Detecting the Aggressive Driving of Elderly Driver)

  • 고동우;강행봉
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권11호
    • /
    • pp.537-542
    • /
    • 2017
  • 공격적인 성향의 운전은 자동차 사고의 주요한 원인이 된다. 기존 연구에서는 공격적 성향의 운전을 검출하기 위해, 주로 청년을 대상으로 연구가 이뤄졌으며 기계학습의 순수한 Clustering 또는 Classification 기법을 통해 이뤄졌다. 그러나 노인들은 취약한 신체적 조건에 의해 젊은 운전자와는 다른 운전 강도를 가지고 있어 기존의 방식으로는 검출이 불가능 하며, 데이터를 보정하는 등의 새로운 방법이 필요하다. 그리하여, 본 연구에서는 기존의 클러스터링 기법(K-means, Expectation - maximization algorithm)에, 새롭게 제안하는 ECA(Enhanced Clustering method for Acceleration data)기법을 추가하여, 주행 차량에 위치한 스마트폰으로부터 수집된 가속도 데이터를 분석하고 공격적인 운전 형태를 검출해 낸다. ECA는 모든 피험자의 데이터에서 K-means와 EM을 통해 검출된 군집군의 데이터 중 높은 강도의 데이터를 선별하여, 특징을 스케일링한 값을 통해 모델링한다. 본 방식을 통해 기존의 연구의 순수한 클러스터링 방식과는 달리, 모든 청장년 및 노인 실험 참가자 개인들의 공격적인 운전 데이터가 검출되었으며, 클러스터링 기법간의 비교를 통해 K-means 기법이 보다 높은 검출 효율을 갖고 있음을 확인했다. 또한, K-means 방식을 검출한 공격적인 운전 데이터에서는 젊은 운전자가 노인운전자에 비해 1.29배의 높은 운전 강도를 가지고 있음을 발견했다. 이와 같이 본 연구에서 제안된 방식은 낮은 운전 강도를 갖고 있는 노인의 데이터에서 공격적인 운전을 검출 가능하게 되었으며, 특히. 제안된 방법은 노인 운전자를 위한 맞춤형 안전운전 시스템을 구축이 가능하며, 추후 다양한 연구을 통해 이상 운전 상태를 검출하고 조기 경보하는데 활용이 가능할 것이다.

한국 하천의 지역별 유사특성의 군집화와 H-ADCP 기반 부유사 농도 관측 기법에의 활용 방안 (Clustering of sediment characteristics in South Korean rivers and its expanded application strategy to H-ADCP based suspended sediment concentration monitoring technique)

  • 노효섭;손근수;김동수;박용성
    • 한국수자원학회논문집
    • /
    • 제55권1호
    • /
    • pp.43-57
    • /
    • 2022
  • 유사량 계측 기술의 발달로 초음파 도플러 유속계(ADCP)의 산란도가 부유사 농도와 관계가 있다는 특성을 이용해 부유사의 농도를 짧은 시간 간격으로 계측하여 부유사 관측의 비용과 위험 문제를 극복하고자 하는 노력이 지속되고 있다. 국내에는 자동 유량 관측소에 횡방향 ADCP (H-ADCP)가 설치되어 있어 실시간으로 부유사 농도를 계측하는 기술의 적용이 가능하지만 자동 유량 관측소와 부유사 관측소의 위치가 항상 일치하지는 않아 모든 관측소에서의 모형 개발은 불가한 실정이다. 본 연구에서는 이러한 문제를 극복하기 위해 H-ADCP가 설치된 유사량 관측소 9개소에 대해 부유사 농도를 계측하는 H-ADCP-SSC 관계식을 개발하고 그 결과의 적용성에 대해 고찰하였다. 그리고 부유사 관측소별로 나타나는 특징에 대해 알아보기 위해 한국 하천의 부유사 관측소 44개소의 유역면적, 부유사와 하상토의 입도분포, 유량-유사량 관계식 등의 유사특성 자료를 이용해 비지도 기계학습 기법인 가우시안 혼합 모형(GMM)으로 군집분석을 수행하였다. 군집화 결과, 유사량 관측소를 공간적으로 구분해낼 수 있었으며, 특히 하천의 본류와 지류의 유사 특징을 구분해낼 수 있었다. 결과적으로, H-ADCP-SSC 관계식과 부유사 관측소의 군집분석 결과를 종합해 H-ADCP-SSC 관계식이 개발되지 않은 자동 유량 관측소에서 관계식을 적용하는 부유사 농도를 실시간으로 계측할 수 있도록 하는 프로토콜을 제안하였다.