• 제목/요약/키워드: Gaussian Mixture model (GMM)

검색결과 236건 처리시간 0.023초

서브밴드 가중치를 이용한 잡음에 강인한 화자검증 (Noise Rabust Speaker Verification Using Sub-Band Weighting)

  • 김성탁;지미경;김회린
    • 한국음향학회지
    • /
    • 제28권3호
    • /
    • pp.279-284
    • /
    • 2009
  • 화자검증은 발성화자가 제시화자 (claimed speaker)인지 아닌지를 구별하는 것이다. 기존의 화자검증 시스템인 GMM-UBM 방식의 화자검증 시스템은 무잡음 환경에서는 높은 검증성능을 보이지만, 잡음환경에서는 성능이 급격히 떨어지는 단점이 있다. 이런 단점을 극복하기 위해 멀티밴드를 이용한 방법인 특징벡터 재결합방법이 제안되었지만, 특징벡터 재결합방법은 전체 서브밴드 특징벡터들을 사용하여 유사도를 계산하는 단점이 있다. 이런 단점을 극복하기 위해 기 발표된 이전 논문에서 각 서브밴드 유사도를 독립적으로 계산하는 변형된 특징벡터 재결합방법을 제안하였고, 본 논문에서는 변형된 특징벡터 재결합방법과 각 서브밴드들의 신뢰도를 나타내는 신호 대 잡음비를 이용한 가중치를 이용하여 잡음환경에서 기존의 특징벡터 재결합방법에 비해 에러를 28% 감소시켰다.

지역의 사회·경제적 인자와 용수공급체계를 고려한 가뭄 위험도 평가 (Drought risk assessment considering regional socio-economic factors and water supply system)

  • 김지은;김민지;최시중;이주헌;김태웅
    • 한국수자원학회논문집
    • /
    • 제55권8호
    • /
    • pp.589-601
    • /
    • 2022
  • 가뭄은 자연적 현상이지만, 지역의 물리적 및 사회적 요소와 결합되어 피해가 발생한다. 특히, 각종 용수 공급 및 수요과 연관되어 사회 경제적으로 큰 피해를 야기시킨다. 비슷한 심도의 기상학적 가뭄에도 지역의 특성과 용수공급체계에 따라 실제로 발생하는 가뭄 피해는 다르다. 본 연구에서는 지역의 사회·경제적 인자와 용수공급체계를 고려하여 가뭄 위험도를 평가하였다. 노출성은 용수공급 과부족량을 나타내는 결합가뭄관리지수(JDMI)를 등급화하여 평가하였다. 취약성은 가뭄에 영향을 받는 10개의 사회·경제적 인자에 엔트로피, PCA 및 GMM를 적용하여 가중평균하여 평가하였다. 대응능력은 지역의 용수능력을 나타내는 인자들을 베이지안 네트워크에 적용하여 평가하였다. 위험도는 노출성, 취약성 및 대응능력을 통합하여 결정하였다. 용수공급 실패 사상의 발생 가능성을 의미하는 가뭄 노출성을 평가한 결과, 괴산군이 0.81로 가장 높게 나타났다. 가뭄 취약성의 경우, 대전광역시가 0.61로 매우 취약한 것으로 나타났다. 지역의 용수공급체계가 고려된 가뭄 대응능력을 평가한 결과, 세종시가 가뭄 대응능력이 가장 낮은 것으로 나타났다. 마지막으로 위험도를 평가한 결과, 청주시가 가장 높게 나타났다. 이러한 결과를 통해 가뭄에 대한 위험 및 취약 원인을 파악하였으며, 향후 지역의 특성을 고려한 가뭄 피해 저감 정책 마련이 가능하다.

베이지안 네트워크를 이용한 단기 교통정보 예측모델 (A Short-Term Traffic Information Prediction Model Using Bayesian Network)

  • 유영중;조미경
    • 한국정보통신학회논문지
    • /
    • 제13권4호
    • /
    • pp.765-773
    • /
    • 2009
  • 최근의 텔레매틱스 교통정보제공서비스는 지능형 교통시스템의 구축을 통한 실시간 교통정보 수집이 가능해짐에 따라 다양해지고 있다. 본 논문에서는 고품질의 다양한 교통정보제공을 위해 필요한 미래시간에 대한 단기 교통정보 예측 모델을 제안하고 개발하였다. 단기 예측 모델은 현재로부터 가까운 미래의 교통 상황을 예측하기 위한 교통 모델로 본 연구에서 제안한 예측 모델은 각 도로에 대하여 5분 이후부터 1시간 이전까지의 미래시간에 대한 차량 평균 속도를 예측 결과로 준다. 본 연구에서 제안한 예측 모델은 베이지안 네트워크에 기반을 두고 있으며 각 도로의 미래시간 교통상황에 영향을 줄 수 있는 요인들을 분석하여 베이지안 네트워크의 원인노드로 설정하였다. 설계된 베이지안 네트워크에 대하여 실시간 교통정보데이터를 이용하여 가우시안 혼합 분포를 가정한 베이지안 네트워크의 결합 확률 밀도 함수를 EM(Expectation Maximization) 알고리즘으로 구하여 미래시간의 교통정보를 예측하였다. 예측 모델의 정확도 검증을 위해 실시간 교통데이터로 다양한 실험을 수행하였다. 실험결과 제안된 모델은 현재 시간으로부터 10분 이후, 30분 이후, 60분 이후 예측 오차로 각각 4.5, 4.8, 5.2의 RMSE(Root Mean Square Error) 값을 주었다.

켑스트럼 파라미터를 이용한 후두암 검진 (Laryngeal Cancer Screening using Cepstral Parameters)

  • 이원범;전경명;권순복;전계록;김수미;김형순;양병곤;조철우;왕수건
    • 대한후두음성언어의학회지
    • /
    • 제14권2호
    • /
    • pp.110-116
    • /
    • 2003
  • Background and Objectives : Laryngeal cancer discrimination using voice signals is a non-invasive method that can carry out the examination rapidly and simply without giving discomfort to the patients. n appropriate analysis parameters and classifiers are developed, this method can be used effectively in various applications including telemedicine. This study examines voice analysis parameters used for laryngeal disease discrimination to help discriminate laryngeal diseases by voice signal analysis. The study also estimates the laryngeal cancer discrimination activity of the Gaussian mixture model (GMM) classifier based on the statistical modelling of voice analysis parameters. Materials and Methods : The Multi-dimensional voice program (MDVP) parameters, which have been widely used for the analysis of laryngeal cancer voice, sometimes fail to analyze the voice of a laryngeal cancer patient whose cycle is seriously damaged. Accordingly, it is necessary to develop a new method that enables an analysis of high reliability for the voice signals that cannot be analyzed by the MDVP. To conduct the experiments of laryngeal cancer discrimination, the authors used three types of voices collected at the Department of Otorhinorlaryngology, Pusan National University Hospital. 50 normal males voice data, 50 voices of males with benign laryngeal diseases and 105 voices of males laryngeal cancer. In addition, the experiment also included 11 voices data of males with laryngeal cancer that cannot be analyzed by the MDVP, Only monosyllabic vowel /a/ was used as voice data. Since there were only 11 voices of laryngeal cancer patients that cannot be analyzed by the MDVP, those voices were used only for discrimination. This study examined the linear predictive cepstral coefficients (LPCC) and the met-frequency cepstral coefficients (MFCC) that are the two major cepstrum analysis methods in the area of acoustic recognition. Results : The results showed that this met frequency scaling process was effective in acoustic recognition but not useful for laryngeal cancer discrimination. Accordingly, the linear frequency cepstral coefficients (LFCC) that excluded the met frequency scaling from the MFCC was introduced. The LFCC showed more excellent discrimination activity rather than the MFCC in predictability of laryngeal cancer. Conclusion : In conclusion, the parameters applied in this study could discriminate accurately even the terminal laryngeal cancer whose periodicity is disturbed. Also it is thought that future studies on various classification algorithms and parameters representing pathophysiology of vocal cords will make it possible to discriminate benign laryngeal diseases as well, in addition to laryngeal cancer.

  • PDF

다시점 비디오의 시공간적 중복도를 높여 부호화 성능을 향상시키는 새로운 조명 불일치 보상 기법 (New Illumination compensation algorithm improving a multi-view video coding performance by advancing its temporal and inter-view correlation)

  • 이동석;유지상
    • 방송공학회논문지
    • /
    • 제15권6호
    • /
    • pp.768-782
    • /
    • 2010
  • 다시점 비디오의 조명 불일치 현상은 서로 다른 카메라의 위치와 카메라간의 불완전한 보정(calibration)으로 인하여 발생한다. 이러한 인접 시점간의 색상 불일치는 획득된 영상을 참조 영상으로 이용하여 부호화하는 다시점 비디오 부호화(multi-view video coding)의 성능을 저하시키는 요인이 된다. 이러한 조명 불일치를 보상하기 위한 방법 중에서 히스토그램 매칭(histogram matching)을 이용한 전처리 기법이 있다. 히스토그램 매칭을 통해 모든 시점 영상의 히스토그램은 정해진 참조 시점 영상의 히스토그램으로 매칭되어지고 다시점 비디오 부호화의 성능을 개선할 수 있다. 그러나 다시점 비디오 시퀀스는 카메라와 등장인물의 이동으로 인하여 시점 간 영상뿐만 아니라, 한 시점 내에 시간의 흐름에 따른 영상간의 히스토그램 분포가 서로 다를 수 있다. 참조 시점 시퀀스에 속한 모든 영상을 참조하는 기존의 히스토그램 매칭 기법은 시공간적으로 상관성이 높지 않은 영상의 조명을 효과적으로 보상하기에 적합하지 않다. 본 논문에서는 시점 영상 간의 색상 분포의 차이를 보이는 다시점 비디오를 보상하여 공간적 상관성을 높이기 위해 두 조건식이 반영된 영상분리 기법을 적용한 레이어별 히스토그램 매칭 기법과 시간의 흐름에 따라 색상 분포의 차이를 보이는 다시점 비디오를 비디오 부호화의 단위인 화면 그룹(group of pictures : GOP)별로 보상하여 시간적 상관성을 높이는 개별적인 히스토그램 매칭 기법을 제안한다. 실험을 통해 제안하는 조명 보상 기법이 기존의 조명 보상 기법보다 향상된 다시점 비디오 부호화 효율을 보이는 것을 확인하였다.

Mean Shift 알고리즘 기반의 히스토그램 근사화를 이용한 피부 영역 검출 (Skin Region Detection Using Histogram Approximation Based Mean Shift Algorithm)

  • 변기원;주재흠;남기곤
    • 대한전자공학회논문지SP
    • /
    • 제48권4호
    • /
    • pp.21-29
    • /
    • 2011
  • 사전에 정의된 피부 색상 정보를 이용한 기존 피부 검출 방법들은 배경과 피부 영역을 분할하는 단계에서 사용되는 임계값을 실험을 통하여 주관적 관점에서 결정하였다. 또한 기존 방법들은 배경 환경과 조명 환경에 따라 각각 다른 임계값을 설정하였다. 이러한 기존 방법들은 반복 실험을 통하여 추정된 임계값에 따라 성능이 좌우되는 단점이 제시되었다. 제시된 기존 방법들의 단점을 극복하기 위하여 본 논문은 mean shift 알고리즘 기반의 히스토그램 근사화를 이용한 피부 영역 검출 방법을 제안한다. 제안하는 방법은 CbCr 컬러공간에서의 표준 피부색상과 유사도를 비교하여 생성된 입력 영상의 피부맵(skin-map)의 히스토그램에서 mean shift 방법을 이용하여 각각 밝기 영역별로 수렴하는 극대점을 능동적으로 찾아서 배경 영역과 피부영역으로 분할한다. 히스토그램은 픽셀의 명도값에 따라 누적되는 불연속 함수의 형태를 가지므로 베이지 곡선(Bezier curve) 기법을 이용하여 연속 가우시안 함수로 근사화된다. 따라서 제안하는 방법은 기존 방법에서처럼 수동적으로 임계값을 설정하는 방법을 사용하지 않고 mean shift 기법을 이용하여 능동적으로 영역 분할점인 극대점을 찾아서 피부 영역을 검출한다. 제안된 방법은 실험을 통하여 강인하고 효율적으로 피부 영역을 검출하였다.