• 제목/요약/키워드: System GMM Estimation

검색결과 19건 처리시간 0.024초

GMM 기반 실시간 문맥독립화자식별시스템의 성능향상을 위한 프레임선택 및 가중치를 이용한 Hybrid 방법 (Hybrid Method using Frame Selection and Weighting Model Rank to improve Performance of Real-time Text-Independent Speaker Recognition System based on GMM)

  • 김민정;석수영;김광수;정호열;정현열
    • 한국멀티미디어학회논문지
    • /
    • 제5권5호
    • /
    • pp.512-522
    • /
    • 2002
  • 본 논문에서는 GMM(Gaussian Mixture Model)에 기반한 실시간문맥독립화자식별시스템[1][2]의 성능향상을 위하여 프레임선택(Frame Selection)방법과 프레임가중치(Weighting Model Rank)방법을 혼합한 hybrid방법을 제안한다. 본 시스템에서는 GMM의 파라미터를 최적화하기 위하여 MLE(Maximum likelihood estimation)방법과 인식 알고리즘으로 ML(Maximum Likelihood)을 기본적으로 사용하였다. 제안한 hybrid 방법은 두 단계로 이루어진다. 첫째, 화자모델과 테스트 데이터를 이용하여 프레임단위로 유사도를 계산하고, 가장 큰 유사도 값과 두 번째로 큰 유사도 값의 차를 계산한 후, 차가 문턱치보다 큰 프레임만을 선택한다 두 번째로, 선택되어진 프레임에서 계산되어진 유사도 값 대신에 가중치 값을 사용하여 전체 스코어를 계산한다. 특징 파라미터로서는 켑스트럼과 회귀계수를 사용하였으며, 학습과 테스트를 위한 데이터베이스는 채집기간이 다른 여러 데이터베이스들로 구성되어 있으며, 실험을 위한 데이터는 임의의 단어를 선택하여 사용하였다. 화자인식실험은 기본 시스템에 프레임선택방법, 프레임가중치방법, 제안한 Hybrid방법을 각각 적용하여 실험하였다. 실험결과, 프레임선택방법에 비해 평균 4%, 프레임가중치방법에 비해 평균 1%의 인식률 향상을 보여, 본 논문에서 적용한 hybrid방법의 유효성을 확인하였다.

  • PDF

음성신호의 대역폭 확장을 위한 GMM 방법 및 HMM 방법의 성능평가 (Performance Comparison of GMM and HMM Approaches for Bandwidth Extension of Speech Signals)

  • 송근배;김석호
    • 한국음향학회지
    • /
    • 제27권3호
    • /
    • pp.119-128
    • /
    • 2008
  • 본 논문에서는 대역폭 확장 (Bandwidth Extension, BWE)을 위한 대표적인 통계적 방법인 가우스 혼합 모델 (Gaussian Mixture Model, GMM) 방법과 은닉마코프 모델 (Hidden Markov Model, HMM) 방법의 관계를 분석하고 성능을 비교한다. HMM 방법은 GMM 방법과 달리 기억능력을 가진 시스템으로서 인접한 음성 프레임간의 상관성을 모델링하고 이를 BWE 시스템에 활용한다는 장점을 가진다. 따라서 원래 신호의 프레임간 스펙트럼 변화특성을 보다 잘 추정할 수 있으리라 예상할 수 있다. 이 점을 확인하기 위해 정적 측도 외에 음성 스펙트럼의 일차 도 함수와 관련된 동적 측도를 적용하였다. 성능평가 결과, 정적 측도 관점에서는 두 방법은 대등한 성능을 보였지만 동적 측도 관점에서는 HMM 방법이 우수한 성능을 보였다. 또한 이러한 차이는 HMM 모델의 상태 수에 비례하여 증가함을 확인할 수 있었다. 이와 같은 실험결과는 HMM 방법이 적어도 'blind BWE' 문제에 있어서 적절한 해법임을 시사한다. 한편, 동적 측도의 관점에서는 비록 열세로 나타났지만 GMM 방법은 상대적으로 단순하다는 장점을 가지고 있으며 특히, 정적 측도에 있어서 HMM 방법과 대등하다는 사실은 응용분야에 따라서는 HMM 방법의 효과적인 대안이 될 수 있음을 시사한다.

The Effect of Trade Agreements on Korea's Bilateral Trade Volume: Mitigating the Impact of Economic Uncertainty in Trading Countries

  • Heedae Park;Jiyoung An
    • Journal of Korea Trade
    • /
    • 제27권5호
    • /
    • pp.153-166
    • /
    • 2023
  • Purpose - This research empirically analyzes the influence of economic policy uncertainty and free trade agreements (FTAs) on bilateral trade volumes between Korea and its trading partners. The study investigates whether fluctuations in the Economic Policy Uncertainty Index (EPUI) for both Korea and its trading partners significantly impact trade volumes and whether the implementation of FTAs mitigates these effects. Design/methodology - The study employs dynamic panel data analysis using the system generalized method of moments (system GMM) estimation method to achieve its research objectives. It utilizes country-month-level panel data, including the EPUI, trade volume between Korea and its trading partner countries, and other pertinent variables. The use of system GMM allows for the control of potential endogeneity issues and the incorporation of country-specific and time-specific effects. Findings - The analysis yields significant results regarding the impact of economic policy uncertainty on Korea's exports and imports, particularly before the implementation of FTAs. An increase in the EPUI of trading partners leads to a notable increase in Korea's exports to them. Conversely, an increase in Korea's EPUI negatively affects its imports from trading partners. However, post-FTA implementation, the influence of each country's EPUI on trade volume is neutralized, with no significant difference observed. Originality/value - This research contributes to the existing literature by providing empirical evidence on the interaction effects between economic policy uncertainty and FTAs on bilateral trade volumes. The study's uniqueness lies in its examination of how FTAs mitigate the impact of economic uncertainty on trade relations between countries. The findings underscore the importance of trade agreements as mechanisms to address economic risks and promote international trade relations. In a world where global market uncertainties persist, these insights can aid policymakers in Korea and other countries in enhancing their trade cooperation strategies and navigating challenges posed by evolving economic landscapes.

Factors Affecting Liquidity Risks of Joint Stock Commercial Banks in Vietnam

  • NGUYEN, Hoang Chung
    • The Journal of Asian Finance, Economics and Business
    • /
    • 제9권4호
    • /
    • pp.197-212
    • /
    • 2022
  • The study uses the audited financial statements of 26 Vietnamese commercial banks listed on the Ho Chi Minh City Stock Exchange (HOSE) and Hanoi Stock Exchange (HOSE) during the 2008-2018 period to estimate the system GMM model, which provides empirical evidence on the effect of the variables of customer deposit to total assets (DEPO) ratio, loan to assets (LTA) ratio, liquidity of commercial banks (LIQ), credit development (CRD) ratio, external funding (EFD) ratio, and credit loss provision (LLP) ratio on liquidity risk. The study confirms that commercial banks' internal factors play the most important role, and there is no empirical evidence on macro variables that affect liquidity risk. Finally, in accordance with the theoretical framework, the study uses an estimation method with the R language and the bootstrap methodology to give empirical proof of the nonlinear correlation and U-shaped graph between commercial bank size and liquidity risk. The importance of commercial bank size in absorbing and moderating the effects of liquidity shocks is demonstrated, however, excessive growth in commercial bank size would increase liquidity risk in commercial bank operations.

프레임레벨유사도정규화를 적용한 문맥독립화자식별시스템의 구현 (Realization a Text Independent Speaker Identification System with Frame Level Likelihood Normalization)

  • 김민정;석수영;김광수;정현열
    • 융합신호처리학회논문지
    • /
    • 제3권1호
    • /
    • pp.8-14
    • /
    • 2002
  • 본 논문에서는 Gaussian mixture model을 이용한 실시간 문맥독립화자식별시스템을 구현하여 인식실험을 수행하였으며, 인식시스템의 성능을 향상시키기 위하여 화자검증시스템에서 좋은 결과를 보인 유사도 정규화(Likelihood normalization)방법을 적용하여 인식실험을 하였다. 시스템은 크게 전처리단과 화자모델생성단, 화자식별단으로 나누어진다. 전처리단에서는 화자의 발성변화를 고려하여 CMN(Cepstral mean normalization)과 Silence removal 방법을 적용하였다. 화자모델생성단에서는, 화자발성의 음향학적 특징을 잘 표현할 수 있는 GMM(Gaussian mixture model)을 이용하여 화자모델을 작성하였으며, GMM의 파라미터를 최적화하기 위하여 MLE(Maximum likelihood estimation)방법을 사용하였다. 화자식별단에서는 학습된 데이터와 테스트용 데이터로부터 ML(Maximum likelihood)을 이용하여 유사도를 계산하였으며, 이 과정에서 유사도 정규화를 적용한 경우에는 프레임단위로 유사도를 계산하게 된다. 계산된 유사도는 스코어(S$_{C}$)로 표현하였고, 가장 높은 스코어를 가지는 화자가 인식화자로 결정된다. 화자인식에서 발성의 종류로는 문맥독립 문장을 사용하였다. 인식실험을 위해서는 ETRI445 DB와 KLE452 DB를 사용하였으며, 특징파라미터로서는 켑스트럼계수 및 회귀계수값만을 사용하였다. 인식실험에서는 등록화자의 수를 달리하여 일반적인 화자식별방법과 프레임단위유사도정규화방법으로 각각 인식실험을 하였다. 인식실험결과, 프레임단위유사도정규화방법이 인식화자수가 많아지는 경우에 일반적인 방법보다 향상된 인식률을 얻을 수 있었다.

  • PDF

프레임단위유사도정규화를 이용한 문맥독립화자식별시스템의 성능 향상 (Improving A Text Independent Speaker Identification System By Frame Level Likelihood Normalization)

  • 김민정;석수영;정현열;정호열
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.487-490
    • /
    • 2001
  • 본 논문에서는 기존의 Caussian Mixture Model을 이용한 실시간문맥독립화자인식시스템의 성능을 향상시키기 위하여 화자검증시스템에서 좋은 결과를 나타내는 유사도정규화 ( Likelihood Normalization )방법을 화자식별시스템에 적용하여 시스템을 구현하였으며, 인식실험한 결과에 대해 보고한다. 시스템은 화자모델생성단과 화자식별단으로 구성하였으며, 화자모델생성단에서는, 화자발성의 음향학적 특징을 잘 표현할 수 있는 GMM(Gaussian Mixture Model)을 이용하여 화자모델을 작성하였으며. GMM의 파라미터를 최적화하기 위하여 MLE(Maximum Likelihood Estimation)방법을 사용하였다. 화자식별단에서는 학습된 데이터와 테스트용 데이터로부터 ML(Maximum Likelihood)을 이용하여 프레임단위로 유사도를 계산하였다. 계산된 유사도는 유사도 정규화 과정을 거쳐 스코어( SC)로 표현하였으며, 가장 높은 스코어를 가지는 화자를 인식화자로 결정한다. 화자인식에서 발성의 종류로는 문맥독립 문장을 사용하였다. 인식실험을 위해서는 ETRI445 DB와 KLE452 DB를 사용하였으며. 특징파라미터로서는 켑스트럼계수 및 회귀계수값만을 사용하였다. 인식실험에서는 등록화자의 수를 달리하여 일반적인 화자식별방법과 프레임단위유사도정규화방법으로 각각 인식실험을 하였다. 인식실험결과, 프레임단위유사도정규화방법이 인식화자수가 많아지는 경우에 일반적인 방법보다 향상된 인식률을 얻을수 있었다.

  • PDF

GMM과 클러스터링 기법에 의한 뉴로-퍼지 시스템 모델링 (A Neuro-Fuzzy System Modeling using Gaussian Mixture Model and Clustering Method)

  • 김승석;곽근창;유정웅;전명근
    • 한국지능시스템학회논문지
    • /
    • 제12권6호
    • /
    • pp.571-576
    • /
    • 2002
  • 본 논문에서는 여러 분야에서 널리 응용되고 있는 적응 뉴로-퍼지 시스템(ANFIS)의 성능 개선에 있어서 전제부 파라미터를 효과적으로 초기화 시키는 방법을 제안한다. 기존의 그리드 분할을 이용한 입력공간 선택 방법은 ANFIS의 규칙 생성에 있어서 얻어진 규칙의 수가 지수적으로 증가하는 단점이 있다. 이에, 본 연구에서는 GMM에서의 최대우도추정을 이용한 EM 알고리즘을 통하여 초기치에 의하여 성능의 영향이 좌우되는 ANFIS의 입력으로 주어 제안된 클러스터링 기법에 의하여 모델의 성능을 개선하고자 한다. 제안된 방법의 클러스터링 방법은 통계적 방법에 근거하여 좋은 성능의 파라미터를 획득할 수 있어 주어진 모델에 대한 ANFIS의 성능을 개선할 수 있다. 이들 방법의 유용함을 전형적인 다변수 비선형 데이터인 자동차 연료 예측 문제와 정수장 응집제 주입 문제에 적용하여 제안된 방법이 이전의 연구보다 성능이 개선되는 것을 통하여 보였다.

영상기반 보행자 키 추정 방법 (Height Estimation of pedestrian based on image)

  • 김성민;송종관;윤병우;박장식
    • 한국전자통신학회논문지
    • /
    • 제9권9호
    • /
    • pp.1035-1042
    • /
    • 2014
  • 객체인식은 지능적이고 다양화된 범죄 예방을 위한 영상 감시 시스템에서 중요한 기술 중 하나이다. 사람의 신체 정보인 키는 그 대상이 가지고 있는 신체적인 특징 중 하나로 신원을 확인하는데 중요한 정보가 될 수 있다. 본 논문에서는 CCTV 영상으로부터 보행자를 검출하고 검출된 객체인 보행자의 키를 추정하는 방법을 제안하였다. 이를 위하여 GMM(Gaussian Mixture Model) 방식을 이용하여 움직이는 객체를 분리하고, 분리된 후보 객체들의 가로세로 비율, 크기 등의 조건을 이용하여 보행자를 검출하였다. 제안한 방법을 CCTV 영상에 적용하고 동일 보행자에 대하여 근거리, 중거리, 원거리의 위치에서 키를 추정하고 정확성을 평가하였다. 실험결과 근거리에서 97%, 중거리에서 98%, 원거리에서 97% 이상의 정확도로 키 추정이 가능함을 보였다. 또한 영상내의 보행자는 위치에 따라 크기가 다르지만 실험을 통하여 제안하는 방법이 보행자의 위치에 관계없이 키를 추정하는데 효과적임을 확인하였다.

발성변화에 강인한 화자 인식에 관한 연구 (Safety Robust Speaker Recognition Against Utterance Variationsed)

  • 이기용
    • 인터넷정보학회논문지
    • /
    • 제5권2호
    • /
    • pp.69-73
    • /
    • 2004
  • 화자인식 시스템에서 화자 모델은 여러 세션동안 수집된 많은 양의 데이터 집합으로 등록한다. 많은 양의 데이터 집합은 많은 양의 메모리와 계산을 필요로 할 뿐 아니라, 게다가 사용자가 음성 등록을 위하여 여러 번에 걸쳐서 발성해야 하는 문제점이 있다. 최근, 이러한 문제를 보완하기 위해서 많은 적응 방법들이 제안되었다. 그러나, 여러 세션동안 모아진 데이터 집합은 불규칙한 발성 변화와 잡음 같은 이상치에 취약하고, 그것은 부정확한 화자 모델을 만든다. 본 논문에서는, GMM에 기초를 둔 화자 모델에 이상치들의 영향을 최소화하기 위한 적응 방법을 제안하였다. 강인한 적응은 M-추정의 점진적인 방법으로부터 얻어진다. 화자 모델은 초기에 적은 양의 데이터로 등록되어지고, 각각의 세션에서 얻어진 데이터로 반복적으로 적응시킨다. 실험 결과는 7개월에 걸쳐서 수집된 데이터 집합으로부터 제안된 방법이 이상치에 강인하다는 것을 보여준다.

  • PDF

Noise Elimination Using Improved MFCC and Gaussian Noise Deviation Estimation

  • Sang-Yeob, Oh
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권1호
    • /
    • pp.87-92
    • /
    • 2023
  • 음성 인식 시스템의 지속적인 발전으로 음성에 대한 인식율은 급속도로 발전되었지만 사용 환경에서의 잡음과 여러 음성이 혼합되어 발생하는 잡음으로 정확한 음성을 인식할 수 없는 단점을 가진다. 환경 잡음이 있는 음성을 처리할 때 음성 인식률을 높이기 위해서는 잡음을 제거해야 하며, 기존의 HMM, CHMM, GMM, 그리고 AI 모델이 적용된 DNN에서도 예상치 못한 잡음이 발생하거나 기본적으로 디지털 신호에 양자화 잡음이 추가되면 소스 신호가 변경되거나 손상되어 인식률이 저하된다. 이를 해결하기 위해 각 음성 프레임에 대한 음성 신호의 특징을 효율적으로 추출하기 위해 MFCC를 개선하여 처리하였으며, 음성 신호에 대한 잡음을 제거하기 위해 가우시안 모델을 적용한 잡음 편차 추정을 이용한 잡음 제거 방법을 개선하여 적용하였다. 제안된 모델에 대한 성능 평가는 음성에 대한 정확성 평가를 위해 교차 상관 계수를 사용하여 처리하였으며, 제안하는 방법의 인식률을 평가한 결과 이들에 대한 상관 계수에 대한 평균값 차이는 0.53 dB 개선된 것을 확인하였다.