• Title/Summary/Keyword: gaussian mixture model

검색결과 417건 처리시간 0.025초

한반도 연안 1시간 조위자료의 통계적 특성 (Statistical Characteristics of Hourly Tidal Levels around the Korean Peninsula)

  • 고동휘;정신택;조홍연
    • 한국해안·해양공학회논문집
    • /
    • 제25권6호
    • /
    • pp.365-373
    • /
    • 2013
  • 한반도 연안 주요 조위관측소 조위자료를 선정하여 확률분포 측면에서 분석을 수행함으로써 조위 특성 및 통계적인 매개변수들을 분석하였다. 조석현상이 우세한 인천과 군산 자료의 조위확률 분포는 HWONT와 LWONT에서 2개의 대칭형 첨두형태를 보이고, 목포 자료의 경우 비대칭형 첨두형태를 보이고 있다. 반면에 제주, 여수, 부산 자료의 경우 편평한 첨두형태를 보이고, 포항, 속초 자료의 경우 1개의 첨두형태를 보이고 있다. 본 연구에서 노출과 침수 관계식으로 제안한 6개의 매개변수를 가진 가우스 혼합분포 모형은 정확하고, 관측결과와도 잘 일치하고 있다. ${\mu}_1$, ${\mu}_2$ 매개변수는 LWONT, HWONT와 ${\sigma}_1$, ${\sigma}_2$ 매개변수는 평균조차와 밀접하다. ${\mu}_1$, ${\mu}_2$는 제안한 확률분포의 최빈값에 해당한다.

유/무성음 구분 및 이종적 특징 파라미터 결합을 이용한 화자인식 성능 개선 (Speaker Recognition Performance Improvement by Voiced/Unvoiced Classification and Heterogeneous Feature Combination)

  • 강지훈;정상배
    • 한국정보통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.1294-1301
    • /
    • 2014
  • 본 논문에서는 화자 인식의 성능을 개선하기 위해서 유성음 및 무성음에 대한 별도의 확률분포 모델링을 사용하였다. 또한, 종래의 멜-주파수 캡스트럼 계수 이외에 유성음 구간에서 추가적으로 왜도, 첨도, 하모닉 대 잡음비 등을 추출하여 활용하였다. 화자 인식을 위한 스코어는 유성음 및 무성음 확률분포 모델에서 각각 구해지는데 전수 조사방식에 의해서 최적의 스코어 결합 가중치가 결정되었다. 제안된 방식의 화자인식기의 성능은 종래의 멜-주파수 캡스트럼 계수 및 화자당 하나의 혼합 가우시안 기반 확률분포 모델링을 사용한 방식과 비교되었으며 실험 결과 제안된 방식이 가우시안 혼합의 수가 낮아질수록 더 큰 성능 향상을 얻음을 알 수 있었다.

GSC 기반 빔포밍을 위한 주파수 밴드별 전력비 분포의 혼합 가우시안 모델을 이용한 목표 음성신호의 검출 (Target Speech Detection Using Gaussian Mixture Model of Frequency Bandwise Power Ratio for GSC-Based Beamforming)

  • 장형욱;김영일;정상배
    • 한국정보통신학회논문지
    • /
    • 제19권1호
    • /
    • pp.61-68
    • /
    • 2015
  • 다양한 종류의 잡음에 의해서 발생하는 음성인식 성능 저하를 보상하기 위해서는 잡음제거가 필수적이다. 마이크로폰 배열을 이용하는 많은 잡음제거 기술 중에서, GSC는 비정상성 잡음을 제거하기 위해서 널리 적용되어 왔다. GSC의 성능은 AMC에 의해서 직접적인 영향을 받는다. 즉, 정확한 목표 음성 신호의 검출은 순수 잡음구간에서의 충분한 잡음제거 및 목표 음성구간에서의 적은 왜곡을 보장하기 위해서 필수적이다. 따라서, 본 논문에서는 고정 빔포밍의 출력과 차단 매트릭스의 출력간의 전력비가 주파수 밴드 단위로 계산되는 향상된 AMC 설계법을 제안한다. 그 후, 밴드별 전력비는 가우시안 혼합에 의해서 각 클래스가 확률적으로 모델링 된다. 실험결과, 제안한 알고리즘이 ROC 및 출력 SNR 관점에서 더 높은 성능을 보였다.

비음수 텐서 분해 및 은닉 마코프 모델을 이용한 다음향 환경에서의 이중 채널 음향 사건 검출 (Dual-Channel Acoustic Event Detection in Multisource Environments Using Nonnegative Tensor Factorization and Hidden Markov Model)

  • 전광명;김홍국
    • 전자공학회논문지
    • /
    • 제54권1호
    • /
    • pp.121-128
    • /
    • 2017
  • 본 논문에서는 다음향(multisource) 환경에서의 음향 사건 검출 정확도를 높이기 위해 비음수 텐서 분해(nonnegative tensor factorization, NTF)와 은닉 마코프 모델(hidden Markov model, HMM)을 이용한 이중 채널 음향 사건 검출 방법을 제안한다. 제안된 방법은 먼저 이중 채널 입력 신호들에 NTF 기법을 적용하여 얻은 각 음향 사건 별 채널 이득을 활용하여 다수의 음향 사건들을 검출한다. 그러고 나서, 채널 이득에 의해 검출된 음향 사건의 발생 여부를 검증하기 위하여 채널 이득을 우도 가중치로 활용하는 HMM 기반의 우도비 검증을 수행한다. 제안된 방법의 검출 정확도를 평가하기 위하여 다양한 잡음과 사건간 중첩 밀도를 고려하는 다중 사건 발생 환경에 대한 F-measure를 측정하였고, 기존의 혼합 가우시안 모델 및 비음수 행렬 분해 기반의 음향 사건 검출 방법들과 비교하였다. 실험 결과, 제안된 방법이 기존 방법들에 비하여 모든 실험 조건에서 높은 정확도를 보였다.

확률적 방법을 이용한 음성 개성 변환 (Voice Personality Transformation Using a Probabilistic Method)

  • 이기승
    • 한국음향학회지
    • /
    • 제24권3호
    • /
    • pp.150-159
    • /
    • 2005
  • 본 논문에서는 임의의 음성을 특정 화자가 발성한 것처럼 들리도록 변환하는 음성 개성 변환 알고리즘에 대해 연구하였다. 제안된 기법은 화자의 음성을 LPC 켑스트럼, 피치, 발성 속도를 사용하여 표현하였으며 각각에 대한 변환 규칙을 생성하여 변환을 수행하였다. LPC 켑스트럼은 혼합 가우시안 모델을 이용한 확률적으로 모델링하고, 두 화자간의 대응관계를 조건 확률로 나타내었다. 확률적인 모델링에 필요한 각종 파라메터들을 얻기 위해 최대 가능도 기법이 사용되었으며, 변환 LPC 켑스트럼은 최소 자승 오차 방법에 근거하여 얻어지도록 하였다. 운율 변환을 위한 변수로 본 논문에서는 피치와 발성 속도를 사용하였으며, 두 음성간의 평균값 비율을 사용하여 운율 변환을 수행하였다. 제안된 기법은 기존 벡터 양자화 기반의 기법과 비교에서, 객관적인 척도로 사용한 평균 켑스트럼 거리 감소율, 가능도 증가율 면에서 우수한 성능을 나타내었다. 주관적인 테스트에서도 기존의 방법과 유사한 인식율을 얻었으며 특히 완만하게 변화하는 스펙트럼 궤적에 따른 고음질이 얻어짐을 확인할 수 있었다.

발성변화에 강인한 화자 인식에 관한 연구 (Safety Robust Speaker Recognition Against Utterance Variationsed)

  • 이기용
    • 인터넷정보학회논문지
    • /
    • 제5권2호
    • /
    • pp.69-73
    • /
    • 2004
  • 화자인식 시스템에서 화자 모델은 여러 세션동안 수집된 많은 양의 데이터 집합으로 등록한다. 많은 양의 데이터 집합은 많은 양의 메모리와 계산을 필요로 할 뿐 아니라, 게다가 사용자가 음성 등록을 위하여 여러 번에 걸쳐서 발성해야 하는 문제점이 있다. 최근, 이러한 문제를 보완하기 위해서 많은 적응 방법들이 제안되었다. 그러나, 여러 세션동안 모아진 데이터 집합은 불규칙한 발성 변화와 잡음 같은 이상치에 취약하고, 그것은 부정확한 화자 모델을 만든다. 본 논문에서는, GMM에 기초를 둔 화자 모델에 이상치들의 영향을 최소화하기 위한 적응 방법을 제안하였다. 강인한 적응은 M-추정의 점진적인 방법으로부터 얻어진다. 화자 모델은 초기에 적은 양의 데이터로 등록되어지고, 각각의 세션에서 얻어진 데이터로 반복적으로 적응시킨다. 실험 결과는 7개월에 걸쳐서 수집된 데이터 집합으로부터 제안된 방법이 이상치에 강인하다는 것을 보여준다.

  • PDF

화자 검증 시스템을 위한 PCA 기반 MFDWC 특징 파라미터 (A PCA-based MFDWC Feature Parameter for Speaker Verification System)

  • 함성준;정호열;정현열
    • 한국음향학회지
    • /
    • 제25권1호
    • /
    • pp.36-42
    • /
    • 2006
  • 본 논문에서는 화자검증 시스템의 성능향상을 위해서 주성분 분석 (PCA) 기반 Mel-Frequency Discrete Wavelet Coefficients (MFDWC) 추출방법을 제안한다. 제안된 방법에서는 멜척도 (Mel-scale)를 근사화한 각 레벨 (level)의 각 노드 (node) 에너지를 계산하기 위해 기존의 평균치 대신 주성분 분석을 이용한 첫 번째 eigenvector를 이용한다. 이 eigenvecto.의 제곱의 합은 1로서 일반적인 가중 함수 (weighting function)의 조건을 만족하고, 또한 각 화자마다 서로 다른 값을 갖게 되므로, 화자의 특징을 더 잘 나타내는 MFDWC를 추출할 수 있다. 화자검증은 Gaussian Mixture Model (GMM) 기반의 백그라운드 모델과 화자 모델과의 점수를 비교하는 이진 결정 (binary decision) 방법을 이용하여 Universal 백그라운드 모델 (UBM)과 각 화자 모델의 값을 프레임단위로 비교하여 대상 화자의 수락/거부 여부를 결정하는 방법을 채택하였다. 특징 파라미터에 따른 화자 검증 성능변화를 확인하기 위하여 제안된 화자종속 가중함수를 이용한 MFDWC를 특징 파라미터로 이용한 경우와 Mel-Frequency Cepstral Coefficients (MFCC), Linear Predictive Cepstral Coefficients (LPCC), 기존의 MFDWC를 특징 파라미터로 이용한 경우에 대하여 성능비교실험을 수행한 결과 각각 $0.80\%,\;5.14\%,\; 6.69\%$의 향상된 성능을 나타내어 제안한 방법의 유효성을 확인할 수 있었다.

클래스 종속 반연속 HMM을 이용한 립싱크 시스템 최적화 (Lip-Synch System Optimization Using Class Dependent SCHMM)

  • 이성희;박준호;고한석
    • 한국음향학회지
    • /
    • 제25권7호
    • /
    • pp.312-318
    • /
    • 2006
  • 기존의 립싱크 시스템은 음소 분할 후, 각각의 음소를 인식하는 2단계의 과정을 거쳤다. 하지만, 정확한 음소 분할의 부재와 음성이 끊긴 분할 된 음소로 이루어진 훈련 데이터들은 시스템의 전체 성능을 크게 떨어뜨렸다. 이런 문제를 해결하기 위해 Head-Body-Tail (HBT) 모델을 이용한 단모음 연속어 인식 기술을 제안한다. 주로 소규모 어휘를 다루는데 적합한 HBT 모델은 Head 와 Tail 부분에 문맥 종속 정보를 포함하여 앞 뒤 문맥에 따른 조음효과를 최대한 반영한다. 또한, 7개의 단모음을 입모양이 비슷한 세 개의 클래스로 분류하여, 클래스에 종속적인 코드북 3개를 가진 반연속HMM (Hidden Markov Model)을 적용하여 시스템을 최적화하고, 변이 부분이 큰 단어의 처음과 끝은 연속HMM의 8 믹스쳐 가우시안 구조를 사용하여 모델링하였다. 제안한 방법은 HBT구조의 연속HW과 대등한 성능을 보이지만, 파라미터 수는 33.92% 감소하였다. 파라미터 감소는 계산 양을 줄여주므로, 시스템이 실시간으로 동작 가능하게 한다.

주기성 배경을 위한 개선된 MOG 알고리즘 (Improved MOG Algorithm for Periodic Background)

  • 정용석;오정수
    • 한국정보통신학회논문지
    • /
    • 제17권10호
    • /
    • pp.2419-2424
    • /
    • 2013
  • 기존 MOG (Mixture of Gaussian) 알고리즘에서 배경 결정을 위한 작은 임계치는 주기적인 배경에서 배경 인식 지연을 발생시키고, 큰 임계치는 고정 배경에서 지나가는 객체를 배경으로 인식하게 한다. 본 논문은 적응적인 임계치를 이용한 개선된 MOG 알고리즘을 제안한다. 제안된 알고리즘은 MOG 알고리즘의 주도적인 배경 모델에서 가중치 변화를 단 장기적으로 평가하고, 배경을 정적 배경과 주기성 배경으로 분류하여 그들에 적절한 임계치를 설정한다. 실험결과들은 제안된 알고리즘이 정적 배경에서 기존 알고리즘과 등등한 성능을 유지하면서 주기성 배경에서 배경인식 지연의 최대 프레임수를 137에서 4로 줄여주는 것을 보여주고 있다.

연기의 색 정보, 형태학적 및 동적 특징 기반의 실시간 연기 검출 (Real-time Smoke Detection Based on Colour Information, Morphological and Dynamic Features of the Smoke)

  • 김현태;박장식
    • 한국전자통신학회논문지
    • /
    • 제10권1호
    • /
    • pp.21-26
    • /
    • 2015
  • 본 논문에서는 고화질 IP 카메라로부터 입력되는 영상으로부터 실시간으로 연기를 검출할 수 있는 시스템을 제안한다. 실시간 처리를 위해 FFmpeg 라이브러리를 이용하여 비디오 파일을 오픈하는 것처럼 IP 카메라로부터 전송되는 RTSP 스트림을 직접 오픈한다. 연기 검출을 위해 연기 후보 영역에 대해 연기의 색정보 및 형태학적 특성은 물론, 연기의 동적 특성까지 고려한다. 최종적으로 다양한 연기의 특성들을 효율적으로 결합하기 위해 부스팅 알고리즘으로 Adaboost 알고리즘을 사용한다. 실험 결과를 통하여 제안하는 방법이 연기를 검출하는 데 효과적인 것을 보인다.