• 제목/요약/키워드: GMM-EM 기반 분류

검색결과 4건 처리시간 0.016초

MFCC를 이용한 GMM 기반의 음성/혼합 신호 분류 (Speech/Mixed Content Signal Classification Based on GMM Using MFCC)

  • 김지은;이인성
    • 전자공학회논문지
    • /
    • 제50권2호
    • /
    • pp.185-192
    • /
    • 2013
  • 본 논문에서는 MFCC를 이용한 GMM 기반의 음성과 혼합 신호 분류 알고리즘을 MPEG의 표준 코덱인 USAC에 적용하였다. 효과적인 패턴 인식을 위해 GMM을 이용하였고, EM알고리즘을 사용하여 최적의 GMM 파라미터를 추출하였다. 제안하는 분류 알고리즘은 두 가지 중요한 부분으로 나뉜다. 첫째는 GMM을 통해 최적의 파라미터를 추출하는 것 이고, 두 번째는 MFCC 값을 이용한 패턴인식을 통해 음성/혼합 신호를 분류하였다. 제안된 알고리즘의 성능을 평가한 결과 MFCC를 이용한 GMM 기반의 제안된 방법이 기존 USAC의 방법보다 우수한 음성/혼합 신호 분류 성능을 보였다.

3GPP2 SMV의 실시간 음성/음악 분류 성능 향상을 위한 Gaussian Mixture Model의 적용 (Analysis and Implementation of Speech/Music Classification for 3GPP2 SMV Based on GMM)

  • 송지현;이계환;장준혁
    • 한국음향학회지
    • /
    • 제26권8호
    • /
    • pp.390-396
    • /
    • 2007
  • 본 논문에서는 음성 인식과 음악 인식에서 뛰어난 성능을 보이는 Expectation-Maximization(EM) 알고리즘 기반의 패턴인식기법인 가우시안 혼합모델(Gaussian Mixture Model, GMM)을 이용하여 기존의 3GPP2 Selectable Mode Vocoder(SMV)의 실시간 음성/음악 분류 성능을 향상 시키는 방법을 제안한다 SMV의 음성/음악 실시간 분류 알고리즘에서 사용된 특징벡터와 분류방법을 분석하고, 이를 기반으로 분류성능향상을 위해 패턴인식 알고리즘인 GMM을 도입한다. 구체적으로, SMV의 음성/음악 분류알고리즘에서 사용되어진 특징벡터만을 선택적으로 사용하여 효과적인 GMM을 구성한 실시간 분류기법이 제시되었다. SMV의 음성/음악 분류에 적용한 GMM의 성능 평가를 위해 SMV 원래의 분류알고리즘과 비교하였으며, 다양한 음악장르에 대해 시스템의 성능을 평가한 결과 GMM을 이용하였을 때 기존의 SMV의 방법보다 우수한 음성/음악 분류 성능을 보였다.

오디오 부호화기를 위한 스펙트럼 변화 및 MFCC 기반 음성/음악 신호 분류 (Speech/Music Signal Classification Based on Spectrum Flux and MFCC For Audio Coder)

  • 이상길;이인성
    • 한국정보전자통신기술학회논문지
    • /
    • 제16권5호
    • /
    • pp.239-246
    • /
    • 2023
  • 본 논문에서는 오디오 부호화기를 위한 스펙트럼 변화 파라미터와 Mel Frequency Cepstral Coefficients(MFCC) 파라미터를 이용하여 음성과 음악 신호를 분류하는 개루프 방식의 알고리즘을 제안한다. 반응성을 높이기 위해 단구간 특징 파라미터로 MFCC를 사용하고 정확도를 높이기 위해 장구간 특징 파라미터로 스펙트럼 변화를 사용하였다. 전체적인 음성/음악 신호 분류 결정은 단구간 분류와 장구간 분류를 결합하여 이루어진다. 패턴인식을 위해 Gaussian Mixed Model(GMM)을 사용하였고, Expectation Maximization(EM) 알고리즘을 사용하여 최적의 GMM 파라미터를 추출하였다. 제안된 장단구간 결합 음성/음악 신호 분류 방법은 다양한 오디오 음원에서 평균적으로 1.5% 분류 오류율을 보였고 단구간 단독 분류 방법 보다 0.9%, 장구간 단독 분류 방법보다 0.6%의 분류 오류율의 성능 개선을 이룰 수 있었다. 제안된 장단구간 결합 음성/음악 신호 분류 방법은 USAC 오디오 분류 방법보다 타악기 음악 신호에서 9.1% 분류 오류율, 음성신호에서 5.8% 분류 오류율의 성능 개선을 이룰 수 있었다.

모바일 레이저 스캐닝 데이터로부터 철도 선로 추출에 관한 연구 (Railway Track Extraction from Mobile Laser Scanning Data)

  • 좌윤석;손건호;원종운;이원춘;송낙현
    • 한국측량학회지
    • /
    • 제33권2호
    • /
    • pp.111-122
    • /
    • 2015
  • 본 연구에서는 모바일 레이저 스캐닝 데이터로부터 철도 선로탐지 및 선로모델 추출을 위한 방법을 제시하였다. 제안된 방법은 크게 세 단계로 구성된다. 첫째, 레이저 포인트로부터 잠재적인 철도 선로지역을 탐지하고, 초기 철도 선로궤적 방향을 추정한다. 둘째, 철도 선로에 관한 선 지식을 이용하여 첫번째 스트립에서 초기 선로위치를 결정한다. 여기서, 스트립은 국부 탐색공간을 나타내며 철도 선로궤적에 수직인 방향으로 정의된다. 마지막으로, 초기 선로위치에서 GMM-EM기반 분류방법을 통해 선로 포인트들을 탐지한 후 초기 선로 모델을 생성하고 스트립을 데이터 처리 기본단위로 하여 tracking by detection관점에서 연속적으로 선로모델을 생성하였다. 제안된 방법의 주요 특징은 다음과 같다. 첫째, 이전 스트립에서 생성된 선로 모델을 가이드 라인으로 다음 스트립에 전파되어 국부 탐색영역을 예측하여 선로 포인트를 탐지하는 하는데 있어서 처리 복잡성을 줄일 수 있었다. 둘째, 선로 포인트 탐지와 선로 모델링을 동시에 진행 함으로써 데이터 처리 시간을 최소화 할 수 있었다. 개발된 알고리즘은 C++ 프로그램 언어로 구현되었고 도시지역에서 MMS 측량을 통해 취득된 LiDAR 데이터(경부선 일부 구간)를 이용하여 성능 테스트를 진행하였다.