• 제목/요약/키워드: LBG Clustering

검색결과 14건 처리시간 0.022초

문장종속 화자확인 시스템을 위한 개선된 군집화 알고리즘에 관한 연구 (A Study on Modified Clustering Algorithm for Text-Dependent Speaker Verification System)

  • 강철호;정희석
    • 한국음향학회지
    • /
    • 제23권7호
    • /
    • pp.548-553
    • /
    • 2004
  • 본 연구에서는 집단화 오차를 최소로 하기위해 개선된 LBG 알고리즘을 제안한다. 기존의 LBG 알고리즘은 화자확인 시스템에 적용시 소량의 학습 데이터의 분포가 가지는 특수성으로부터 기인하는 문제점들이 발생한다. 즉, 개인별 특성을 무시하고 항상 일정한 크기의 코드북을 생성해야 하는데서 기인하는 군집화 오류와 분할할 (Splitting) 방향을 잘못 선택하면서 발생하는 집단화의 오류가 전체 화자 인식율 저하의 원인이 된다. 따라서, 본 연구에서는 개인별로 최적의 크기를 가지는 가변길이 코드북 생성 기법과 중심값으로부터 최외곽의 멤버 벡터 인덱스를 찾고 다시 최외곽 멤버 벡터에서 가장 먼 멤버 벡터 인덱스를 찾음으로써 분할할 방향을 인위적으로 지정해 주는 개선된 군집화 알고리즘을 제안한다. 실험 결과, 제안된 방식을 적용한 화자확인 시스템이 기존의 LBG알고리즘을 사용한 시스템보다 오거부율(FR)은 3.165%, 오수락율 (FA)는 0.06%씩 각각 향상 되었다.

The Effect of the Number of Clusters on Speech Recognition with Clustering by ART2/LBG

  • Lee, Chang-Young
    • 말소리와 음성과학
    • /
    • 제1권2호
    • /
    • pp.3-8
    • /
    • 2009
  • In an effort to improve speech recognition, we investigated the effect of the number of clusters. In usual LBG clustering, the number of codebook clusters is doubled on each bifurcation and hence cannot be chosen arbitrarily in a natural way. To have the number of clusters at our control, we combined adaptive resonance theory (ART2) with LBG and perform the clustering in two stages. The codebook thus formed was used in subsequent processing of fuzzy vector quantization (FVQ) and HMM for speech recognition tests. Compared to conventional LBG, our method was shown to reduce the best recognition error rate by 0${\sim$}0.9% depending on the vocabulary size. The result also showed that between 400 and 800 would be the optimal number of clusters in the limit of small and large vocabulary speech recognitions of isolated words, respectively.

  • PDF

LBG 알고리즘 기반 데이터마이닝을 이용한 네트워크 침입 탐지율 향상 (Improvement of Network Intrusion Detection Rate by Using LBG Algorithm Based Data Mining)

  • 박성철;김준태
    • 지능정보연구
    • /
    • 제15권4호
    • /
    • pp.23-36
    • /
    • 2009
  • 네트워크 침입 탐지는 데이터마이닝 기법을 활용하면서 지속적으로 발전하여 왔다. 데이터마이닝에 의한 침입 탐지 기법에는 클래스 레이블을 이용한 감독 학습과 클래스 레이블이 없는 비감독 학습 방법이 있다. 본 논문에서는 클래스 레이블이 없는 비감독 학습 방법인 LBG 클러스터링 알고리즘을 이용하여 네트워크 침입 탐지 정확도를 높이는 방법을 연구하였다. 임의의 초기 중심값들로 시작하여 유클리디언 거리 기반에 의해 클러스터링을 수행하는 K-means 방법은 잡음(noisy) 데이터와 이상치(outlier)에 대하여 취약하다는 단점이 있다. 비균일이진 분할에 의한 클러스터링 알고리즘은 초기값 없이 이진분할에 의해 클러스터링을 수행하며 수행 속도가 빠르다. 본 논문에서는 이 두 알고리즘의 장단점을 통합한 EM(Expectation Maximization) 기반의 LBG 알고리즘을 네트워크 침입 탐지에 적용하였으며, KDD 컵 데이터셋을 대상으로 한 실험을 통하여 LBG 알고리즘을 이용함으로써 침입 탐지의 정확도를 높일 수 있음을 보였다.

  • PDF

프레임 기반의 수중 천이신호 식별을 위한 기준패턴의 데이터베이스 구성 방법에 관한 연구 (A Study on the Reference Template Database Design Method for Frame-based Classification of Underwater Transient Signals)

  • 임태균;류종엽;김태환;배건성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2008년도 하계종합학술대회
    • /
    • pp.885-886
    • /
    • 2008
  • This paper presents a reference template design method for frame-based classification of underwater transient signals. In the proposed method, framebased feature vectors of each reference signal are clustered by using LBG clustering algorithm to reduce the number of feature vectors in each class. Experimental results have shown that drastic reduction of the reference database can be achieved while maintaining the classification performance with LBG clustering algorithm.

  • PDF

Fast LBG Algorithm to Reduce the Computational Complexity

  • Kim Dong-Hyun;Kang Chul-Ho
    • The Journal of the Acoustical Society of Korea
    • /
    • 제24권4E호
    • /
    • pp.123-127
    • /
    • 2005
  • In this paper, we propose a new method for reducing the number of distance calculations in the LBG (Linde, Buzo, Gray) algorithm, which is widely used method to construct a codebook in vector quantization of speech recognition system. The proposed algorithm can reduce the distance calculation between input vector and codeword by utilizing the observation that codewords are quickly stabilized as the number of iteration increases. From the simulation results, it is shown that we can reduce the running times over $43.77\%$ on average in comparison with current LBG algorithm without sacrificing the performance of codebook.

Hard 분산 분할 기반 추론 시스템을 이용한 비선형 공정 모델링 (Nonlinear Process Modeling Using Hard Partition-based Inference System)

  • 박건준;김용갑
    • 한국정보전자통신기술학회논문지
    • /
    • 제7권4호
    • /
    • pp.151-158
    • /
    • 2014
  • 본 논문에서는 Hard 분산 분할 방법을 이용하는 추론 시스템을 소개하고 비선형 공정을 모델링한다. 이를 위해 입력 공간을 분산 형태로 분할하고 소속 정도가 0 또는 1을 갖는 Hard 분할 방법을 이용한다. 제안한 방법은 C-Means 클러스터링 알고리즘에 의해 구현되며, 초기 중심값에 민감한 단점을 보완하기 위해 LBG 알고리즘을 적용하여 이진 분할에 의한 초기 중심값을 이용한다. Hard 분산 분할된 입력 공간은 규칙 기반의 시스템 모델링에서 규칙을 형성한다. 규칙의 전반부 파라미터는 C-Means 클러스터링 알고리즘에 의한 소속행렬로 결정된다. 규칙의 후반부는 다항식 함수의 형태로 표현되며, 각 규칙의 후반부 파라미터들은 표준 최소자승법에 의해 동정된다. 비선형 공정으로는 널리 이용되는 데이터를 이용하여 비선형 공정을 모델링한 후 특성을 평가한다.

프레임 기반의 효율적인 수중 천이신호 식별을 위한 참조 신호의 벡터 양자화 (Vector Quantization of Reference Signals for Efficient Frame-Based Classification of Underwater Transient Signals)

  • 임태균;김태환;배건성;황찬식
    • 한국통신학회논문지
    • /
    • 제34권2C호
    • /
    • pp.181-185
    • /
    • 2009
  • 프레임 단위로 식별 데이터베이스에 저장된 참조 신호의 특징 벡터와 유사성을 비교하여 입력 신호를 식별하는 경우에, 참조 신호의 특징 벡터로 데이터베이스를 어떻게 구성하는가에 따라 식별 성능은 영향을 받을 수 있다. 즉, 식별 데이터베이스의 구성 방법에 따라 데이터베이스의 크기와 식별을 위한 계산량, 식별 성능 등이 결정되며, 이것은 실제로 수중 천이신호 식별 시스템을 구성할 때 중요한 문제이다. 본 논문에서는 LBG 벡터 양자화 기법을 이용하여 식별 데이터베이스의 크기를 줄여 줌으로써 프레임 기반 수중 천이신호 식별 기법의 효율성을 증가시킬 수 있는 방법을 제안하고, 실험을 통하여 제안한 방법의 타당성을 검증하였다.

LBG 알고리즘 기반의 의상 색상 유사성 판별 (Distinction of Color Similarity for Clothes based on the LBG Algorithm)

  • 주형돈;홍민;조위덕;문남미;최유주
    • 인터넷정보학회논문지
    • /
    • 제9권5호
    • /
    • pp.117-130
    • /
    • 2008
  • 본 논문은 LBG 알고리즘을 이용하여 다양한 조명에 노출된 의상들의 색상 유사성을 안정적으로 판단하는 방법을 제안한다. 색상 유사성 판별을 위하여 기존에 대표적으로 사용되어왔던 히스토그램 인터섹션이나 누적 히스토그램 방법은 조명 변화에 민감하게 반응하여, 동일한 의상 색상이라 할지라도 서로 다른 조명환경에서는 서로 상이한 색상 판별 결과를 나타낸다. 본 논문에서는 조명에 의한 영향을 줄이고 색상 자체의 분포 특성을 분석하기 위하여 조명조건의 변화에도 일관된 특성을 유지하는 색조와 채도 컬러 성분에 대한 분포 특성을 분석한다. 색조와 채도에 의해 정의되는 2차원 공간에서 각 의상 영상에 대한 색상 분포를 분석하기 위하여 LBG 알고리즘에 의한 비모수적 클러스터링 기법을 적용하고, 클러스터링 결과 얻어진 두 영상의 클러스터 사이의 평균 유클리디안 거리 값을 계산하여 이를 색상 유사성을 판단하는 유사 값으로 정의한다. 제안 기법의 안정성을 입증하기 위하여 서로 다른 조명 환경에서 촬영된 12벌의 의상에 대하여 기존 히스토그램 분석 기법을 기반으로 한 색상 유사성 판별 결과와 제안 기법의 적용 결과를 비교하였다. 실험 결과 제안기법은 동일한 의상 쌍과 상이한 의상 쌍에 대하여 구분을 지을 수 있는 객관적 기준 정의가 용이하였고, 기준에 따른 의상의 동일성 판별 실험에서 91.6%의 판별 성공률을 얻었다.

  • PDF

비선형 집단화와 완화기법을 이용한 VQ/HMM에 관한 연구 (A Study on VQ/HMM using Nonlinear Clustering and Smoothing Method)

  • 정희석;강철호
    • 한국음향학회지
    • /
    • 제18권3호
    • /
    • pp.35-42
    • /
    • 1999
  • 본 논문에서는 이산적인 HMM(Hidden Markov Model)을 이용한 고립단어 인식 시스템에서 입력특징벡터의 변별력을 향상시키기 위해 수정된 집단화 알고리듬을 제안하므로써 K-means나 LBG 알고리듬을 이용한 기존의 HMM에 비해 2.16%의 인식율을 향상시켰다. 또한 HMM학습과정에서 불충분한 학습데이타로 인해 발생되는 인식율저하의 문제를 해소하기 위해 확률적으로 개선된 smoothing 기법을 제안하므로써 화자독립 실험에서 3.07%의 인식율을 향상시켰다. 본 논문에서 제안한 두 가지 알고리듬을 모두 적용하여 최종적으로 실험한 VQ/HMM에서는 기존의 방식에 비해 화자독립 인식실험 결과 평균 인식율이 4.66% 개선되었다.

  • PDF

Iterative LBG Clustering for SIMO Channel Identification

  • Daneshgaran, Fred;Laddomada, Massimiliano
    • Journal of Communications and Networks
    • /
    • 제5권2호
    • /
    • pp.157-166
    • /
    • 2003
  • This paper deals with the problem of channel identification for Single Input Multiple Output (SIMO) slow fading channels using clustering algorithms. Due to the intrinsic memory of the discrete-time model of the channel, over short observation periods, the received data vectors of the SIMO model are spread in clusters because of the AWGN noise. Each cluster is practically centered around the ideal channel output labels without noise and the noisy received vectors are distributed according to a multivariate Gaussian distribution. Starting from the Markov SIMO channel model, simultaneous maximum ikelihood estimation of the input vector and the channel coefficients reduce to one of obtaining the values of this pair that minimizes the sum of the Euclidean norms between the received and the estimated output vectors. Viterbi algorithm can be used for this purpose provided the trellis diagram of the Markov model can be labeled with the noiseless channel outputs. The problem of identification of the ideal channel outputs, which is the focus of this paper, is then equivalent to designing a Vector Quantizer (VQ) from a training set corresponding to the observed noisy channel outputs. The Linde-Buzo-Gray (LBG)-type clustering algorithms [1] could be used to obtain the noiseless channel output labels from the noisy received vectors. One problem with the use of such algorithms for blind time-varying channel identification is the codebook initialization. This paper looks at two critical issues with regards to the use of VQ for channel identification. The first has to deal with the applicability of this technique in general; we present theoretical results for the conditions under which the technique may be applicable. The second aims at overcoming the codebook initialization problem by proposing a novel approach which attempts to make the first phase of the channel estimation faster than the classical codebook initialization methods. Sample simulation results are provided confirming the effectiveness of the proposed initialization technique.