• 제목/요약/키워드: EM 알고리즘

검색결과 236건 처리시간 0.028초

나이브베이즈 문서분류시스템을 위한 선택적샘플링 기반 EM 가속 알고리즘 (Accelerating the EM Algorithm through Selective Sampling for Naive Bayes Text Classifier)

  • 장재영;김한준
    • 정보처리학회논문지D
    • /
    • 제13D권3호
    • /
    • pp.369-376
    • /
    • 2006
  • 본 논문은 온라인 전자문서환경에서 전통적 베이지안 통계기반 문서분류시스템의 분류성능을 개선하기 위해 EM(Expectation Maximization) 가속 알고리즘을 접목한 방법을 제안한다. 기계학습 기반의 문서분류시스템의 중요한 문제 중의 하나는 양질의 학습문서를 확보하는 것이다. EM 알고리즘은 소량의 학습문서집합으로 베이지안 문서분류 알고리즘의 성능을 높이는데 활용된다. 그러나 EM 알고리즘은 최적화 과정에서 느린 수렴성과 성능 저하 현상을 나타내는데, EM 알고리즘의 기본 가정을 따르지 않는 온라인 전자문서환경에서 특히 그러하다. 제안 기법의 주요 아이디어는 전통적 EM 알고리즘을 개선하기 위해 불확정성도 기반 선택적 샘플링 기법을 활용한 것이다. 성능평가를 위해 Reuter-21578 문서집합을 사용하여, 제안 알고리즘의 빠른 수렴성을 보이고 전통적 베이지안 알고리즘의 분류 정확성을 향상시켰음을 보인다.

혼합정규분포의 모수 추정에서 구간도수 EM 알고리즘의 실행 속도 개선 (Speedup of EM Algorithm by Binning Data for Normal Mixtures)

  • 오창혁
    • Communications for Statistical Applications and Methods
    • /
    • 제15권1호
    • /
    • pp.1-11
    • /
    • 2008
  • 혼합정규분포로부터 얻은 자료의 크기가 크면 EM 알고리즘으로 모수를 추정하는 경우 추정에 많은 시간이 걸리며 이는 실시간 음성인식 분야등에서는 적용이 어렵게 되는 문제가 발생한다. 대용량 자료를 구간도수로 요약하여 구간도수 EM 알고리즘을 적용하면 표준 EM 알고리즘에 비해 실행속도가 획기적으로 개선되며 더욱이 구간도수 EM 알고리즘에서의 추정치의 효율성이 표준 EM 알고리즘에 근접함을 시뮬레이션 실험을 통하여 보였다.

Expectation-Maximization 기반의 새로운 OFDM 채널 추정 방식 (A Novel Expectation-Maximization based Channel Estimation for OFDM Systems)

  • 김남겸;손인수;신재호
    • 한국통신학회논문지
    • /
    • 제34권4C호
    • /
    • pp.397-402
    • /
    • 2009
  • 대용량의 데이터 전송을 위해 최근에 많이 사용되고 있는 OFDM 시스템은 다중경로페이딩에는 유리하지만 시간 선택성 페이딩에서는 자유롭지 못하고 이를 위해 채널추정이 필요하게 된다. 이를 위해 본 논문에서는 기존의 EM 알고리즘의 성능을 향상시키기 위해 LPC 알고리즘을 접목시킨 EM-LPC 알고리즘을 제안했다. 이 알고리즘은 기존의 EM 알고리즘의 M-Step 다음에 LPC 알고리즘을 사용하여 미리 다음 pilot 데이터를 추정할 수 있게된다. 또한 interpolation을 통한 데이터 수정도 가능하게 된다. 살펴본 결과 EM-LPC 알고리즘이 기존의 LS 알고리즘과 EM 알고리즘보다 좋은 성능을 내는 것을 볼 수 있었다. 또한 EM 루프의 반복도 역시 줄어드는 것을 볼 수 있었다.

다중해상도 kd-트리와 클러스터 유효성을 이용한 점증적 EM 알고리즘과 이의 영상 분할에의 적용 (Incremental EM algorithm with multiresolution kd-trees and cluster validation and its application to image segmentation)

  • 이경미
    • 한국지능시스템학회논문지
    • /
    • 제25권6호
    • /
    • pp.523-528
    • /
    • 2015
  • 본 논문은 효율적인 영상 분할을 수행하기 위한 다중해상도와 동적인 성질을 가지고 있는 새로운 EM 알고리즘을 제안한다. EM 알고리즘은 가장 많이 사용되고 성능이 우수한 클러스터링 방법이다. 그러나, 기존의 EM 알고리즘은 다중해상도 데이터 처리에 대한 문제점과 클러스터 개수에 대한 사전 지식 요구라는 단점을 가지고 있다. 본 논문에서는 이러한 문제점을 해결하기 위해서 E-단계에 다중해상도 kd-트리를 적용함으로써 다중해상도 데이터 처리 문제를 해결하였고, 순차적 데이터에 따라 클러스터를 할당할 수 있데 하였다. 클러스터의 유효성을 검사하기 위해서, 클러스터 병합 원칙을 이용한다. 본 논문에서는 제안하는 알고리즘을 텍스쳐 영상 분할에 적용하였고, 우수한 성능을 보였다.

새로운 고속 EM 알고리즘 (A New Fast EM Algorithm)

  • 김성수;강지혜
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제31권10호
    • /
    • pp.575-587
    • /
    • 2004
  • 본 논문은 여러 분야에서 활용될 수 있는 향상된 고속 Expectation-Maximization(FEM) 알고리즘을 제안한다. 첫째, EM의 초기값 설정의 방법으로 많이 사용되고 있는 클러스터링 기법인 K-means의 문제점을 해결하여 개선된 EM의 초기값 선정에 적용하였다. 이것은 기존 K-means 알고리즘에서 임의로 지정하던 랜덤한 초기값 선정을, 데이타 분포 특성을 이용한 균등 분할법을 사용하여 EM의 초기값 문제를 해결하였다. 둘째, EM 과정의 핵심을 이루는 후행 확률(Posterior)의 의미를 부각하여 최대 가능성 후행 확률(Maximum Likelihood Posterior: MLP)과정을 적용하였다. 최종적으로, 본 논문에서 제안한 고속 EM알고리즘(FEM)은 근본적으로 해결하기 못했던 기존의 EM 초기치 선정과 수렴에 대한 문제점을 개선함으로써, EM 알고리즘의 특성을 극대화하는 방향으로 상대적으로 마른 수렴과 향상된 결과를 가져온다. 제안된 알고리즘의 객관적 타당성을 위해 기존의 방법과 제안된 방법에 의한 시뮬레이션의 결과를 여러 데이타들을 가지고 비교 분석하여 제안한 알고리즘의 우수성을 입증하였다.

영상흐림보정에서 EM 알고리즘의 일반해: 반복과정을 사용하지 않는 영상복원 (An Explicit Solution of EM Algorithm in Image Deblurring: Image Restoration without EM iterations)

  • 김승구
    • Communications for Statistical Applications and Methods
    • /
    • 제16권3호
    • /
    • pp.409-419
    • /
    • 2009
  • 본 연구에서는 영상흐림보정를 위한 EM 알고리즘의 일반형 해를 제공한다. 주어진 관측영상의 크기가 크거나 많은 반복을 필요로 할 때, EM 알고리즘의 반복은 매우 오랜시간이 걸리며 비실용적이다. 본 연구에서는 복원 영상의 유효영역 밖에서 약간의 근사로부터 해를 일반형으로 나타내고, 이것을 이산형 유한 푸리에 변환을 이용하여 EM 알고리즘의 반복과정을 사용하지 않으면서 매우 유효한 복원영상을 즉시 계산하는 방법을 제공한다.

치우친 다변량 t-분포 혼합모형에 대한 최우추정 (An Alternating Approach of Maximum Likelihood Estimation for Mixture of Multivariate Skew t-Distribution)

  • 김승구
    • 응용통계연구
    • /
    • 제27권5호
    • /
    • pp.819-831
    • /
    • 2014
  • 치우친 다변량 t-분포 혼합을 적합하기 위해 Exact-EM 알고리즘이 사용된다. 그러나 이 방법은 E-step에서 매우 긴 처리시간을 요하는 다변량 절단 t-분포의 적률을 계산해야 한다. 본 논문에서는 이러한 문제점을 완화하기 위해 SPU-EM이라 명명한 알고리즘을 제안하는데, 이것은 Meng과 van Dyk (1997)의 AECM 알고리즘의 원리를 이용하여 다차원 적률의 계산상의 어려움을 해결한다. 결과적으로 제안된 방법은 Exact-EM 알고리즘 보다 빠른 처리시간으로 보장한다. 이를 입증하기 위해 실험을 통해 제안된 방법의 유효성을 보인다.

결정적 어닐링 EM 알고리즘을 이요한 칼라 영상의 분할 (Segmentation of Color Image using the Deterministic Annealing EM Algorithm)

  • 조완현;박종현;박순영
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권3호
    • /
    • pp.324-333
    • /
    • 2001
  • 본 논문에서는 가우시안 혼합모형을 이용한 새로운 칼라 영상의 분할 알고리즘을 제안한다. 기존의 EM 알고리즘의 문제점인 국부적 최대값의 문제를 해결하기 위하여 최대 엔트로피의 원리를 이용하는 결정적 어닐링 EM 알고리즘을 소개하였고, 여러 색상들로 구성된 영상에 대하여 가우시안 혼합모형을 가정하였으며, 결정적 어닐링 EM 알고리즘을 사용하여 이들의 모수를 추정하는 방법을 알아보았다. 또한 혼합모형에 성분의 수를 자동으로 결정할 수 있는 방법을 제시하였으며 선택된 최적의 혼합모형을 사용하여 각 화소에 대한 사후확률을 계산하고 이들의 최대값을 이용하여 영상분할을 실시하였다. 결정적 어닐링 EM 알고리즘이 기존의 EM 알고리즘보다 혼합모형의 모수를 더 정확하게 추정한다는 것과 혼합모형의 성분의 수를 결정하는 제안된 방법의 성능을 실험결과를 통하여 고찰하였고, 또한 두 가지 실제 영상을 통하여 제안된 알고리즘이 기존의 알고리즘 보다 영상을 더 효율적으로 분할 할 수 있음을 보였다.

  • PDF

EM 알고리즘 및 메타휴리스틱을 통한 다이나믹 환경에서의 베이지안 네트워크 학습 전파 프레임웍 (Learning and Propagation Framework of Bayesian Network using Meta-Heuristics and EM algorithm considering Dynamic Environments)

  • 추상현;이현수
    • 한국지능시스템학회논문지
    • /
    • 제26권5호
    • /
    • pp.335-342
    • /
    • 2016
  • 기 구축되어있는 베이지안 네트워크에서 다이나믹한 환경 변화가 발생 할 때, 관련된 베이지안 네트워크의 파라미터는 새롭게 형성된 데이터의 패턴에 적응하여 새로운 파라미터로 변경되어야 한다. 이때, 새로운 파라미터는 베이지안 네트워크의 인과관계를 고려하여 변경되어야 한다. 본 논문에서는 Expectation Maximization(EM)알고리즘과 Meta-Heuristics 기법 중 하나인 Harmony Search(HS)알고리즘을 이용한 다이나믹한 파라미터 업데이트 프레임웍을 제안한다. 일반적으로, EM 알고리즘은 숨겨진 파라미터를 추정하는데 유효한 알고리즘이지만 지역 최적값에 수렴한다는 단점을 가지고 있다. 이 문제를 해결하기 위해서 본 논문은 Maximum Likelihood Estimator(MLE)의 파라미터가 글로벌 최적값을 지향하도록 하기위하여 메타휴리스틱 방법론의 하나인 HS를 적용한다. 제안된 방법은 EM 알고리즘의 단점을 보완하고 글로벌 최적값에 수렴하는 MLE의 파라미터를 추정하여 다이나믹하게 변화하는 환경에서도 사용 가능한 베이지안 네트워크의 학습 및 전파프레임웍을 제시한다.

분포 혼합비율의 모수추정을 위한 효율적인 알고리즘에 관한 연구 (A Study for Efficient EM Algorithms for Estimation of the Proportion of a Mixed Distribution)

  • 황강진;박경탁;유희경
    • 품질경영학회지
    • /
    • 제30권4호
    • /
    • pp.68-77
    • /
    • 2002
  • EM algorithm has good convergence rate for numerical procedures which converges on very small step. In the case of proportion estimation in a mixed distribution which has very big incomplete data or of update of new data continuously, however, EM algorithm highly depends on a initial value with slow convergence ratio. There have been many studies to improve the convergence rate of EM algorithm in estimating the proportion parameter of a mixed data. Among them, dynamic EM algorithm by Hurray Jorgensen and Titterington algorithm by D. M. Titterington are proven to have better convergence rate than the standard EM algorithm, when a new data is continuously updated. In this paper we suggest dynamic EM algorithm and Titterington algorithm for the estimation of a mixed Poisson distribution and compare them in terms of convergence rate by using a simulation method.