• 제목/요약/키워드: EM, Expectation Maximization

검색결과 138건 처리시간 0.026초

A Finite Mixture Model for Gene Expression and Methylation Pro les in a Bayesian Framewor

  • Jeong, Jae-Sik
    • 응용통계연구
    • /
    • 제24권4호
    • /
    • pp.609-622
    • /
    • 2011
  • The pattern of methylation draws significant attention from cancer researchers because it is believed that DNA methylation and gene expression have a causal relationship. As the interest in the role of methylation patterns in cancer studies (especially drug resistant cancers) increases, many studies have been done investigating the association between gene expression and methylation. However, a model-based approach is still in urgent need. We developed a finite mixture model in the Bayesian framework to find a possible relationship between gene expression and methylation. For inference, we employ Expectation-Maximization(EM) algorithm to deal with latent (unobserved) variable, producing estimates of parameters in the model. Then we validated our model through simulation study and then applied the method to real data: wild type and hydroxytamoxifen(OHT) resistant MCF7 breast cancer cell lines.

Text-Independent Speaker Verification Using Variational Gaussian Mixture Model

  • Moattar, Mohammad Hossein;Homayounpour, Mohammad Mehdi
    • ETRI Journal
    • /
    • 제33권6호
    • /
    • pp.914-923
    • /
    • 2011
  • This paper concerns robust and reliable speaker model training for text-independent speaker verification. The baseline speaker modeling approach is the Gaussian mixture model (GMM). In text-independent speaker verification, the amount of speech data may be different for speakers. However, we still wish the modeling approach to perform equally well for all speakers. Besides, the modeling technique must be least vulnerable against unseen data. A traditional approach for GMM training is expectation maximization (EM) method, which is known for its overfitting problem and its weakness in handling insufficient training data. To tackle these problems, variational approximation is proposed. Variational approaches are known to be robust against overtraining and data insufficiency. We evaluated the proposed approach on two different databases, namely KING and TFarsdat. The experiments show that the proposed approach improves the performance on TFarsdat and KING databases by 0.56% and 4.81%, respectively. Also, the experiments show that the variationally optimized GMM is more robust against noise and the verification error rate in noisy environments for TFarsdat dataset decreases by 1.52%.

Analysis and probabilistic modeling of wind characteristics of an arch bridge using structural health monitoring data during typhoons

  • Ye, X.W.;Xi, P.S.;Su, Y.H.;Chen, B.
    • Structural Engineering and Mechanics
    • /
    • 제63권6호
    • /
    • pp.809-824
    • /
    • 2017
  • The accurate evaluation of wind characteristics and wind-induced structural responses during a typhoon is of significant importance for bridge design and safety assessment. This paper presents an expectation maximization (EM) algorithm-based angular-linear approach for probabilistic modeling of field-measured wind characteristics. The proposed method has been applied to model the wind speed and direction data during typhoons recorded by the structural health monitoring (SHM) system instrumented on the arch Jiubao Bridge located in Hangzhou, China. In the summer of 2015, three typhoons, i.e., Typhoon Chan-hom, Typhoon Soudelor and Typhoon Goni, made landfall in the east of China and then struck the Jiubao Bridge. By analyzing the wind monitoring data such as the wind speed and direction measured by three anemometers during typhoons, the wind characteristics during typhoons are derived, including the average wind speed and direction, turbulence intensity, gust factor, turbulence integral scale, and power spectral density (PSD). An EM algorithm-based angular-linear modeling approach is proposed for modeling the joint distribution of the wind speed and direction. For the marginal distribution of the wind speed, the finite mixture of two-parameter Weibull distribution is employed, and the finite mixture of von Mises distribution is used to represent the wind direction. The parameters of each distribution model are estimated by use of the EM algorithm, and the optimal model is determined by the values of $R^2$ statistic and the Akaike's information criterion (AIC). The results indicate that the stochastic properties of the wind field around the bridge site during typhoons are effectively characterized by the proposed EM algorithm-based angular-linear modeling approach. The formulated joint distribution of the wind speed and direction can serve as a solid foundation for the purpose of accurately evaluating the typhoon-induced fatigue damage of long-span bridges.

그래프 이론 기반의 클러스터링을 이용한 영상 감시 시스템 시야 내의 출입 영역 검출 (Detection of Entry/Exit Zones for Visual Surveillance System using Graph Theoretic Clustering)

  • 우하용;김경환
    • 전자공학회논문지SC
    • /
    • 제46권6호
    • /
    • pp.1-8
    • /
    • 2009
  • 여러 대의 카메라를 이용한 감시 시스템이 정확하고 효율적으로 동작하기 위하여 카메라 시야 간의 연결 관계를 아는 것이 필수적이다. 카메라들의 연결 관계를 파악하기 위하여 카메라 시야 내의 출입 영역을 검출하는 일이 선행되어야 한다. 본 논문에서는 카메라 시야에서 객체의 등장 및 퇴장으로부터 얻은 데이터에 그래프 이론 기반의 클러스터링(clustering)을 적용하여 시야 내의 출입 영역을 검출하는 방법을 제안한다. 데이터 포인트들 사이의 관계를 조사하여 최소신장트리를 구성하고, 트리의 에지들 중 일관성을 갖지 않는 것들을 삭제하여 well-formed 클러스터를 얻는다. 본 논문에서는 클러스터의 형태를 설명하는 두 가지 특징을 정의하고 이를 클러스터의 분할 조건으로 사용하였다. 실험결과를 통하여 데이터 포인트의 분포가 조밀하지 않은 경우 expectation maximization(EM)에 기반을 둔 방법에 비하여 치안하는 방법이 보다 효과적으로 클러스터링을 수행함을 확인하였다. 또한 EM 기반 방법들에 비하여 안정적인 결과를 얻기 위해 필요한 데이터 포인트의 개수가 적으므로 출입영역에 대한 학습시간을 단축할 수 있다.

다중 단계 NMF-EM 알고리즘 기반의 오디오 소스 분리 방법에 대한 연구 (A sturdy on the blind audio source separation based on multi-step NMF-EM algorithm)

  • 조충상;김제우
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2014년도 하계학술대회
    • /
    • pp.9-11
    • /
    • 2014
  • 본 논문에서는 오디오 신호의 특성 표현에 유용한 nonnegative matrix factorization(NMF)에 대해 설명하였으며, expectation maximization (EM)을 이용한 NMF 파라미터 추출 및 EM-NMF 기반한 오디오 소스 분리 기술에 대해서 설명했다. 또한, 다중 단계 NMF-EM 구조의 객체 분리를 통해서 객체 분리 성능을 향상시키기 위한 알고리즘을 제안하며, 제안된 알고리즘은 K-pop 음원과 SDR(source distortion ratio)를 통해서 객체 분리 성능을 평가한다. 성능 평가 결과 제안된 알고리즘은 다중 단계를 통해 약 3dB 의 보컬 분리 성능이 향상되며, 상업적 음원 제작에서 사용되는 가상 오디오 효과가 많이 적용된 음원에서 약 5dB 의 분리 성능을 향상시켰다. 그러므로 제안된 방식은 오디오 객체 분리에 유용한 방법이 될 것으로 생각된다.

  • PDF

EM 알고리즘 기반 강인한 진동 특징을 이용한 고 신뢰성 유도 전동기 다중 결함 분류 (High-Reliable Classification of Multiple Induction Motor Faults Using Vibration Signatures based on an EM Algorithm)

  • 장원철;강명수;최병근;김종면
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2013년도 추계학술대회 논문집
    • /
    • pp.346-353
    • /
    • 2013
  • Industrial processes need to be monitored in real-time based on the input-output data observed during their operation. Abnormalities in an induction motor should be detected early in order to avoid costly breakdowns. To early identify induction motor faults, this paper effectively estimates spectral envelopes of each induction motor fault by utilizing a linear prediction coding (LPC) analysis technique and an expectation maximization (EM) algorithm. Moreover, this paper classifies induction motor faults into their corresponding categories by calculating Mahalanobis distance using the estimated spectral envelopes and finding the minimum distance. Experimental results shows that the proposed approach yields higher classification accuracies than the state-of-the-art approach for both noiseless and noisy environments for identifying the induction motor faults.

  • PDF

관심영역 추출과 통합에 의한 적외선 영상 분할 (Infrared Image Segmentation by Extracting and Merging Region of Interest)

  • 염석원
    • 한국지능시스템학회논문지
    • /
    • 제26권6호
    • /
    • pp.493-497
    • /
    • 2016
  • 적외선 영상은 야간에 표적의 탐지가 가능하여 보완과 감시분야에 활용도가 높다. 그러나 가시광선 영상에 비하여 해상도가 낮고 잡음의 영향이 크다는 단점이 있다. 본 논문에서는 적외선 영상의 표적을 분할하는 방법을 연구한다. 표적을 포함하는 다수의 관심영역(Region of Interest)을 다단계 분할 방법을 이용하여 추출하고 관심영역을 입력영상으로 다단계 분할방법을 다시 적용하여 표적을 분할한다. 다단계 분할 방법의 각 단계는 가우시안 혼합모델의 파라미터를 초기화 하고 추정하는 k-means 클러스터링(Clustering)과 EM(Expectation-Maximization) 알고리즘과 추정된 사후확률을 이용하여 각 화소의 클러스터를 결정하는 단계로 구성된다. 본 논문에서 추출된 관심영역을 선택하고 통합하는 방법을 제안한다. 관심영역의 통합은 근접한 모든 관심영역의 윈도우를 포함하도록 이루어진다. 실험에서는 야간의 보행자로부터 획득한 적외선 영상에 제안된 방법을 적용하고 다른 분할 방법과 비교하여 제안한 방법이 우수함을 보인다.

결측 공변량을 갖는 혼합회귀모형에서의 EM 알고리즘 (The EM algorithm for mixture regression with missing covariates)

  • 김형민;함건희;서병태
    • 응용통계연구
    • /
    • 제29권7호
    • /
    • pp.1347-1359
    • /
    • 2016
  • 혼합회귀모형은 반응 변수와 공변량 사이의 관계를 규명하는 유용한 통계적 모형으로 여러 분야에서 사용되어지고 있다. 하지만 실제로 혼합회귀모형을 이용하여 분석을 하는 과정에서 공변량이 결측값을 포함하는 문제는 흔하게 발생하며, 발생하는 결측의 유형 또한 다양하게 나타난다. 이러한 경우에 있어서 본 논문에서는 최대우도추정량을 구하기 위한 EM 알고리즘을 제안하고자 한다. 제안된 EM 알고리즘의 효용성을 모의실험을 통해 확인하였으며 또한 사례연구를 통해 제시된 방법이 어떻게 사용될수 있는지와 그 효용성을 함께 확인하였다.

노인 운전자의 공격적인 운전 상태 검출 기법 (A Method of Detecting the Aggressive Driving of Elderly Driver)

  • 고동우;강행봉
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권11호
    • /
    • pp.537-542
    • /
    • 2017
  • 공격적인 성향의 운전은 자동차 사고의 주요한 원인이 된다. 기존 연구에서는 공격적 성향의 운전을 검출하기 위해, 주로 청년을 대상으로 연구가 이뤄졌으며 기계학습의 순수한 Clustering 또는 Classification 기법을 통해 이뤄졌다. 그러나 노인들은 취약한 신체적 조건에 의해 젊은 운전자와는 다른 운전 강도를 가지고 있어 기존의 방식으로는 검출이 불가능 하며, 데이터를 보정하는 등의 새로운 방법이 필요하다. 그리하여, 본 연구에서는 기존의 클러스터링 기법(K-means, Expectation - maximization algorithm)에, 새롭게 제안하는 ECA(Enhanced Clustering method for Acceleration data)기법을 추가하여, 주행 차량에 위치한 스마트폰으로부터 수집된 가속도 데이터를 분석하고 공격적인 운전 형태를 검출해 낸다. ECA는 모든 피험자의 데이터에서 K-means와 EM을 통해 검출된 군집군의 데이터 중 높은 강도의 데이터를 선별하여, 특징을 스케일링한 값을 통해 모델링한다. 본 방식을 통해 기존의 연구의 순수한 클러스터링 방식과는 달리, 모든 청장년 및 노인 실험 참가자 개인들의 공격적인 운전 데이터가 검출되었으며, 클러스터링 기법간의 비교를 통해 K-means 기법이 보다 높은 검출 효율을 갖고 있음을 확인했다. 또한, K-means 방식을 검출한 공격적인 운전 데이터에서는 젊은 운전자가 노인운전자에 비해 1.29배의 높은 운전 강도를 가지고 있음을 발견했다. 이와 같이 본 연구에서 제안된 방식은 낮은 운전 강도를 갖고 있는 노인의 데이터에서 공격적인 운전을 검출 가능하게 되었으며, 특히. 제안된 방법은 노인 운전자를 위한 맞춤형 안전운전 시스템을 구축이 가능하며, 추후 다양한 연구을 통해 이상 운전 상태를 검출하고 조기 경보하는데 활용이 가능할 것이다.

최대 추정 기법과 최소 평균 자승 알고리즘을 이용한 초음파 비파괴검사 신호 분류법 (Classification of Ultrasonic NDE Signals Using the Expectation Maximization (EM) and Least Mean Square (LMS) Algorithms)

  • 김대원
    • 비파괴검사학회지
    • /
    • 제25권1호
    • /
    • pp.27-35
    • /
    • 2005
  • 초음파 검사 방법은 여러 가지 물질들의 흠집이나 틈새, 티끌 등을 감지해내는데 널리 쓰이고 있다. 그 중 초음파 신호를 분석하는 절차는 전체의 신호처리 과정에서 아주 중요한 역할을 담당하고 있다. 이 논문은 최소평균 제곱 (LMS) 알고리즘을 이용하여 핵 전력 발전소에서 쓰이는 증기 발생기 튜브로부터 감지된 초음파 비파괴검사 신호를 분류 해내는 것에 관한 것이다. 이 초음파 신호는 튜브내의 흠집이나 틈새로부터 감지된 신호일수도 있고 또는 튜브 내의 침전물에 의해서 발생된 신호일 수도 있는데 이 두 가지 신호는 매우 유사하기 때문에 반드시 분류를 해내어 침전물에 의한 신호일 경우는 무방하지만 흠집이나 갈라진 틈새에서 나오는 신호일 경우는 더 이상의 오염이나 사고 등을 방지하기 위해 수리 또는 교체 등의 후속 조치로 이어져야 한다. 이러한 절차를 밟기 위하여 증기 발생기 튜브의 내부에서의 초음파 센서로부터 증기 발생기 튜브 사이의 거리를 측정하는데 모델링 기법에 기반한 deconvolution 방법이 제시되었으며 이 방법은 space alternating generalized expectation maximization (SAGE) 알고리즘을 이차원 미분 파라미터인 Hessian의 사용으로 인하여 수렴 속도가 빠른 Newton-Raphson 알고리즘과 함께 병행 사용하여 초음파 신호의 초점 도달 시간과 그 크기를 측정하여 초점 도달 거리에 따라 두 종류의 신호를 분류, 차별화 하는 기법이다. 이 알고리즘을 이용하여 흠집이나 틈새로부터 나온 신호일 경우와 퇴적물에 의해 나온 신호일 경우로 분류되었고 그 결과가 이 논문에 제시되었다.