• 제목/요약/키워드: EM Algorithm

검색결과 377건 처리시간 0.024초

Recommendation of Optimal Treatment Method for Heart Disease using EM Clustering Technique

  • Jung, Yong Gyu;Kim, Hee Wan
    • International Journal of Advanced Culture Technology
    • /
    • 제5권3호
    • /
    • pp.40-45
    • /
    • 2017
  • This data mining technique was used to extract useful information from percutaneous coronary intervention data obtained from the US public data homepage. The experiment was performed by extracting data on the area, frequency of operation, and the number of deaths. It led us to finding of meaningful correlations, patterns, and trends using various algorithms, pattern techniques, and statistical techniques. In this paper, information is obtained through efficient decision tree and cluster analysis in predicting the incidence of percutaneous coronary intervention and mortality. In the cluster analysis, EM algorithm was used to evaluate the suitability of the algorithm for each situation based on performance tests and verification of results. In the cluster analysis, the experimental data were classified using the EM algorithm, and we evaluated which models are more effective in comparing functions. Using data mining technique, it was identified which areas had effective treatment techniques and which areas were vulnerable, and we can predict the frequency and mortality of percutaneous coronary intervention for heart disease.

멀티 레벨 낸드 플래시 메모리용 연판정 복호를 수행하는 이진 ECC 설계를 위한 EM 알고리즘 (EM Algorithm for Designing Soft-Decision Binary Error Correction Codes of MLC NAND Flash Memory)

  • 김성래;신동준
    • 한국통신학회논문지
    • /
    • 제39A권3호
    • /
    • pp.127-139
    • /
    • 2014
  • 멀티 레벨 낸드 플래시 메모리는 한 셀에 2 비트 이상의 정보를 저장하는 구조이고, 비트 위치별 채널 LLR의 밀도 함수 l-밀도가 비대칭 특성을 가지고 있다. 이런 특성은 이진 무기억 대칭 채널 조건에서 설계된 오류 정정부호의 성능이 제대로 발휘되지 못하게 할 뿐만 아니라, 멀티 레벨 낸드 플래시 메모리용 연판정 복호를 수행하는 이진 오류 정정 부호의 설계도 어렵게 한다. 본 논문에서 밀도 미러링과 EM 알고리즘을 이용하여 오류 정정 부호 설계를 위한 차선책을 소개한다. 밀도 미러링은 EM 알고리즘을 적용하기 전에 0 부호어를 전송한 경우로 가정할 수 있도록 하기 위해서 채널 LLR을 처리하는 과정이고, 이후 채널 LLR l-밀도를 EM 알고리즘을 적용하여 K개의 성분으로 이루어진 대칭 가우시안 혼합 밀도로 근사화하는 방법을 소개한다.

암 유전자 배열에서 체세포 돌연변이 발견을 위한 유전자형 조사 시스템 (Genotype-Calling System for Somatic Mutation Discovery in Cancer Genome Sequence)

  • 박수영;정채영
    • 한국정보통신학회논문지
    • /
    • 제17권12호
    • /
    • pp.3009-3015
    • /
    • 2013
  • 차세대 시퀀싱(NGS)은 암에서 전사체 싱글 뉴클레오티드 변형 발견과 모든 지놈 발견을 가능하게 한다. 어느 한 위치에서 배열된 다수의 짧은 리드 시퀀스로부터 개인의 유전자형을 결정하는 가장 기초적인 방법이다. Byesian 알고리즘은 사후 유전자형 확률을 사용하여 파라미터 추정한다. 또 다른 방법인 EM 알고리즘은 최대 가능성 추정 방법을 사용해서 관측된 데이터에서 파라미터를 추정한다. 본 논문에서는 새로운 유전자형 조사 시스템을 제안하고 시퀀싱 에러 비율과 체세포 돌연 변이 상태 그리고 유전자형 확률의 사후 추정치에 관한 샘플 크기(S = 50, 100, 500)의 영향을 비교 분석하였다. 그 결과 작은 샘플 크기 50에서도 Byesian 알고리즘을 사용하여 추정한 파라미터가 EM 알고리즘 보다 더 정확하게 실제 파라미터에 근접하였다.

Reducing Decoding Complexity by Improving Motion Field Using Bicubic and Lanczos Interpolation Techniques in Wyner-Ziv Video Coding

  • Widyantara, I Made O.;Wirawan, Wirawan;Hendrantoro, Gamantyo
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제6권9호
    • /
    • pp.2351-2369
    • /
    • 2012
  • This paper describes interpolation method of motion field in the Wyner-Ziv video coding (WZVC) based on Expectation-Maximization (EM) algorithm. In the EM algorithm, the estimated motion field distribution is calculated on a block-by-block basis. Each pixel in the block shares similar probability distribution, producing an undesired blocking artefact on the pixel-based motion field. The proposed interpolation techniques are Bicubic and Lanczos which successively use 16 and 32 neighborhood probability distributions of block-based motion field for one pixel in k-by-k block on pixel-based motion field. EM-based WZVC codec updates the estimated probability distribution on block-based motion field, and interpolates it to pixel resolution. This is required to generate higher-quality soft side information (SI) such that the decoding algorithm is able to make syndrome estimation more quickly. Our experiments showed that the proposed interpolation methods have the capability to reduce EM-based WZVC decoding complexity with small increment of bit rate.

EM 알고리즘에 의한 퍼지 규칙생성과 온도 제어 시스템의 설계 (A Fuzzy Rule Extraction by EM Algorithm and A Design of Temperature Control System)

  • 오범진;곽근창;유정웅
    • 조명전기설비학회논문지
    • /
    • 제16권5호
    • /
    • pp.104-111
    • /
    • 2002
  • 본 논문에서는 EM(Expectation-Maximization) 알고리즘을 이용한 자동적인 퍼지 규칙생성과 적응 뉴로-퍼지 제어기(Adaptive Neuro-Fuzzy Controller)의 설계를 제안한다. EM 알고리즘은 가우시안 혼합모델(Gaussian Mixture Model)의 최대우도추정(Maximum Likelihood Estimate)을 위해 사용되어지며 본 논문에서는 규칙생성을 위해 클러스터 중심을 추정한다. 추정된 클러스터는 ANFIS(Adaptive Neuro-Fuzzy Inference System)의 퍼지 규칙과 소속함수를 구축하는데 사용되어진다. 시뮬레이션으로 제안된 적응 뉴로-퍼지 제어기의 성능을 입증하기 위해 목욕물 온도 제어 시스템에 대해 다루고 기존 퍼지 제어기에 비해 적은 규칙의 수와 작은 값의 SAE(Sum of Absolute Error)으로 성능개선을 확인하였다.

EM 알고리즘에 의한 다변량 치우친 정규분포 혼합모형의 근사적 적합 (An approximate fitting for mixture of multivariate skew normal distribution via EM algorithm)

  • 김승구
    • 응용통계연구
    • /
    • 제29권3호
    • /
    • pp.513-523
    • /
    • 2016
  • 다중 치우침 모수벡터를 가진 다변량 치우친 정규분포 (MSNMix)를 EM 알고리즘으로 적합하려면 E-step에서 다변량 절단 정규분포의 적률과 확률을 계산해야 하는데 이것은 매우 큰 계산 시간을 요구한다. 그래서 비대칭 자료를 적합하는데 흔히 단순 치우침 모수를 가진 모형을 적용한다. 이 모형은 단변량 처리방식으로 적합하는 것이 가능하기 때문에 처리속도가 매우 빠르다. 그러나 단순 치우침 모수를 적용하는 것은 응용에서 비현실적인 경우가 많다. 본 논문에서는 다중 치우침 모수를 가지는 MSNMix의 근사적 추정법을 제안하는데, 이 방법은 단변량 처리방식이 적용되므로 향상된 처리속도를 보장한다. 그리고 제안된 방법의 실효성을 보이기 위해 몇 가지 실험 결과를 제공한다.

색조영상에서 랜덤결측화소값 대체를 위한 EM 알고리즘 기반 기법 (An EM Algorithm-Based Approach for Imputation of Pixel Values in Color Image)

  • 김승구
    • 응용통계연구
    • /
    • 제23권2호
    • /
    • pp.305-315
    • /
    • 2010
  • 본 논문에서는 색조영상의 R-, G-, B-성분에서 랜덤결측된 화소값들의 대체를 위한 프리퀀티스틱(frequentictic) 기법을 제공한다. 이 기법은 관측영상을 가우시안 마코프 랜덤필드 상의 실현치로서 가정하고, 주어진 화소 내의 근방 화소들이 에지 강도에 따른 서로 다른 분산을 가지는 정규분포를 따른다고 설계함으로써 에지에서 결측화소 대체값이 이질적 색상에 영향 받지 않도록 한다. 이러한 모형하에서 우도가 최대화하도록 결측화소값들을 근사 EM 알고리즘에 기반 한 방법으로 모수들을 추정하고 결측화소를 대체한다. 제안된 방법의 결과들은 보간법에 기초한 대체법과 비교하여 그 유효성을 보인다.

EM 알고리듬을 이용한 단일염기변이 (SNP;SINGLE NUCLEOTIDE POLYMORPHISM)군의 일배체형 (HAPLOTYPE) 비율 추정 (Estimation of Haplotype Proportions in Single Necleotide Polymorphism Group Using EM Algorithm)

  • 김선우;김종원;이경아
    • 응용통계연구
    • /
    • 제16권2호
    • /
    • pp.195-202
    • /
    • 2003
  • 복합성유전질환 연구에 있어서 단일염기변이를 이용한 일배체형 분석은 개별적인 단일염기변이 분석에 비하여 비용 및 효율 면에서 훨씬 유용하며, 생물학적으로도 기능적 중요성을 갖는 것으로 평가되고 있다. 그러나 일반적인 유전형분석방법을 이용한 단일염기변이군 자료는 이배체형(diploid)으로서 위상(phase)을 확인할 수 없으므로 일배체형 비율을 예측하기 어렵다. 본 연구에서는 고형종양 환자군과 정상군의 단일염기변이군 이배체형 자료가 주어졌을 때 단일염기변이군 일배체형 비율의 우도함수에 EM알고리듬을 적용하여 각 일배체형의 비율을 추정하였다. 이로부터 단일염기변이간의 연관불균형(linkage disequilibrium)을 분석하여 고형 종양과 연관 가능성이 있는 단일염기변이를 살펴보았다.

등각원형배열을 고려한 코히어런트 다중신호 방향탐지 기법 연구 (The Study of Direction Finding Algorithms for Coherent Multiple Signals in Uniform Circular Array)

  • 박철순;이호주;장원
    • 한국군사과학기술학회지
    • /
    • 제12권1호
    • /
    • pp.97-105
    • /
    • 2009
  • In this paper, the performance of AP(Alternating Projection) and EM(Expectation Maximization) algorithms is investigated in terms of detection of multiple signals, resolvability of coherent signals and the efficiency of sensor array processing. The basic idea of these algorithms is utilization of relaxation technique of successive 1D maximization to solve a direction finding problem by maximizing the multidimensional likelihood function. It means that the function is maximized over only for a single parameter while the other parameters are fixed at each step of the iteration. According to simulation results, the algorithms showed good performance for both incoherent and coherent multiple signals. Moreover, some advantages are identified for direction finding with very small samples and fast convergence. The performance of AP algorithm is compared with that of EM using multiple criteria such as the number of sensor, SNR, the number of samples, and convergence speed over uniform circular array. It is resulted AP algorithm is superior to EM overally except for one criterion, convergence speed. Especially, for EM algorithm there is no performance difference between incoherent and coherent case. In conclusion, AP and EM are viable and practical alternatives, which can be applied to a direction under due to the resolvability of multi-path signals, reliable performance and no troublesome eigen-decomposition of the sample-covariance matrix.

오류 학습 문서 제거를 통한 문서 범주화 기법의 성능 향상 (A Text Categorization Method Improved by Removing Noisy Training Documents)

  • 한형동;고영중;서정연
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권9호
    • /
    • pp.912-919
    • /
    • 2005
  • 문서 범주화에서 이진 분류를 다중 분류에 적용할 때 일반적으로 '한 범주에 적합-다른 모든 범주에서는 부적합(One-Against-All) 판정 방법'을 사용한다. 하지만, 이러한 '한 범주에 적합-다른 모든 범주에서는 부적합 판정 방법'은 한 가지 문제점을 가지는데, 적합(positive) 집합의 문서들은 사람이 직접범주를 할당한 것이지만 부적합(negative) 집합의 문서들은 사람이 직접 범주를 할당한 것이 아니기 때문에 오류 문서들이 많이 포함될 수 있다는 것이다. 본 논문에서는 이러한 문제점을 해결하기 위해서 슬라이딩 원도우(sliding window) 기법과 EM 알고리즘을 이진 분류 기반의 문서 범주화에 적용할 것을 제안한다. 제안된 기법은 먼저 슬라이딩 윈도우 기법을 사용하여 오류 문서들을 추출하고 이들을 EM알고리즘을 사용해서 다시 범주를 할당함으로써 이진 분류 기반의 문서 범주화 기법의 성능을 향상시킨다.