• 제목/요약/키워드: EM 알고리즘

검색결과 236건 처리시간 0.029초

정규 혼합분포를 이용한 준지도 학습 (Semi-Supervised Learning by Gaussian Mixtures)

  • 최병정;채윤석;최우영;박창이;구자용
    • 응용통계연구
    • /
    • 제21권5호
    • /
    • pp.825-833
    • /
    • 2008
  • 혼합모형을 이용한 판별분석은 다중 분류문제를 해결하는데 유용한 방법으로서 준지도 학습으로 확장될 수 있다. 본 논문에서는 정규 혼합분포를 이용한 준지도 학습 방법에서 혼합 모형의 하위 구성요소 개수 선택 기준을 연구하고자 한다. 하위 구성요소 선택 기준으로서 베이지안 정보량을 사용하였고 모의실험을 통해 이 방법의 유용성을 규명하였다.

군집 최적화를 이용한 열화 진단 알고리즘 개발 (The Algorithm Development of Aging Diagnosis Using Swarm Optimization)

  • 김기준
    • 한국전기전자재료학회논문지
    • /
    • 제26권2호
    • /
    • pp.151-157
    • /
    • 2013
  • In this paper, properties of pattern using LBG (Linde-Buzo-Gray) Algorithm was explored including the exactness of K-means algorithm and process time of EM (Expectation Maximization) algorithm in order to develop analysis algorithm of partial discharge pattern in a cable using acoustic data analysis system. Partial discharge was measured by generating inner fault due to lamination of XLPE which is used for cable insulation material. Discharge pattern was analysed by changing the number of swarm article to 2, 4, and 6 in order to interpret swarm structure and properties.

PCA 혼합 모형을 위한 효율적인 구조 선택 방법 (An Efficient Model Selection Method for a PCA Mixture Model)

  • 김현철;김대진;방승양
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.538-540
    • /
    • 2001
  • PCA는 다변수 데이터 해석법 중 가장 널리 알려진 방법 중 하나로 많은 응용을 가지고 있다. 그런데, PCA는 선형 모델이어서 비선형 구조를 분석하는데 효과적이지 않다. 이를 극복하기 위해서 PCA의 조합을 이용하는 PCA 혼합 모형이 제안되었다. PCA 혼합 모형의 핵심은 구조 선택, 즉 mixture 요소의 수와 PCA 기저의 수의 결정 인데 그의 체계적인 결정 방법이 필요하다. 본 논문에서는 단순화된 PCA 혼합 모형과 이를 위한 효율적인 구조 선택 방법을 제안한다. 각각의 mixture 요소 수에 대해서 모든 PCA 기저를 갖도록 한 상태에서 PCA 혼합 모형의 파라미터를 EM 알고리즘을 써서 결정한다. 최적의 mixture 요소의 수는 오류를 최소로 하는 것으로 결정한다. PCA 기저의 수는 PCA의 정렬성 특성을 이용해서 중요도가 적은 기저부터 하나씩 잘라 내며 오류가 최소로 하는 것으로 결정한다. 제안된 방법은 특히 다차원 데이터의 경우에 EM 학습의 횟수를 많이 줄인다. 인공 데이터에 대한 실험은 제안된 방법이 적절한 모델 구조를 결정한다는 것을 보여준다. 또, 눈 감지에 대한 실험은 제안된 방법이 실용적으로도 유용하다는 것을 보여준다.

  • PDF

자기조직화 신경망을 이용한 정규혼합분포의 추정 (A Self-Organizing Network for Normal Mixtures)

  • 안성만;김명균
    • Communications for Statistical Applications and Methods
    • /
    • 제18권6호
    • /
    • pp.837-849
    • /
    • 2011
  • 본 연구에서는 자기조직화 신경망이 필요한 노드만을 가지고 최적화하여 정규혼합분포를 추정하는 모형을 제안한다. 제안한 모형은 SOMN모형과 벌점가능도를 사용한 모형을 결합한 것이다. SOMN의 장점은 수렴속도가 빠르고 표본의 크기가 작아도 발산하는 가능성이 낮다는 것이며, 벌점가능도를 사용한 모형은 필요없는 성분의 수를 줄일 수 있다는 것이다. 모의실험을 통하여 제안한 모형이 기대한 결과를 얻음을 확인하였다.

EM 알고리즘을 이용한 전문용어의 자동 추출 (Automatic Term Recognition Through EM Algorithm)

  • 오종훈;김재호;최기선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.487-489
    • /
    • 2003
  • 전문용어란 전문분야의 개념이 언어적으로 표현된 형태이다. 전문분야마다 분야 특성 적인 개념이 사용되므로, 전문용어는 전문분야를 특성화하는 단위로 사용된다. 따라서 전문분야문서에 대한 자연언어처리에서 전문용어를 효과적으로 처리하는 것은 매우 중요하다. 전문용어 추출은 분야 특성적인 전문용어를 해당 분야 문서에서 파악하는 작업을 말한다. 본 논문에서는 기계학습방법을 이용한 전문용어 자동 추출 기법을 제안한다. 본 논문의 기법은 전문분야 사전과 전문분야 문서를 이용하여 문서에서 나타나는 전문용어의 특성을 파악하고 이를 이용하여 전문용어를 추출한다. 본 논문의 기법은 70,000단어 수준의 영어 의학분야 300개 문서에 대하여 약 77%의 정확률로 전문용어를 추출하였다.

  • PDF

불충분한 주기적 프리픽스를 갖는 STBC/SFBC OFDM 시스템을 위한 잔재 ISI 제거 기법 및 EM 기반 채널 추정 기법 (Residual ISI cancellation and EM-based channel estimation for STBC/SFBC OFDM with insufficient cyclic prefix)

  • 원희철
    • 한국통신학회논문지
    • /
    • 제32권11A호
    • /
    • pp.1154-1163
    • /
    • 2007
  • OFDM 시스템은 채널 충격 응답보다 긴 길이의 주기적 프리픽스를 사용해야 하므로 주파수 효율이 감소된다. 주기적 프리픽스 사용에 따른 주파수 효율 감소를 막기 위하여 잔재 ISI 제거 기법이 최근에 개발되었다. 본 논문에서는 잔재 ISI 제거 기법을 불충분한 주기적 프리픽스를 갖는 시공간 블록 부호 (STBC) OFDM과 주파수 공간 블록 부호 (SFBC) OFDM 시스템에 적용한다. SFBC OFDM과 달리, STBC OFDM에서는 잔재 ISI 제거 기법의 주기성 복원 과정 뿐만 아니라 꼬리 제거 과정도 반복되어야 함을 확인할 수 있다. 또한, 불충분한 주기적 프리픽스를 사용하는 STBC OFDM 시스템에서의 잔재 ISI 제거 기법을 위한 채널 추정 방법을 제안한다. 제안된 채널 추정 방법은 EM 알고리즘을 이용한 반복적 추정을 특징으로 하고, 잔재 ISI가 제거된 신호를 통해 얻어지는 채널 디코더의 외부 확률 값을 활용한다. 제안된 방법의 성능은 다중 경로 페이딩 환경에서 컴퓨터 시뮬레이션을 통해 확인한다.

해조류 속도 오차 추정을 통한 속도보정항법 알고리즘 (Velocity Aided Navigation Algorithm to Estimate Current Velocity Error)

  • 최윤혁
    • 한국항행학회논문지
    • /
    • 제23권3호
    • /
    • pp.245-250
    • /
    • 2019
  • 관성항법장치는 시간 경과에 따라 관성센서 및 초기정렬 오차로 인해 항법 오차가 발생한다. 이를 보상하기 위한 방법으로 위성항법시스템 및 속도계 등을 이용하여 보정항법을 수행한다. 수중 환경에서는 GNSS 신호가 통하지 않기 때문에, 수중운동체에 탑재한 관성항법장치는 주로 속도계 보조센서를 이용하여 보정항법을 수행한다. 속도계 보조센서는 DVL, EM-Log, RPM이 있으며, 시스템 환경에 따라서 센서 종류가 적용된다. 본 논문은 고속 및 심해 환경에서 운용되는 관성항법장치의 RPM 속도보정항법을 설계하였다. 또한 직진 방향의 성분을 갖는 RPM 속도계의 한계를 보완하며, 해조류 속도 오차를 보상하는 알고리즘을 제안하였다. 제안한 알고리즘은 몬테카를로 시뮬레이션 결과를 통해 성능을 입증하였다.

머신러닝 알고리즘 분석 및 비교를 통한 Big-5 기반 성격 분석 연구 (A Study on Big-5 based Personality Analysis through Analysis and Comparison of Machine Learning Algorithm)

  • 김용준
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권4호
    • /
    • pp.169-174
    • /
    • 2019
  • 본 연구에서는 설문지를 이용한 데이터 수집과 데이터 마이닝에서 클러스터링 기법으로 군집하여 지도학습을 이용하여 유사성을 판단하고, 성격들의 상관 관계의 적합성을 분석하기 위해 특징 추출 알고리즘들과 지도학습을 이용하는 것을 목표로 진행한다. 연구 수행은 설문조사를 진행 후 그 설문조사를 토대로 모인 데이터들을 정제하고, 오픈 소스 기반의 데이터 마이닝 도구인 WEKA의 클러스터링 기법들을 통해 데이터 세트를 분류하고 지도학습을 이용하여 유사성을 판단한다. 그리고 특징 추출 알고리즘들과 지도학습을 이용하여 성격에 대해 적합한 결과가 나오는지에 대한 적합성을 판단한다. 그 결과 유사성 판단에 가장 정확도 높게 도움을 주는 것은 EM 클러스터링으로 3개의 분류하고 Naïve Bayes 지도학습을 시킨 것이 가장 높은 유사성 분류 결과를 도출하였고, 적합성을 판단하는데 도움이 되도록 특징추출과 지도학습을 수행하였을 때, Big-5 각 성격마다 문항에 추가되고 삭제되는 것에 따라 정확도가 변하는 모습을 찾게 되었고, 각 성격 마다 차이에 대한 분석을 완료하였다.

혼합분포모형의 매개변수 추정방법 비교 (Comparison of Three Parameter Estimation Methods for Mixture Distributions)

  • 신주영;김수영;김태림;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.45-45
    • /
    • 2017
  • 상이한 자연현상으로 발생된 자료들은 때때로 통계적으로 다른 특성을 가지는 경우가 있다. 이런 자료들은 다른 두 개 이상의 모집단에서 자료가 발생한 것으로 가정할 수 가 있다. 기존에 널리 사용되어온 분포형 모형의 경우 단일한 모집단으로부터 자료가 발생한다는 가정하에서 개발된 모형들로 위에서 언급한 자료들을 적절히 모의할 수 없다. 이런 상이한 모집단에서 발생된 자료를 모형화 하기 위해서 혼합분포모형(mixture distribution)이 개발되었다. 홍수나 가뭄 등과 같은 극치 사상의 경우 다양한 자연현상들로부터 발생하기에 혼합분포모형을 적용할 경우 보다 정확한 모의가 가능하다. 혼합분포모형은 두 개 이상의 비혼합분포모형들을 가중합하여 만들어진다. 혼합 분포모형의 형태로 인하여 기존의 분포형 모형의 매개변수 추정 모형으로 널리 사용되던 최우도법 (maximum likelihood method), 모멘트법(method of moment), 확률가중모멘트법 (probability weighted moment method) 등을 이용하여 혼합분포모형의 매개변수를 추정하는 것이 용이 하지 않다. 혼합분포모형의 매개변수 추정 방법으로는 Expectation-Maximization (EM) 알고리즘, Meta-Heuristic Maximum Likelihood (MHML) 방법, Markov Chain Monte Carlo (MCMC) 방법 등이 적용되고 있다. 현재까지 수자원 분야에서 사용되는 극치 자료를 혼합분포모형을 이용하여 모의할 때 매개변수 추정방법에 따른 특성에 대한 연구가 진행되지 않았다. 본 연구에서는 우리나라 연최대강우량 자료를 이용하여 혼합분포모형의 매개변수 추정방법 (EM 알고리즘, MHML 방법, MCMC 방법) 들의 특성들을 비교 분석하였다. 혼합분포모형으로는 Gumbel-Gumbel 혼합분포 모형을 적용하였다. 본 연구의 결과는 향후 혼합분포모형을 이용한 연구에 좋은 기초자료로 사용될 수 있을 것으로 판단된다.

  • PDF

개 심장사상충을 진단하기 위한 중합연쇄반응검사 (PCR)의 진단적 특성 평가 (Evaluation of Diagnostic Performance of a Polymerase Chain Reaction for Detection of Canine Dirofilaria immitis)

  • 박선일;김두
    • 한국임상수의학회지
    • /
    • 제24권2호
    • /
    • pp.77-81
    • /
    • 2007
  • 본 연구는 개에서 심장사상충을 검출하기 위하여 표준검사를 적용하지 않은 상황에서 중합연쇄반응검사 (PCR)의 진단 능력을 평가하였다. 효소면역검사법 (ELISA)과 PCR 검사를 동시에 사용한 경우 PCR 검사의 민감도와 특이도는 두 검사의 조건부 독립을 가정한 상태에서expectation-maximization (EM) 알고리즘을 이용한 최대우도법과 Bayesian 기법으로 두 집단 검사 모형으로 분석하였다 2002-2004년 기간 중 심장사상충검사 결과를 기록한 의무기록에서 무작위로 266개 결과를 추출하여 133개씩 2회의 시험으로 배치하였다. 2회의 분석결과를 종합할 때 EM 알고리즘에서 PCR 검사의 민감도와 특이도는 각각 96.4-96.7%와 97.6-98.8%, Bayesian기법에서는 94.4-94.8h와 97.1-98%로 추정되었다. PCR 검사는 심장사상충을 스크리닝하는 도구로 유용하며, 표준검사를 적용하지 않은 상황에서 진단검사의 특성을 추론하는 방법으로 Bayesian 기법은 매우 유용함을 확인하였다.