• 제목/요약/키워드: 정규혼합

검색결과 233건 처리시간 0.031초

혼합정규분포의 모수 추정에서 구간도수 EM 알고리즘의 실행 속도 개선 (Speedup of EM Algorithm by Binning Data for Normal Mixtures)

  • 오창혁
    • Communications for Statistical Applications and Methods
    • /
    • 제15권1호
    • /
    • pp.1-11
    • /
    • 2008
  • 혼합정규분포로부터 얻은 자료의 크기가 크면 EM 알고리즘으로 모수를 추정하는 경우 추정에 많은 시간이 걸리며 이는 실시간 음성인식 분야등에서는 적용이 어렵게 되는 문제가 발생한다. 대용량 자료를 구간도수로 요약하여 구간도수 EM 알고리즘을 적용하면 표준 EM 알고리즘에 비해 실행속도가 획기적으로 개선되며 더욱이 구간도수 EM 알고리즘에서의 추정치의 효율성이 표준 EM 알고리즘에 근접함을 시뮬레이션 실험을 통하여 보였다.

자기조직화 신경망을 이용한 정규혼합분포의 추정 (A Self-Organizing Network for Normal Mixtures)

  • 안성만;김명균
    • Communications for Statistical Applications and Methods
    • /
    • 제18권6호
    • /
    • pp.837-849
    • /
    • 2011
  • 본 연구에서는 자기조직화 신경망이 필요한 노드만을 가지고 최적화하여 정규혼합분포를 추정하는 모형을 제안한다. 제안한 모형은 SOMN모형과 벌점가능도를 사용한 모형을 결합한 것이다. SOMN의 장점은 수렴속도가 빠르고 표본의 크기가 작아도 발산하는 가능성이 낮다는 것이며, 벌점가능도를 사용한 모형은 필요없는 성분의 수를 줄일 수 있다는 것이다. 모의실험을 통하여 제안한 모형이 기대한 결과를 얻음을 확인하였다.

정규혼합모델을 이용한 수중 천이신호 식별 (Classification of Underwater Transient Signals Using Gaussian Mixture Model)

  • 오상환;배건성
    • 한국정보통신학회논문지
    • /
    • 제16권9호
    • /
    • pp.1870-1877
    • /
    • 2012
  • 천이신호는 지속시간이 짧으면서 길이의 변화가 크고, 시변성 및 비정재성 특성을 갖는다. 이러한 천이신호의 식별에는 분석 프레임 단위로 참조신호에 대한 기준패턴을 만들어 입력신호와의 유사도를 비교하는 방법이 효과적일 수 있다. 본 연구에서는 참조신호의 기준패턴으로 프레임 기반의 특징벡터들에 대해 확률통계 모형인 정규혼합모델을 적용하는 방법을 제안하고, 다양한 수중 천이신호에 대한 식별 실험을 통해 제안한 방법의 타당성을 검증하였다.

정규혼합분포를 이용한 ROC 분석 (ROC Curve Fitting with Normal Mixtures)

  • 홍종선;이원용
    • 응용통계연구
    • /
    • 제24권2호
    • /
    • pp.269-278
    • /
    • 2011
  • 스코어 변수의 민감도와 특이도와의 관계로 표현한 ROC 곡선을 더욱 정확한 진단을 위하여 분포함수와 공변량을 고려한 연구가 많이 진행되었다. 공변량을 고려하는 회귀분석 방법을 사용하였으며 이때 분포함수를 정규분포로 가정하거나 잔차의 분포함수를 추정하여 ROC 분석을 하였다. 본 연구는 분포함수가 주어지지 않으며 진단에 영향을 주는 공변량을 모르는 일반적인 상황에서 논의하였다. 확률변수인 스코어와 두 개의 보모집단으로 구성된 신용평가 자료에 적합한 분포함수를 추정하기 위하여 여러 개의 정규분포가 혼합된 정규혼합분포를 사용하여 ROC 분석을 한다. 고전적인 비모수적이고 경험적인 ROC 곡선에 적합한지를 파악하기 위하여 AUC 통계량을 사용하여 비교하며, 본 연구에서 제안한 정규혼합분포를 이용한 ROC 곡선이 다른 방법으로 구한 ROC 곡선보다 적합함을 보였다.

정규혼합분포에서 최소오류의 분류정확도 측도 (Classification accuracy measures with minimum error rate for normal mixture)

  • 홍종선;;홍선우;김강천
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권4호
    • /
    • pp.619-630
    • /
    • 2011
  • 본 연구에서는 두 분포함수의 혼합된 자료에서 적절한 분류점을 추정하고 평가하기 위하여 많이 사용하는 아홉 종류의 분류정확도 측도인 MVD, Youden지수, (0,1)까지최단기준, 수정된 (0,1)까지 최단기준, SSS, 대칭점, 정확도면적, TA, TR을 다섯 개의 조건범주로 군집시킨다. 신용평가분석에서 정상과 부도상태의 스코어 확률변수가 정규분포를 따르며 전체부도율로 혼합되었다고 가정한다. 다양한 정규혼합분포의 상황에서 군집된 측도들의 최적분류점을 발견하고, 그 분류점에 대응하는 제I종 오류율과 제II종 오류율 그리고 두 종류의 오류율 합을 구하여 각각의 오류율이 최소인 경우를 탐색적으로 살펴본다. 현실자료에 적합한 정규혼합분포를 추정하여 본 연구 결과를 적용하면 최소 오류율이 보장되는 분류정확도를 선택할 수 있으며, 이를 사용하여 모형의 판별력을 향상시킬 수 있다.

정규혼합에서 분류정확도 측도들의 최적기준 (Optimal Criterion of Classification Accuracy Measures for Normal Mixture)

  • 유현상;홍종선
    • Communications for Statistical Applications and Methods
    • /
    • 제18권3호
    • /
    • pp.343-355
    • /
    • 2011
  • 두 분포함수의 혼합모형을 가정한 자료에서 적절한 분류점을 찾고 평가하는 것은 중요한 문제이다. 분류정확도 측도로 많이 사용하는 아홉 종류의 MVD, Youden지수, (0,1)까지 최단기준, 수정된(0,1)까지 최단 기준, SSS, 대칭점, 정확도면적, TA, TR에 대하여 설명하고, 이 측도들의 관계를 발견하면서 정확도 측도들의 조건을 몇 개의 범주로 군집화한다. 정규혼합분포를 가정하여 군집된 측도들에 기반하는 분류점들을 구하고, 그 분류점에 대응하는 제I종 오류율과 제II종 오류율 그리고 두 종류의 오류율합을 구하여 크기를 비교하고 토론하다. 추정된 혼합분포에 대하여 어떤 분류 정확도 측도의 제I종과 II종 오류율 또는 오류율합이 최소인지를 탐색할 수 있으며 자주 인용하는 정확도 측도의 장점과 단점을 파악할 수 있다.

수익률 분포의 적합과 리스크값 추정 (Distribution fitting for the rate of return and value at risk)

  • 홍종선;권태완
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권2호
    • /
    • pp.219-229
    • /
    • 2010
  • 자산을 운용할 때 다양한 위험요인의 증가로 인해 위험관리에 대한 많은 연구가 진행되어왔으며, 통합적인 위험관리기법의 필요성이 대두됨에 따라 개발된 많은 방법 중의 하나가 리스크값이다. 현재까지 연구된 많은 리스크값의 추정과정에서 중요한 과제는 수익률분포의 비대칭성 및 두꺼운 꼬리와 같은 비정규성과 관련된 문제들을 해결하는 것이다. 대부분의 수익률 분포는 첨도가 매우 큰 양수값을 가지며 약한 음수값의 왜도를 갖는다. 본 연구에서는 실제 금융자산 수익률분포에 여러 종류의 대체분포들을 이용하여 실제의 수익률 분포에 적합한 분포를 선정하여 리스크값를 추정한다. 정규분포를 포함한 대체분포들을 이용하여 추정한 리스크값들이 실제 분포로부터 추정한 리스크값에 얼마나 일치하는지를 비교 연구한다. 다양한 대체분포 중에서 실제 분포에 정규혼합분포가 가장 적합하였으며, 이 정규혼합분포를 이용하여 추정한 리스크값과 다른 대체분포를 이용하여 구한 리스크값보다 정확함을 실증 자료를 통해 보였다.

EM 알고리즘에 의한 다변량 치우친 정규분포 혼합모형의 근사적 적합 (An approximate fitting for mixture of multivariate skew normal distribution via EM algorithm)

  • 김승구
    • 응용통계연구
    • /
    • 제29권3호
    • /
    • pp.513-523
    • /
    • 2016
  • 다중 치우침 모수벡터를 가진 다변량 치우친 정규분포 (MSNMix)를 EM 알고리즘으로 적합하려면 E-step에서 다변량 절단 정규분포의 적률과 확률을 계산해야 하는데 이것은 매우 큰 계산 시간을 요구한다. 그래서 비대칭 자료를 적합하는데 흔히 단순 치우침 모수를 가진 모형을 적용한다. 이 모형은 단변량 처리방식으로 적합하는 것이 가능하기 때문에 처리속도가 매우 빠르다. 그러나 단순 치우침 모수를 적용하는 것은 응용에서 비현실적인 경우가 많다. 본 논문에서는 다중 치우침 모수를 가지는 MSNMix의 근사적 추정법을 제안하는데, 이 방법은 단변량 처리방식이 적용되므로 향상된 처리속도를 보장한다. 그리고 제안된 방법의 실효성을 보이기 위해 몇 가지 실험 결과를 제공한다.

경량기포혼합토의 압축 및 강도특성 연구 (Compressibility and Strength Characteristics of Light-weighted Foam Soil)

  • 윤길림;김병탁
    • 한국지반공학회논문집
    • /
    • 제20권4호
    • /
    • pp.5-13
    • /
    • 2004
  • 본 논문에서는 경량기포혼합토의 압축성과 강도 특성에 대해 실험을 통하여 연구하였다. 경량기포혼합토는 재료의 경량화와 압축강도의 증가를 위해 해양준설토에 시멘트와 기포로 구성되어 있다. 이러한 목적을 위하여 초기 함수비, 시멘트 함유율, 실트질 준설토의 혼합을, 구속압조건 등의 다양한 조건에서 준비된 공시체로 일축압축시험 및 삼축압축시험을 수행하였다. 경량기포혼합토의 실험결과, 응력-변형거동과 압축강도는 준설토의 초기 함수비보다 시멘트 함유율에 더 큰 영향을 받는 것으로 나타났다. 또한, 본 연구에서는 초기 함수비, 시멘트 함유율, 기포 함유율을 고려한 정규화계수를 제시하였으며 경량기포혼합토의 압축강도와 정규화 계수와의 유용한 관계를 얻을 수 있었다.

이분산 상황 하에서 정규혼합모형 기반 군집분석의 변수선택 (Variable Selection in Normal Mixture Model Based Clustering under Heteroscedasticity)

  • 김승구
    • 응용통계연구
    • /
    • 제24권6호
    • /
    • pp.1213-1224
    • /
    • 2011
  • 관측치의 개수보다 변량의 개수가 더 많은 다변수 상황에서 정규혼합모형을 이용하여 군집분석을 하기 위해서는 비정보적인 변수들을 제거하는 과정이 필수적으로 요구된다. 이와 같은 변수선택과 군집의 동시 처리를 위한 기존 연구의 대부분은 군집별 등분산 가정 하에서 이루어져 왔으며, 비정보적인 변수를 제거하기 위해 주로 벌점화 우도 기법이 이용되었다. 본 연구에서는 약간 변형된 정규혼합모형을 기반으로 비현실적인 등분산 가정을 탈피하면서 효율적으로 비정보적인 변수를 제거하는 새로운 방법을 제공한다. 이 모형에 대한 타당성을 설명하였고, 모수 추정을 위한 EM 알고리즘을 유도하였다. 그리고 모의실험 및 실자료 실험을 통해 제안된 방법의 유효성을 보였다.