• Title/Summary/Keyword: 혼합정규분포

검색결과 82건 처리시간 0.03초

AROC 곡선과 최적분류점 (AROC Curve and Optimal Threshold)

  • 홍종선;이희정
    • 응용통계연구
    • /
    • 제24권1호
    • /
    • pp.185-191
    • /
    • 2011
  • 혼합분포를 가정한 신용평가 연구에서 ROC 곡선은 부도와 정상 차주의 판별력을 탐색하는데 유용한 그림이다. ROC 곡선을 개선하여 스코어를 파악할 수 있는 AROC 곡선을 수리적으로 분석하고, 정규분포를 적용하여 다양한 곡선의 형태를 파악한다. 최적분류점을 발견하는 다양한 분류정확도 통계량과 AROC 곡선의 관계를 발견하고, 두 분포의 분산이 동일한 경우에 AROC 곡선의 극소점으로 최적의 분류점을 추정할 수 있음을 발견한다.

이중 K-평균 군집화 (Double K-Means Clustering)

  • 허명회
    • 응용통계연구
    • /
    • 제13권2호
    • /
    • pp.343-352
    • /
    • 2000
  • K-평균 군집화(K-means clustering)는 비계층적 군집화 방법이 하나로서 큰 자료에서 개체 군집화에 효율적인 것으로 알려져 있다. 그러나 종종 비교적 균일한 대군집의 일부를 소군집에 떼어주는 오류를 범하기도 한다. 이 연구에서는 그러한 현상을 정확히 인지하고 이에 대한 대책으로서 ‘이중 K-평균 군집화(double K-means clustering)’방법을 제시한다. 또한 실증적 사례에 새 방법론을 적용해보고 토의한다.

  • PDF

유사-가능도 최대화를 통한 가우시안 프로세스 기반 음원분리 (Gaussian Processes for Source Separation: Pseudo-likelihood Maximization)

  • 박선호;최승진
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권7호
    • /
    • pp.417-423
    • /
    • 2008
  • 본 논문에서는 각 음원이 시간적 구조를 가졌을 경우 음원들을 분리해내는 확률적 음원분리 방법을 제안한다. 이를 위해 각 음원의 시간적 구조를 가우시안 프로세스(Gaussian process)로 모델링하고 기존의 음원분리 문제를 유사-가능도 최대화 문제(pseudo-likelihood maximization)로 공식화한다. 본 알고리즘을 통해 얻어진 데이타의 유사-가능도는 정규 분포이며 이는 가우시안 프로세스 회귀방법(Gaussian process regression)을 통해 쉽게 계산이 가능하다. 음원분리의 역혼합 행렬은 경도(gradient) 기반최적화 기법을 통해 데이타의 유사-가능도를 최대화하는 해를 찾음으로써 구해진다. 여러 실험을 통하여 제안 알고리듬이 몇 가지 특정 상황에서 기존의 분리 알고리듬들에 비해 우수한 성능을 보임을 확인 할 수 있다.

Diaphragm Wall에서 굴착깊이-시간-변위에 관한 원심모형실험 (Centriofuge Model Tests on Excavation Depth-Time-Displacement of Unpropped Diaphragm Walls)

  • 이처근;안광국;허열
    • 한국지반공학회논문집
    • /
    • 제16권5호
    • /
    • pp.179-191
    • /
    • 2000
  • 본 연구에서는 화강토 지반상의 자립식 diaphragm wall의 거동을 연구하기 위하여 벽체의 근입깊이비, 지하수위 및 굴착조건(연속 및 단계굴착)을 변화시키면서 원심모형시럼을 수행하였다. 원심모형실험시 지반굴착은 흙과 동일한 밀도로 혼합된 zine chloride 용액이 배수되도록 밸브를 조작하여 실시하였으며, 굴착에 의해 발생되는 지반의 변형괴 벽체의 변위 및 휨모멘트를 시간경과에 따라 측정하였다. 실험결과, 벽체의 근입깊이비가 증가함에 따라 벽체의 휨모멘트는 증가하는 반면, 굴착과정동안 배면측에서의 간극수압 감소속도는 감소하였다. 최종 굴착단계에서 굴착후 시간경과에 따른 침하량은 굴착과정중의 침하?에 비해 5~7% 정도를 나타내었다. 최대표면침하량과 벽체변위를 굴착깊이로 정규화한 결과 최대 침하량은 벽체 변위량의 0.8~1.2배9평균0.91배)사이에 분포하였다. 굴착깊이로 전규화한 벽체변위와 근입깊이와의 관계는 지수함수식으로 제안하였다. 파괴면은 직선적인 형태로 파괴면내의 배면측 지반은 벽체를 향하여 하향의 변위를 일으키면서 벽체의 회전에 의해 파괴되었으며, 퐈괴면의 각도는 66~72.5$^{\circ}$정도로 이론적인 파괴면의 각도보다 크게 평가되었다.

  • PDF

효율적인 통계 계산을 위한 파이썬 numba 라이브러리의 소개 (Introduction to numba library in Python for efficient statistical computing)

  • 조윤상;유동현;손원;박선철
    • 응용통계연구
    • /
    • 제33권6호
    • /
    • pp.665-682
    • /
    • 2020
  • 본 논문은 순수하게 파이썬 언어로 작성된 연산에 대하여 just-in-time (JIT) 컴파일을 적용하여 전체 계산 속도를 향상시킬 수 있는 numba 라이브러리에 대한 사용법과 응용에 대하여 소개한다. 실제 통계 계산 문제에 대한 numba 라이브러리의 적용에 대한 예제로 반복문 사용이 요구되는 통계 계산 문제들 중 순열 검정과 정규 혼합 분포의 모수 추정의 EM 알고리즘을 고려하였으며 순수한 파이썬 구문 및 반복문을 활용한 계산 시간과 numba를 활용한 계산 시간을 비교하여 numba 라이브러리 활용의 효율성을 수치적으로 제시하였다.

수영만에 유입된 담수의 체류시간과 그 계절적 변동 특성 (A Study on the Seasonal Variations of Fresh Water Distribution and Flushing Time in Suyoung Bay)

  • 이병걸;조규대;김동선
    • 수산해양기술연구
    • /
    • 제27권3호
    • /
    • pp.170-177
    • /
    • 1991
  • 수영만으로 유입되는 수영강수에 의한 하구의 물리적인 특성을 밝히기 위하여 1989년 5월부터 1990년 4월까지 월별로 관측된 염분 자료와 Officer(1977)가 제안한 식을 이용하여 담수량 및 그 체류 시간을 계산하였다. 그 결과, 수평적으로는 수영만의 동백섬을 기준으로 수영강과 접하고 있는 만 안쪽으로 저염화가 강하게 나타나고 연직적으로는 강 혼합과 부분 혼합의 특징이 나타났다. 그리고 수영강을 중심으로 광안리 쪽이 해운대쪽보다 높은 담수율을 나타내었다. 그리고 거리에 따른 담수율의 분포 특성을 알아보기 위하여 수영강에서 외해쪽으로 6개 정점에서 각각 계산한 담수율을 각각의 최대치로 나누어 계절별로 정규화한 결과 담수율이 지수함수적으로 감소하였다. 추계에는 정점C3를 기준으로 감소율이 다른 계절에 비해 현저히 떨어졌는데, 이것은 성층에 기인한 것으로 보인다. 그리고 앞에서 구한 담수율을 이용하여 수영강에서 유입되는 담수의 체류시간을 계산한 결과, 약 1.3일인 하계를 제외하고 나머지 계절은 약 10~15일 정도임이 밝혀져 하계가 다른 계절이 비하여 담수의 순환이 빠름을 알 수 있었다.

  • PDF

보조 혼합 샘플링을 이용한 베이지안 로지스틱 회귀모형 : 당뇨병 자료에 적용 및 분류에서의 성능 비교 (Bayesian logit models with auxiliary mixture sampling for analyzing diabetes diagnosis data)

  • 이은희;황범석
    • 응용통계연구
    • /
    • 제35권1호
    • /
    • pp.131-146
    • /
    • 2022
  • 로지스틱 회귀 모형은 다양한 분야에서 범주형 종속 변수를 예측하거나 분류하기 위한 모형으로 많이 사용되고 있다. 로지스틱 회귀 모형에 대한 전통적인 베이지안 추론 기법으로 메트로폴리스-헤이스팅스 알고리즘이 많이 사용되었지만, 수렴의 속도가 느리고 제안 분포에 대한 적절성을 보장하기 어렵다. 따라서, 본 논문에서는 모형에 대한 베이지안 추론 방법으로 Frühwirth-Schnatter와 Frühwirth (2007)에서 제안된 보조 혼합 샘플링(auxiliary mixture sampling) 기법을 사용하였다. 이 방법은 모형의 선형성과 정규성을 만족시키기 위해 두 단계에 거쳐 잠재변수를 도입하며, 결과적으로 깁스 샘플링을 통한 추론을 가능하게 한다. 제안한 모형의 효과를 검증하기 위해 2020년 지역사회 건강조사 당뇨병 자료에 적용하여 메트로폴리스-헤이스팅스를 사용한 모형과 추론 결과를 비교 분석하였다. 또한, 다양한 분류 모형들과 본 논문에서 제안한 모형의 분류 성능을 비교한 결과 제안된 모형이 분류 분석에서도 좋은 성능을 보이는 것을 확인할 수 있었다.

이변량 왜도, 첨도 그리고 표면그림 (Bivariate skewness, kurtosis and surface plot)

  • 홍종선;성재현
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권5호
    • /
    • pp.959-970
    • /
    • 2017
  • 본 연구에서는 두 변수의 상관계수를 반영한 이변량 자료의 왜도와 첨도 통계량을 제안하고, 시각적으로 표현할 수 있는 표면그림을 개발한다. 이변량 왜도 통계량은 이변량 확률표본 자료의 치우침 방향과 정도를 표현하는 실수 한 쌍으로 정의한다. 첨도는 양의 값을 가지며 이변량 정규분포를 기준으로 꼬리 부분의 두터운 정도를 파악할 수 있다. 그리고 표면그림은 분위벡터를 바탕으로 평면에 구현한다. 다양한 형태의 이변량 자료를 생성하여 표면그림을 작성하고 왜도와 첨도를 계산하여 탐색해 본 결과, 왜도와 첨도 값들은 표면그림으로 구현한 이변량 자료의 특징을 잘 반영하는 것을 발견할였다. 그러므로 본 논문에서 제안한 왜도, 첨도 그리고 표면그림은 이변량 분포를 분석하는 기술통계학적 방법으로 활용할 수 있다.

조선작업장의 분진크기에 관한 조사 (A Study on the Size of Oust in Workplaces of a Shipyard)

  • 이충렬;류철인
    • Journal of Preventive Medicine and Public Health
    • /
    • 제31권1호
    • /
    • pp.104-111
    • /
    • 1998
  • 진폐증발생에 관계되는 분진의 크기별 분진농도를 측정하고자 용접공진폐증이 발생된 울산의 모 조선회사에서 용접만 하는 작업장 14개소, 용접 및 그라인더, 절단, 블라스팅, 금속가공 등 혼합 작업장 32개소, 용접을 하지 않는 작업장 25개소 총 71개소를 대상으로 분진크기별로 분진의 채집이 가능한 Anderson 공기시료채집기를 이용하여 분진크기별 분진농도와 분진비율을 조사하였다. 그 결과는 다음과 같다. 1. 각 작업장간의 분진크기별 분진농도는 대수정규 분포를 했으며 각 작업장의 분진의 기하평균치는 각각 $0.877mg/m^3,\;1.346mg/m^3,\;1.145mg/m^3$으로서 통계적으로 서로 차이가 없었으며 $0.43\sim4.7{\mu}m$ 분진농도가 각 작업장별로 각각 $0.395mg/m^3,\;0.491mg/m^3,\;0.364mg/m^3$으로 서로 차이가 없었다. 2. 분진크기별로 전체 분진농도에 대한 비율은 용접만 하는 작업장은 $1.1\sim0.65{\mu}m$ 크기의 분진이 제일 많았고 다음이 $0.43{\mu}m$이하, $11.0{\mu}m$이상, $0.65\sim0.43{\mu}m$ 크기순이었는데 반해 용접과 다른 작업을 동시에 하는 작업장과 용접을 하지 않는 작업장은 $11.0{\mu}m$이상의 분진의 비율이 제일 높고 다음이 $0.43{\mu}m$이하의 분진의 비율이 높았다. 그러나 $0.43\sim4.7{\mu}m$ 크기의 분진 비율은 용접만 하는 작업장은 48.5%, 용접과 다른 작업을 동시에 하는 작업장은 42.4%, 용접을 하지 않는 작업장은 35.6%로 통계적으로 서로 차이가 없었다. 이상의 결과로 보아 조선작업장의 경우 각 작업장에서 폭로되는 분진종류는 서로 다를 수 있으나 분진 크기별 분포와 농도는 작업종류에 관계없이 거의 비슷한 것으로 사료된다.

  • PDF

다중 영역 통계량을 이용한 환경-광 가림 볼륨 가시화 (Ambient Occlusion Volume Rendering using Multi-Range Statistics)

  • 남진현;계희원
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제21권3호
    • /
    • pp.27-35
    • /
    • 2015
  • 본 연구는 전역 조명 기법 중 하나인 환경-광 가림(ambient occlusion)을 이용한 볼륨 렌더링 방법을 설명한다. 볼륨 밀도 분포를 정규 분포로 가정하여, 환경-광 가림을 불투명도 전이함수의 변경과 무관하게 실시간 가시화할 수 있다. 전처리 과정에서 각 복셀 주변의 일정 크기 영역의 평균과 표준편차를 계산하여 두고, 가시화 단계에서 근방의 불투명도를 추정하여 밝기를 계산한다. 이 논문은 본 연구자들의 기존 연구를 발전시켜 이론적 모델을 일반화하고 출력 영상의 화질을 향상시킨다. 구체적으로 다양한 형태의 불투명도 전이함수를 사용할 수 있는 계산 모델을 제안한다. 그리고 영역의 크기를 다양하게 통계량을 생성하여 근처의 물체에 더 높은 가중치를 부여할 수 있도록 하였다. 최종적으로 환경-광 가림 효과와 지역 조명 효과를 혼합하여, 더 현실감 있는 화질의 볼륨 가시화 영상을 실시간으로 생성할 수 있다.