• 제목/요약/키워드: 혼합정규분포

검색결과 82건 처리시간 0.025초

로버스트 베이지안 메타분석 (Robust Bayesian meta analysis)

  • 최성미;김달호;신임희;김호각;김상경
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권3호
    • /
    • pp.459-466
    • /
    • 2011
  • 본 논문은 독립적으로 수행된 연구결과를 합쳐서 일반적인 결론을 도출하는 메타분석을 위한 로버스트 계층적 베이지안 모형을 고려한다. 사전정보가 정규분포를 따른다는 가정 대신 정규분포의 척도혼합을 사용하여 정규분포보다 더 두꺼운 꼬리를 가지는 사전분포를 사용한다. 나아가 개별 분석의 분산이 알려져 있지 않은 경우를 계층적 베이지안 모형에 포함하여 메타분석을 수행하고자 한다. 깁스 표집을 사용하여 추정값을 계산하고, 실제 자료를 사용하여 제안된 방법을 예시한다.

준영속분포 HMM을 이용한 한국어 단어 인식 (Korean Word Recognition Using Semi-continuous Hidden Markov Models)

  • 조병서;이기영;최갑석
    • 한국음향학회지
    • /
    • 제11권6호
    • /
    • pp.46-52
    • /
    • 1992
  • 본 논문에서는 HMM 의 이산분포를 연속분포로 근사시키는 준 연속분포 HMM 에 의한 한국어 단어인식에 관하여 연구하였다. 이 모델의 생성과정에서는 입력벡터의 출력확률을 혼합 다차원 정규분 포로 가정하여 입력벡터의 확률함수와 코드위드의 심볼출력을 선형결합하므로써, 연속분포 모델로 근사 시켰으며, 단어인식과정에서는 생성모델에 의해 이산분포 모델에서 발생되는 양자와 왜곡을 감소시키므 로써 인식률을 향상시켰다. 이 방법을 평가하기 위하여 DDD 지역명을 대상으로 이산분포 HMM과 준연 속분포 HMM 의 비교실험을 수행하였다. 그 결과 준연속분포 HMM 에 의하여 이산분포 HMM 보다 향상된 인식률을 얻을 수 있었다.

  • PDF

정규혼합에서 분류정확도 측도들의 최적기준 (Optimal Criterion of Classification Accuracy Measures for Normal Mixture)

  • 유현상;홍종선
    • Communications for Statistical Applications and Methods
    • /
    • 제18권3호
    • /
    • pp.343-355
    • /
    • 2011
  • 두 분포함수의 혼합모형을 가정한 자료에서 적절한 분류점을 찾고 평가하는 것은 중요한 문제이다. 분류정확도 측도로 많이 사용하는 아홉 종류의 MVD, Youden지수, (0,1)까지 최단기준, 수정된(0,1)까지 최단 기준, SSS, 대칭점, 정확도면적, TA, TR에 대하여 설명하고, 이 측도들의 관계를 발견하면서 정확도 측도들의 조건을 몇 개의 범주로 군집화한다. 정규혼합분포를 가정하여 군집된 측도들에 기반하는 분류점들을 구하고, 그 분류점에 대응하는 제I종 오류율과 제II종 오류율 그리고 두 종류의 오류율합을 구하여 크기를 비교하고 토론하다. 추정된 혼합분포에 대하여 어떤 분류 정확도 측도의 제I종과 II종 오류율 또는 오류율합이 최소인지를 탐색할 수 있으며 자주 인용하는 정확도 측도의 장점과 단점을 파악할 수 있다.

분단위 강우자료를 이용한 공간상관구조 분석 (Analysis of Spatial Correlation Structure Using Minutely Rainfall Data)

  • 박창열;김경준;황정호;전경수;유철상
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2008년도 학술발표회 논문집
    • /
    • pp.790-794
    • /
    • 2008
  • 본 연구에서는 국내 분단위 강우자료(MMR)를 이용하여 시간해상도에 따른 강우의 공간상관구조 특성을 검토하였다. 이러한 특성을 파악하기 위해 이변량 혼합분포를 이용하여 강우를 모형화한 후 정규분포와 대수 정규분포를 고려하여 시간해상도별로 공간상관함수를 유도하고 그 변동특성을 파악하였다. 또한 분단위 강우 자료를 호우 발생 특성별(태풍, 장마, 대류성 강우)로 분류하여 이에 대한 공간상관함수를 각각 유도하였다. 이때 시간해상도를 고려하기 위한 대상 집성시간은 1, 2, 3, 5, 10, 30, 60분이고, 대상지점은 중부지역의 27개 우량관측소 지점을 이용하였다. 그 적용 결과 분단위 강우자료의 경우 무강우 자료의 영향이 상대적으로 매우 크게 나타나는 것을 확인할 수 있었다. 공간상관거리는 적용 분포형, 호우 발생 특성에 따라 차이가 있지만 1분의 경우 약 $9{\sim}15km$, 60분의 경우 약 $21{\sim}53km$인 것으로 파악되었다. 또한 강우의 집성시간이 길어질수록 공간상관특성이 상대적으로 뚜렷하게 나타나고 공간상관거리가 길어짐을 확인하였다. 본 연구의 결과는 분단위 강우자료의 관측소 밀도가 시단위 강우자료 관측소에 비해 상대적으로 매우 적음을 나타내며, 분단위 강우자료를 이용하여 지점빈도해석과 같은 공간적인 특성을 분석할 경우 적절한 개선방안이 제시되어야함을 의미하는 것이기도 하다.

  • PDF

우리나라 연안의 기온과 수온 분포함수 추정 및 비교평가 (Estimation and Comparative Analysis on the Distribution Functions of Air and Water Temperatures in Korean Coastal Seas)

  • 조홍연;정신택
    • 한국해안·해양공학회논문집
    • /
    • 제28권3호
    • /
    • pp.171-176
    • /
    • 2016
  • 기온과 수온의 분포형태는 발생빈도의 양상을 결정하는 기본적이고 필수적인 정보이다. 또한 기후변화에 의한 기온과 수온의 장기변화 양상 파악에 유용하다. 기온과 수온의 전형적인 분포형태는 다수의 첨두(mode)를 가지는 형태로 일반적으로 널리 사용되는 정규분포로 표현하기에는 한계가 있다. 본 연구에서는 Gaussian 혼합함수와 Kernel 분포함수를 보다 기온과 수온의 보다 적합한 분포함수 형태로 제안한다. 제안된 분포함수를 우리나라 연안 기온과 수온자료를 이용하여 추정-평가한 결과, 관측 자료의 분포는 꼬리 영역에서 크게 차이를 보이고 있는 것으로 파악되었다. 높은 수온영역과 낮은 기온 영역에서 꼬리 영역이 길게 나타나고 있다. 또한 본 연구에서 제안한 분포함수 추정 및 비교는 기온과 수온의 상호 변동관계 및 장기적인 변동양상을 파악할 수 있다. 그러나 평균 기온 및 수온 그리고 정규분포 함수 형태로는 이러한 변화 양상의 파악은 크게 제한되고 있다.

겹친라플라스 혼합분포를 통한 첨 다봉형 비대칭 원형자료의 모형화 (Modeling sharply peaked asymmetric multi-modal circular data using wrapped Laplace mixture)

  • 나종화;장영미
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권5호
    • /
    • pp.863-871
    • /
    • 2010
  • 지금까지 원형자료의 적합에 대한 연구는 주로 von Mises, 겹친왜정규 분포를 비롯하여 주로 완만한 봉우리를 가지는 대칭 및 비대칭의 경우에 대해 수행되어 왔다. 본 논문에서는 뾰족한 봉우리를 가지며 정점을 중심으로 비대칭의 경향이 심한 첨봉형의 비대칭 원형자료에 대한 적합을 다루었다. 최근 Jammalamadaka와 Kozubowski (2003)가 소개한 겹친라플라스 분포와 그의 혼합분포를 중심으로 단봉형 및 다봉형의 원형자료에 대한 모형화 과정을 다루었다. 특히 혼합분포의 모수추정을 위해 EM 알고리즘을 사용하였으며, 모의실험을 통해 그 정확도를 확인하였다.

강우공간상관구조의 변동 특성 (On the Variations of Spatial Correlation Structure of Rainfall)

  • 김경준;유철상
    • 한국수자원학회논문집
    • /
    • 제40권12호
    • /
    • pp.943-956
    • /
    • 2007
  • 강우장의 특성을 정량화하는 여러 통계적 특성치 중에 자주 사용되는 공간상관함수(또는 공간상관도)는 강우의 평가나 설계 그리고 강우장을 모형화하는데 중요하게 사용된다. 그러나 강우의 공간상관 구조는 여러 요인에 의해 많은 변동성을 가지고 있다. 이와 같은 강우의 공간상관구조에 대한 변동특성은 유역을 대표하는 공간상관구조를 결정하는데 문제점으로 작용한다. 따라서 본 연구에서는 이변량 혼합분포를 이용하여 강우를 모형화한 후 정규분포와 대수정규분포를 고려하여 월별, 자료의 시간간격별로 공간상관도를 유도하고 그 변동특성을 파악하였다. 대상유역인 금강유역의 28개 강우관측소의 자료를 이용한 결과 다음과 같은 결론을 얻을 수 있었다. (1) 무강우자료에 대한 영향을 고려한 결과, 세 가지의 경우(Case A, B, C) 중에서 Case A(+,+)의 경우가 #0#에 대한 공간상관함수의 왜곡이 최소가 되기 때문에 가장 적절한 경우이다. (2) 일반적으로 사용되는 정규분포보다는 이론적 그리고 실증적으로 더 적절한 대수정규분포를 사용해야 함이 바람직하다. (3) 월별 공간상관함수 중 지수함수적인 감소경향이 가장 뚜렷한 7월의 경우가 유역을 대표하는 공간상관함수로 적절하다. (4) 자료의 시간해상도별 공간상관도는 다르게 유도되기 때문에 각각에 대한 경우를 고려해야 한다.

혼합원형분포를 이용한 지방국도의 시간교통량 추정모형 (Modeling on Daily Traffic Volume of Local State Road Using Circular Mixture Distributions)

  • 나종화;장영미
    • 응용통계연구
    • /
    • 제24권3호
    • /
    • pp.547-557
    • /
    • 2011
  • 본 논문에서는 우리나라 지방국도의 특정지점에서 수집된 교통량 자료를 이용하여 일일 시간교통량 추정모형을 개발하였다. 본 연구의 특징은 일일 24시의 시간변수를 원형변수로 취급하고, 지방부 교통량 자료의 특성상 출퇴근 시간에 교통량이 집중되는 이봉형의 현상을 감안하여 원형분포의 혼합모형을 고려하였다. 또한 시간대별 교통량의 분포가 요일에 따라 유사한 패턴을 가지는 데 착안하여 요일별 모형을 제시하였다. 혼합원형분포의 모수추정에는 EM알고리즘이 사용되었으며, 모형의 성능비교를 위해 가변수 회귀모형과의 비교를 실시하였다. 제시된 요일별 지방국도의 시간교통량 적합모형은 계측기의 손상 등으로 인한 교통량 결측자료의 추정에 효과적으로 사용될 수 있다.

혼합분포함수를 적용한 최심신적설량에 대한 수문통계학적 빈도분석 (Statistical frequency analysis of snow depth using mixed distributions)

  • 박경운;김동욱;신지예;김태웅
    • 한국수자원학회논문집
    • /
    • 제52권12호
    • /
    • pp.1001-1009
    • /
    • 2019
  • 최근 우리나라에서 폭설이 증가하고 있으며, 이로 인한 피해액 또한 증가하고 있다. 우리나라는 전국적으로 폭설로 인한 피해를 줄이기 위해 내설 설계기준 마련 등의 노력을 하고 있으나, 강설 자료의 특성으로 기준 설정에 어려움이 있다. 본 연구에서는 우리나라 남부 지역에 있는 진주, 창원, 합천 지점의 적설량에 대한 수문통계학적 빈도분석을 수행하여 최심신적설량에 대한 설계수문량을 정량적으로 산정하였다. 자료의 특성상 연도별 측정값이 '0'인 경우가 존재하여 기존의 빈도분석 방법을 적용할 경우 매개변수의 추정이 불가능한 상황도 발생한다. 이러한 문제를 해결하기 위하여 혼합분포함수를 이용하였고, 분포모형으로는 대수정규, 일반화 파레토, 일반화 극치, 감마, 검벨, 와이블 분포를 적용하였다. 적용 결과, 단일분포함수를 적용할 때 보다 혼합분포함수를 적용할 때 확률적설심이 더 작게 산정되었으며, 전체적으로 관측값이 간헐적으로 나타나는 지점에서 혼합분포함수의 적용성이 우수한 것으로 판단된다.

구조선의 도착시간 산출을 위한 실험 데이터 구축 (Construction of experimental data to calculate the arrival time of the rescue ship)

  • 정재용;정초영
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제41권1호
    • /
    • pp.111-117
    • /
    • 2017
  • 조난 사고 발생 시 구조선의 현장 도착시간은 매우 중요하다. 본 연구에서는 구조선의 도착시간을 추정하기 위한 실험 데이터 구축 방법을 제시하였다. 이를 위하여 선박통항확률분포를 활용하였다. 목포항을 연구 대상 해역으로 선정하고, 1년간의 AIS 데이터를 활용하였다. 선박통항확률분포를 조사하기 위해 기준선을 설정하고, 선박의 횡거리 분포를 계산하여, 정규분포와 이중 가우시안 혼합분포로 적합 시킨 후 각 매개변수를 추출하였다. 정규분포의 ${\mu}$, ${\mu}{\pm}1{\sigma}$와 이중 가우시안 혼합분포의 ${\mu}_1$ 위치를 각각 변침점으로 설정하여 위치와 확률을 도출하였다. 이를 매개변수 종류별로 연결하여 시나리오를 구축하여 도착시간을 계산할 수 있었다.