• 제목/요약/키워드: markov models

검색결과 490건 처리시간 0.022초

발달 독성학에서 비대칭 로짓 모형을 사용한 이진수 자료와 연속형 자료에 대한 결합분석 (Joint analysis of binary and continuous data using skewed logit model in developmental toxicity studies)

  • 김영화;황범석
    • 응용통계연구
    • /
    • 제33권2호
    • /
    • pp.123-136
    • /
    • 2020
  • 하나의 개체에서 여러가지 측정치가 동시에 관찰되는 경우는 다양한 연구 분야에서 흔히 나타난다. 발달 독성학 연구에서는 특정 독성 물질의 각기 다른 수준에 노출된 임신한 어미 쥐에 대해 기형인 태아의 존재와 태아의 무게가 동시에 측정된다. 이런 두 변수를 결합하여 모형화하는 것은 각기 독립적인 두 모형으로 분석하는 것보다 더 효율적인 결과를 낸다고 알려져 있다. 대부분의 결합 모형은 정규분포를 랜덤효과로 가정하여 분석한다. 그러나 발달 독성학 연구에서처럼 반응변수들의 분포가 독성 물질이 변함에 따라 불규칙하게 변하는 경우 정규분포의 가정으로는 그 특징을 잡아낼 수 없게 된다. 본 논문에서는 이진수 자료와 연속형 자료에 대해 비대칭 로짓 모형을 사용한 베이지안 결합모형을 제시한다. 본 모형은 비대칭 로짓 모형을 사용함으로써 반응변수의 분포의 형태가 독성 물질의 수준에 따라 대칭/비대칭의 형태를 자유롭게 띨 수 있는 장점을 가지고 있다. 모형의 적합성을 살펴보기 위해 발달 독성학 연구에서 독성 물질 DEHP에 적용하여 그 결과를 확인해본다.

에너지 기반 스테레오 매칭에서의 정합 파라미터 추정에 관한 연구 (A Study on Estimation of Regularizing Parameters for Energy-Based Stereo Matching)

  • 한희일;류대현
    • 한국멀티미디어학회논문지
    • /
    • 제14권2호
    • /
    • pp.288-294
    • /
    • 2011
  • 본 논문에서는 스테레오 이미지 생성 모델을 제시한 다음 이로부터 디스패리티를 구하는 과정을 유도하고 이의 해를 구하는 과정은 에너지 기반 스테레오 정합과 일치함을 수식으로 증명한다. 정합되는 화소 간의 차와 인근 화소에 해당되는 디스패리티의 차는 지수 확률분포에 근사하다는 사실을 실험적으로 확인하고 이에 근거하여 이들의 정합 파라미터를 최적화하는 식을 유도하고 이의 해법을 제시한다. 제안 알고리즘은 초기에 임의의 파라미터로 디스패리티 맵을 구한 후에 이의 통계적 특성을 이용하여 정합 파라미터를 추정하고 추정된 파라미터를 적용하여 디스패리티 맵을 재차 구하는 과정을 반복함으로써 최적의 파라미터에 적응적으로 수렴하도록 조정한다. 제안 알고리즘을 dynamic programming과 belief propagation 기반 스테레오 매칭 알고리즘에 각각 적용하여 구한 정합 파라미터가 수렴하는지를 조사하고 이의 수렴 속도와 성능 개선 효과 등을 확인한다.

화자인식에서 연속밀도 은닉마코프모델의 혼합밀도 결정방법 (Gaussian Density Selection Method of CDHMM in Speaker Recognition)

  • 서창우;이주헌;임재열;이기용
    • 한국음향학회지
    • /
    • 제22권8호
    • /
    • pp.711-716
    • /
    • 2003
  • 본 논문은 연속밀도 은닉마코프모델에서 각 상태별 혼합성분 개수를 결정하는 방법을 제안한다. 지금까지의 대부분의 연구가 연속밀도 은닉마코프모델에서 화자의 스펙트럼 특성에 상관없이 각 상태별 동일한 혼합성분 개수를 적용하였다. 이런 접근방법은 많은 계산량을 요구할 뿐만 아니라, 각 상태의 특성을 무시하고 있기 때문에 각 상태별 음성신호의 정확한 모델링을 할 수 없다. 따라서 본 논문에서 제안한 연속밀도 은닉마코프모델의 파라미터 추정은 각 상태별 혼합성분에 대한 발생 확률값에 따라서 결정하였다. 또한 혼합성분의 개수를 줄이는 과정에서 신호의 상관성을 줄이고 시스템의 전체적인 안정성을 얻기 위해서 주성분 분석을 이용하였다. 제안한 방법은 기존의 은닉마코프모델에 비해서 평균 10% 작은 혼합성분 개수를 이용했을 때를 기준으로 실험하였다. 실험결과에서 혼합성분 결정만을 적용했을 때 거의 비슷한 성능을 얻을 수 있었다. 그리고 주성분 분석을 이용했을 때, 특정벡터가 16 차일 때 평균 0.35%의 성능감소가 일어났지만, 25 차에서는 평균 0.65%의 성능개선을 얻을 수 있었다.

소프트웨어 결함허용 기법에 의한 열차제어시스템 신뢰도 분석 (Reliability Analysis for Train Control System by Software Fault Tolerance Techniques)

  • 서석철;이종우
    • 한국철도학회논문집
    • /
    • 제12권6호
    • /
    • pp.1043-1048
    • /
    • 2009
  • 열차제어시스템의 소프트웨어 발전에 의해 PES가 사용되고 있다. PES는 현재 세계적으로 널리 사용하고 있고, 하드웨어, 펌웨어, 응용 소프트웨어로 구성되어 있다. PES의 실행이 높은 유연성을 가지고 있기 때문에 PES는 많은 응용분야에 쉽게 적용할 수 있다. 많은 안전 필수 기능들은 소프트웨어를 통해 수행되고 있다. 보통 PES는 매우 복잡하여 결함의 근원을 발견하기 쉽지 않다. 그래서 소프트웨어 결함허용 기법을 이용한 신뢰도 해석이 필요하다. 현재 소프트웨어 결함허용 기법에는 복구블록, 분산 복구 블록, N-버전 프로그래밍, N 자기검사 프로그램이 있다. 본 논문에서는 마르코프 모델을 이용하여 소프트웨어 결함허용 기법 중에 복구 블록과 N-버전 프로그래밍의 모델을 제시하였다. 또한 열차제어시스템의 신뢰도를 시간 변화에 따라 분석하였다. 프로그램의 결함 발생률, 수용테스트 결함발생률, 보터의 결함발생률은 고정시켰다. 그래서 시간과 신뢰도 사이의 관계를 Matlab 프로그램을 이용하여서 제시하였다. 같은 수의 대체블록이 있는 경우에 신뢰도 분석결과 복구 블록의 신뢰도는 N-버전 프로그래밍의 신뢰도보다 높게 해석되었다.

랜덤효과를 포함한 영과잉 포아송 회귀모형에 대한 베이지안 추론: 흡연 자료에의 적용 (A Bayesian zero-inflated Poisson regression model with random effects with application to smoking behavior)

  • 김연경;황범석
    • 응용통계연구
    • /
    • 제31권2호
    • /
    • pp.287-301
    • /
    • 2018
  • 0이 과도하게 많이 나타나는 자료는 여러 다양한 분야에서 흔히 볼 수 있다. 이러한 자료들을 분석할 때 대표적으로 영과잉 포아송 모형이 사용된다. 특히 반응변수들 사이에 상관관계가 존재할 때에는 랜덤효과를 영과잉 포아송 모형에 도입해서 분석해야 한다. 이러한 모형은 주로 빈도론자들의 접근방법으로 분석되어왔는데, 최근에는 베이지안 기법을 사용한 분석도 다양하게 발전되어 왔다. 본 논문에서는 반응변수들 사이에 상관관계가 존재하는 경우 랜덤효과가 포함된 영과잉 포아송 회귀모형을 베이지안 추론 방법을 토대로 제안하였다. 이 모형의 적합성을 판단하기 위해 모의 실험을 통해 랜덤효과를 고려하지 않은 모형과 비교 분석하였다. 또한, 실제 지역사회 건강조사 흡연 자료에 직접 응용하여 그 결과를 살펴보았다.

질병지도 작성을 위해 공간모형을 이용한 소지역 추정 (Small area estimations for disease mapping by using spatial model)

  • 안대성;한준희;윤태호;김창훈;노맹석
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권1호
    • /
    • pp.101-109
    • /
    • 2015
  • 행정구역상 읍/면/동 단위의 소지역 (small area)별로 질병위험의 차이에 대한 분석을 위해, 2005년 기준 서울 행정동을 기준으로 2005년부터 2008년까지 질병, 사고, 암 사망자료에 대한 표준화 사망률 (SMR; standardized mortality rate)을 고려하였다. 소지역 단위로 질병사망률을 직접 추정하는 것은 소지역 내 표본수가 작아, 개발 소지역 단위에서의 직접 계산된 SMR은 그 추정치의 정도 (precision) 확보가 어려운 문제점이 발생한다. 따라서, 본 연구에서는 각 소지역간 효과 추정을 위해 공간적 상관성 (spatial correlation)을 가지는 다단계 일반화 선형모형 (HGLM; hierarchical generalized linear models)을 고려하였다. 이를 통해, 서울지역 동별 주요 사망원인에 따른 공변량의 효과 및 추정된 SMR을 근거로 질병지도 결과를 제시하였다.

Support Vector Regression을 이용한 희소 데이터의 전처리 (A Sparse Data Preprocessing Using Support Vector Regression)

  • 전성해;박정은;오경환
    • 한국지능시스템학회논문지
    • /
    • 제14권6호
    • /
    • pp.789-792
    • /
    • 2004
  • 웹 마이닝, 바이오정보학, 통계적 자료 분석 등 여러 분야에서 매우 다양한 형태의 결측치가 발생하여 학습 데이터를 희소하게 만든다. 결측치는 주로 전처리 과정에서 가장 기본적인 평균과 최빈수뿐만 아니라 조건부 평균, 나무 모형, 그리고 마코프체인 몬테칼로 기법과 같은 결측치 대체 기법들을 적용하여 추정된 값에 의해 대체된다. 그런데 주어진 데이터의 결측치 비율이 크게 되면 기존의 결측치 대체 방법들의 예측의 정확도는 낮아지는 특성을 보인다. 또한 데이터의 결측치 비율이 증가할수록 사용 가능한 결측치 대체 방법들의 수는 제한된다. 이러한 문제점을 해결하기 위하여 본 논문에서는 통계적 학습 이론 중에서 Vapnik의 Support Vector Regression을 데이터 전처리 과정에 알맞게 변형하여 적용하였다. 제안 방법을 이용하여 결측치 비율이 큰 희소 데이터의 전처리도 가능할 수 있도록 하였다 UCI machine learning repository로부터 얻어진 데이터를 이용하여 제안 방법의 성능을 확인하였다.

손 제스처 기반의 애완용 로봇 제어 (Hand gesture based a pet robot control)

  • 박세현;김태의;권경수
    • 한국산업정보학회논문지
    • /
    • 제13권4호
    • /
    • pp.145-154
    • /
    • 2008
  • 본 논문에서는 애완용 로봇에 장착된 카메라로부터 획득된 연속 영상에서 사용자의 손 제스처를 인식하여 로봇을 제어하는 시스템을 제안한다. 제안된 시스템은 손 검출, 특징 추출, 제스처 인식 로봇 제어의 4단계로 구성된다. 먼저 카메라로부터 입력된 영상에서 HSI 색상공간에 정의된 피부색 모델과 연결성분 분석을 이용하여 손 영역을 검출한다. 다음은 연속 영상에서 손 영역의 모양과 움직임에 따른 특징을 추출한다. 이때 의미 있는 제스처의 구분을 위해 손의 모양을 고려한다. 그 후에 손의 움직임에 의해 양자화된 심볼들을 입력으로 하는 은닉 마르코프 모델을 이용하여 손 제스처는 인식된다. 마지막으로 인식된 제스처에 대응하는 명령에 따라 애완용 로봇이 동작하게 된다. 애완용 로봇을 제어하기 위한 명령으로 앉아, 일어서, 엎드려, 악수 등의 제스처를 정의하였다. 실험결과로 제안한 시스템을 이용하여 사용자가 제스처로 애완용 로봇을 제어 할 수 있음을 보였다.

  • PDF

Survival Prognostic Factors of Male Breast Cancer in Southern Iran: a LASSO-Cox Regression Approach

  • Shahraki, Hadi Raeisi;Salehi, Alireza;Zare, Najaf
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제16권15호
    • /
    • pp.6773-6777
    • /
    • 2015
  • We used to LASSO-Cox method for determining prognostic factors of male breast cancer survival and showed the superiority of this method compared to Cox proportional hazard model in low sample size setting. In order to identify and estimate exactly the relative hazard of the most important factors effective for the survival duration of male breast cancer, the LASSO-Cox method has been used. Our data includes the information of male breast cancer patients in Fars province, south of Iran, from 1989 to 2008. Cox proportional hazard and LASSO-Cox models were fitted for 20 classified variables. To reduce the impact of missing data, the multiple imputation method was used 20 times through the Markov chain Mont Carlo method and the results were combined with Rubin's rules. In 50 patients, the age at diagnosis was 59.6 (SD=12.8) years with a minimum of 34 and maximum of 84 years and the mean of survival time was 62 months. Three, 5 and 10 year survival were 92%, 77% and 26%, respectively. Using the LASSO-Cox method led to eliminating 8 low effect variables and also decreased the standard error by 2.5 to 7 times. The relative efficiency of LASSO-Cox method compared with the Cox proportional hazard method was calculated as 22.39. The19 years follow of male breast cancer patients show that the age, having a history of alcohol use, nipple discharge, laterality, histological grade and duration of symptoms were the most important variables that have played an effective role in the patient's survival. In such situations, estimating the coefficients by LASSO-Cox method will be more efficient than the Cox's proportional hazard method.

대용량 한국어 연속음성인식 시스템 개발 (On the Development of a Large-Vocabulary Continuous Speech Recognition System for the Korean Language)

  • 최인정;권오욱;박종렬;박용규;김도영;정호영;은종관
    • 한국음향학회지
    • /
    • 제14권5호
    • /
    • pp.44-50
    • /
    • 1995
  • 본 논문에서는 연속분포 HMM을 이용한 대용량 한국어 연속음성인식 시스템에 관하여 기술한다. 인식 시스템의 성능을 개선하기 위하여 음성 모델링 단위의 선정, 단어간 모델링, 탐색 알고리듬, 문법에 관하여 연구하였다. 기본 인식단위로 트라이존을 사용하며 학습성을 개선하고 기능어에서의 에러 발생을 줄이기 위하여 일반화된 트라이폰과 function word-de-pendent phone을 사용한다. 단어 사이에는 묵음 모델과 null transition을 사용하여 선택적으로 묵음을 추가하였다. 언어모델로는 단어 클래스에 근거한 word pair 문법과 bigram 모델이 이용된다. 또한 지식 정보들을 효율적으로 활용할 수 있도록 N개의 후보 문장들을 탐색할 수 있는 알고리듬을 구현하였다. 후처리기에서는 word triple문법을 사용하여 N개의 최적 문장을 재정렬하여 최종적인 인식 문장을 결정하며, 마지막으로 후치사와 관련된 사소한 에러들을 수정한다. 3천단어의 연속음성 데이타베이스에 대한 인식실험에서, 후처리로 word triple 문법을 사용하여 $93.1\%$의 단어 인식률과 $73.8\%$의 문장 인식률을 얻었다.

  • PDF