• 제목/요약/키워드: markov chain

검색결과 886건 처리시간 0.025초

Support Vector Regression을 이용한 희소 데이터의 전처리 (A Sparse Data Preprocessing Using Support Vector Regression)

  • 전성해;박정은;오경환
    • 한국지능시스템학회논문지
    • /
    • 제14권6호
    • /
    • pp.789-792
    • /
    • 2004
  • 웹 마이닝, 바이오정보학, 통계적 자료 분석 등 여러 분야에서 매우 다양한 형태의 결측치가 발생하여 학습 데이터를 희소하게 만든다. 결측치는 주로 전처리 과정에서 가장 기본적인 평균과 최빈수뿐만 아니라 조건부 평균, 나무 모형, 그리고 마코프체인 몬테칼로 기법과 같은 결측치 대체 기법들을 적용하여 추정된 값에 의해 대체된다. 그런데 주어진 데이터의 결측치 비율이 크게 되면 기존의 결측치 대체 방법들의 예측의 정확도는 낮아지는 특성을 보인다. 또한 데이터의 결측치 비율이 증가할수록 사용 가능한 결측치 대체 방법들의 수는 제한된다. 이러한 문제점을 해결하기 위하여 본 논문에서는 통계적 학습 이론 중에서 Vapnik의 Support Vector Regression을 데이터 전처리 과정에 알맞게 변형하여 적용하였다. 제안 방법을 이용하여 결측치 비율이 큰 희소 데이터의 전처리도 가능할 수 있도록 하였다 UCI machine learning repository로부터 얻어진 데이터를 이용하여 제안 방법의 성능을 확인하였다.

Survival Prognostic Factors of Male Breast Cancer in Southern Iran: a LASSO-Cox Regression Approach

  • Shahraki, Hadi Raeisi;Salehi, Alireza;Zare, Najaf
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제16권15호
    • /
    • pp.6773-6777
    • /
    • 2015
  • We used to LASSO-Cox method for determining prognostic factors of male breast cancer survival and showed the superiority of this method compared to Cox proportional hazard model in low sample size setting. In order to identify and estimate exactly the relative hazard of the most important factors effective for the survival duration of male breast cancer, the LASSO-Cox method has been used. Our data includes the information of male breast cancer patients in Fars province, south of Iran, from 1989 to 2008. Cox proportional hazard and LASSO-Cox models were fitted for 20 classified variables. To reduce the impact of missing data, the multiple imputation method was used 20 times through the Markov chain Mont Carlo method and the results were combined with Rubin's rules. In 50 patients, the age at diagnosis was 59.6 (SD=12.8) years with a minimum of 34 and maximum of 84 years and the mean of survival time was 62 months. Three, 5 and 10 year survival were 92%, 77% and 26%, respectively. Using the LASSO-Cox method led to eliminating 8 low effect variables and also decreased the standard error by 2.5 to 7 times. The relative efficiency of LASSO-Cox method compared with the Cox proportional hazard method was calculated as 22.39. The19 years follow of male breast cancer patients show that the age, having a history of alcohol use, nipple discharge, laterality, histological grade and duration of symptoms were the most important variables that have played an effective role in the patient's survival. In such situations, estimating the coefficients by LASSO-Cox method will be more efficient than the Cox's proportional hazard method.

간헐적 수요예측을 위한 부트스트랩 시뮬레이션 방법론 개발 (A New Bootstrap Simulation Method for Intermittent Demand Forecasting)

  • 박진수;김윤배;이하늘;정기선
    • 한국시뮬레이션학회논문지
    • /
    • 제23권3호
    • /
    • pp.19-25
    • /
    • 2014
  • 수요예측은 경영 전략을 포함한 모든 경영 활동의 기초가 된다. 특히 부품의 수요예측은 공급망관리 측면에서 매우 중요한 요소 중 하나이다. 부품의 수요는 다양한 산업에서 종종 간헐적 특성을 포함한다. 간헐적 특성이란 수요가 발생하지 않는 경우가 빈번한 현상을 지칭한다. 간헐적 수요 현상에서는 발생된 수요의 분산이 크고 그 발생간격이 확률적이다. 따라서 간헐적 특성을 갖는 수요를 예측하기 위해서 일반적인 시계열 분석기법이나 인과관계를 이용한 모형(회귀모형)을 사용하는 것은 적합하지 않다. 이는 기존의 방법들이 실제 수요행태를 묘사하기 어렵기 때문이다. 이러한 간헐적 수요의 예측을 위해 마코프 부트스트랩이 개발되었다. 이 방법은 1계차 자기상관성을 반영하며 리드타임 동안 수요의 합이 독립임을 가정하였다. 본 연구에서는 리드타임 내 수요 합의 독립가정을 완화한 부트스트랩 방법을 제안한다. 수정된 부트스트랩 방법에 의해 재추출된 데이터는 실측 데이터의 간헐적 특성을 근사적으로 반영한다. 마지막으로 실측 데이터에 수정된 방법을 적용한 예측 결과를 사례로 제시하고자 한다.

A Receiver-Driven Loss Recovery Mechanism for Video Dissemination over Information-Centric VANET

  • Han, Longzhe;Bao, Xuecai;Wang, Wenfeng;Feng, Xiangsheng;Liu, Zuhan;Tan, Wenqun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권7호
    • /
    • pp.3465-3479
    • /
    • 2017
  • Information-Centric Vehicular Ad Hoc Network (IC-VANET) is a promising network architecture for the future intelligent transport system. Video streaming applications over IC-VANET not only enrich infotainment services, but also provide the drivers and pedestrians real-time visual information to make proper decisions. However, due to the characteristics of wireless link and frequent change of the network topology, the packet loss seriously affects the quality of video streaming applications. In this paper, we propose a REceiver-Driven loss reCOvery Mechanism (REDCOM) to enhance video dissemination over IC-VANET. A Markov chain based estimation model is introduced to capture the real-time network condition. Based on the estimation result, the proposed REDCOM recovers the lost packets by requesting additional forward error correction packets. The REDCOM follows the receiver-driven model of IC-VANET and does not require the infrastructure support to efficiently overcome packet losses. Experimental results demonstrate that the proposed REDCOM improves video quality under various network conditions.

영 과잉 포아송 모형에 대한 베이지안 방법 연구 (Bayesian Approaches to Zero Inflated Poisson Model)

  • 이지호;최태련;우윤성
    • 응용통계연구
    • /
    • 제24권4호
    • /
    • pp.677-693
    • /
    • 2011
  • 본 논문에서는 영 과잉 계수형 자료 분석을 위한 모형중의 하나인 영 과잉 포아송 모형의 베이지안 접근 방법에 대해서 연구한다. 구체적으로는 베이지안 영 과잉 포아송 모형의 적합을 위한 사후 표본을 추출하는데 있어서, 깁스 표집기(Gibbs sampler)를 이용하는 마르코프 연쇄 몬테칼로(MCMC) 방법과 역 베이즈공식(IBF)에 의한 표본추출 방법 두 가지를 고려한다. 이러한 두 가지 사후 표본 추출방법을 비교 설명하고, IBF를 통한 사후표본을 깁스 표집기 사후표본의 수렴성 여부를 확인하는 방식에 대해서도 소개한다. 이를 바탕으로 베이지안 영 과잉 포아송 모형을 Trajan이라는 사과 품종의 발아자료(Trajan data, Marin 등, 1993)에 적용하고 모수에 대한 사후추론을 실시하고 기존의 결과와 비교한다. 또한 주어진 자료에 대하여 영 과잉 포아송 모형이 적합한지에 대한 여부를 여러 가지 모형선택 기준을 통해서 살펴보고, 아울러 기존의 자료 분석 결과 (Rodrigues, 2003)를 보완하기 위하여 계층적 베이지안 모형과 같은 대안에 대해서도 논의해본다.

Bayesian Method for Modeling Male Breast Cancer Survival Data

  • Khan, Hafiz Mohammad Rafiqullah;Saxena, Anshul;Rana, Sagar;Ahmed, Nasar Uddin
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제15권2호
    • /
    • pp.663-669
    • /
    • 2014
  • Background: With recent progress in health science administration, a huge amount of data has been collected from thousands of subjects. Statistical and computational techniques are very necessary to understand such data and to make valid scientific conclusions. The purpose of this paper was to develop a statistical probability model and to predict future survival times for male breast cancer patients who were diagnosed in the USA during 1973-2009. Materials and Methods: A random sample of 500 male patients was selected from the Surveillance Epidemiology and End Results (SEER) database. The survival times for the male patients were used to derive the statistical probability model. To measure the goodness of fit tests, the model building criterions: Akaike Information Criteria (AIC), Bayesian Information Criteria (BIC), and Deviance Information Criteria (DIC) were employed. A novel Bayesian method was used to derive the posterior density function for the parameters and the predictive inference for future survival times from the exponentiated Weibull model, assuming that the observed breast cancer survival data follow such type of model. The Markov chain Monte Carlo method was used to determine the inference for the parameters. Results: The summary results of certain demographic and socio-economic variables are reported. It was found that the exponentiated Weibull model fits the male survival data. Statistical inferences of the posterior parameters are presented. Mean predictive survival times, 95% predictive intervals, predictive skewness and kurtosis were obtained. Conclusions: The findings will hopefully be useful in treatment planning, healthcare resource allocation, and may motivate future research on breast cancer related survival issues.

WiBro에서 마코프 체인을 이용한 성능분석 (Performance Analysis using Markov chain in WiBro)

  • 박원길;김형진
    • 한국산학기술학회논문지
    • /
    • 제11권1호
    • /
    • pp.190-197
    • /
    • 2010
  • WiBro의 ACR(Access Control Router)은 ACR간을 움직일 때만 홈 에이전트와 상대 노드에게 위치등록을 하므로, 위치등록비용은 MIPv6에 비해 적지만, 이동 노드의 송수신되는 모든 패킷들은 ACR을 통해 전달되기 때문에 ACR이 관리하는 이동노드의 수가 많아지면 ACR의 패킷처리비용은 증가한다. 따라서 ACR도메인 내에 있는 이동 노드들을 관리하는 ACR이 잘 작동한다면 ACR도메인 내의 통신상태는 원활하다. 그러나 ACR이 잘 작동하지 않으면 네트워크의 delay가 발생하므로 ACR의 역할은 중요하다. 본 논문에서는 WiBro의 효율적인 작동을 위해 ACR의 성능을 측정한다. 이를 위해, 성능평가 요소로서 이동노드의 거부확률(deny probability)와 ACR 성능의 총이익을 사용한다. 그리고 이동모델로서 랜덤워크 모델을 이용한다.

MMR 시스템을 위한 적응적인 RS 커버리지 확장 기법의 성능 분석 (Performance Analysis of Adaptive RS Coverage Extension Scheme for the MMR systems)

  • 김승연;김세진;이형우;류승완;조충호
    • 한국통신학회논문지
    • /
    • 제35권4B호
    • /
    • pp.584-591
    • /
    • 2010
  • 본 논문에서는 Mobile Multi-hop Relay (MMR) 시스템을 위한 적응적인 Relay Station (RS) 커버리지 확장기법을 제안한다. 넌-트랜스패런트 모드 (non-transparent mode) RS를 갖는 MMR 시스템은 Base Station (BS)의 남아있는 용량을 사용하여 BS의 커버리지를 확장시킬 수 있다. 그래서 Multi-hop Relay Base Station (MR-BS)에서 호가 빈번하게 발생할 경우, RS에서는 호 차단을 겪게 된다. 제안된 기법에서는 MR-BS 혹은 RS에서 호가 빈번하게 발생할 경우, 트래픽 부하가 적은 주변 MMR 시스템에 2nd tier RS로서 연결되어 MMR 시스템에서 추가적인 호를 수락할 수 있다. 분석을 통해 제안된 기법이 일반적인 MMR 시스템보다 호 차단 확률과 처리량에서 성능이 향상되었음을 보였다.

다변량 비대칭 라플라스 점프확산 모형의 베이지안 추론 (Bayesian inference on multivariate asymmetric jump-diffusion models)

  • 이영은;박태영
    • 응용통계연구
    • /
    • 제29권1호
    • /
    • pp.99-112
    • /
    • 2016
  • 비대칭 점프확산 모형은 자산 가격의 비대칭적 변동을 효과적으로 설명하는 모형으로 활용되어 왔다. 그러나 다변량 모형으로 확장한 다변량 비대칭 라플라스 점프확산 모형은 가능도함수가 닫힌 해로 존재하지 않아 모형의 추론에 한계가 존재하였다. 본 논문에서는 이러한 한계점을 극복하기 위해 자료 확장 기법을 제안하고 새로운 베이지안 추론 방법을 개발한다. 본 논문에서 제안된 모형은 단일 점프와 공통 점프 뿐만 아니라 모든 가능한 조합으로 발생하는 점프를 반영한 확장된 다변량 비대칭 라플라스 점프확산 모형이다. 이러한 모형을 분석하기 위해 붕괴된 깁스 샘플러를 고안한 베이지안 방법을 개발하였다. 본 논문에서 제안된 모형과 방법을 모의실험 자료 및 2005년 1월 3일부터 2015년 9월 30일까지 관찰된 일별 KOSPI, S&P500, 그리고 Nikkei225에 적용하여 효율성을 검증하였다.

Energy-efficient Buffer-aided Optimal Relay Selection Scheme with Power Adaptation and Inter-relay Interference Cancellation

  • Xu, Xiaorong;Li, Liang;Yao, Yingbiao;Jiang, Xianyang;Hu, Sanqing
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권11호
    • /
    • pp.5343-5364
    • /
    • 2016
  • Considering the tradeoff between energy consumption and outage behavior in buffer-aided relay selection, a novel energy-efficient buffer-aided optimal relay selection scheme with power adaptation and Inter-Relay Interference (IRI) cancellation is proposed. In the proposed scheme, energy consumption minimization is the objective with the consideration of relay buffer state, outage probability and relay power control, in order to eliminate IRI. The proposed scheme selects a pair of optimal relays from multiple candidate relays, denoted as optimal receive relay and optimal transmit relay respectively. Source-relay and relay-destination communications can be performed within a time-slot, which performs as Full-Duplex (FD) relaying. Markov chain model is applied to analyze the evolution of relay buffer states. System steady state outage probability and achievable diversity order are derived respectively. In addition, packet transmission delay and power reduction performance are investigated with a specific analysis. Numerical results show that the proposed scheme outperforms other relay selection schemes in terms of outage behavior with power adaptation and IRI cancellation in the same relay number and buffer size scenario. Compared with Buffer State relay selection method, the proposed scheme reduces transmission delay significantly with the same amount of relays. Average transmit power reduction can be implemented to relays with the increasing of relay number and buffer size, which realizes the tradeoff between energy-efficiency, outage behavior and delay performance in green cooperative communications.