• 제목/요약/키워드: Bayesian model

검색결과 1,312건 처리시간 0.025초

Survival Analysis of Gastric Cancer Patients with Incomplete Data

  • Moghimbeigi, Abbas;Tapak, Lily;Roshanaei, Ghodaratolla;Mahjub, Hossein
    • Journal of Gastric Cancer
    • /
    • 제14권4호
    • /
    • pp.259-265
    • /
    • 2014
  • Purpose: Survival analysis of gastric cancer patients requires knowledge about factors that affect survival time. This paper attempted to analyze the survival of patients with incomplete registered data by using imputation methods. Materials and Methods: Three missing data imputation methods, including regression, expectation maximization algorithm, and multiple imputation (MI) using Monte Carlo Markov Chain methods, were applied to the data of cancer patients referred to the cancer institute at Imam Khomeini Hospital in Tehran in 2003 to 2008. The data included demographic variables, survival times, and censored variable of 471 patients with gastric cancer. After using imputation methods to account for missing covariate data, the data were analyzed using a Cox regression model and the results were compared. Results: The mean patient survival time after diagnosis was $49.1{\pm}4.4$ months. In the complete case analysis, which used information from 100 of the 471 patients, very wide and uninformative confidence intervals were obtained for the chemotherapy and surgery hazard ratios (HRs). However, after imputation, the maximum confidence interval widths for the chemotherapy and surgery HRs were 8.470 and 0.806, respectively. The minimum width corresponded with MI. Furthermore, the minimum Bayesian and Akaike information criteria values correlated with MI (-821.236 and -827.866, respectively). Conclusions: Missing value imputation increased the estimate precision and accuracy. In addition, MI yielded better results when compared with the expectation maximization algorithm and regression simple imputation methods.

모바일 비디오기기 위에서의 중요한 객체탐색을 위한 문맥인식 특성벡터 선택 모델 (Context Aware Feature Selection Model for Salient Feature Detection from Mobile Video Devices)

  • 이재호;신현경
    • 인터넷정보학회논문지
    • /
    • 제15권6호
    • /
    • pp.117-124
    • /
    • 2014
  • 모바일 기기를 사용한 실시간 비디오 영상처리분야의 중요 객체탐색 및 추적의 문제에 있어서 난제는 복잡한 배경속에서 전경을 구분해 내는 일이다. 본 논문에서는 기계학습을 위한 특성벡터 선정의 문제를 위한 문맥인식 모델을 제시하여 잡음제거를 위한 기계학습기반의 구분자를 구현하였다. 수학적으로 NP-hard로 알려진 가장 가까운 이웃을 사용한 문맥인식 특성벡터 선정 알고리즘의 구현에 있어서, 본 논문은 연산횟수를 줄인 유사방법론에 대해 자세히 거론하였다. 또한, 문맥인식 성격을 가미한 특성벡터 선정을 통해 얻어진 특성 공간에서의 향상된 분리성에 대해 주성분 분석을 통해 엄밀한 분석결과를 제시하였다. 전반적인 성능 향상의 정도를 계측하기 위해 다양한 기계학습 방법론, 예를 들어, 다층신경망, 지원벡터기계, 나이브베이지안, 회귀분석 등을 사용해 비교결과를 제시하였다. 본 논문에서 제시한 방법론의 성능과 계산상 자원사용에 대한 내용을 결론으로 서술하였다.

데이터마이닝 모형을 활용한 호흡기질환의 주요인 선별 (Identification of major risk factors association with respiratory diseases by data mining)

  • 이제영;김현지
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권2호
    • /
    • pp.373-384
    • /
    • 2014
  • 데이터 마이닝이란 대량의 데이터나 복잡한 구조의 데이터들을 정교한 통계분석과 모델링 테크닉을 이용하여 정확히 식별되지 않는 패턴이나 자료간의 상관관계를 밝혀내어 여러 가지 결과를 예측해 내는 통계적 기법이다. 이러한 데이터 마이닝 기법은 금융, 통신, 유통, 의학 등 다양한 분야에 활용되는데, 본 연구에서는 의학 분야에 적용하여 호흡기질환에 영향을 끼치는 요인을 선별하였다. 분석은 2012년도 경상북도 지역사회건강조사에 참여한 사람 중 의사에게서 폐결핵, 천식, 알레르기성 비염을 진단받은 경험이 있는 호흡기질환군과 건강군으로 정리한 자료를 대상으로 하였다. 호흡기질환이 영향을 끼치는 주요인을 선별하기 위해 인공신경망, 로지스틱 회귀모형, 베이지안 네트워크, C5.0, CART 기법을 이용하였다. 공정한 모형 평가를 위해 전체 데이터를 훈련용 데이터와 검증용 데이터로 나누었고, 훈련용 데이터에서 설정된 모형을 검증용 데이터에 적용하여 정확도를 비교하였다. 그 결과 CART가 최적 모형으로 선정되었으며 CART의 의사결정나무를 통하여 우울감 인지 여부, 현재 흡연여부, 스트레스 인지 여부 순으로 호흡기질환에 영향을 주는 것으로 나타났다. 그리고 호흡기질환의 주요인들에 대한 오즈비를 구하여 개별적인 영향력에 대해서도 밝혔다.

VHDL 모델 검증의 효율적인 시간단축 방법 (Efficient Methods for Reducing Clock Cycles in VHDL Model Verification)

  • Kim, Kang-Chul
    • 대한전자공학회논문지SD
    • /
    • 제40권12호
    • /
    • pp.39-45
    • /
    • 2003
  • 칩의 크기가 증가함에 따라 VHDL 모델의 설계검증은 점점 어려워지고, 많은 시간을 소모하는 과정이 되고 있다. 최근에 VHDL 모델을 검증하기 위하여 베이지안 예측과 정지법(stopping rule)을 이용한 방법들이 소개되고 있다. 이 논문에서는 VHDL 모델을 검증하기 위하여 정지법을 사용할 때 클럭 사이클을 줄일 수 있는 2가지 방법을 제안한다. 첫 번째 방법은 세미랜덤변수를 정의하고, 정지법이 동작 중에 세미랜덤변수의 영역에 존재하는 데이터를 생략하여 정지점stopping point)을 줄이고, 두 번째 방법은 정지법의 페이즈가 변화시에 베이지안 파라미터의 기존 값을 그대고 유지하여 클럭 사이클을 줄이는 방법이다. 제안된 방법의 효율성을 입증하기 위하여 12개의 VHDL 모델에 대하여 분기검출율에 관한 모의실험을 하였으며, 기존의 방법과 비교하여 분기검출율은 0.6% 줄었지만 25% 이상의 클럭 사이클을 줄일 수 있었다.

Determination of Genetic Diversity Using 15 Simple Sequence Repeats Markers in Long Term Selected Japanese Quail Lines

  • Karabag, Kemal;Balcioglu, Murat Soner;Karli, Taki;Alkan, Sezai
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제29권12호
    • /
    • pp.1696-1701
    • /
    • 2016
  • Japanese quail is still used as a model for poultry research because of their usefulness as laying, meat, and laboratory animals. Microsatellite markers are the most widely used molecular markers, due to their relative ease of scoring and high levels of polymorphism. The objective of the research was to determine genetic diversity and population genetic structures of selected Japanese quail lines (high body weight 1 [HBW1], HBW2, low body weight [LBW], and layer [L]) throughout 15th generations and an unselected control (C). A total of 69 individuals from five quail lines were genotyped by fifteen microsatellite markers. When analyzed profiles of the markers the observed ($H_o$) and expected ($H_e$) heterozygosity ranged from 0.04 (GUJ0027) to 0.64 (GUJ0087) and 0.21 (GUJ0027) to 0.84 (GUJ0037), respectively. Also, $H_o$ and $H_e$ were separated from 0.30 (L and LBW) to 0.33 (C and HBW2) and from 0.52 (HBW2) to 0.58 (L and LBW), respectively. The mean polymorphic information content (PIC) ranged from 0.46 (HBW2) to 0.52 (L). Approximately half of the markers were informative ($PIC{\geq}0.50$). Genetic distances were calculated from 0.09 (HBW1 and HBW2) to 0.33 (C and L). Phylogenetic dendrogram showed that the quail lines were clearly defined by the microsatellite markers used here. Bayesian model-based clustering supported the results from the phylogenetic tree. These results reflect that the set of studied markers can be used effectively to capture the magnitude of genetic variability in selected Japanese quail lines. Also, to identify markers and alleles which are specific to the divergence lines, further generations of selection are required.

스마트폰상의 지능형 개인화 서비스를 위한 강인한 파티클 필터 기반의 사용자 경로 예측 (Robust Particle Filter Based Route Inference for Intelligent Personal Assistants on Smartphones)

  • 백혜정;박영택
    • 정보과학회 논문지
    • /
    • 제42권2호
    • /
    • pp.190-202
    • /
    • 2015
  • 스마트폰내 GPS 및 다양한 센서 데이터를 이용하여 스마트폰 사용자의 이동 패턴을 학습하고, 이를 기반으로 사용자 목적지와 경로를 예측하여 사용자의 의도에 맞는 서비스를 제공하는 위치기반 지능형 개인화 서비스(Intelligent personal assistant) 연구가 활발히 진행 되고 있다. 위치기반 개인화 서비스의 지능성은 불완전한 센서 데이터로부터 사용자 이동 정보를 처리하여, 실시간으로 사용자의 경로를 예측하는 정확성과 효율성에 좌우된다. 본 논문은 불완전한 정보로부터 사용자의 경로와 목적지를 추론하는 동적 베이지안 네트워크 기반의 강인한 파티클 필터(Robust particle filter)를 제안한다. 제안한 강인한 파티클 필터 방법은 부정확하고, 불완전한 센서 정보를 보완할 수 있는 파티클 생성, 실시간에 계산 복잡도를 감소시키는 효율적인 스위칭 함수와 가중치 함수, 파티클의 정확도를 향상시키는 재표본화로 구성되며, 사용자의 목적지와 경로의 예측 정확성과 효율성의 성능을 향상시켰다.

Assessment of genetic diversity of Prangos fedtschenkoi (Apiaceae) and its conservation status based on ISSR markers

  • Mustafina, Feruza U.;Kim, Eun Hye;Son, Sung-Won;Turginov, Orzimat T.;Chang, Kae Sun;Choi, Kyung
    • 식물분류학회지
    • /
    • 제47권1호
    • /
    • pp.11-22
    • /
    • 2017
  • Prangos fedtschenkoi (Regel et Schmalh.) Korovin (Apiaceae) is an endemic species for mountainous Middle Asia, which is both a rare and useful plant. Organic extractions from this species are being used in pharmaceutics and cosmetology. In recent years, P. fedtschenkoi distribution area has considerably decreased, presumably, resulting from human activities such as agriculture, construction works, overgrazing and collection from wild for pharmaceutic purposes. Six populations were found in Uzbekistan and their genetic divergence and differentiation were studied with 10 inter-simple sequence repeat (ISSR) markers, selected out of 101. Totally 166 amplified ISSR fragments (loci) were revealed, of which 164 were polymorphic. Relatively moderate level of polymorphism was found at population level with polymorphic bands ranging from 27.71% to 47.59%. Mean P = 39.05%, $N_a=1.40$, $N_e=1.25$, S.I. = 0.21, and $H_e=0.14$ were revealed for all loci across six populations. AMOVA showed higher variation among populations (62%) than within them (38%). The Bayesian model determined 5 clusters, or genetic groups. The posteriori distribution of the Theta II estimator detected full model identifying high inbreeding, intensified by low gene flow (Nm = 0.3954). Mantel test confined population 6 as distinct cluster corresponding to geographic remoteness (R = 0.5137, $p{\leq}0.005$). Results were used as the bases for developing conserve measures to restore populations.

거시경제 및 통화정책 기조 변화가 통화정책의 유효성에 미친 영향 분석 (Effectiveness of Monetary Policy in Korea Due to Time Varying Monetary Policy Stance)

  • 김태봉
    • KDI Journal of Economic Policy
    • /
    • 제36권3호
    • /
    • pp.1-23
    • /
    • 2014
  • 본고는 4개의 거시변수들을 포함한 Time Varying VAR 모형을 통해 한국의 통화정책 변화를 평가하였다. 첫째, 외환위기나 금융위기 때와 같이 통화정책이 환율변동에 대해 민감하게 변화하는 시기가 존재하므로 위기를 포함한 긴 표본 안에서 한국의 통화정책을 평가할 때는 환율을 모형안에 포함시키는 것이 필요하다. 둘째, 표본기간 내에서 이례적인 큰 변동성이 때때로 나타나는 한국 거시변수들을 설명하기 위해서는 stochastic volatilities를 TVP-VAR 모형 내에서 설정할 필요가 있다. 한편, 2000년대 거시변수들의 안정화는 stochastic volatilities의 감소에 의해 설명되며, 부분적으로는 거시경제의 구조를 반영하는 충격반응함수에 의해서도 설명된다. 셋째, 통화정책의 인플레이션에 대한 유효성의 크기는 예전에 비해 최근 약화된 편이나 유효성의 지속성은 비교적 높아진 것으로 나타났다. 마지막으로 인플레이션 안정화에 대한 통화정책의 기조는 물가안정목표제가 도입되기 전에 비해 그 후에 적극적인 방향으로 개선되어 왔음을 보이고 있다. 하지만 우리나라의 통화정책은 그 기조가 경기변동에 비해 인플레이션 안정화에 대하여 여전히 덜 적극적인 것을 감안할 때 개선될 여지가 있는 것으로 판단된다.

  • PDF

Elastic modulus of ASR-affected concrete: An evaluation using Artificial Neural Network

  • Nguyen, Thuc Nhu;Yu, Yang;Li, Jianchun;Gowripalan, Nadarajah;Sirivivatnanon, Vute
    • Computers and Concrete
    • /
    • 제24권6호
    • /
    • pp.541-553
    • /
    • 2019
  • Alkali-silica reaction (ASR) in concrete can induce degradation in its mechanical properties, leading to compromised serviceability and even loss in load capacity of concrete structures. Compared to other properties, ASR often affects the modulus of elasticity more significantly. Several empirical models have thus been established to estimate elastic modulus reduction based on the ASR expansion only for condition assessment and capacity evaluation of the distressed structures. However, it has been observed from experimental studies in the literature that for any given level of ASR expansion, there are significant variations on the measured modulus of elasticity. In fact, many other factors, such as cement content, reactive aggregate type, exposure condition, additional alkali and concrete strength, have been commonly known in contribution to changes of concrete elastic modulus due to ASR. In this study, an artificial intelligent model using artificial neural network (ANN) is proposed for the first time to provide an innovative approach for evaluation of the elastic modulus of ASR-affected concrete, which is able to take into account contribution of several influence factors. By intelligently fusing multiple information, the proposed ANN model can provide an accurate estimation of the modulus of elasticity, which shows a significant improvement from empirical based models used in current practice. The results also indicate that expansion due to ASR is not the only factor contributing to the stiffness change, and various factors have to be included during the evaluation.

한국어 음성/문자 공용인식기의 성능향상을 위한 가변 상태수 CHMM모델의 구성 (Difference State Number of CHMM Model to Improve the Performance of SCCRS)

  • 석수영;김민정;김광수;정호열;정현열
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.95-98
    • /
    • 2002
  • 문자인식 또는 음성인식을 위해 사용되어지는 CHMM(Continuous Hidden Markov Model)모델은 일반적으로 모델의 상태수를 일정한 수로 고정하는 고정 상태수 모델 구조를 가지고 있으나, 이는 개별적인 인식 단위의 특성을 고려하지 않은 경우로써 이를 고려한 가변 상태수 모델을 사용할 경우 인식률 향상을 기대할 수 있다. 개별적인 인식 단위에 적합한 모델 상태수를 결정하는 방법으로 파라미터 히스토그램 방법과, BIC(Bayesian Information Criterion)방법을 사용하는 것이 대표적이다. 이들 방법들은 개별적인 인식단위의 우도값만을 향상시키기 위한 방법으로 전체인식률과 직접적으로 비례하지는 않는다. 따라서, 본 논문에서는 고정 상태수를 갖는 모델 적용 방법과 인식단위별 상태수 변화에 따른 인식률을 비교하였으며, 이를 바탕으로 각 모델별 상태수를 달리하는 가변 상태수 CHMM모델 구성 방법을 제안한다. 제안된 가변상태수 모델의 유효성을 확인하기 위해 음성/문자 공용인식기 중 필기체 문자 인식에 적용한 결과 제안한 LM(Local Maximum)으로 구성된 가변 상태수 모델이 MLE와 BIC로 구성된 모델과 인식률 면에서는 거의 동일한 성능을 유지하면서 전체 상태수는 MLE 모델에 비해 $31\%$, BIC로 구성된 모델에 비해 $22\%$ 감소를 나타내어 제안한 모델의 유효성을 확인할 수 있었다.

  • PDF