• 제목/요약/키워드: Bayesian 분석

검색결과 689건 처리시간 0.029초

AptaCDSS - 압타머칩을 이용한 심혈관질환 질환단계 예측 및 진단의사결정지원시스템 (AptaCDSS - A Cardiovascular Disease Level Prediction and Clinical Decision Support System using Aptamer Biochip)

  • 엄재홍;김병희;이재근;허민오;박영진;김민혁;김성천;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (A)
    • /
    • pp.28-32
    • /
    • 2006
  • 최근 연구결과에 의하면 심장질환을 포함한 심혈관질환은 성별에 관계없이 미국 및 전 세계적으로 질병사망의 주요 원인으로 조사되었다. 본 연구에서는 보다 효율적으로 진단하기 위해 진단의사 결정 보조시스템에 대해서 다룬다. 개발된 시스템은 혈청 내의 특정 단백질의 상대적 양을 측정할 수 있는 바이오칩인 압타머칩을 이용해 생성한 환자들의 칩 데이터를 Support Vector Machine, Neural Network, Decision Tree, Bayesian Network 등의 총 4가지 기계학습 알고리즘으로 분석하여 질환단계를 예측하고 진단을 위한 보조정보를 제공한다. 논문에서는 총 135개 샘플로 구성된 3K 압타머칩 데이터에 대해 측정된 초기 시스템의 질환단계 분류성능을 제시하고 보다 유용한 진단의사결정 보조 시스템을 구성하기 위한 요소들에 대해서 논의한다.

  • PDF

남북경제협력에 따른 개발이익 경매와 DMZ 보전기금 확보 (A Study on Auction Mechanism for DMZ Conservation using the South-North Korean Economic Development Projects)

  • 박호정;김준순;김현희
    • 자원ㆍ환경경제연구
    • /
    • 제28권1호
    • /
    • pp.39-59
    • /
    • 2019
  • DMZ는 반세기 이상 인위적 활동이 배제되어 우수한 생태계를 보유하고 있다. 통일 이후에도 DMZ의 생태계는 보전되어야 하며 이를 위해서는 남북한 통일 이후가 아니라 사전에 그 보전방안이 마련되어야 한다. DMZ 생태자원 보전에는 생태자원 관리 비용 뿐만 아니라 복구비용 및 연구예산까지 수반되어야 하므로 상당한 규모의 예산이 필요하다. 이에 본 논문은 실물옵션과 경매이론을 연계하여 경제적 인센티브 메커니즘을 이용한 DMZ 보전기금 확보 방안을 연구하고자 한다. 다수의 사업자들은 경매를 통해 북한지역 개발사업권을 획득하려고 하고, 매몰비용에 대한 사적 정보를 가지고 있으며, 사업수익의 일부를 보전기금으로 지불한다고 할 때, 먼저, 경매 참가자의 최적 투자시기를 결정하는 실물옵션 모형을 분석하고, 다음으로 베이즈 내쉬균형을 이용해 경매 참가자가 사적 정보에 대해 진실을 보고할 경매를 설계한다.

환자 IQR 이상치와 상관계수 기반의 머신러닝 모델을 이용한 당뇨병 예측 메커니즘 (Diabetes prediction mechanism using machine learning model based on patient IQR outlier and correlation coefficient)

  • 정주호;이나은;김수민;서가은;오하영
    • 한국정보통신학회논문지
    • /
    • 제25권10호
    • /
    • pp.1296-1301
    • /
    • 2021
  • 최근 전 세계적으로 당뇨병 유발률이 증가함에 따라 다양한 머신러닝과 딥러닝 기술을 통해 당뇨병을 예측하려고 는 연구가 이어지고 있다. 본 연구에서는 독일의 Frankfurt Hospital 데이터로 머신러닝 기법을 활용하여 당뇨병을 예측하는 모델을 제시한다. IQR(Interquartile Range) 기법을 이용한 이상치 처리와 피어슨 상관관계 분석을 적용하고 Decision Tree, Random Forest, Knn, SVM, 앙상블 기법인 XGBoost, Voting, Stacking로 모델별 당뇨병 예측 성능을 비교한다. 연구를 진행한 결과 Stacking ensemble 기법의 정확도가 98.75%로 가장 뛰어난 성능을 보였다. 따라서 해당 모델을 이용하여 현대 사회에 만연한 당뇨병을 정확히 예측하고 예방할 수 있다는 점에서 본 연구는 의의가 있다.

WRF-Hydro와 DART를 이용한 분포형 수문모형의 자료동화 (Ensemble data assimilation using WRF-Hydro and DART)

  • 노성진;최현진;김보미;이가림;이송희
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.392-392
    • /
    • 2021
  • 자료동화(data assimilation) 기법은 관측 자료와 예측 모형의 정보를 동시에 활용, 모형의 상태량(state variables)이나 매개변수(model parameters)를 실시간으로 업데이트하는 Bayesian 필터링 이론에 근거한 방법으로, 최근 이를 활용한 수문 모의 정확도 향상 기술이 빠르게 발전하고 있다. 본 연구에서는 앙상블 자료동화의 정확성을 향상시키기 위한 세부 방법인 along-the-stream localization과 inflation 기법의 분포형 수문 모형에 대한 적용성을 대규모 지역 단위(regional-scale) 모의를 통해 검토한다. 분포형 수문모형과 자료동화 framework로는 WRF-Hydro(Weather Research and Forecasting Model Hydrological Modeling System)와 DART(Data Assimilation Research Testbed)를 각각 적용한다. WRF-Hydro는 미국의 전 대륙지역(CONUS; continental United States)에 대한 수문 모델링 framework인 National Water Model의 핵심엔진이고, DART는 미국 National Center for Atmospheric Research(NCAR) 연구소에서 개발한 범용 자료동화 도구이다. 본 연구에서는 지표수 수문모형의 자료동화를 위해 개발된 기법인 along-the-stream localization과 inflation 기법이 하도 추적에 미치는 영향을 분석한다. along-the stream localization 기법은 공간적 근접도 외에 하도의 수문학적 연관관계를 고려하는 localization 기법으로, 상대적으로 수문학적 상관도가 떨어지는 하도에 대한 과도한 자료동화를 줄여줄 수 있다. inflation 기법은 앙상블의 다양성을 증가시키는 기법으로, 칼만 필터(Kalman filter)에 의한 업데이트의 이전이나 이후 적용하여 앙상블 예측의 정확도를 추가적으로 향상시킬 수 있다. 본 고에서는 앙상블 자료동화 기법을 지표수 수문 모의에 적용할 경우 남아 있는 난제와 적용 가능한 방법에 대해 중점적으로 논의한다.

  • PDF

고강도 Nb기 초내열 합금 설계를 위한 기계학습 기반 데이터 분석 (Machine Learning-based Data Analysis for Designing High-strength Nb-based Superalloys)

  • 마은호;박수원;최현주;황병철;변종민
    • 한국분말재료학회지
    • /
    • 제30권3호
    • /
    • pp.217-222
    • /
    • 2023
  • Machine learning-based data analysis approaches have been employed to overcome the limitations in accurately analyzing data and to predict the results of the design of Nb-based superalloys. In this study, a database containing the composition of the alloying elements and their room-temperature tensile strengths was prepared based on a previous study. After computing the correlation between the tensile strength at room temperature and the composition, a material science analysis was conducted on the elements with high correlation coefficients. These alloying elements were found to have a significant effect on the variation in the tensile strength of Nb-based alloys at room temperature. Through this process, a model was derived to predict the properties using four machine learning algorithms. The Bayesian ridge regression algorithm proved to be the optimal model when Y, Sc, W, Cr, Mo, Sn, and Ti were used as input features. This study demonstrates the successful application of machine learning techniques to effectively analyze data and predict outcomes, thereby providing valuable insights into the design of Nb-based superalloys.

가축 유전체정보 활용 종축 유전능력 평가 연구 - 표지인자 효과 추정 모의실험 (Study on Genetic Evaluation using Genomic Information in Animal Breeding - Simulation Study for Estimation of Marker Effects)

  • 조충일;이득환
    • Journal of Animal Science and Technology
    • /
    • 제53권1호
    • /
    • pp.1-6
    • /
    • 2011
  • 연구는 유전체분석에 대해 모의실험한 연구로써 Reference Population (RP)이 구성되었을 때, 표현형 자료가 없고 유전체자료만 있는 Juven 1 또는 Juven 2 세대에 대해 유전평가의 정확도에 대해 알아보고자 연구를 실시하였다. 모의실험의 가정으로 염색체는 1개이며 염색체길이는 100cM로 가정하였다. 초기의 유효집단의 수는 100두의 다형성이 없는 초기집단에서 유전자 효과가 없는 표지인자(Marker)를 0.1cM 및 0.5cM 간격으로 균등하게 단일 염기 돌연변이에 의한 다형성을 발생시켰고 유전자 효과가 있는 QTL 좌위는 Marker와 동수의 비율로 임의위치를 지정하여 돌연변이에 의한 변이성을 생성하였으며 이때 유전자 효과는 Gamma 분포함수(scale=1.66, shape=0.4)에서 생성하였다. 배우자(gamete) 형성과정에서 Haldane의 가정하에 유전자 재조합을 생성하였으며 돌연변이 발생율은 Marker 및 QTL 좌위에서 $2.5{\times}10^{-3}$$2.5{\times}10^{-5}$의 확률로 발생시켜 1000세대까지 세대번식을 유지하였다. 이 후 1001세대부터 1004세대까지 세대당 2000두의 자손을 생성하였으며 이 때 유전력을 0.1 및 0.5의 가정하에 1001~1002 세대에서 표현형 자료를 생성하였고, 1003~1004세대는 오직 유전체자료만 생성하였다. Bayesian 방법을 이용하여 개체별 육종가를 추정하였으며 표지인자간 거리(0.1cM, 0.5cM), 유전력(0.1, 0.5) 및 반형매 집단크기(20두, 4두)에 따라 참육종가와 추정 육종가간의 상관으로 표현되는 육종가 정확도에 대해 비교한 결과 1003세 대에서 표지인자간 거리가 0.1cM 및 0.5cM일 때 육종가의 정확도는 각각 0.87, 0.81였고, 유전력이 0.1 및 0.5 일 때 각각 0.87, 0.94로 추정되었으며, 반형매 집단의 크기가 20두 일 때 0.87, 4두 일 때 0.84로 추정되었다. 위의 결과로 미루어 보아 다량의 SNP 표지정보 및 반형매 집단의 크기가 클수록 즉, 혈연계수가 높은 집단일 때 육종가의 정확도는 높게 나타났다. 유전체선발의 활용시 비교적 높은 정확도로써 조기선발이 가능하며 이로 인한 세대간격을 단축시킬 수 있어 개량의 효율을 높일 수 있을 것으로 사료된다. 반면에 유전체선발은 분석비용이 비싸며, 지속적인 유전체 선발시 특정유전자 선호로 인한 유전적 부동(Genetic Drift) 현상이 발생될 수 있기 때문에 지속적인 SNP 발굴에 대한 노력이 필요한(Meuwissen 2003) 단점이 있으나 한우 또는 젖소와 같은 대가축과 같이 세대간격이 긴 가축에서 유전체선발 할 경우 조기선발로 인한 세대간격 단축과 유전평가의 높은 정확도(0.8이상)로 인해 개량의 효율을 극대화 할 수 있을 것으로 사료된다.

유전다양성 복원을 위한 지리산 구상나무 아집단의 유전변이 (Genetic Variation of Korean Fir Sub-Populations in Mt. Jiri for the Restoration of Genetic Diversity)

  • 안지영;임효인;하현우;한진규;한심희
    • 한국산림과학회지
    • /
    • 제106권4호
    • /
    • pp.417-423
    • /
    • 2017
  • 구상나무(Abies koreana)의 유전다양성 복원 전략 수립을 위해 지리산의 반야봉, 벽소령, 천왕봉 아집단들에 대한 유전다양성과 아집단 간 유전분화율을 추정하였다. 아집단 평균 유전다양성은 대립유전자수(A)가 7.8개, 평균 유효대립유전자수($A_e$)가 4.9개, 이형접합도 관찰치($H_o$)가 0.578, 이형접합도 기대치($H_e$)가 0.672이었다. 3개 아집단들의 평균 유전다양성($H_e=0.672$)은 지리산 집단 수준의 유전다양성($H_e=0.778$)과 구상나무 종 수준의 유전다양성($H_e=0.759$)보다 낮았으나, 전나무 속 타 수종들과 비교하면 높은 것으로 나타났다. 아집단 간 유전분화율은 F-통계분석($F_{ST}$)에서 0.014였고, AMOVA 분석(${\Phi}_{ST}$)에서 0.004로 나타났다. 베이지안 군집분석에서 지리산 내 아집단 간 유전분화가 거의 없는 것으로 나타났다. 그러므로 3개 지역으로부터 모수들을 충분히 선정하여 종자를 채취한다면, 유전적으로 다양한 복원재료를 확보할 수 있을 것으로 생각된다.

베이지안 네트워크 기반에 자가관리를 위한 결함 지역화 (Fault Localization for Self-Managing Based on Bayesian Network)

  • 박순선;박정민;이은석
    • 정보처리학회논문지B
    • /
    • 제15B권2호
    • /
    • pp.137-146
    • /
    • 2008
  • 결함 지역화는 관찰된 결함의 근본 원인을 자동 인식 하는 것이 가능하기 때문에 규모가 큰 분산시스템에서 중요 역할 수행하며 시스템의 신뢰성 개선을 위해 시스템의 관리와 제어가 가능한 자가 관리를 지원한다. 결함 지역화를 지원하는 기존 연구들은 유비쿼터스 환경에서 베이지안 네트워크와 같은 인공지능 기술들을 주로 사용하여 진단과 예측 기능 중 하나만을 고려하고 있다. 따라서, 본 논문에서는 시스템의 신뢰성 개선을 위해 실시간 시스템 성능 스트림에 대한 학습을 통해 자가관리를 위한 확률적 의존 분석을 기반으로 하는 결함 지역화 방법을 제안하여 진단과 예측기능을 동시 제공한다. 학습 방법으로 베이지안 네트워크 알고리즘을 사용하여 각종 관련된 요소들을 연결함으로써 네트워크를 생성하고 확률적 의존 관계를 통해 귀납적과 연역적 추론기능을 제공한다. 베이지안 네트워크의 구성은 노드들간의 연관성을 찾아내는 것이 중요하기 때문에 그것을 구성하는 인자의 개수가 많은 경우 노드 순서 리스트를 추출하는 사전처리 과정이 필요하다. 따라서 전체 모델링 프로세스에 대한 개선이 요구된다. 이러한 문제를 해결하기 위해 발생한 문제와 관련성이 높은 노드 순서 리스트를 추출하는 방법을 제공한다. 구조 학습을 지원 하는 사전처리 방법을 통해 다양한 문제 영역에서의 학습 효율성을 높이며 학습에 필요로 되는 시간을 줄인다. 제안 방법론을 통해서 시스템의 자원 문제를 신속하고 정확하게 진단하는 것이 가능하며, 관찰된 정보를 기반으로 실행 중에 발생되는 잠재적인 문제를 예측하는 것이 가능하다. 시스템 성능 평가 영역에서 제안 방법론을 적용한 시스템 성능 분석을 기반으로 진단, 예측의 효율성과 정확성을 평가하여 제안 방법론의 유효성을 입증하였다.

수문학적 가뭄 모니터링을 위한 실적자료 기반 물순환 모델 개발 (The development of water circulation model based on quasi-realtime hydrological data for drought monitoring)

  • 김진영;김진국;김장경;전근일;강신욱;이정주;남우성;권현한
    • 한국수자원학회논문집
    • /
    • 제53권8호
    • /
    • pp.569-582
    • /
    • 2020
  • 최근 우리나라는 도시화로 인해 수자원이용 환경이 급격한 변화를 맞이하였으며, 이로 인해 유출현상을 정량적으로 규명하여 가용수자원을 최적배분 하는데 어려움이 발생하고 있다. 이를 대비하기 위하여 국가물관리계획, 하천유역수자원관리계획 등이 제안되고 있으며, 효율적인 수자원 운영 계획 수립을 위해서는 정확하며 상세한 물수지 분석이 요구되고 있다. 그러나 기존에 수행되는 물수지 분석은 유역의 물순환 상황을 충분히 반영하지 못하며, 이러한 결과는 의사결정 측면에서 활용이 어려운 실정이다. 이러한 점에서 본 연구에서는 유역을 공간적으로 상세화하여 하천을 네트워크 형태로 재구성, 실적기반 자료를 반영한 물순환 모델을 개발하였으며, 하천을 중심으로 모니터링 지점의 유량정보가 준실시간으로 제공될 수 있는 체계를 마련하였다. 본 연구에서 개발된 물순환 모델은 기존 물수지 분석에서 나타나는 문제점을 개선하는데 목적이 있으며, 계측유역을 대상으로 모형의 적합성을 평가한 결과 특히 저유량 부분에서 기존 모형에 비해 크게 개선된 효과를 확인할 수 있었다. 본 연구에서 개발된 물순환 모델은 보다 정확한 자연유량 보정기법 적용과 유역 내 상세화된 유역네트워크를 통해 유량정보를 준실시간으로 제공함으로써 보다 현실적인 가뭄 모니터링 및 가뭄대책을 마련하기 위한 기초자료로 활용될 수 있을 것으로 기대된다.

ESTP 표지를 이용한 국내 소나무 집단의 유전변이 (Genetic Variation of Pinus densiflora Populations in South Korea Based on ESTP Markers)

  • 안지영;홍경낙;이제완;홍용표;강호덕
    • 한국자원식물학회지
    • /
    • 제28권2호
    • /
    • pp.279-289
    • /
    • 2015
  • 소나무의 유전다양성과 유전구조를 추정하기 위해 9개의 ESTP 표지를 13개 소나무 집단에 적용하였다. 소나무 집단의 유전다양성은 관찰된 대립유전자 수(A)가 2.2개, 유효 대립유전자 수(Ae)가 1.8개, 다형적 유전자좌 비율(P)이 98.8%, 이형접합도 관찰치(Ho)가 0.391, 이형접합도 기대치(He)가 0.402로 나타났다. 안강과 강릉 집단을 제외한 11개 집단이 하디-바인베르그 평형을 만족하였다. 집단간 유전분화도(FST)는 0.057으로, 동위효소나 nSSR 표지분석 결과보다 강하게 나타났다. 군집분석에서 집단의 유전적 거리와 지리적 분포간에 뚜렷한 연관성은 확인할 수 없었으며, 집단의 유전분화와 지리적 인접성도 상관이 없는 것으로 나타났다(Mantel 검증, r = 0.017, P = 0.344). 유전자좌에 대한 FST-outlier 분석을 실시한 결과, 빈도주의 방법에서는 FST 값이 신뢰하한 이하인 3개 유전자좌와 신뢰상한 이상인 3개 유전자좌가 특이값으로 추정되었고, 베이즈 방법에서는 3개 유전자좌들만 특이값으로 확인되었다. 두 방법에서 공히 특이값으로 판정된 3개 유전자좌(sams2+AluⅠ, sams2+RsaⅠ, PtNCS_p14A9+HaeⅢ)중 sams2 표지에서 유래된 2개 유전자좌는 balancing selection의 영향을 받는 것으로 추정되었다.