• 제목/요약/키워드: Bayesian methods

검색결과 718건 처리시간 0.021초

The Robust Phylogeny of Korean Wild Boar (Sus scrofa coreanus) Using Partial D-Loop Sequence of mtDNA

  • Cho, In-Cheol;Han, Sang-Hyun;Fang, Meiying;Lee, Sung-Soo;Ko, Moon-Suck;Lee, Hang;Lim, Hyun-Tae;Yoo, Chae-Kyoung;Lee, Jun-Heon;Jeon, Jin-Tae
    • Molecules and Cells
    • /
    • 제28권5호
    • /
    • pp.423-430
    • /
    • 2009
  • In order to elucidate the precise phylogenetic relationships of Korean wild boar (Sus scrofa coreanus), a partial mtDNA D-loop region (1,274 bp, NC_000845 nucleotide positions 16576-1236) was sequenced among 56 Korean wild boars. In total, 25 haplotypes were identified and classified into four distinct subgroups (K1 to K4) based on Bayesian phylogenetic analysis using Markov chain Monte Carlo methods. An extended analysis, adding 139 wild boars sampled worldwide, confirmed that Korean wild boars clearly belong to the Asian wild boar cluster. Unexpectedly, the Myanmarese/Thai wild boar population was detected on the same branch as Korean wild boar subgroups K3 and K4. A parsimonious median-joining network analysis including all Asian wild boar haplotypes again revealed four maternal lineages of Korean wild boars, which corresponded to the four Korean wild boar subgroups identified previously. In an additional analysis, we supplemented the Asian wild boar network with 34 Korean and Chinese domestic pig haplotypes. We found only one haplotype, C31, that was shared by Chinese wild, Chinese domestic and Korean domestic pigs. In contrast to our expectation that Korean wild boars contributed to the gene pool of Korean native pigs, these data clearly suggest that Korean native pigs would be introduced from China after domestication from Chinese wild boars.

무제약 필기 숫자를 인식하기 위한 다수 인식기를 결합하는 의존관계 기반의 프레임워크 (Dependency-based Framework of Combining Multiple Experts for Recognizing Unconstrained Handwritten Numerals)

  • 강희중;이성환
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권8호
    • /
    • pp.855-863
    • /
    • 2000
  • K개의 인식기로부터 관찰된 K개 결정을 결합하는 결합 방법론 중의 하나인 BKS (Behavior-Knowledge Space) 방법은 아무런 가정 없이 이들 결정을 결합하지만, 관찰된 K개 결정을 저장하고 관리하려면 이론적으로 기하학적인 저장 공간을 만들어야 한다. 즉, K개의 인식기 결정을 결합하기 위하여 (K+1)차 확률 분포를 필요로 하는데, 작은 K라 할지라도 그 확률 분포를 저장하거나 평가하는 것이 어렵다는 것은 이미 잘 알려져 있다. 그러한 문제점을 극복하기 위해서는 고차 확률 분포를 몇 개의 구성 분포로 나누고, 이들 구성 분포의 곱(product)으로 고차 확률 분포를 근사시켜야 한다. 그러한 이전 방법 중의 하나는 그 확률 분포에 조건부 독립 가정을 적용하는 것이고, 다른 방법으로는 [1]에서와 같이 그 확률 분포를 단지 트리 의존관계 또는 2차 구성 분포의 곱으로 근사하는 것이다. 본 논문에서는, 구성 분포의 곱으로 근사하는 방법에서, 2차 이상의 고차 구성 분포까지 고려하여 (K+1)차 확률 분포를 d차 ($1{\le}d{\le}K$) 의존관계에 의한 최적의 곱으로 근사하고, 베이지안 방법과 그 곱을 기반으로 다수 인식기의 결정을 결합하는 의존관계 기반의 프레임워크를 제안한다. 이 프레임워크는 표준 CENPARMI 데이타베이스로 실험되어 평가되었다.

  • PDF

문서분류를 위한 의미적 주제선정방법 (Semantic Topic Selection Method of Document for Classification)

  • 고광섭;김판구;이창훈;황명권
    • 한국정보통신학회논문지
    • /
    • 제11권1호
    • /
    • pp.163-172
    • /
    • 2007
  • 웹은 전세계 규모의 네트워크로써 문자, 화상, 음성 등의 미디어 정보들을 페이지 단위로 관리되며, 링크를 이용하여 분산된 정보들을 연결하고 있다. 이러한 웹의 지속적인 발전으로 무수한 정보들을 축적하고 있으며, 그 중 텍스트로 구성된 문서들이 주를 이룬다. 사용자는 이렇게 많은 정보들 중에서 자신이 원하는 특정 정보를 찾기 위해 웹을 사용한다. 그래서 웹은 사용자 요구에 적합한 정보를 검색해 주기 위해 계속적인 시도와 많은 연구들로 발전되고 있다. 확률을 이용한 방법, 통계적인 기법을 이용한 방법, 벡터 유사도를 이용한 방법, 베이지안 자동문서 분류 방법 등 기존의 방법들은 문서의 의미적인 주제나 특징을 정확하게 처리 할 수 없어 사용자는 재검색을 해야 하는 문제점을 갖는다. 특히, 국내 문서 분류를 위한 연구는 많이 이루어지지 않아 검색에 더욱 어렵다. 이러한 문제점을 보완하기 위해 본 논문에서는 국내문서의 효율적이고 의미적인 분류를 위해 출현 개념의 TF(Term Frequency)와 주변 개념들과의 관계된 정도(RV : Relation Value)를 추출한다. 그리고 추출된 키워드들을 국내 어휘 사전인 U-WIN에 매핑하여 문서의 주제를 선택하고 본문에서 제 시하는 분류방법에 의해 웹 문서를 분류한다. 이는 문서 내 개념들의 관계를 이용하여 문서의 주제를 선정하고 문서의 의미적인 분류를 가능하게 한다.

머신 러닝 기법을 이용한 PIC 범퍼 빔 설계 방법 (The PIC Bumper Beam Design Method with Machine Learning Technique)

  • 함석우;지승민;전성식
    • Composites Research
    • /
    • 제35권5호
    • /
    • pp.317-321
    • /
    • 2022
  • 본 연구에서는 머신 러닝을 통해 하중 유형에 따른 구간을 나누어 각 하중 유형에 강한 적층 각도 순서가 배치되는 PIC 설계 방법이 범퍼 빔에 적용되었다. 머신 러닝을 적용하기 위한 학습 데이터의 입력 값과 라벨은 각각 전체 요소 중 일부인 참조 요소의 좌표와 하중 유형으로 정의되었다. 좌표 값을 나타내는 방법인 2D 표현 방법과 3D 표현 방법을 비교하기 위하여 각각의 방법으로 학습 데이터 생성 및 머신 러닝 모델이 학습되었다. 2D 표현 방법은 유한요소 모델을 각 면으로 나누고 그에 따른 학습 데이터 생성 및 머신 러닝 모델을 학습시키는 방법이며, 3D 표현 방법은 유한요소 모델 전체에서 학습 데이터를 생성하여 하나의 머신 러닝 모델을 학습시키는 방법이다. 머신 러닝 모델의 성능에 영향을 미치는 하이퍼파라미터는 베이지안 알고리즘을 통해 최적 값으로 튜닝되었으며, 튜닝 된 모델 중 k-NN 분류 방법이 가장 높은 예측률과 AUC-ROC로 나타났다. 그리고 2D 표현 방법과 3D 표현 방법 중 3D 표현 방법이 더 높은 성능을 보였다. 튜닝 된 머신 러닝 모델을 통해 예측된 하중 유형 데이터가 유한요소 모델에 매핑되었으며, 유한요소 해석을 통해 비교 검증되었다. 3D 표현 방법의 머신 러닝 모델로 설계된 PIC 방법이 강도 측면에서 더 우수함이 검증되었다.

Nonlinear mixed models for characterization of growth trajectory of New Zealand rabbits raised in tropical climate

  • de Sousa, Vanusa Castro;Biagiotti, Daniel;Sarmento, Jose Lindenberg Rocha;Sena, Luciano Silva;Barroso, Priscila Alves;Barjud, Sued Felipe Lacerda;de Sousa Almeida, Marisa Karen;da Silva Santos, Natanael Pereira
    • Animal Bioscience
    • /
    • 제35권5호
    • /
    • pp.648-658
    • /
    • 2022
  • Objective: The identification of nonlinear mixed models that describe the growth trajectory of New Zealand rabbits was performed based on weight records and carcass measures obtained using ultrasonography. Methods: Phenotypic records of body weight (BW) and loin eye area (LEA) were collected from 66 animals raised in a didactic-productive module of cuniculture located in the southern Piaui state, Brazil. The following nonlinear models were tested considering fixed parameters: Brody, Gompertz, Logistic, Richards, Meloun 1, modified Michaelis-Menten, Santana, and von Bertalanffy. The coefficient of determination (R2), mean squared error, percentage of convergence of each model (%C), mean absolute deviation of residuals, Akaike information criterion (AIC), and Bayesian information criterion (BIC) were used to determine the best model. The model that best described the growth trajectory for each trait was also used under the context of mixed models, considering two parameters that admit biological interpretation (A and k) with random effects. Results: The von Bertalanffy model was the best fitting model for BW according to the highest value of R2 (0.98) and lowest values of AIC (6,675.30) and BIC (6,691.90). For LEA, the Logistic model was the most appropriate due to the results of R2 (0.52), AIC (783.90), and BIC (798.40) obtained using this model. The absolute growth rates estimated using the von Bertalanffy and Logistic models for BW and LEA were 21.51g/d and 3.16 cm2, respectively. The relative growth rates at the inflection point were 0.028 for BW (von Bertalanffy) and 0.014 for LEA (Logistic). Conclusion: The von Bertalanffy and Logistic models with random effect at the asymptotic weight are recommended for analysis of ponderal and carcass growth trajectories in New Zealand rabbits. The inclusion of random effects in the asymptotic weight and maturity rate improves the quality of fit in comparison to fixed models.

Compressed Demographic Transition and Economic Growth in the Latecomer

  • Inyong Shin;Hyunho Kim
    • 분석과 대안
    • /
    • 제7권2호
    • /
    • pp.35-77
    • /
    • 2023
  • This study aims to solve the entangled loop between demographic transition (DT) and economic growth by analyzing cross-country data. We undertake a national-level group analysis to verify the compressed transition of demographic variables over time. Assuming that the LA (latecomer advantage) on DT over time exists, we verify that the DT of the latecomer is compressed by providing a formal proof of LA on DT over income. As a DT has the double-kinked functions of income, we check them in multiple aspects: early maturation, leftward threshold, and steeper descent under a contour map and econometric methods. We find that the developing countries (the latecomer) have speedy DT (CDT, compressed DT) as well as speedy income such that DT of the latecomers starts at lower levels of income, lasts for a shorter period, and finishes at the earlier stage of economic development compared to that of developed countries (the early mover). To check the balance of DT, we classify countries into four groups of DT---balanced, slow, unilateral, and rapid transition countries. We identify that the main causes of rapid transition are due to the strong family planning programs of the government. Finally, we check the effect of latecomer's CDT on economic growth inversely: we undertake the simulation of the CDT effect on economic growth and the aging process for the latecomer. A worrying result is that the CDT of the latecomer shows a sharp upturn of the working-age population, followed by a sharp downturn in a short period. Compared to early-mover countries, the latecomer countries cannot buy more time to accommodate the workable population for the period of demographic bonus and prepare their aging societies for demographic onus. Thus, we conclude that CDT is not necessarily advantageous to developing countries. These outcomes of the latecomer's CDT can be re-interpreted as follows. Developing countries need power sources to pump up economic development, such as the following production factors: labor, physical and financial capital, and economic systems. As for labor, the properties of early maturation and leftward thresholds on DTs of the latecomer mean that demographic movement occurs at an unusually early stage of economic development; this is similar to a plane that leaks fuel before or just before take-off, with the result that it no longer flies higher or farther. What is worse, the property of steeper descent represents the falling speed of a plane so that it cannot be sustained at higher levels, and then plummets to all-time lows.

다중 레이블 분류의 정확도 향상을 위한 스킵 연결 오토인코더 기반 레이블 임베딩 방법론 (Label Embedding for Improving Classification Accuracy UsingAutoEncoderwithSkip-Connections)

  • 김무성;김남규
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.175-197
    • /
    • 2021
  • 최근 딥 러닝 기술의 발전으로 뉴스, 블로그 등 다양한 문서에 포함된 텍스트 분석에 딥 러닝 기술을 활용하는 연구가 활발하게 수행되고 있다. 다양한 텍스트 분석 응용 가운데, 텍스트 분류는 학계와 업계에서 가장 많이 활용되는 대표적인 기술이다. 텍스트 분류의 활용 예로는 정답 레이블이 하나만 존재하는 이진 클래스 분류와 다중 클래스 분류, 그리고 정답 레이블이 여러 개 존재하는 다중 레이블 분류 등이 있다. 특히, 다중 레이블 분류는 여러 개의 정답 레이블이 존재한다는 특성 때문에 일반적인 분류와는 상이한 학습 방법이 요구된다. 또한, 다중 레이블 분류 문제는 레이블과 클래스의 개수가 증가할수록 예측의 난이도가 상승한다는 측면에서 데이터 과학 분야의 난제로 여겨지고 있다. 따라서 이를 해결하기 위해 다수의 레이블을 압축한 후 압축된 레이블을 예측하고, 예측된 압축 레이블을 원래 레이블로 복원하는 레이블 임베딩이 많이 활용되고 있다. 대표적으로 딥 러닝 모델인 오토인코더 기반 레이블 임베딩이 이러한 목적으로 사용되고 있지만, 이러한 기법은 클래스의 수가 무수히 많은 고차원 레이블 공간을 저차원 잠재 레이블 공간으로 압축할 때 많은 정보 손실을 야기한다는 한계가 있다. 이에 본 연구에서는 오토인코더의 인코더와 디코더 각각에 스킵 연결을 추가하여, 고차원 레이블 공간의 압축 과정에서 정보 손실을 최소화할 수 있는 레이블 임베딩 방법을 제안한다. 또한 학술연구정보서비스인 'RISS'에서 수집한 학술논문 4,675건에 대해 각 논문의 초록으로부터 해당 논문의 다중 키워드를 예측하는 실험을 수행한 결과, 제안 방법론이 기존의 일반 오토인코더 기반 레이블 임베딩 기법에 비해 정확도, 정밀도, 재현율, 그리고 F1 점수 등 모든 측면에서 우수한 성능을 나타냄을 확인하였다.

동적 $H_2^{15}O$ PET에서 앙상블 독립성분분석법을 이용한 심근 혈류 정량화 방법 개발 (Development of Quantification Methods for the Myocardial Blood Flow Using Ensemble Independent Component Analysis for Dynamic $H_2^{15}O$ PET)

  • 이병일;이재성;이동수;강원준;이종진;김수진;최승진;정준기;이명철
    • 대한핵의학회지
    • /
    • 제38권6호
    • /
    • pp.486-491
    • /
    • 2004
  • 목적: 요소분석법. 독립성분분석법 등이 PET을 이용하여 심근혈류를 비침습적으로 측정하기 위하여 사용되어 왔다. 이론적으로 뛰어나고 새로운 방법인 앙상블 독려성분분석법을 이용하여 $H_2^{15}O$ 동적 심근 PET데이터의 정량분석방법을 개발하였다. 이 연구에서 사용한 앙상블 독려성분분석법을 이용하여 환자의 혈류를 정량화 하였다. 대상 및 방법: 관동맥질환이 의심되어 관류 SPECT를 시행한 환자 20명을 대상으로 $H_2^{15}O$ 동적 심근 PET을 시행한 후 앙상블 독립성분분석법을 이용하여 심근 독립성분영상을 추출하였으며, 좌심실영역과 심근영역에 대한 영상대조도를 조사하였다. 앙상블 학습은 독립성분과 가중치 행렬에 대한 확률분포를 가정하고 베이지안 이론에 의해서 혼합자료에 대한 확률분포를 추정한다. 이렇게 추정한 혼합자료의 확률분포와 실제 분포간의 차이인 Kullback-Leibler 발산치가 최소가 되도록 독립성분과 가중치 행렬을 순차적으로 변화시켜가며 최종 해를 찾는 방식이다. 이 연구에서 사후확률분포는 동적 핵의학 영상에 적합한 비음성제약조건과 함께 수정된 가우시안 분포를 이용하여 최적화 하였다. 혈류량은 심첨부, 중벽 네 부분, 하벽 네 부분의 9개 영역으로 나누어 측정하였으며, 측정결과에 대해 관류 SPECT 소견과 관동맥조영술의 소견과 비교하였다. 결과: 전체 20명의 휴식기 및 부하기 영상에서 5명을 제외한 15명의 데이터에 대해 심근혈류를 측정할 수 있었다. $H_2^{15}O$ 동적 심근 PET에서 앙상블 독립성분분석법을 이용하여 정량화한 휴식기 혈류량은 $1.2{\pm}0.40$ ml/min/g, 부하기 혈류량은 $1.85{\pm}1.12$ml/min/g이었다. 같은 영역에 대해 두 번 측정했을 때 측정된 심근혈류값의 상관계수는 0.99로 재현성이 높았다. 분리된 독립성분영상에서 영상대조도는 좌심실에 대한 심근영역의 비는 평균 1:2.7이었다. 관동맥 조영술을 시행한 9명에서 협착이 없는 분절과 협착이 있는 분절의 혈류예비능에 유의한 차이가 있었다(P<0.01). 또한, 관동맥조영술에서 협착이 확인된 66분절의 심근관류 SPECT 소견에서 가역적 혈류감소를 보인 분절의 혈류예비능이 더 많이 감소되는 경향을 보였으나 통계적 유의성을 보이지는 않았다. 결론: 앙상블 학습을 이용한 독립성분분석방법을 이용하여 심근혈류가 측정이 되었다. 앙상블 독립성분분석법을 이용한 $H_2^{15}O$ 동적 심근 PET 분석방법이 관상동맥 질환의 분석 및 동적 핵의학 영상 데이터의 연구에 도움이 될 것으로 기대된다.