• 제목/요약/키워드: Unbiased Estimate

검색결과 93건 처리시간 0.022초

Pathway enrichment and protein interaction network analysis for milk yield, fat yield and age at first calving in a Thai multibreed dairy population

  • Laodim, Thawee;Elzo, Mauricio A.;Koonawootrittriron, Skorn;Suwanasopee, Thanathip;Jattawa, Danai
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제32권4호
    • /
    • pp.508-518
    • /
    • 2019
  • Objective: This research aimed to determine biological pathways and protein-protein interaction (PPI) networks for 305-d milk yield (MY), 305-d fat yield (FY), and age at first calving (AFC) in the Thai multibreed dairy population. Methods: Genotypic information contained 75,776 imputed and actual single nucleotide polymorphisms (SNP) from 2,661 animals. Single-step genomic best linear unbiased predictions were utilized to estimate SNP genetic variances for MY, FY, and AFC. Fixed effects included herd-year-season, breed regression and heterosis regression effects. Random effects were animal additive genetic and residual. Individual SNP explaining at least 0.001% of the genetic variance for each trait were used to identify nearby genes in the National Center for Biotechnology Information database. Pathway enrichment analysis was performed. The PPI of genes were identified and visualized of the PPI network. Results: Identified genes were involved in 16 enriched pathways related to MY, FY, and AFC. Most genes had two or more connections with other genes in the PPI network. Genes associated with MY, FY, and AFC based on the biological pathways and PPI were primarily involved in cellular processes. The percent of the genetic variance explained by genes in enriched pathways (303) was 2.63% for MY, 2.59% for FY, and 2.49% for AFC. Genes in the PPI network (265) explained 2.28% of the genetic variance for MY, 2.26% for FY, and 2.12% for AFC. Conclusion: These sets of SNP associated with genes in the set enriched pathways and the PPI network could be used as genomic selection targets in the Thai multibreed dairy population. This study should be continued both in this and other populations subject to a variety of environmental conditions because predicted SNP values will likely differ across populations subject to different environmental conditions and changes over time.

Comparison on genomic prediction using pedigree BLUP and single step GBLUP through the Hanwoo full-sib family

  • Eun-Ho Kim;Ho-Chan Kang;Cheol-Hyun Myung;Ji-Yeong Kim;Du-Won Sun;Doo-Ho Lee;Seung-Hwan Lee;Hyun-Tae Lim
    • Animal Bioscience
    • /
    • 제36권9호
    • /
    • pp.1327-1335
    • /
    • 2023
  • Objective: When evaluating individuals with the same parent and no phenotype by pedigree best linear unbiased prediction (BLUP), it is difficult to explain carcass grade difference and select individuals because they have the same value in pedigree BLUP (PBLUP). However, single step GBLUP (ssGBLUP), which can estimate the breeding value suitable for the individual by adding genotype, is more accurate than the existing method. Methods: The breeding value and accuracy were estimated with pedigree BLUP and ssGBLUP using pedigree and genotype of 408 Hanwoo cattle from 16 families with the same parent among siblings produced by fertilized egg transplantation. A total of 14,225 Hanwoo cattle with pedigree, genotype and phenotype were used as the reference population. PBLUP obtained estimated breeding value (EBV) using the pedigree of the test and reference populations, and ssGBLUP obtained genomic EBV (GEBV) after constructing and H-matrix by integrating the pedigree and genotype of the test and reference populations. Results: For all traits, the accuracy of GEBV using ssGBLUP is 0.18 to 0.20 higher than the accuracy of EBV obtained with PBLUP. Comparison of EBV and GEBV of individuals without phenotype, since the value of EBV is estimated based on expected values of alleles passed down from common ancestors. It does not take Mendelian sampling into consideration, so the EBV of all individuals within the same family is estimated to be the same value. However, GEBV makes estimating true kinship coefficient based on different genotypes of individuals possible, so GEBV that corresponds to each individual is estimated rather than a uniform GEBV for each individual. Conclusion: Since Hanwoo cows bred through embryo transfer have a high possibility of having the same parent, if ssGBLUP after adding genotype is used, estimating true kinship coefficient corresponding to each individual becomes possible, allowing for more accurate estimation of breeding value.

낙동강 유역 SS, TN, TP 수문학적 플럭스 (The hydrologic flux of SS, TN and TP in Nakdong River Basin)

  • 이아연;최대규;김태웅;김상단
    • 대한토목학회논문집
    • /
    • 제30권6B호
    • /
    • pp.551-560
    • /
    • 2010
  • 본 연구에서는 현재 시행되고 있는 수질오염총량관리제 모니터링 시스템에 적용가능한 하천 오염부하량 추정기법을 제안하고 있다. 하도추적기능과 증발산량 계산 기능을 추가한 수정 TANK 모형을 이용하여 국립환경과학원에서 8일 간격으로 관측된 유량자료를 일 유량 자료로 확장하였다. 관측된 수질-유량 동시관측자료를 이용하여 7변수 대수선형모형의 매개변수를 최소분산 비편향 추정기법에 의해 추정하였다. 확장된 일 유량자료와 7변수 대수선형모형의 결과가 연계되어 관측지점별일 오염부하량이 계산되었다. 그 결과 SS, TN, TP 하천 오염부하량 추정에서 만족스러운 결과를 확인할 수 있었다. 적용의 일환으로 낙동강유역을 대표할 수 있는 SS, TN 및 TP 수질항목별 대표 단위면적당 부하량 유황곡선을 작성하였으며, 이를 통하여 낙동강 유역의 전체적인 하천오염부하량의 배출분포를 살펴보았다.

소아 천식을 통해서 본 의료보험 상병 자료의 완전성 추정 : Capture-Recapture 분석방법의 적용 (Completeness Estimation of the Korean Medical Insurance Data in Childhood Asthma : Using Capture-Recapture Method)

  • 하미나;권호장;강대희;조수헌;유근영;주영수;성주헌;강종원;김대성;이상일
    • Journal of Preventive Medicine and Public Health
    • /
    • 제30권2호
    • /
    • pp.428-436
    • /
    • 1997
  • Objectives : The purpose of this paper is to estimate the completeness of the Korean Medical Insurance Data in childhood asthma. Methods : Capture-recapture method was used to estimate the prevalence of childhood asthma and case ascertainment rate(completeness) of Korean Medical Insurance Data using two source model, 'Korean Medical Insurance Committee Data (KMICD)' and 'Nationwide Study of Asthma and Allergies in Korean Children'. The asthma cases were restricted to those who were born from 1981 to 1989 and were identified by their Resident Register Number. Asthma cases in Korean Medical Insurance Data were defined as cases coded by ICD-9 493 and ICD-10 J45. In 'Nationwide Study of Asthma and Allergies in Korean Children', asthma cases were defined as the children who had been diagnosed asthma and had experienced symptoms of asthma during the past 12 months. The defined cases in two data sources were matched by 13 digits Resident Register Number. The numbers of matched patients in two data sources were 245 of 32,825 eligible total subjects. Chapman and Wittes' nearly unbiased estimation was used for capture-recapture analysis of two data sources. Results : Observed prevalence rate of childhood asthma was 5.3% and estimated prevalence rate by capture-recapture analysis was 11.6%. The highest prevalence rate was observed in 6-7 age group and the older the rate decreased. The completeness (the proportion of cases ascertained by KMICD to the total observed cases by two data sources) was 20.6%, and ranged form 10.8% to 28.8% by area. Conclusions : Invalid diagnosis of cases might overestimate the prevalence of child-hood asthma and might underestimate the completeness of Korean Medical Insurance Committee Data in this study.

  • PDF

한우의 유전체 육종가의 정확도 추정 (Estimation of the Accuracy of Genomic Breeding Value in Hanwoo (Korean Cattle))

  • 이승수;이승환;최태정;최연호;조광현;최유림;조용민;김내수;이중재
    • Journal of Animal Science and Technology
    • /
    • 제55권1호
    • /
    • pp.13-18
    • /
    • 2013
  • 본 연구는 농협 한우개량사업소 후대검정우 552두의 도체중, 배최장근단면적, 등지방두께 및 근내지방도를 측정한 후 고밀도 SNP 패널(777K)을 사용하여 유전체 혈연 행렬(Genetic Relationship Matrix, GRM)을 추정하고 GBLUP (Genomic Best Linear Unbiased Prediction) 방법으로 GEBV (Genomic Estimated Breeding Value)를 구하여 교차 검증(Cross-validation) 방법으로 그 정확도를 추정함으로써 유전체 선발 기법을 한우 유전평가 체계에 적용하기 위한 기초자료로 이용하고자 수행하였다. 교차 검증 방법으로 각 형질별로 추정된 유전체 육종가의 정확도는 0.915~0.957로 상당히 높게 추정되었다. 대립유전자의 빈도로 계산된 유전체 혈연 행렬을 이용하여 GBLUP 방법으로 추정된 육종가 정확도의 최대 차이는 후대검정우 534두에 대하여 도체중, 배최장근단면적, 등지방 두께 및 근내지방도 순으로 각각 9.56%, 5.78%, 5.78% 및 4.18% 정도의 수준으로 상승했고, 혈통 기록상의 모든 개체 3,674두에 대해서는 형질 별로 최대 13.54%, 6.50%, 6.50% 및 4.31% 정도의 수준으로 증가한 결과가 추정되었다. 이는 한우 보증씨수소의 선발 시스템에서 아직 표현형 자료를 생산할 수 없는 당대검정 후보축 대한 집단을 조성할 때 유전체 정보를 이용한 사전 선발을 활용하면 기존의 상대적으로 낮았던 육종가의 정확도의 상승 효과와 세대 간격의 단축으로 인하여 유전적 개량량을 증대시킬 수 있을 것으로 기대된다. 본 연구에서 genomic breeding value 추정을 위하여 조성된 집단의 경우는 후대 검정우 집단으로서 개체들 간의 혈연관계가 높으며, 이미 전통적인 BLUP 방법으로도 상당히 높은 정확도를 가진 집단을 이용하였다. 그러나, 현재 한우 집단에 대한 유전체 자료 구축 시 이용할 수 있는 정확한 자료는 후대검정우 집단 외에는 참조 집단을 조성할 수 있는 대안이 없으므로, 지속적인 유전체 검정을 위해서는 다양한 유전적 조성이 구축된 참조 집단을 구축해야 할 것으로 사료된다. 또한 유전체 검정을 통한 정확도 상승효과를 기대하기 위해서 지속적으로 참조 집단의 크기를 늘릴 필요성이 있다.

The effectiveness of genomic selection for milk production traits of Holstein dairy cattle

  • Lee, Yun-Mi;Dang, Chang-Gwon;Alam, Mohammad Z.;Kim, You-Sam;Cho, Kwang-Hyeon;Park, Kyung-Do;Kim, Jong-Joo
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제33권3호
    • /
    • pp.382-389
    • /
    • 2020
  • Objective: This study was conducted to test the efficiency of genomic selection for milk production traits in a Korean Holstein cattle population. Methods: A total of 506,481 milk production records from 293,855 animals (2,090 heads with single nucleotide polymorphism information) were used to estimate breeding value by single step best linear unbiased prediction. Results: The heritability estimates for milk, fat, and protein yields in the first parity were 0.28, 0.26, and 0.23, respectively. As the parity increased, the heritability decreased for all milk production traits. The estimated generation intervals of sire for the production of bulls (LSB) and that for the production of cows (LSC) were 7.9 and 8.1 years, respectively, and the estimated generation intervals of dams for the production of bulls (LDB) and cows (LDC) were 4.9 and 4.2 years, respectively. In the overall data set, the reliability of genomic estimated breeding value (GEBV) increased by 9% on average over that of estimated breeding value (EBV), and increased by 7% in cows with test records, about 4% in bulls with progeny records, and 13% in heifers without test records. The difference in the reliability between GEBV and EBV was especially significant for the data from young bulls, i.e. 17% on average for milk (39% vs 22%), fat (39% vs 22%), and protein (37% vs 22%) yields, respectively. When selected for the milk yield using GEBV, the genetic gain increased about 7.1% over the gain with the EBV in the cows with test records, and by 2.9% in bulls with progeny records, while the genetic gain increased by about 24.2% in heifers without test records and by 35% in young bulls without progeny records. Conclusion: More genetic gains can be expected through the use of GEBV than EBV, and genomic selection was more effective in the selection of young bulls and heifers without test records.

불완전한 자료에 대한 보완기법(EM 알고리듬과 2단계(Two Stage) 모델) (EM Algorithm and Two Stage Model for Incomplete Data)

  • 박경숙
    • 한국인구학
    • /
    • 제21권1호
    • /
    • pp.162-183
    • /
    • 1998
  • 여기서는 많은 수의 비관측사례로부터 발생할 수 있는 표본의 편의(bias) 문제를 탐구한다. 이 연구는 본래 일본 후생성이 1989년 실시한 <가족주기와 가구형태에 대한 인구학적 조사> 자료를 이용하여 노인부보와 자녀간 근접성을 분석하는 목적에서 이루어졌다. 그런데 <가족주기와 가구형태에 대한 인구학적 조사>는 노인부모를 대상으로 한 조사가 아니라 전체 가구 일반에 대한 조사이기 때문에 노인부모에 대한 많은 정보를 손상하고 있었다. 또한 본 조사는 가구주를 통하여 가족원에 대한 정보를 획득하는 방식으로 설계되었기 때문에 가족원에 대한 정보가 완전하지 못하였다. 나아가 비관측사례의 유형을 보면 여러 항목들이 동시적으로 관측되지 않고 있었다. 이와 같이 복합적 메커니즘에서 발생한 비관측 사례는 분석의 편의를 초래할 위험이 크다. 우선, 많은 수의 비관측사례로 표준오차를 잘못 추정할 소지가 크다. 더욱이 사례들이 선택적으로 관측되지 않았다면 관측된 자료에 따른 추정을 심각한 편의를 포함할 수 있다. 이와 같이 손상된 자료로부터 발생할 수 있는 추정 편의를 개선하기 위하여 여기서는 두 가지 기법을 활용하였다. 첫째, 관측치와 공변인간의 관계에 기초하여 비관측사례를 추정하는 방법으로 EM 알고리듬을 활용하였다. 둘째, 관찰의 선택성에서 비롯된 추정 편의를 개선하기 위하여 이단계(two stage) 모형을 활용하였다.

  • PDF

위성자료와 다중회귀분석법을 이용한 아시아 주요도시의 포름알데하이드 칼럼농도 추정연구 (First-time estimation of HCHO column in major cities over Asia using multiple regression with satellite data)

  • 최원이;홍현기;박준성;이한림
    • 대한원격탐사학회지
    • /
    • 제31권6호
    • /
    • pp.523-530
    • /
    • 2015
  • 본 연구에서는 다중회귀분석법과 Ozone Monitoring Instrument(OMI), Moderate Resolution Imaging Spectroradiometer(MODIS) 자료를 이용하여 2005년 1월부터 2008년 7월 사이 아시아 주요도시 지역의 포름알데하이드 층적분농도를 동북아시아에 위치한 3개도시(베이징, 서울, 도쿄)와 동남아시아에 위치한 3개도시(뉴델리, 다카, 방콕)에서 처음으로 추정하였다. 동북아시아의 3개 도시에서는 OMI로 측정된 포름알데하이드의 층적분농도($HCHO_{OMI}$)와 다중회귀분석방법으로 추정된 포름알데하이드의 층적분농도($HCHO_{MRM}$) 사이의 높은 상관성(0.78 < $R^2$ < 0.82)을 보였다. 동남아시아의 주요도시에서는 동북아시아 지역에 비해 $HCHO_{OMI}$$HCHO_{MRM}$사이의 낮은 상관성을 발견 할 수 있었다. 이외에도, 다중회귀분석법의 편중되지 않은 평가를 위하여, 다중회귀분석식을 도출해내기 위한 모델링 그룹과 다중회귀분석법의 성능을 보여줄 검증그룹으로 나누어 다중회귀분석법의 성능을 평가하였다. 본 연구는 아시아 일부 지역에서 다중회귀 분석법이 포름알데하이드 칼럼농도 추정에 있어 위성 관측이 어려울 경우 대안으로 활용될 수 있음을 제시하고 있다.

Comparison of accuracy of breeding value for cow from three methods in Hanwoo (Korean cattle) population

  • Hyo Sang Lee;Yeongkuk Kim;Doo Ho Lee;Dongwon Seo;Dong Jae Lee;Chang Hee Do;Phuong Thanh N. Dinh;Waruni Ekanayake;Kil Hwan Lee;Duhak Yoon;Seung Hwan Lee;Yang Mo Koo
    • Journal of Animal Science and Technology
    • /
    • 제65권4호
    • /
    • pp.720-734
    • /
    • 2023
  • In Korea, Korea Proven Bulls (KPN) program has been well-developed. Breeding and evaluation of cows are also an essential factor to increase earnings and genetic gain. This study aimed to evaluate the accuracy of cow breeding value by using three methods (pedigree index [PI], pedigree-based best linear unbiased prediction [PBLUP], and genomic-BLUP [GBLUP]). The reference population (n = 16,971) was used to estimate breeding values for 481 females as a test population. The accuracy of GBLUP was 0.63, 0.66, 0.62 and 0.63 for carcass weight (CWT), eye muscle area (EMA), back-fat thickness (BFT), and marbling score (MS), respectively. As for the PBLUP method, accuracy of prediction was 0.43 for CWT, 0.45 for EMA, 0.43 for MS, and 0.44 for BFT. Accuracy of PI method was the lowest (0.28 to 0.29 for carcass traits). The increase by approximate 20% in accuracy of GBLUP method than other methods could be because genomic information may explain Mendelian sampling error that pedigree information cannot detect. Bias can cause reducing accuracy of estimated breeding value (EBV) for selected animals. Regression coefficient between true breeding value (TBV) and GBLUP EBV, PBLUP EBV, and PI EBV were 0.78, 0.625, and 0.35, respectively for CWT. This showed that genomic EBV (GEBV) is less biased than PBLUP and PI EBV in this study. In addition, number of effective chromosome segments (Me) statistic that indicates the independent loci is one of the important factors affecting the accuracy of BLUP. The correlation between Me and the accuracy of GBLUP is related to the genetic relationship between reference and test population. The correlations between Me and accuracy were -0.74 in CWT, -0.75 in EMA, -0.73 in MS, and -0.75 in BF, which were strongly negative. These results proved that the estimation of genetic ability using genomic data is the most effective, and the smaller the Me, the higher the accuracy of EBV.

2계층 Frobenius norm 유한 임펄스 응답 필터 기반 디지털 위상 고정 루프 설계 (Design of Digital Phase-locked Loop based on Two-layer Frobenius norm Finite Impulse Response Filter )

  • 김신;신성;유성현;최현덕
    • 한국전자통신학회논문지
    • /
    • 제19권1호
    • /
    • pp.31-38
    • /
    • 2024
  • 디지털 위상 고정 루프는 디지털 위상 검출기, 디지털 루프 필터, 디지털 제어 발진기, 분배기 등으로 이루어진 일반적인 회로로 전기 및 회로 분야 등 다양한 분야에서 널리 사용된다. 디지털 위상 고정 루프의 성능 향상을 위해 다양한 수학적인 알고리즘 등을 활용한 상태 추정기가 사용된다. 전통적인 상태 추정기로는 무한 임펄스 응답 상태 추정기의 칼만 필터를 활용해왔으며, 무한 임펄스 응답 상태 추정기 기반 디지털 위상 고정 루프는 초기값의 부정확성, 모델 오차, 다양한 외란 등의 예상치 못한 상황에서 급격한 성능 저하가 발생할 수 있다. 본 논문에서는 새로운 디지털 위상 고정 루프를 설계하기 위해 2계층 Frobenius norm 기반 유한 임펄스 상태 추정기를 제안한다. 제안한 상태 추정기는 첫 번째 층의 추정 상태를 이용하여 두 번째 층에서 상태 추정을 하는데, 이때 첫 번째 층의 추정 상태와 누적된 측정값과 결합하여 설계하였다. 새로운 유한 임펄스 응답 상태 추정기 기반 디지털 위상 동기 루프의 강인한 성능을 검증하기 위해 잡음 공분산 정보가 부정확한 상황에서 무한 임펄스 응답 상태 추정기와 비교하여 시뮬레이션을 수행하였다.