• 제목/요약/키워드: rank regression

검색결과 288건 처리시간 0.026초

Random Regression Models Are Suitable to Substitute the Traditional 305-Day Lactation Model in Genetic Evaluations of Holstein Cattle in Brazil

  • Padilha, Alessandro Haiduck;Cobuci, Jaime Araujo;Costa, Claudio Napolis;Neto, Jose Braccini
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제29권6호
    • /
    • pp.759-767
    • /
    • 2016
  • The aim of this study was to compare two random regression models (RRM) fitted by fourth ($RRM_4$) and fifth-order Legendre polynomials ($RRM_5$) with a lactation model (LM) for evaluating Holstein cattle in Brazil. Two datasets with the same animals were prepared for this study. To apply test-day RRM and LMs, 262,426 test day records and 30,228 lactation records covering 305 days were prepared, respectively. The lowest values of Akaike's information criterion, Bayesian information criterion, and estimates of the maximum of the likelihood function (-2LogL) were for $RRM_4$. Heritability for 305-day milk yield (305MY) was 0.23 ($RRM_4$), 0.24 ($RRM_5$), and 0.21 (LM). Heritability, additive genetic and permanent environmental variances of test days on days in milk was from 0.16 to 0.27, from 3.76 to 6.88 and from 11.12 to 20.21, respectively. Additive genetic correlations between test days ranged from 0.20 to 0.99. Permanent environmental correlations between test days were between 0.07 and 0.99. Standard deviations of average estimated breeding values (EBVs) for 305MY from $RRM_4$ and $RRM_5$ were from 11% to 30% higher for bulls and around 28% higher for cows than that in LM. Rank correlations between RRM EBVs and LM EBVs were between 0.86 to 0.96 for bulls and 0.80 to 0.87 for cows. Average percentage of gain in reliability of EBVs for 305-day yield increased from 4% to 17% for bulls and from 23% to 24% for cows when reliability of EBVs from RRM models was compared to those from LM model. Random regression model fitted by fourth order Legendre polynomials is recommended for genetic evaluations of Brazilian Holstein cattle because of the higher reliability in the estimation of breeding values.

Expression Profiles of Loneliness-associated Genes for Survival Prediction in Cancer Patients

  • You, Liang-Fu;Yeh, Jia-Rong;Su, Mu-Chun
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제15권1호
    • /
    • pp.185-190
    • /
    • 2014
  • Influence of loneliness on human survival has been established epidemiologically, but genomic research remains undeveloped. We identified 34 loneliness-associated genes which were statistically significant for high-lonely and low-lonely individuals. With the univariate Cox proportional hazards regression model, we obtained corresponding regression coefficients for loneliness-associated genes fo individual cancer patients. Furthermore, risk scores could be generated with the combination of gene expression level multiplied by corresponding regression coefficients of loneliness-associated genes. We verified that high-risk score cancer patients had shorter mean survival time than their low-risk score counterparts. Then we validated the loneliness-associated gene signature in three independent brain cancer cohorts with Kaplan-Meier survival curves (n=77, 85 and 191), significantly separable by log-rank test with hazard ratios (HR) >1 and p-values <0.0001 (HR=2.94, 3.82, and 1.78). Moreover, we validated the loneliness-associated gene signature in bone cancer (HR=5.10, p-value=4.69e-3), lung cancer (HR=2.86, p-value=4.71e-5), ovarian cancer (HR=1.97, p-value=3.11e-5), and leukemia (HR=2.06, p-value=1.79e-4) cohorts. The last lymphoma cohort proved to have an HR=3.50, p-value=1.15e-7. Loneliness-associated genes had good survival prediction for cancer patients, especially bone cancer patients. Our study provided the first indication that expression of loneliness-associated genes are related to survival time of cancer patients.

수로교 개보수를 위한 개략공사비 산정 모델 개발 - 회귀분석과 사례기반추론의 비교를 중심으로 - (Development of Approximate Cost Estimate Model for Aqueduct Bridges Restoration - Focusing on Comparison between Regression Analysis and Case-Based Reasoning -)

  • 전건영;조재용;허영
    • 대한토목학회논문집
    • /
    • 제33권4호
    • /
    • pp.1693-1705
    • /
    • 2013
  • 국내의 수로교는 쌀문화로 상징되는 농업용수를 공급하는 교량으로서 수로교를 개보수하기 위해서는 기본설계를 실시하는 것이 바람직하나 현재 생략되고 있는 실정이므로 이에 소요되는 공사비를 산정할 필요가 있다. 이 연구에서는 2003년 이후 교체한 RC구조 수로교에 대한 실적자료를 기초로 개략공사비 산정 회귀분석(RA) 모델과 사례기반추론(CBR) 모델을 개발하였다. RA 모델의 경우 단순회귀 모델이 다중회귀 모델보다 오차율이 낮았다. CBR 모델의 경우 유전 알고리즘을 이용하였으며 영향요인의 가중치, 편차, 순위조건을 최적화 대상으로 하였고 특히 영향요인 가중치의 범위를 제한하여 수로교 개보수 공사비의 예측 정확도를 제고하였다. RA 모델과 CBR 모델 사이의 오차율은 통계적 차이를 보이지 않았다. 본 논문에서 제시된 수로교 개보수 개략공사비 산정방법은 개보수사업의 시행에 따른 신속한 의사결정을 하는데 활용될 수 있을 것으로 기대된다.

불완전 검정일 기록이 RRTDM을 이용한 홀스타인 젖소의 유전평가에 미치는 영향 (The Effect of the Incomplete Lactation Records for Genetic Evaluations with Random Regression Test-Day Models (RRTDM) in Holstein Cattle)

  • 조주현;조광현;이광전
    • Journal of Animal Science and Technology
    • /
    • 제47권2호
    • /
    • pp.147-158
    • /
    • 2005
  • The purpose of this study was to find out the effects that daughters' incomplete lactation records affect sire's breeding values through genetic evaluation using RRTDM(random regression test-day model). First, we estimated genetic parameters and breeding values on sires having complete lactation records of daughter by RRTDM, second, we changed complete lactation records of specific sires into incomplete records by various methods. Third, the breeding values were compared between complete and incomplete records. Finally, this study aimed to find out the methods to minimize the estimation errors of young bulls' breeding values. Data used in this study were collected from the dairy herd improvement program, and a total of 97,562 records were composed of 10,929 first parity with both parents known, since 1999. Breeding values on the daughters from randomly chosen sires were calculated and compared with among 90 day, 150day, and 200 day's incomplete records. For milk yields, sire's ranks of breeding values used by complete lactation records were very different from sire's ranks of breeding values obtained by incomplete lactation records(Rank_90 cut, 150cut, 200 cut).The differences were also obtained between complete lactation records(per305_full) and incomplete lactation record (per_90 cut, 150cut, 200 cut) in breeding values regarding persistency. Especially, the differences between per_90 cut and per305_full were very large(from 1.8 kg to 145kg).

Survey of the use of statistical methods in Journal of the Korean Association of Oral and Maxillofacial Surgeons

  • Choi, Yong-Geun
    • Journal of the Korean Association of Oral and Maxillofacial Surgeons
    • /
    • 제44권1호
    • /
    • pp.25-28
    • /
    • 2018
  • Objectives: This study aimed to describe recent patterns in the types of statistical test used in original articles that were published in Journal of the Korean Association of Oral and Maxillofacial Surgeons. Materials and Methods: Thirty-six original articles published in the Journal in 2015 and 2016 were ascertained. The type of statistical test was identified by one researcher. Descriptive statistics, such as frequency, rank, and proportion, were calculated. Graphical statistics, such as a histogram, were constructed to reveal the overall utilization pattern of statistical test types. Results: Twenty-two types of statistical test were used. Statistical test type was not reported in four original articles and classified as unclear in 5%. The four most frequently used statistical tests constituted 47% of the total tests and these were the chi-square test, Student's t-test, Fisher's exact test, and Mann-Whitney test in descending order. Regression models, such as the Cox proportional hazard model and multiple logistic regression to adjust for potential confounding variables, were used in only 6% of the studies. Normality tests, including the Kolmogorov-Smirnov test, Levene test, Shapiro-Wilk test, and $Scheff{\acute{e}}^{\prime}s$ test, were used diversely but in only 10% of the studies. Conclusion: A total of 22 statistical tests were identified, with four tests occupying almost half of the results. Adoption of a nonparametric test is recommended when the status of normality is vague. Adjustment for confounding variables should be pursued using a multiple regression model when the number of potential confounding variables is numerous.

부트스트랩 DEA를 이용한 공기업 효율성 분석 (An Efficiency Analysis of Public Enterprises Using Bootstrap DEA)

  • 박만희
    • 한국콘텐츠학회논문지
    • /
    • 제15권5호
    • /
    • pp.475-487
    • /
    • 2015
  • 본 연구에서는 부트스트랩 DEA를 이용하여 2013년 14개 공기업의 경영 효율성을 분석하였다. 또한 단절회귀분석을 이용하여 부트스트랩 편의조정 효율성에 영향을 미치는 요인을 분석하였다. 본 연구를 통해 도출된 결과와 시사점을 정리하면 다음과 같다. 첫째, 부트스트랩 DEA모형을 적용한 효율성 분석결과에 따르면 평균 기술효율성이 0.3182, 평균 순수기술효율성이 0.4994, 평균 규모효율성이 0.6585로 나타났으며, 기술비효율성의 주된 원인이 순수기술비효율성에 기인하는 것으로 분석되었다. 둘째, CRS 가정과 VRS 가정하의 일반 DEA모형을 적용한 TE와 부트스트랩 DEA모형을 적용한 TE 순위간에는 유의한 차이가 없는 것으로 나타났다. 셋째, 비효율원인 분석에서는 평가대상 14개 기관 중 11개 기관의 비효율원인이 순수기술에 더 크게 기인하고 있고, 3개 기관이 규모효율에 의해 비효율이 나타나는 것으로 분석되었다. 넷째, 단절회귀분석에서는 규모효율성에 영향을 미치는 요인으로 유의수준 10%에서 인건비, 영업이익, 매출액, 자기자본수익률, 종원원수 순으로 나타났다.

활동보조서비스가 가족부양부담에 미치는 영향 -가족탄력성 조절효과- (An Effect of Personal Assistance Services for the Disabled Persons upon the Burdens of Raising a Family - Focusing on Family Resilience Control Effect -)

  • 신준옥
    • 재활복지
    • /
    • 제18권4호
    • /
    • pp.95-117
    • /
    • 2014
  • 본 연구는 활동보조서비스(신체활동지원, 가사활동지원, 사회활동지원) 이용이 가족부양부담에 영향을 미치는지와 활동보조서비스와 가족 부양부담감 간에 가족탄력성(가족신념체계, 가족응집력, 상호작용)이 조절효과를 나타내는지를 파악하여 장애인복지의 실천적 개입 방안을 모색하는 근거자료를 제시하는데 목적이 있다. 본 연구의 연구목적을 위하여 경기도를 동부, 서부, 남부, 북부 지역으로 나누어서 2013년 4월 1일~5월 15일까지 활동보조서비스를 이용하는 1급, 2급 장애인가족 부양자 200명을 대상으로 자료를 수집하여 분석하였다. 자료분석은 spss 19.0 통계프로그램을 이용하여 탐색적 요인분석과 확인적 요인분석 그리고 위계적 회귀분석을 기초로 한 조절적 다중회귀분석(Moderated Multiple Regression Analysis)을 실시하였다. 본 연구의 주요 연구결과는 첫째, 활동보조서비스 중 신체활동지원을 이용하는 경우 장애인가족의 부양부담 감소에 영향을 주는 것으로 나타났다. 둘째, 활동보조서비스가 가족부양부담과의 관계에서 가족탄력성 중 가족신념체계와 가족응집력에서 조절효과가 있는 것으로 분석되었다.

Increased Argonaute 2 Expression in Gliomas and its Association with Tumor Progression and Poor Prognosis

  • Feng, Bo;Hu, Peng;Lu, Shu-Jun;Chen, Jin-Bo;Ge, Ru-Li
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제15권9호
    • /
    • pp.4079-4083
    • /
    • 2014
  • Background: Previous studies have showed that argonaute 2 is a potential factor related to genesis of several cancers, however, there have been no reports concerning gliomas. Methods: Paraffin specimens of 129 brain glioma cases were collected from a hospital affiliated to Binzhou Medical University from January 2008 to July 2013. We examined both argonaute 2 mRNA and protein expression by real-time quantitative PCR (qRT-PCR), Western blot analysis, and immunohistochemistry (IHC). The survival curves of the patients were determined using the Kaplan-Meier method and Cox regression, and the log-rank test was used for statistical evaluations. Results: Both argonaute 2 mRNA and protein were upregulated in high-grade when compared to low-grade tumor tissues. Multivariate analysis revealed that argonaute 2 protein expression was independently associated with the overall survival (HR=4.587, 95% CI: 3.001-6.993; P=0.002), and that argonaute 2 protein expression and WHO grading were independent prognostic factors for progression-free survival (HR=4.792, 95% CI: 3.993-5.672; P<0.001, and HR=2.109, 95% CI: 1.278-8.229; P=0.039, respectively). Kaplan-Meier analysis with the log-rank test indicated that high argonaute 2 protein expression had a significant impact on overall survival (P=0.0169) and progression-free survival (P=0.0324). Conclusions: The present study showed that argonaute 2 expression is up-regulated in gliomas. Argonaute 2 might also serve as a novel prognostic marker.

그림의 '부드러운-딱딱한' 정도의 평가 방법 (A Method to Evaluate Rate of 'Soft-Hard' In a Drawing)

  • 윤석훈
    • 한국산학기술학회논문지
    • /
    • 제10권12호
    • /
    • pp.3963-3970
    • /
    • 2009
  • 본 연구에서는 컴퓨터를 이용하여 미술치료에서 윤곽선의 예리성으로 형태를 평가하고 컬러이미지스케일을 통해 색채를 평가하여 '부드러운-딱딱한'의 정도를 정량적으로 평가하는 방법을 제안한다. 회귀모형을 사용하며 종속 변수는 색채 전문가가 그림을 '부드러운-딱딱한'으로 평가한 순위가 된다. 독립변수는 그림의 명도 및 채도의 평균과 표준편차, 그림의 색채 수, 픽셀의 양, 클러스터의 수, 윤곽선의 길이 및 예리성 등을 고려한다. 단계별 회귀분석에 의하여 종속변수를 설명하는 적절한 독립변수들을 선정한다. 평가자 간의 신뢰성을 살피고 평가자 순위와 시스템 순위 간의 순위상관계수를 통해 시스템의 타당성을 입증한다. 객관적이고 정량적 평가를 가능케 함으로써 색채심리 연구, 미술치료뿐만 아니라 패션, 섬유, 인테리어 산업 등에 유용한 정보를 제공한다.

랭킹 SVM과 RDBMS의 밀결합 통합 (Tightly Coupled Integration of Ranking SVM and RDBMS)

  • 송재환;오진오;양은석;유환조
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권4호
    • /
    • pp.247-253
    • /
    • 2009
  • 지난 십 년간 랭킹은 데이터 마이닝 분야의 활발한 연구분야였다. 그러나 랭킹은 다른 데이터 마이닝 기법들과 비슷하게 RDBMS와는 독립적으로 개발되었고, 그로 인해 기존에 널리 사용되고 있는 RDBMS들과의 연동성이 떨어진다는 단점이 존재하게 되었다. 다른 데이터 마이닝 기법들은 소결합이나 밀결합 접근법을 이용하여 RDBMS와 연동하기 위한 연구가 활발하게 진행되어 왔고, 그 결과 실제로 사용 가능한 응용시스템들이 나오게 되었다. 그러나 랭킹에서는 이와 같은 노력들이 잘 이루어지지 않고 있다. 본 논문에서는 랭킹 작업을 RDBMS에 연동하여 효율적으로 수행하기 위하여 MySQL에 Ranking SVM을 통합하는 작업을 진행하였다. 밀결합 접근법을 기반으로 하는 우리의 구현은 MySQL에 랭킹을 위한 새로운 SQL 명령어를 추가하였고 랭킹 작업의 효율성을 확인하기 위해서 소결합 접근법을 기반으로 하는 Ranking SVM과 성능을 비교 평가하여 훈련단계에서 $10{\sim}40%$, 예측단계에서 평균 60%의 성능향상을 확인할 수 있었다.