• 제목/요약/키워드: regression analysis method

검색결과 4,600건 처리시간 0.029초

Application of Crossover Analysis-logistic Regression in the Assessment of Gene- environmental Interactions for Colorectal Cancer

  • Wu, Ya-Zhou;Yang, Huan;Zhang, Ling;Zhang, Yan-Qi;Liu, Ling;Yi, Dong;Cao, Jia
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제13권5호
    • /
    • pp.2031-2037
    • /
    • 2012
  • Background: Analysis of gene-gene and gene-environment interactions for complex multifactorial human disease faces challenges regarding statistical methodology. One major difficulty is partly due to the limitations of parametric-statistical methods for detection of gene effects that are dependent solely or partially on interactions with other genes or environmental exposures. Based on our previous case-control study in Chongqing of China, we have found increased risk of colorectal cancer exists in individuals carrying a novel homozygous TT at locus rs1329149 and known homozygous AA at locus rs671. Methods: In this study, we proposed statistical method-crossover analysis in combination with logistic regression model, to further analyze our data and focus on assessing gene-environmental interactions for colorectal cancer. Results: The results of the crossover analysis showed that there are possible multiplicative interactions between loci rs671 and rs1329149 with alcohol consumption. Multifactorial logistic regression analysis also validated that loci rs671 and rs1329149 both exhibited a multiplicative interaction with alcohol consumption. Moreover, we also found additive interactions between any pair of two factors (among the four risk factors: gene loci rs671, rs1329149, age and alcohol consumption) through the crossover analysis, which was not evident on logistic regression. Conclusions: In conclusion, the method based on crossover analysis-logistic regression is successful in assessing additive and multiplicative gene-environment interactions, and in revealing synergistic effects of gene loci rs671 and rs1329149 with alcohol consumption in the pathogenesis and development of colorectal cancer.

UNCERTAINTY ANALYSIS OF DATA-BASED MODELS FOR ESTIMATING COLLAPSE MOMENTS OF WALL-THINNED PIPE BENDS AND ELBOWS

  • Kim, Dong-Su;Kim, Ju-Hyun;Na, Man-Gyun;Kim, Jin-Weon
    • Nuclear Engineering and Technology
    • /
    • 제44권3호
    • /
    • pp.323-330
    • /
    • 2012
  • The development of data-based models requires uncertainty analysis to explain the accuracy of their predictions. In this paper, an uncertainty analysis of the support vector regression (SVR) model, which is a data-based model, was performed because previous research showed that the SVR method accurately estimates the collapse moments of wall-thinned pipe bends and elbows. The uncertainty analysis method used in this study was an analytic uncertainty analysis method, and estimates with a 95% confidence interval were obtained for 370 test data points. From the results, the prediction interval (PI) was very narrow, which means that the predicted values are quite accurate. Therefore, the proposed SVR method can be used effectively to assess and validate the integrity of the wall-thinned pipe bends and elbows.

주성분회귀와 고유값회귀에 대한 감도분석의 성질에 대한 연구 (A study on the properties of sensitivity analysis in principal component regression and latent root regression)

  • 신재경;장덕준
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권2호
    • /
    • pp.321-328
    • /
    • 2009
  • 회귀분석에서 설명변수들 사이에 상관이 높으면 최소제곱추정법에서 구한 회귀계수들의 정도가 떨어진다. 다중공선성이라 불리는 이 현상은 실제 자료분석에서 심각한 문제를 야기시킨다. 이 다중공선성의 문제를 극복하기 위한 여러 가지 방법이 제안되었다. 능형회귀, 축소추정량 그리고 주성분분석에 기초한 주성분회귀와 고유값회귀등이 있다. 지난 수십 년간 많은 통계학자들은 일반적인 중 회귀에서 감도분석에 관해 연구하였으며, 주성분회귀, 고유값회귀와 로지스틱 주성분회귀에 대해서도 같은 주제로 연구하였다. 이 모든 방법에서 주성분분석은 중요한 역할을 하였다. 또한, 많은 통계학자들이 주성분분석과 관련된 다변량 방법에서 감도분석에 대해 연구를 하였다. 본 연구논문에서는 주성분회귀와 고유값회귀를 소개하고, 또한 주성분회귀와 고유값회귀에서 감도분석의 방법을 소개하고, 마지막으로 이들두방법에 대한 감도분석의 성질에 대해 논의하였다.

  • PDF

How to identify fake images? : Multiscale methods vs. Sherlock Holmes

  • Park, Minsu;Park, Minjeong;Kim, Donghoh;Lee, Hajeong;Oh, Hee-Seok
    • Communications for Statistical Applications and Methods
    • /
    • 제28권6호
    • /
    • pp.583-594
    • /
    • 2021
  • In this paper, we propose wavelet-based procedures to identify the difference between images, including portraits and handwriting. The proposed methods are based on a novel combination of multiscale methods with a regularization technique. The multiscale method extracts the local characteristics of an image, and the distinct features are obtained through the regularized regression of the local characteristics. The regularized regression approach copes with the high-dimensional problem to build the relation between the local characteristics. Lytle and Yang (2006) introduced the detection method of forged handwriting via wavelets and summary statistics. We expand the scope of their method to the general image and significantly improve the results. We demonstrate the promising empirical evidence of the proposed method through various experiments.

클래스 간 메소드 위치 결정 방법의 비교 (Comparative Analysis of Determination of Method Location between Classes)

  • 정영애;박용범
    • 한국콘텐츠학회논문지
    • /
    • 제6권12호
    • /
    • pp.80-88
    • /
    • 2006
  • 객체지향 패러다임에서 객체의 속성, 동작, 객체사이의 관계를 표현하는 클래스의 구성요소들에 대한 연관관계를 측정하는 응집도는 다양하게 연구되어 왔다. 리팩토링 분야에서도 개발자의 경험이나 직감에 의한 수동분석에서 자동분석에 이르기까지 다양한 연구가 제안되어 왔다. 리팩토링을 자동으로 수행하기 위해서는 수행여부를 결정짓는 객관적 판단기준에 대한 검증이 필요하다. 본 논문에서는 참조관계를 고려한 여섯 개의 메소드 위치 결정 요인과 메소드 위치에 대한 관계를 분석하기 위한 방법으로 로지스틱 회귀분석과 신경망을 사용할 것을 제안하였다. 실험 결과, 로지스틱 회귀 분석은 97%, 신경망은 90% 이상의 예측율을 보였으며, 로지스틱 회귀분석이 신경망을 이용한 방법보다 더 우수한 예측결과를 보였다. 또한 두 방법 모두 90% 이상의 예측율로 여섯 개의 메소드 위치 결정 요인이 리팩토링 무브 메소드의 객관적 판단기준으로 적용될 수 있음을 보였다.

  • PDF

Quantile 회귀분석을 이용한 극대강수량 자료의 경향성 분석 (Trend Analysis of Extreme Precipitation Using Quantile Regression)

  • 소병진;권현한;안정희
    • 한국수자원학회논문집
    • /
    • 제45권8호
    • /
    • pp.815-826
    • /
    • 2012
  • 기존 Ordinary Regression (OR) 방법을 이용한 경향성 분석은 경향성을 과소평가하는 문제점을 나타낸다. 이러한 점에서 본 연구에서는 자료의 정규분포 가정과 평균을 중심으로 경향성 평가가 이루어지는 기존 Ordinary Regression (OR) 방법을 개선한 Quantile Regression (QR) 방법을 제안하였다. 본 연구에서는 64개 강우 관측지점의 연 최대 극대강수량 자료에 대하여 QR 방법과 OR 방법에 대하여 통계적 성능을 평가하였다. QR 방법의경향성 분석결과 47개 지점에서 5% 오차수준 내에서 t-검정을 통과한 반면 OR 방법에서는 13개 지점 만이 통계적 유의성을 가지는 것으로 나타났다. 이는 OR 방법이 자료의 평균을 중심으로 경향성을 평가하는 기법인데 반해 QR은 자료의 다양한 분위에서 경향성을 평가함으로써 극대 및 극소 부분에서의 경향성을 보다 유연하게 감지하는 이유로 판단된다. QR 방법을 통한 경향성 평가는 평균 중심의 해석문제점을 개선할 수 있으며 자료가 정규분포를 따르지 않거나 왜곡된 분포형태를 갖는 자료의 수문학적 경향성 평가에 유용하게 사용될 수 있을 것으로 판단된다.

예측소음도를 이용한 어노이언스 예측모델을 위한 로지스틱 회귀분석의 적용방법 (Application Method of Logistic Regression Analysis for Annoyance Prediction Model Based on Predicted Noise Level)

  • 손진희;이건;정태량;장서일
    • 한국소음진동공학회논문집
    • /
    • 제20권6호
    • /
    • pp.555-561
    • /
    • 2010
  • Predicted noise level has been used to assess the annoyance response since noise map was generalized and being the normal method to assess the environmental noise. Unfortunately using predicted noise level to derive the annoyance prediction curve caused some problems. The data have to be grouped manually to use the annoyance prediction curve. The aim of this paper is to propose the method to handle the predicted noise level and the survey data for annoyance prediction curve. This paper used the percentage of persons annoyed(%A) and the percentage of persons highly annoyed as the descriptor of noise annoyance in a population. The logistic regression method was used for deriving annoyance prediction curve. It is concluded that the method of dichotomizing data and logistic regression was suitable to handle the predicted noise level and survey data.

규제 순응도와 산업재해 발생 수준간의 관계 분석 - 로지스틱 회귀분석과 포아송 회귀분석을 중심으로 - (Analysis of the relationship between regulation compliance and occupational injuries - Focusing on logistic and poisson regression analysis -)

  • 이경용;김기식;윤영식
    • 대한안전경영과학회지
    • /
    • 제15권2호
    • /
    • pp.9-20
    • /
    • 2013
  • OSHA(Occupational Safety and Health Act) generally regulates employer's business principles in the workplace to maintain safety environment. This act has the fundamental purpose to protect employee's safety and health in the workplace by reducing industrial accidents. Authors tried to investigate the correlation between 'occupational injuries and illnesses' and level of regulation compliance using Survey on Current Status of Occupational Safety & Health data by the various statistical methods, such as generalized regression analysis, logistic regression analysis and poison regression analysis in order to compare the results of those methods. The results have shown that the significant affecting compliance factors were different among those statistical methods. This means that specific interpretation should be considered based on each statistical method. In the future, relevant statistical technique will be developed considering the distribution type of occupational injuries.

대형 데이터에서 VIF회귀를 이용한 신속 강건 변수선택법 (Fast robust variable selection using VIF regression in large datasets)

  • 서한손
    • 응용통계연구
    • /
    • 제31권4호
    • /
    • pp.463-473
    • /
    • 2018
  • 연구에서는 선형회귀모형을 가정한 대형 데이터에서의 변수선택 알고리즘을 다룬다. 방법의 속도와 강건성에 주안점을 둔 여러 알고리즘들이 제안되었다. 그 중에서 streamwise 회귀 접근법을 사용한 VIF회귀는 신속하고 정확하게 수행된다. 그러나 VIF회귀는 최소제곱방법에 의해 모형이 추정되므로 이상치에 민감하다. 변수선택방법의 강건성을 높이기 위해 가중 추정치를 사용한 강건측도가 제안되었으며 강건 VIF회귀도 제안되었다. 본 연구에서는 잠재적 이상치를 탐지하여 제거한 후 VIF회귀를 수행하는, 빠르고 강건한 변수선택 방법을 제안한다. 제안된 방법은 모의실험과 데이터 분석 통해 다른 방법들과 비교된다.

회귀 매니폴드 3-D PCA 기반 새로운 이미지 분석 방법 (A New Image Analysis Method based on Regression Manifold 3-D PCA)

  • 이경민;인치호
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권2호
    • /
    • pp.103-108
    • /
    • 2022
  • 본 논문에서는 회귀 매니폴드 3-D PCA 기반 새로운 이미지 분석 방법을 제안한다. 제안된 방법은 대용량 이미지 데이터 입력 시 효율적인 차원 축소를 위해 개선된 매니폴드 3-D PCA와 PCA의 비선형 확장이 가능한 오토인코더를 기반으로 설계된 구조로 회귀분석 알고리즘으로 구성된 새로운 이미지 분석 방법이다. 오토인코더의 구성으로는 이미지 픽셀 값을 3차원 회전을 통한 최전의 초평면을 도출하는 회귀 매니폴드 3-D PCA와 딥러닝 구조와 유사한 Bayesian Rule 구조를 적용한다. 성능 검증을 위해 실험을 수행한다. 미세먼지 이미지를 활용하여 이미지를 향상되며, 이를 분류 모델을 통한 정확도 성능 평가를 수행한다. 그 결과 딥러닝 성능에 유효함을 확인할 수 있다.