• 제목/요약/키워드: GENERALIZED LINEAR MODEL

검색결과 451건 처리시간 0.026초

The relationship between shift work pattern and thyroid stimulating hormone in female workers

  • Hun Jeong;Chang Ho Chae;Jun Ho Lee;Hyo Won Chong
    • Annals of Occupational and Environmental Medicine
    • /
    • 제35권
    • /
    • pp.14.1-14.10
    • /
    • 2023
  • Background: Shift work is known to cause changes in the circadian rhythm of the human body and adversely affect not only physical health but also mental health. Some studies have demonstrated the correlation between shift work and thyroid stimulating hormone (TSH), a hormone that changes according to the diurnal rhythm, but few studies have reported the different TSH levels according to the shift work type. This study aimed to investigate changes in TSH according to the shift work type. Methods: This study included 1,318 female workers who had a medical checkup at a university hospital in Changwon from 2015 to 2019. Shift work types were classified as non-shift work, regular 2 shifts, and irregular three shifts, and a TSH ≥ 4.2 mIU/L was defined as abnormal. A general linear model (GLM) was used to compare the TSH levels and the risk of subclinical hypothyroidism in each year, and a binary logistic analysis was performed using a generalized estimation equation (GEE) to compare the risk of subclinical hypothyroidism over the 5-year period. Results: Of the 1,318 participants included in this study, 363, 711, and 244 were non-shift, two-shift, and irregular three-shift workers, respectively. In the GEE analysis, after adjusting for age, body mass index, smoking, and alcohol consumption, the odds ratios (ORs) were 1.81 (95% confidence interval [CI]: 1.15-2.86; p = 0.011) in 2 shifts and 2.02 (95% CI: 1.23-3.32; p = 0.006) in irregular three shifts, compared to non-shift. Conclusions: Our results showed that shift work had a higher risk of subclinical hypothyroidism than non-shift work and that there was a significant difference in the risk of subclinical hypothyroidism according to the shift work type. These findings suggest that the shift work type can be considered in future thyroid function tests and evaluations.

Monte-Carlo expectation-maximaization 방법을 이용한 무응답 모형 추정방법 (An estimation method for non-response model using Monte-Carlo expectation-maximization algorithm)

  • 최보승;유현상;윤용화
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권3호
    • /
    • pp.587-598
    • /
    • 2016
  • 각종 선거를 앞두고 여러 여론조사 기관들은 다양한 방법으로 선거 결과를 예측한다. 조사를 통한 선거 예측을 수행하는 데 있어서 발생할 수 있는 문제점 중 하나는 무응답이며 무응답 대체 방법에 따라 예측 결과는 완전히 다른 결과를 생산해 낼 수 있다. 본 연구에서는 무응답 대체의 방법으로 모형을 기반으로 한 대체 방법에 대하여 연구하였다. 특히, 최대 우도 추정 방법을 적용했을 때 무시할 수 없는 무응답 (non-ignorable non-response) 체계 하에서 발생할 수 있는 변방 값 문제를 해결하기 위해 Wei와 Tanner (1990)가 제안한 Monte Carlo EM 알고리즘을 적용하였다. 모의 실험을 통하여 MCEM 방법과 기존의 최대 우도 추정 방법, 베이지안 추정 방법 사이의 비교 연구를 진행하였고 그 결과 MCEM 방법이 기존 방법들에 대한 대안 방법으로 이용될 수 있음을 보였다. 또한 2012년에 시행된 제18대 대통령 선거 당일의 출구조사 자료를 적용하여 실증 분석을 수행하였다. 예측 결과를 비교하기 위해 Bautista 등 (2007)이 제안한 MWPE (modified within precinct error)를 이용하였다.

통계적 예측모형을 활용한 경륜 경기 순위 분석 (Analysis of cycle racing ranking using statistical prediction models)

  • 박가희;박리라;송종우
    • 응용통계연구
    • /
    • 제30권1호
    • /
    • pp.25-39
    • /
    • 2017
  • 최근 경륜은 2015년도 기준, 5백만 명 이상의 많은 사람들이 참여하고 2조를 넘어선 매출을 발생시키는 대중적인 레저스포츠로서 자리 잡고 있다. 본 연구의 목적은 다양한 통계적 분석기법을 사용하여 경륜경기의 순위를 예측하고, 순위에 유의한 영향을 미치는 변수들을 파악하는 데에 있다. 다양한 Classification 방법과 Regression 방법들을 적용하여 순위예측모형을 만들고 비교분석하였다. 대부분의 모형에서 공통적으로 선택된 변수들을 살펴보면, 등급이 강급될수록, 종합득점이 높을수록 순위가 높아지며 반대로 등급이 승급될수록, 번호 4번을 부여받을수록 그리고 최근성적의 순위가 낮을수록 순위가 낮아지는 것을 알 수 있었다. 또한, 선수의 실력과 관련된 연속형 변수들을 각 경기별로 평균값을 빼서 보정한 자료와 원자료를 사용하여 모형을 적합시킨 결과 모든 모형에서 보정된 자료를 사용하였을 때 더 낮은 오분류율을 보였다. 마지막으로 분석에 사용하지 않은 최근 한 달 경기결과를 예측해서 베팅했을 때 모든 경우에 예측률은 높았지만 큰 이익을 거두지 못했는데 그 이유는 낮은 배당률을 가진 경기의 결과만을 잘 예측했기 때문이다.

Support Vector Machine과 상태공간모형을 이용한 단변량 수문 시계열의 동역학적 비선형 예측모형 (Dynamic Nonlinear Prediction Model of Univariate Hydrologic Time Series Using the Support Vector Machine and State-Space Model)

  • 권현한;문영일
    • 대한토목학회논문집
    • /
    • 제26권3B호
    • /
    • pp.279-289
    • /
    • 2006
  • 최근에 수문시계열로부터 저차원의 비선형 거동을 재구성하고자 하는 연구가 활발히 진행되고 있다. 이러한 관점에서 본 연구에서는 Support Vector Machine(SVM)을 이용하여 우수한 상태-공간 재구성 능력을 갖는 비선형 예측모형을 구성하여 Great Salt Lake(GSL) Volume에 적용하였다. SVM은 Kernel 함수로부터 유도된 고차원의 특성공간 안에서 선형함수의 가상공간을 이용하는 Machine Learning 방법론이다. 또한 SVM은 훈련자료로부터 얻어지는 평균제곱오차가 아닌 일반화된 오차를 최소화함으로써 상대적으로 기존 방법에 비해 적은 수의 매개변수와 과적합(over fitting)을 피하면서 비선형 함수의 최적화가 가능하다. 본 연구에서 제시한 SVM 회귀분석의 적용성은 미국의 GSL의 2주 간격 Volume을 대상으로 검토하였다. SVM을 이용한 비선형 예측모형은 GSL Volume의 2주(1-Step), 8주(4-Step)와 반복예측(Iterated Prediction, 121-Step)까지 적용되었다. 본 연구에서는 극치사상 즉, 급격한 감소 및 증가 구간을 예측하는데 있어서 훈련구간과 예측구간을 구분하여 모형의 신뢰성을 평가하였다. 예측결과SVM은 훈련자료로부터 적은 수의 관측치를 이용하여 동역학적 거동을 추출할 수 있었으며 실제 관측자료와 거의 유사한 예측이 가능함을 통계적 지표로 확인할 수 있었다. 따라서 비선형 수문시계열의 단기 예측을 위한 모형으로 적용이 가능할 것으로 판단된다.

Does Home Oxygen Therapy Slow Down the Progression of Chronic Obstructive Pulmonary Diseases?

  • Han, Kyu-Tae;Kim, Sun Jung;Park, Eun-Cheol;Yoo, Ki-Bong;Kwon, Jeoung A;Kim, Tae Hyun
    • Journal of Hospice and Palliative Care
    • /
    • 제18권2호
    • /
    • pp.128-135
    • /
    • 2015
  • 목적: 2006년부터 가정산소치료 서비스에 대해 보장을 시작함에 따라, 기준에 부합하는 사람들은 가정산소 서비스이용에 대해 20%의 본인부담만을 지출하게 되었다. 이 같은 제도의 도입은 환자의 가정산소치료 서비스에 대한 부담을 경감시키게 됨에 따라 주요 이용자인 만성 폐쇄성 폐질환 환자들에게 긍정적인 효과를 미쳤을 것으로 예상된다. 하지만, 제도 도입 후 가정산소치료 서비스 제도의 효과에 대한 연구가 많지 않았고, 실증적 근거자료 또한 부족한 실정이다. 따라서, 본 연구는 제도 도입 후, 가정산소치료 서비스가 만성 폐쇄성 폐질환 환자들의 상태에 긍정적 영향을 미쳤는지를 알아보고자 한다. 방법: 만성폐쇄성 폐질환으로 2007년부터 2012년까지 병원을 방문한 사람(N=10,798)의 청구데이터를 분석에 이용하였으며, 가정산소치료 서비스 제도 적용의 기준인 호흡기장애등급에 따라 분포의 차이를 설명하기 위해 ${\chi}^2$ test을 하였다. 또한, 가정산소치료 서비스 이용에 대한 요인을 알아보고자 Multiple Logistic Regression Analysis을 하였으며, 가정산소치료 서비스 이용이 호흡기장애등급의 변화에 어떠한 영향을 주었는지 알아보고자 Generalized Linear Mixed Model 분석을 하였다. 결과: 분석대상 중 호흡기장애등급 1등급에 속하는 대상은 2,490명이었으며, 2/3등급에 속하는 대상은 8,308명이었다. 가정산소치료 서비스 이용에 대해서는 호흡기 장애등급 3등급이 1 또는 2등급에 비해 적게 이용하였다(OR: 0.33, 95% CI: 0.30~0.37). 또한, 가정산소치료를 이용함에 따라 환자의 상태의 변화에 대해 분석한 결과, 가정산소치료 이용자는 미이용자에 비해 상태의 완화 또는 유지에 대해 높은 값을 보였다(OR: 1.41, 95% CI: 1.23~1.61). 결론: 가정산소치료 서비스 이용은 만성 폐쇄성 폐질환 환자의 상태 악화방지에 대해서 긍정적인 영향을 준다.

이더넷 다중 클러스터에서 GHT의 병렬 분산 구현 (Parallel Distributed Implementation of GHT on Ethernet Multicluster)

  • 김영수;김명호;최흥문
    • 전자공학회논문지CI
    • /
    • 제46권3호
    • /
    • pp.96-106
    • /
    • 2009
  • 이더넷 클러스터에서 그 분산처리 규모를 확장하려면 스위치 당 최대포트 수(현재 48포트)에 의해 물리적 제약을 받는다. 본 연구에서는 MPI기반 이더넷 클러스터에서 일반화 허프변환(generalized Hough transform: GHT)의 분산처리 규모를 확장하기 위해 다수의 이더넷 스위치들로 다중 클러스터를 구현하고, 확장에 따른 통신 부담을 병렬분산 시간분석 모델 및 통신성능 모델로 분석한 후 고속화 구현하였다. 다중 클러스터 분산처리환경에서 가능한 작업분할 정책들에 대해 평가하고, 허프공간 누산기 배열분할(accumulator array partitioning: AAP)정책을 수정 적용하여 노드간의 통신회수와 통신시간을 최소화하였고, 노드 수의 증가에 따라 AAP 정책의 분할 데이터 범위를 크게 하고 그에 부합하는 부하균형 알고리즘도 구현하였다. 단일링크 병목을 갖는 클러스터간(intercluster) 통신지연을 최대한 줄이기 위하여 일감 분배에는 선형 파이프라인 방송을 사용하고, 작은 결과 메시지들의 수합(gathering)에는 선형 플랫트리(flat tree)를 사용함으로써 총체적으로 계산과 통신을 최대한 시간 중첩시켰다. 제안한 병렬분산 GHT를 이더넷 다중 클러스터 상에서 그 성능을 점근해석하고 실험하여, 4개 고속 이더넷 스위치로 128 노드의 MPI 기반 다중 클러스터를 구현하여 거의 선형에 가까운 속도제고율(speedup)을 확인하였다.

frailtyHL 통계패키지를 이용한 프레일티 모형의 변수선택: 유방암 생존자료 (Variable Selection in Frailty Models using FrailtyHL R Package: Breast Cancer Survival Data)

  • 김보현;하일도;노맹석;나명환;송호천;김자혜
    • 응용통계연구
    • /
    • 제28권5호
    • /
    • pp.965-976
    • /
    • 2015
  • 통계적 모형에서 적절한 변수를 선택하는 것은 회귀분석에서 매우 중요하다. 최근 벌점 함수(예: LASSO 및 SCAD)와 함께 벌점화 가능도를 사용하는 변수 선택 방법들이 선형모형 및 일반화 선형모형과 같은 단순한 통계 모형에서 널리 연구되고 있다. 이러한 방법들의 주요 장점은 중요한 변수를 선택하고 동시에 회귀계수를 추정하는 것이다. 그러므로 이 방법들은 0으로 회귀계수를 추정함으로써 중요하지 않은 변수를 삭제한다. 이 논문에서는 콕스 비례 위험 모형의 한 확장인 준 모수적 프레일티 모형에서 벌점화된 다단계 가능도(h-likelihood; HL)를 기반으로 적절한 변수를 선택하는 방법을 연구한다. 이를 위해 세 가지 벌점 함수 LASSO, SCAD 및 HL을 사용한다. 본 논문에서는 변수선택을 효율적으로 하기 위해 "frailtyHL" R 패키지 (Ha 등, 2012)를 기반으로 하여 새로운 함수를 개발하였다. 개발된 방법의 예증을 위해 전남대 의과대학 병원에서 수집된 유방암 생존자료를 이용하여 세 가지 변수 선택 방법의 결과를 비교하고, 이 변수선택방법들의 상대적 장 단점에 대해 토론한다.

증발접시 증발량자료를 이용한 공기동력학적 증발량 산정 방법의 적용성 평가 (Applicability evaluation of aerodynamic approaches for evaporation estimation using pan evaporation data)

  • 임창수
    • 한국수자원학회논문집
    • /
    • 제50권11호
    • /
    • pp.781-793
    • /
    • 2017
  • 본 연구에서는 우리나라 56개 연구지역에 대해서 증발량 산정방법 중에 하나인 공기동력학적 방법의 적용성을 검토하였다. 이를 위해 과거 연구자들에 의해서 제안된 공기동력학적 증발량 산정식들을 7가지 형식으로 구분하고 일반화하여 증발량 산정모델을 유도하였다. 또한, 공기동력학적 방법 적용에 필요한 기상요소자료들(풍속, 포화미흡량, 기온, 대기압)을 이용하여 4가지의 다변량 선형회귀모델을 유도하고 그 적용성을 검토하였다. 기상자료들의 자기상관의 영향을 고려하기 위해 변수들을 차분시켜 회귀분석을 실시하고 자기상관을 고려하지 않은 경우와 비교한 결과 결정계수 값에 큰 차이가 없음을 확인하였다. 연구결과에 의하면 공기동력학적 모델이나 다변량 선형회귀모델 모두에서 산정된 월 증발량과 관측된 월 증발량 사이에 매우 높은 상관성이 있는 것으로 나타났다. 하지만 대부분의 증발량 산정모델에서 8, 9, 10, 11, 12월에 증발량을 과다 산정하고 있는 것으로 나타났다. 다변량 선형회귀모델들에 사용된 기상요소자료들은 모두 증발량 산정에 유의한 영향력이 있는 것으로 나타났으며, 특히 포화 미흡량이 가장 중요한 기상요소이며, 두 번째로는 기온, 세 번째로는 풍속, 그리고 마지막으로 대기압인 것으로 나타났다.

도시공간에서 날씨와 계절이 보행량에 미치는 영향 (The Effect of Weather and Season on Pedestrian Volume in Urban Space)

  • 이수미;홍성조
    • 한국산학기술학회논문지
    • /
    • 제20권9호
    • /
    • pp.56-65
    • /
    • 2019
  • 물리적 환경이 보행에 미치는 영향에 관한 연구들은 지속적으로 이루어져 왔다. 그러나 도시공간에서의 보행량에 날씨가 미치는 영향에 대한 연구는 부족하다. 이에 본 연구는 도시공간에서 날씨가 보행량에 미치는 영향을 실증 분석하는 것을 목적으로 한다. 본 연구는 2009년 서울시 유동인구 조사자료를 활용하였으며, 지점별 보행량을 종속변수, 날씨와 물리적 환경을 독립변수로 하는 모형을 구축하였다. 날씨가 보행량에 미치는 영향을 계절별, 토지이용별, 시간대별로 파악하고자 계절-토지이용-시간대로 구분된 28개의 모형을 작성하여 결과를 비교 해석하였다. 본 연구의 종속변수가 정규성을 만족하지 못하기 때문에 음이항 회귀모형을 활용하였다. 분석결과를 정리하면 다음과 같다. 첫째, 날씨요인들은 보행량에 영향을 미친다. "비"는 대부분의 모형에서 보행량을 감소시키는 효과가 나타났으며, "눈"과 "천둥번개"는 소수의 모형에서 매우 큰 보행량 감소효과를 나타냈다. 둘째, 날씨가 보행량에 미치는 영향은 계절과 토지이용에 따라 다르게 나타났다. 예를 들어 "비"의 보행량 감소효과는 주거지역보다는 상업지역에서 크게 나타났으며, 동절기 보다는 하절기에 그 효과가 크게 나타났다. 셋째, 환경요인들의 영향도 계절에 따라 다르게 나타났다. 차로 수는 하절기에는 보행량에 정(+)의 영향을, 동절기에는 부(-)의 영향을 미치는 것으로 나타났다. 지하철역 여부 또한 하절기에는 보행량에 강한 정의 영향을 미치지만 동절기에는 그 효과가 작거나 음의 영향을 미쳤다. 본 연구의 정책적 시사점은 다음과 같다. 첫째, 보행량을 감소시키는 효과가 있는 눈이나 비에 대응할 수 있는 반옥외 도시공간의 조성이 필요하다. 둘째 계절별로 특화된 보행활성화 정책이 필요하다.

서울시 대기오염과 일별 사망의 상관성에 관한 시계열적 연구 (1998∼2001년) (A Time-Series Study of Ambient Air Pollution in Relation to Daily Mortality in Seoul, 1998∼2001)

  • 조용성;이종태;김윤신;홍승철;김호;하은희;박혜숙;이보은
    • 한국대기환경학회지
    • /
    • 제19권6호
    • /
    • pp.625-637
    • /
    • 2003
  • This study was performed to examine the relationship between air pollution exposure and mortality in Seoul for the years of 1998∼2001. Daily counts of death were analyzed by general additive Poisson model, with adjustment for effects of seasonal trend, air temperature, humidity, and day of the week as confounders in a nonparametric approach. Daily death counts were associated with CO (current day),O$_3$ (current day), PM$_{10}$ (current day), NO$_2$ (1 day before), SO$_2$ (1 day before). Increase of 41.71 $\mu\textrm{g}$/㎥ (interquartile range) in PM$_{10}$ was associated with 1.3% (95% CI = 0.7∼1.9%) increase in the daily number of death. $O_3$ concentrations resulted in an increased risk of 1.3% for 23.86 ppb in all-aged mortality [RR = 1.013 (1.004-1.023)1. This effect was greater in children (less than 15 aged) and elderly (more than 65 aged). After ozone level exceeds 25 ppb, the dose-response relationship between mortality and ozone was almost linear. We concluded that Seoul had 1∼5% increase in mortality in association with IQR (interquartile range) in air pollutants. Daily variations in air pollution within the range currently occurring in Seoul might have an adverse effect on daily mortality. These findings also support the hypothesis that air pollution, at levels below the current ambient air quality standards of Korea, is harmful to sensitive subjects, such as children or elderly.rly.