• 제목/요약/키워드: extreme value statistics

검색결과 107건 처리시간 0.027초

Relationship between Urbanization and Cancer Incidence in Iran Using Quantile Regression

  • Momenyan, Somayeh;Sadeghifar, Majid;Sarvi, Fatemeh;Khodadost, Mahmoud;Mosavi-Jarrahi, Alireza;Ghaffari, Mohammad Ebrahim;Sekhavati, Eghbal
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제17권sup3호
    • /
    • pp.113-117
    • /
    • 2016
  • Quantile regression is an efficient method for predicting and estimating the relationship between explanatory variables and percentile points of the response distribution, particularly for extreme percentiles of the distribution. To study the relationship between urbanization and cancer morbidity, we here applied quantile regression. This cross-sectional study was conducted for 9 cancers in 345 cities in 2007 in Iran. Data were obtained from the Ministry of Health and Medical Education and the relationship between urbanization and cancer morbidity was investigated using quantile regression and least square regression. Fitting models were compared using AIC criteria. R (3.0.1) software and the Quantreg package were used for statistical analysis. With the quantile regression model all percentiles for breast, colorectal, prostate, lung and pancreas cancers demonstrated increasing incidence rate with urbanization. The maximum increase for breast cancer was in the 90th percentile (${\beta}$=0.13, p-value<0.001), for colorectal cancer was in the 75th percentile (${\beta}$=0.048, p-value<0.001), for prostate cancer the 95th percentile (${\beta}$=0.55, p-value<0.001), for lung cancer was in 95th percentile (${\beta}$=0.52, p-value=0.006), for pancreas cancer was in 10th percentile (${\beta}$=0.011, p-value<0.001). For gastric, esophageal and skin cancers, with increasing urbanization, the incidence rate was decreased. The maximum decrease for gastric cancer was in the 90th percentile(${\beta}$=0.003, p-value<0.001), for esophageal cancer the 95th (${\beta}$=0.04, p-value=0.4) and for skin cancer also the 95th (${\beta}$=0.145, p-value=0.071). The AIC showed that for upper percentiles, the fitting of quantile regression was better than least square regression. According to the results of this study, the significant impact of urbanization on cancer morbidity requirs more effort and planning by policymakers and administrators in order to reduce risk factors such as pollution in urban areas and ensure proper nutrition recommendations are made.

영-과잉 회귀모형을 활용한 폭염자료분석 (Heat-Wave Data Analysis based on the Zero-Inflated Regression Models)

  • 김성태;박만식
    • Journal of the Korean Data Analysis Society
    • /
    • 제20권6호
    • /
    • pp.2829-2840
    • /
    • 2018
  • 음이 아닌(non-negative) 측정값을 가지는 확률변수에 있어서, 영(0)이 과도하게 측정되는 자료를 반연속형(semi-continuous) 자료와 영-과잉(zero-inflated) 자료로 구분한다. 이러한 자료에서는 특정 확률 분포(probability distribution) 하에서의 확률보다 훨씬 큰 확률로 0을 관측하게 되는데, 연속형(continuous) 확률분포를 고려하는 경우에는 반연속형으로, 이산형(discrete) 확률분포를 고려하는 경우에는 영-과잉이라고 한다. 본 연구에서는 경계값(0)의 측정 여부에 관한 모형과 0보다 큰 확률변수에 대한 확률분포를 활용한 모형 등 두 개의 부문으로 이루어진 모형, 즉 2-부문 모형(two-part model)을 소개하고자 한다. 특히, 이산형 확률분포 중 포아송 분포와 음이항 분포를 고려한 영-과잉 회귀모형(regression model)을 설명하고 그 특성을 파악하고자 한다. 실증연구에서는 이러한 영-과잉 회귀모형을 활용하여 지난 10년(2009년부터 2018년) 간 한국의 여름철(6-8월) 폭염주의보(heat-wave advisory) 및 폭염경보(heat-wave warning) 발생일수를 적합하였다. 또한 공간예측기법 중 하나인 범용크리깅(universal kriging)을 이용하여 적합결과를 바탕으로 한 폭염 발생일수에 대한 예측지도를 작성하였다.

영산강 하구의 방류와 강우의 규모 및 빈도 상관성 분석 (Relationships on Magnitude and Frequency of Freshwater Discharge and Rainfall in the Altered Yeongsan Estuary)

  • 류호상;이관홍
    • 한국해양학회지:바다
    • /
    • 제16권4호
    • /
    • pp.223-237
    • /
    • 2011
  • 하구둑으로 인해 담수의 공급이 간헐적으로 발생하는 영산강 하구에서는 담수의 방류가 하구의 유동패턴, 염분농도의 변이, 영양염 공급 등 하구환경과 생태계 반응을 주도하는 요인이다. 담수의 방류는 유역의 강우조건에 영향을 받으므로 담수의 방류시기 및 규모를 파악하기 위해서는 담수방류를 유발하는 강우조건과 강우-방류간 상관관계에 대한 이해가 필요하다. 또한 담수방류가 하구에 미치는 영향을 평가하기 위해서는 방류의 규모와 더불어 빈도에 대한 고려가 필수적이다. 이 연구는 영산강 하구역의 담수방류를 예측하고 평가하는 도구로서 영산강 하구둑의 담수 방류자료를 대상으로 강우에 보다 직접적으로 반응하는 극치방류의 확률분포함수를 파악하고 극치방류를 유발하는 강우조건을 판별하여 극치방류를 유발하는 강우와 극치방류 간의 빈도-규모 관계식을 도출하는 데 목적을 두었다. 13.7년(1997.1.1-2010.8.31)간의 일방류량 자료에 대하여 일연속방류를 분석의 기본단위인 방류이벤트로 정의하되 4일 이상의 일연속방류의 경우는 방류패턴에 토대를 둔 이벤트 분리 알고리듬을 적용하여 개별 이벤트를 식별하였다. 총 529건의 방류 이벤트에 대하여 14년간의 연 최고치 중 최솟값에 해당하는 133,656,000 $m^3$을 기준으로 극치방류이벤트를 선별하고 부분시계열 빈도분석법을 적용하여 극치방류의 확률분포함수가 Weibull(k=1.4)함수를 따름을 확인하였다. 극치방류를 기준으로 대비되는 강우 l일전 3일합 강우량이며 최솟값은 50.98 mm인 것으로 나타났다. 이 기준에 따라 추출된 방류유발기능 강우군은 총 102건으로 극치방류이벤트의 수보다 많았다. 정준판별분석을 통해 3일합 강우량 이외에 관리수위대비(-1.35 m EL.) 하구호 수위가 방류유발 강우를 규정하는 중요한 요소라는 점과 방류유발가능 강우군을 선별하는 임계값을 104mm로 재조정할 경우 3일합 강우량만으로 방류유발 강우를 규정할 수 있음을 확인하였다. 극치방류 유발 강우만을 대상으로 강우-방류 관계식을 수립한 결과 3일합-강우량($\overline{r_{3day}}$), 3일합-강우량 재현주기($T_{r3}$), 방류량(Discharge, D), 방류량 재현주기($T_d$)의 관계는 $D=1.111{\times}10^8+1.677{\times}10^6{\overline{r_{3day}}$, (${\overline{r_{3day}}{\geqq}104$), $T_d=1.326T^{0.683}_{r3}$, $T_d=0.117{\exp}[0.0155{\overline{r_{3day}}]$로 나타났다. 100년 주기 3일합 강우(357mm)에 의해 유발되는 방류량은 영산강 하구둑 방류량의 재현주기는 30.8년 정도이며 그 양은 $7.0979{\times}10^8m^3$이다. 담수방류의 재현주기 및 재현주기에 기초한 강우-방류 관계식은 영산강 하구역을 비롯하여 인위적으로 담수의 방류가 조절되는 하구역에서 담수의 영향을 평가하고 예측하는 데 기여할 수 있을 것이다.

GPD 모형 산정을 위한 부분시계열 자료의 임계값 산정방법 비교 (Comparison of Methods of Selecting the Threshold of Partial Duration Series for GPD Model)

  • 엄명진;조원철;허준행
    • 한국수자원학회논문집
    • /
    • 제41권5호
    • /
    • pp.527-544
    • /
    • 2008
  • GPD 모형은 수문학 극치확률량 해석에 주로 적용되어 왔다. 극치 통계의 주목적은 드문 사상의 예측이며, 주요 문제점으로는 임계값 또는 임계값 초과치들에 대한 정확한 산정방법이 없어 그 추정이 매우 어렵다는 것이다. 본 연구에서는 임계값 또는 임계값 초과치들을 산정하기 위하여 4가지 방법을 적용하였다. 그 비교를 위하여 GPD 모형에 적용하여 7개의 지속시간(1, 2, 3, 6, 12, 18 및 24시간)과 10개의 재현기간(2, 3, 5, 10, 20, 30, 50, 70, 80 및 100년)에 대한 매개변수 및 Quantile을 추정하였다. 3변수 GPD의 매개변수 및 Quantile을 추정하기 위하여 MOM, ML과 PWM을 적용하였다. 적합도를 추정하기 위하여 K-S, CVM 및 A-D 검정을 수행하였고 Monte Carlo 실험으로 상대 제곱근오차를 산정하였다. 이러한 방법들을 이용하여 임계값 산정방법들을 비교하여 최적화된 방법을 추정하였다.

Praat과 R로 분석한 한국인 대화 음성 말뭉치의 fundamental frequency(f0)값 분포 (The fundamental frequency (f0) distribution of Korean speakers in a dialogue corpus using Praat and R)

  • 양병곤
    • 말소리와 음성과학
    • /
    • 제15권3호
    • /
    • pp.17-25
    • /
    • 2023
  • 이 논문은 국립국어원에서 배포한 한국인 대화 음성 말뭉치에서 화자의 성대의 진동을 나타내는 fundamental frequency(f0)값을 측정해서 한국인이 일상 대화를 할 때 f0값의 기초적인 통계자료를 살펴보고, 나이와 f0값의 분포는 어떤 관계를 보이는지를 조사했다. 연구자료 수집과 분석은 Praat과 R을 이용했고, 개인별 억양구마다 상자도를 구하고 사분위값을 활용하여 극단값을 제거하는 방법으로 최종 f0값 자료를 구했다. 그 결과 전체 한국인들의 f0값의 평균값은 185 Hz이고 중앙값은 187 Hz로 나왔다. 자료의 분포모양을 나타내는 왜도는 0.11의 정적분포를 보였고, 첨도는 -0.09로 정상분포에 거의 가까운 모양을 보였다. 일상대화의 피치값의 변화범위로는 238 Hz로 나타났다. 남녀 간의 f0값의 차이는 남성의 중앙값 114 Hz의 거의 두 배에 해당하는 199 Hz가 여성의 중앙값으로 나타났고 t검증결과 유의미한 차이를 보였다. 분포모양을 나타내는 왜도는 남성이 1.24이었고, 여성은 그것의 반에 해당하는 0.58이었다. 첨도는 남녀집단 각각 5.21과 3.88로 나타나 남성의 값이 34% 정도 더 뾰족한 모양을 보였다. 연령대별로는 남녀집단을 합하여 볼 때, 나이가 들수록 f0값이 서서히 내려가는 경향을 보였다. 연령대별 f0중앙값과 나이 간의 회귀분석을 실행한 결과 기울기가 남성집단에서는 0.15, 여성집단에서는 -0.586으로 서로 반대되는 경향을 기록했다. 결론적으로, 대규모 참여자가 녹음한 대화 음성에서 한국인의 집단별 연령별 다양한 f0분포를 규명할 수 있지만, 나이와 f0관계는 더 정밀한 자료수집이 필요함을 알 수 있었다.

L-모멘트법을 이용한 지역홍수빈도분석을 통한 금강유역 미계측 유역의 설계홍수량 산정 (Estimating design floods for ungauged basins in the geum-river basin through regional flood frequency analysis using L-moments method)

  • 이진영;박동혁;신지예;김태웅
    • 한국수자원학회논문집
    • /
    • 제49권8호
    • /
    • pp.645-656
    • /
    • 2016
  • 본 연구에서는 금강유역에 대한 지역홍수빈도분석을 실시하고 재현기간에 따른 홍수량을 추정하는 관계식을 제안하였다. 유역 내 유량자료의 수문학적 독립성과 동질성에 대한 검증을 위하여 Lag-1 자기상관성 분석, 동질성 검정, 이상치 검정, 불일치척도 검정을 수행하였다. 검정 결과, 금강유역의 대상 관측소들은 시간에 대하여 독립적이고 동질적 모집단에 속하며 이상치는 없었다. 일반 극치 분포(GEV), 3변수 대수정규 분포(LN-III), 피어슨-III 분포(P-III), 일반 로지스틱 분포(GLO), 일반 파레토 분포(GPA) 등 5개의 3변수 확률분포함수에 대한 L-모멘트비도와 평균가중거리(AWD), 그리고 $Z^{DIST}$ 적합도 산정 결과, GLO 분포함수가 금강유역의 최적 확률분포형으로 선정되었다. GLO 분포를 바탕으로 지역홍수빈도를 추정하는 회귀모형을 제안하였고, 강경 관측소의 관측 유량을 이용하여 회귀모형의 적용성을 검증하였다.

한국(韓國)의 아시아신흥공업국(新興工業國) 및 일본(日本)과의 대미수출경쟁(對美輸出競爭) : 환율효과(換率效果)를 중심(中心)으로 (Structure of Export Competition between Asian NIEs and Japan in the U.S. Import Market and Exchange Rate Effects)

  • 좌승희
    • KDI Journal of Economic Policy
    • /
    • 제12권2호
    • /
    • pp.3-49
    • /
    • 1990
  • 본고(本稿)는 AIDS(Almost Ideal Demand System) 수요모형(需要模型)을 이용하여 한국(韓國) 등 아시아 신흥공업국(新興工業國)과 일본(日本)을 포함하는 아시아 5국(國)으로부터의 미국(美國)의 수입수요(輸入需要)를 분석함으로써 이들간의 대미수출경쟁관계(對美輸出競爭關係)를 분석하고 있는데, 특히 환율변동(換率變動)이 이들 5개국(個國)의 대미수출(對美輸出)에 미치는 효과를 중점적으로 분석하고 있다. 분석결과에 의하면, 아시아신흥공업 4국(國)은 일본(日本)과는 경쟁적인 반면 서로간에는, 홍콩과 싱가포르간의 경쟁적인 관계를 제외하면, 보완적인 관계를 유지하고 있다. 그리고 이들 아시아 5국(國)은 모두가 서구선진국그룹에 대해서는 경쟁적인 반면 미국(美國)의 국내재(國內財)와는 보완적인 관계를 보이는 것으로 관찰되었다. 한편 이러한 결과에 따라 환율효과(換率效果)를 분석해 보면, 한국(韓國)의 경우 엔화(貨)의 대미(對美)달러환율(換率)이 1% 인상되면 대미수출물량(對美輸出物量)을 일정 수준에 유지하고자 할 경우는 원화(貨)의 대미(對美)달러환율(換率)도 약 1% 정도는 인상되어야 하지만, 대미수출점유율(對美輸出占有率)을 일정 수준에 유지하려면 원화(貨)의 대미(對美)달러환율(換率)은 최악의 경우 약 3%까지도 인상되어야 하는 것으로 나타났다. 이와 같이 한국(韓國)은 대미수출시장점유율(對美輸出市場占有率)이나 수출물량(輸出物量)의 유지를 위해서, 원화(貨)의 대미(對美)달러환율(換率)이 여타 NICS통화환율(通貨換率)의 움직임보다도 오히려 엔화(貨)의 대미(對美)달러환율(換率)의 움직임을 보다 잘 반영할 수 있도록 함으로써 엔화(貨)의 대미(對美)달러환율인상(換率引上)에 따른 수출저상효과(輸出沮喪效果)를 상쇄시켜 나가야 할 것이라는 시사를 얻게 되었다.

  • PDF