• 제목/요약/키워드: 가산자료

검색결과 80건 처리시간 0.019초

영과잉 공간자료의 분석 (Zero In ated Poisson Model for Spatial Data)

  • 한준희;김창훈
    • 응용통계연구
    • /
    • 제28권2호
    • /
    • pp.231-239
    • /
    • 2015
  • 가산자료(counts data)를 적합 하는 경우 보통 포아송 모형이 가장 먼저 고려된다. 과산포 문제가 있을 경우도 유사 포아송(quasi Poisson) 모형이나 음이항(Negative binomial) 모형으로 대부분 설명이 가능하다. 하지만, 가산자료 중에는 포아송분포를 가정한 기대 빈도 이상으로 많은 0이 관측되는 자료가 있고 이를 영과잉(Zero inflated) 가산 자료라고 부른다. 영과잉 가산자료를 설명하기 위해 영과잉 포아송(ZIP) 모형이나 영과잉 음이항(ZINB) 모형을 이용할 수 있다. 더 나아가 영과잉 가산자료가 공간상관관계까지 있을 경우 영과잉 문제뿐만 아니라 유의할 수 있는 공간효과까지 고려해야하고 이를 위해 혼합효과모형(mixed effects model)이 고려 될 수 있다. 본 연구에서 사용된 2004년 기준 부산시 남성동별 갑상선암 발생자수 자료를 이용하여, 일반선형 포아송모형, 영과잉 포아송모형, 공간 영과잉 포아송모형을 적합하여 비교해보았다.

폴랴-감마 잠재변수에 기반한 베이지안 영과잉 음이항 회귀모형: 약학 자료에의 응용 (A Bayesian zero-inflated negative binomial regression model based on Pólya-Gamma latent variables with an application to pharmaceutical data)

  • 서기태;황범석
    • 응용통계연구
    • /
    • 제35권2호
    • /
    • pp.311-325
    • /
    • 2022
  • 0의 값을 과도하게 포함하는 가산자료는 다양한 연구 분야에서 흔히 나타난다. 영과잉 모형은 영과잉 가산자료를 분석하기 위해 가장 일반적으로 사용되는 모형이다. 영과잉 모형에 대한 전통적인 베이지안 추론은 조건부 사후분포의 형태가 폐쇄형 분포로 나타나지 않아 모형 적합 과정이 용이하지 않다는 한계점이 존재했다. 그러나 최근 Pillow와 Scott (2012)과 Polson 등 (2013)이 제안한 폴랴-감마 자료확대전략으로 인해, 로지스틱 회귀모형과 음이항 회귀모형에서 깁스 샘플링을 통한 추론이 가능해지면서, 영과잉 모형에 대한 베이지안 추론이 용이해졌다. 본 논문에서는 베이지안 추론에 기반한 영과잉 음이항 회귀모형을 Min과 Agresti(2005)에서 분석된 약학 연구 자료에 적용해본다. 분석에 사용된 자료는 경시적 영과잉 가산자료로 복잡한 자료 구조를 가지고 있다. 모형 적합 과정에서는 깁스 샘플링을 통한 추론을 수행하기 위해 폴랴-감마 자료확대전략을 사용한다.

영과잉 경시적 가산자료 분석을 위한 허들모형 (Hurdle Model for Longitudinal Zero-Inflated Count Data Analysis)

  • 진익태;이근백
    • 응용통계연구
    • /
    • 제27권6호
    • /
    • pp.923-932
    • /
    • 2014
  • 허들모형은 영이 과잉 가산자료를 분석하기 위해서 사용되어 왔다. 이 모형은 이산부분을 위한 로짓모형과 절삭된 가산부분을 위한 절삭된 포아송모형의 혼합모형이다. 이 논문에서 우리는 경시적 영과잉 가산자료를 분석하기 위해서 수정된 콜레스키 분해을 이용하여 일반적인 이분산성을 가지는 변량효과 공분산행렬을 제안한다. 수정된 콜레스키 분해는 변량효과 공분산행렬을 일반화자기상관 모수와 혁신분산모수로 분리되면, 이러한 모수들은 베이지안 일반화 선형모형을 통해 추정된다. 그리고 실제 자료분석을 통하여 설명한다.

경시적 영과잉 가산자료와 생존자료의 결합모형 (A joint modeling of longitudinal zero-inflated count data and time to event data)

  • 김동욱;천지훈
    • 응용통계연구
    • /
    • 제29권7호
    • /
    • pp.1459-1473
    • /
    • 2016
  • 시간의 흐름에 따라 관측되는 경시적(longitudinal) 자료의 경우, 경시적 자료와 생존(survival) 자료가 종종 동시에 수집된다. 이 때 경시적 자료에서 발생하는 결측이 생존자료와의 연관성으로 인해 발생한 무시할 수 없는 결측(non-ignorable missing)이라면, 경시적 자료분석 방법만으로는 두 자료 간의 연관성을 고려하지 않아 독립변수에 대한 효과는 편향된 결과를 얻게 된다. 이러한 문제를 해결하기 위해서 결측의 원인이 생존시간과 연관되어 있으므로 생존모형을 고려하여 불편추정량을 얻기 위해 경시적 자료와 생존자료의 결합모형에 대한 연구가 이루어져 왔다. 본 논문은 경시적 자료의 형태가 영이 많이 존재하는 영과잉 가산자료(zero-inflated count data)와 생존자료의 결합모형을 연구하였다. 경시적 영과잉 가산자료와 생존자료는 각각 허들모형(hurdle model)과 비례위험모형(proportional hazards model)의 부 모형을 적용하였고, 두 부 모형들의 변량효과가 다변량 정규분포를 따른다는 가정을 통하여 결합하였다. 모수의 최우추정법으로 EM 알고리즘을 활용하였고, 추정된 표준오차를 계산하기 위해 프로파일 우도(profile likelihood)를 이용하였다. 최종적으로 모의실험을 통해 두 부 모형의 변량효과 간 상관관계가 존재하는 경우 결합모형이 개별적 모형보다 편의와 포함확률(coverage probability)의 측면에서 더 우수함을 보였다.

가산자료(count data)의 과산포 검색: 일반화 과정 (Overdispersion in count data - a review)

  • 김병수;오경주;박철용
    • 응용통계연구
    • /
    • 제8권2호
    • /
    • pp.147-161
    • /
    • 1995
  • 생검실험에서는 다산을 통해 번식하는 쥐와 같은 설치류 동물들을 실험대상으로 하여 이항분포나 포아송분포 하에서 가산자료(count data)를 많이 생성한다. 다산을 통해 태어난 동물들을 독립적인 실험대상으로 간주하여 자료분석을 하면, 同腹仔 효과로 인해 기존의 평균과 분산사이의 관계를 벗어나는 과산포현상이 종종 나타난다. 이러한 현상을 무시했을 때 모수추정치에 대한 분산을 과소추정하고, 이로 인하여 가설검정에서 낮은 검정력을 갖게 된다. 이러한 문제점을 해결하기 위하여 최근 10년간 과산포현상을 검색하는 통계량들과 과산포를 반영하는 모형들이 제시되었는데, 이를 개관하고 이러한 절차들의 일반화 과정을 자료 유형별로 비교분석한다.

  • PDF

가산자료 회귀모형을 활용한 연료전지 및 태양전지 분야 특허의 질적 수준 결정요인 분석 (Analyzing the Determinants of the Patent Quality in Fuel Cell and Solar Cell Technology Using Count Data Models)

  • 박정규;허은녕
    • 기술혁신학회지
    • /
    • 제13권2호
    • /
    • pp.365-378
    • /
    • 2010
  • 지속적인 성장을 위하여 정부는 R&D투자 규모를 지속적으로 늘리고 있으며, 동시에 R&D 성과의 산업화 연계 등 성과활용 관점의 관리와 인프라를 강화하고 있다. 그러나 사후적인 성과관리보다는 우수한 결과가 도출될 수 있는 사전적인 R&D기획이 더욱 중요하다. 본 연구는 우수한 R&D성과의 창출을 위한 R&D기획에 대한 시사점을 제시하고자, 신재생에너지 분야 중 연료전지와 태양전지 분야 특허를 대상으로 가산자료 모형을 활용하여 특허의 질적 수준 결정요인을 비교 분석 하였다. 분석결과 기술별로 결정요인은 서로 상이하게 나타나 R&D기획이 기술별로 구별되어야 함을 보였고, 결과를 바탕으로 우수한 R&D성과를 도출할 수 있는 연료전지, 태양전지 분야의 R&D기획 방향을 제시하였다.

  • PDF

이변량 조건부자기회귀모형을이용한강력범죄자료분석 (Analysis of Violent Crime Count Data Based on Bivariate Conditional Auto-Regressive Model)

  • 최정순;박만식;원유복;김학열;허태영
    • Communications for Statistical Applications and Methods
    • /
    • 제17권3호
    • /
    • pp.413-421
    • /
    • 2010
  • 본 연구에서는 5대 범죄중 사람의 생명과 신체에 심각한 위해를 가하는 강력범죄인 살인과 강도 범죄의 이변량 가산자료에 대해 이변량조건부자기회귀모형을 사용하여 공간상관성을 반영한 강력범죄모형을 제안하였다. 범죄자료와 같은 가산자료에 대한 과대산포 검정을 위해 우도비 검정 실시하였으며, 그 결과 과대산포가 유의하지 않음에 따라 공간포아송모형을 이용하였다. 실증예제로 2007년 서울시에서 제공하는 25개 자치구별 강력범죄자료를 지리정보시스템을 이용하여 강력범죄 발생실태를 시각화하였으며 강력범죄에 영향을 주는 다양한 요인들에 대하여 분석을 실시하였다.

일원배열 가산자료에서의 처리효과 비교 (Analysis of counts in the one-way layout)

  • 이선호
    • 응용통계연구
    • /
    • 제10권1호
    • /
    • pp.105-119
    • /
    • 1997
  • 일원배열형태의 가산 자료집합에서 각 군의 평균을 이용하여 처리효과를 비교할 수 있다. Barnwal과 Paul(1988)은 각 군의 산포모수가 같다는 가정 아래에서 처리에 따른 차이를 검정하는 우도검정통계량과 $C(\alpha)$ 통계량을 유도하였는데 본 연구에서는 이러한 가정이 만족되지 않아도 검정할 수 있도록 통계량을 일반화하였다. 또한 음이항분포 대신 Efron(1986)의 이중지수계 포아송 모형을 도입하여 새로운 통계량을 제시하였다. 모의실험을 통해 이중지수계 포아송 모형으로부터 유도된 $C(\alpha)$ 통계량이 어느 경우에나 적합함을 밝혔다.

  • PDF

조선시대 청계천 주변의 가산(假山)에 대한 연구 (A Study on Gasan of the Cheonggyecheon in the Joseon Dynasty)

  • 김묘정;정기호;김두규
    • 한국전통조경학회지
    • /
    • 제34권4호
    • /
    • pp.26-36
    • /
    • 2016
  • 본 연구는 조선시대 청계천 주변의 가산에 대하여 그 위치와 장소를 확인하고, 근대화 과정 속에서 사라졌거나 변화된 모습의 현황을 확인해 보기 위한 것이다. 청계천 준설과 관련된 고문헌자료 및 고지도를 통한 문헌조사와 가산의 실제위치 및 현황을 파악하기 위한 현장조사로 진행되었다. 연구내용은 다음과 같다. 첫째, 조선시대 청계천 관련 고문헌과 고지도를 통해서 청계천 주변 가산 관련 내용 및 기록을 선별하였고, 주로 세종 대에 지류 및 세류의 준설작업과 영조 대의 대규모 준설에 의해 가산이 조성되었다는 사실을 확인할 수 있었다. 둘째, 고지도에 나타난 청계천 주변의 가산 및 수림대의 위치를 파악하였으며, 그 위치가 오간수문을 중심으로 도성 안과 밖의 청계천 양안, 그 주변의 지류 주변임을 알 수 있었다. 셋째, 가산의 위치는 수선전도의 축척지도화방안을 토대로 고지도상의 가산을 현지도상에서 파악하고, 현지조사를 통해서 가산으로 표현된 장소들의 현황을 조사하였다. 연구결과 조선시대 청계천 주변에 조성된 가산은 대부분 19세기말 이래로 진행된 도시개발로 인해 사라졌지만 아직도 그 흔적이 일부 남아있음을 확인하였다.

합류부에 위치한 수위관측소의 배수영향 기간 검토 (Review of Backwater effect period of Gaging station located at the Confluence)

  • 강종완;이태희;이기성
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.380-380
    • /
    • 2021
  • 수위관측소에서는 일반적으로 실시간 수위관측을 통해 연속된 수위자료가 계측이 되고 있는 반면, 하천의 유량은 실시간 측정이 어렵기 때문에 목적에 따라 시기 또는 수위별로 측정을 실시하고 있다. 이를 통해 확보한 유량자료를 이용하여 수위-유량관계곡선(Stage-Discharge relationship)을 개발하고, 이 곡선을 이용하여 연속적인 유량자료를 제시하고 있다. 자연하천의 경우 하도의 인공적 및 자연적 변화에 따라 수위-유량관계가 변화하게 된다. 특히 합류부에 위치한 관측소는 일반적인 단일 하천에서의 수위-유량관계와 다르게 배수(Backwater)가 발생한다. 이는 등류수위의 경사보다 완경사가 발생하고 단순 수위-유량 일대일 관계를 나타내는데 어려움이 있다. 따라서 수위-유량관계곡선을 이용한 유량환산에 있어 배수 발생기간은 왜곡된 유량자료를 생산하거나 유량환산 불가기간이 발생하는 문제점이 있다. 미호천의 지류인 한천에 위치한 진천군(인산리) 관측소는 하류 약 500m에서 미호천 본류와 합류하고 있다. 또한 합류점을 기준으로 본류인 미호천 상류 약 3km에 진천군(가산교) 관측소, 하류 약 2km에 진천군(오갑교) 관측소가 위치하고 있다. 따라서 호우사상의 크기에 따라 본류 배수영향으로 진천군(인산리) 관측소 중고수위에서 수위-유량관계곡선으로 산정된 유량의 크기가 과대 산정되어 진천군(가산교)와 합산한 유량이 진천군(오갑교) 관측소 유량과 상하류 역전이 발생한다. 이러한 문제를 해결하기 위해 합류부 보조수위계 설치를 통해 배수영향을 검토 할 계획이었으나 2020년 큰 호우사상으로 보조수위계가 유실되어 본류에 위치한 진천군(가산교)와 진천군(오갑교) 관측소의 연속적인 수위, 유량, 유속 등 수리학적 인자를 이용하여 에너지 방정식으로부터 합류부 수위를 산정하고 지류인 한천의 배수영향 검토를 통해 진천군(인산리) 관측소의 배수 발생기간을 검토하였다. 따라서 수위-유량관계곡선을 이용한 유량환산에 있어서 배수에 의한 왜곡된 유량 자료를 제외하였으나 배수에 의한 유량환산 불가기간은 추후 해결해야 할 과제로 남는다.

  • PDF