• 제목/요약/키워드: 표본이질성

검색결과 26건 처리시간 0.024초

가구특성과 빈곤지속기간이 빈곤탈피율에 미치는 영향 -지속기간의존성과 표본이질성에 대한 검증을 포함하여- (The Effects of Household Characteristics and Poverty Duration on Poverty Exit Rate -Examining the Effects of Duration Dependency and Sample Heterogeneity -)

  • 김환준
    • 사회복지연구
    • /
    • 제44권3호
    • /
    • pp.301-322
    • /
    • 2013
  • 본 연구는 한국노동패널조사의 1~11차 년도(1998~2008년) 자료를 이용하여 가구특성과 빈곤지속기간이 빈곤탈피에 미치는 영향을 분석하였다. 특히 빈곤지속기간이 경과할수록 빈곤탈피율이 낮아지는 현상이 진정한 지속기간의존성에 의한 것인지 또는 표본이질성에 기인한 것인지를 검증하고 비관찰 이질성을 통제할 때 독립변수의 영향력이 어떻게 달라지는지를 분석하는데 초점을 두었다. 관찰 비관찰 이질성을 통제하면 지속기간의존성이 대부분 사라진다는 분석결과는 겉으로 보이는 지속기간의존성이 사실은 표본이질성으로 인한 가식적 관계임을 의미한다. 또한 비관찰 이질성을 통제한 모형에서는 가구특성의 영향력이 더욱 커졌다. 연령, 교육수준, 가구형태, 가구원 수 등의 인구 사회적 특성과 취업상태 및 종사상 지위 등 경제활동 특성이 빈곤탈피율에 영향을 미친다.

종양 이질성을 검정을 위한 통계적 방법론 연구 (Statistical methods for testing tumor heterogeneity)

  • 이동녘;임창원
    • 응용통계연구
    • /
    • 제32권3호
    • /
    • pp.331-348
    • /
    • 2019
  • 전이성 종양의 성장패턴 차이와 변화율에 따른 종양 이질성(tumor heterogeneity)을 파악하는 것은 종양세포의 약물에 대한 민감성을 파악하고 적절한 치료법을 찾아내기 위해 중요하다. 일반적으로 N개의 표본의 집단이 구분된다면 t-test 혹은 ANOVA 분석을 통해 집단별 평균의 차이에 대한 검정이 가능하다. 그러나 본 논문에서 다루는 데이터와 같이 집단이 구분되지 않는 경우 이러한 방법들은 사용될 수 없다. 표본들 사이의 이질성을 검정하기 위한 통계적 방법들이 연구되어 왔다. 최소 조합 t-검정 방법은 그 중 하나이다. 본 논문에서는 상이한 비율로 데이터를 양분하는 조합도 고려하는 최대 조합 t-검정 방법을 제안한다. 한편, 표본의 이질성을 검정하는 것이 군집분석에서 최적의 군집의 개수가 2개 이상인지를 검정하는 것과 같음에 착안하여 새로운 방법을 제안한다. 최대 조합 t-검정과 gap통계량을 이용하면 이전에 제안된 방법보다 개선된 제1종의 오류를 범할 확률과 검정력을 갖는다는 것을 모의실험을 통해 확인하였고 실제 자료 분석을 통해 결과를 도출하였다.

크기가 1인 표본들로 구성된 집단에 기반한 모평균의 차이를 검정하기 위한 최소 조합 t-검정 방법 (A minimum combination t-test method for testing differences in population means based on a group of samples of size one)

  • 허미영;임창원
    • 응용통계연구
    • /
    • 제30권2호
    • /
    • pp.301-309
    • /
    • 2017
  • 일반적으로 각 N개의 모집단에서 2개 이상의 표본이 추출되었을 때, $H_0:{\mu}_1={\cdots}={\mu}_N$의 가설에 대하여 검정할 수 있지만 각 모집단으로부터 표본이 한 개씩 추출된다면 ${\bar{X}}$가 존재하지 않으므로 모평균의 차이 검정은 불가능하다. 하지만 하나씩 추출된 표본으로 구성된 집단을 두 집단으로 나누어 임의의 평균을 생성함으로써 평균의 차이를 비교한다면 표본들 사이에 존재할 수 있는 이질성을 파악할 수 있다. 따라서 우리는 두 집단으로 나눌 수 있는 조합의 수만큼 평균 차이를 검정할 수 있는 최소 조합 t-검정 방법을 제안하고자 한다. 최종적으로 본 논문에서는 한 개씩 추출된 표본들 사이의 이질성을 확인하기 위하여 평균 차이를 검정할 수 있는 방법을 제안하였고 모의실험 연구를 통해 성능을 확인하였고 실제 자료 분석을 통해 결과를 도출하였다.

선택실험법 자료에서의 선호이질성 분석을 위한 혼합로짓모형 및 잠재계층모형의 활용 (Using Mixed Logit Model and Latent Class Model to Analyze Preference Heterogeneity in Choice Experiment Data)

  • 유병국
    • 자원ㆍ환경경제연구
    • /
    • 제21권4호
    • /
    • pp.921-945
    • /
    • 2012
  • 조건부 로짓(Conditional Logit: CL)모형은 모형추정 및 결과해석이 비교적 용이하다는 장점으로 널리 사용되는 반면에 응답자의 선호이질성(preference heterogeneity)을 충분히 반영하지 못한다는 한계를 가지고 있다. 본 연구에서는 최근 지배적인 방식으로 제시되고 있는 두개의 모형인 혼합로짓(Mixed Logit; ML)모형과 잠재계층모형(Latent Class Model; LCM)을 사용하여 우리나라 보령댐 주변 습지보호에 있어서 응답자간 선호이질성을 설명하고자 하였다. 6대광역시와 보령시 표본에 대하여 응답자별 이질성의 존재여부를 검토한 결과 두 지역간 뚜렷한 차이가 있음을 알 수 있었다. 즉 보령시의 경우에는 응답자간 선호이질성이 뚜렷하게 나타난데 반하여 6대광역시의 경우 응답자간 선호이질성이 거의 나타나지 않았다. 따라서 6대광역시의 경우에는 모수추정을 위해 CL 모형의 사용이 가능하나 보령시의 경우에는 선호이질성을 반영하기 위해 ML모형이나 LCM에 근거한 모수추정이 요구된다. 선호이질성의 원인을 규명하기 위하여 교차항이 있는 혼합로짓모형과 잠재계층모형을 고려할 수 있다. 교차항이 있는 혼합로짓모형의 경우 관찰되지 않은 개인단위의 이질성을 설명할 수 있는 장점이 있다. 그러나 두 모형을 비교한 결과 LCM이 교차항이 있는 ML모형이 제공하지 않는 추가적인 정보를 보여주는 것으로 나타나고 있다. 따라서 본 연구에서의 응답자간 선호이질성은 혼합로짓모형에 의한 개인적인 수준보다 잠재계층모형에 의한 계층단위에서 더 잘 설명될 수 있다고 할 수 있다.

  • PDF

비정상성 지역빈도해석을 위한 지역구분에 따른 이질성 척도 검토 (Investigation of Heterogeneity Measure for Nonstationary Regional Frequency Analysis)

  • 안현준;신주영;정태호;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.340-340
    • /
    • 2018
  • 전 세계적으로 기후변화로 인해 나타나는 이상기후의 영향을 고려하기 위해서 수문빈도해석분야에서는 비정상성 빈도해석에 관한 연구가 활발히 진행 중이다. 자료의 비정상성을 고려하여 빈도해석을 수행하는 방법은 다양하게 연구되어오고 있는데, 그중 시간에 따른 자료의 변화를 고려할 수 있도록 기존 모형의 매개변수에 시간을 고려할 수 있는 변수를 더하여 모형을 구축하는 기법이 비정상성 빈도해석기법으로 널리 활용되고 있다. 한편, 이러한 비정상성 가정에 관련한 연구들은 주로 지점빈도해석 기법을 중심으로 개발되어왔을 뿐, 아직 지역빈도해석기법을 대상으로 시도된 비정상성 연구는 미비한 실정이다. 지역빈도해석은 수문학적 동질지역이라는 가정을 바탕으로 표본의 확장을 통해 지점빈도해석보다 비교적 안정적인 빈도해석을 수행할 수 있는 기법으로 널리 알려져 있다. 따라서 지역빈도해석에서 수문학적 동질지역의 구분은 지역빈도해석 절차 중 가장 중요한 절차라고 할 수 있다. 이러한 수문학적 동질지역 구분을 위해서는 지점별로 가지고 있는 위치 정보나 수문 자료의 통계값과 같은 해당 지점을 대표할 수 있는 인자들이 필요하다. 본 연구에서는 모의실험을 통해 경향성이 나타나는 가상의 지점 자료를 생성한 뒤, 지역구분을 통해 자료의 비정상성이 나타나는 지역의 지역구분 결과를 살펴보고 이질성 척도(heterogenity measure)를 산정하였다. 이를 바탕으로 비정상성 지역빈도해석에서 이질성 척도의 적용성을 검토하고자 한다. 본 연구의 결과는 추후 기후변화의 영향이 나타나는 수문학적 동질 및 비 동질지역의 분석 및 비정상성 지역빈도해석을 위한 기초자료로 활용될 것으로 기대된다.

  • PDF

집락자료의 분할표에서 독립성검정 (Testing Independence in Contingency Tables with Clustered Data)

  • 정광모;이현영
    • 응용통계연구
    • /
    • 제17권2호
    • /
    • pp.337-346
    • /
    • 2004
  • 랜덤표본에 관한 이원분할표의 독립성검정에는 통상 피어슨의 카이제곱적합도검정과 우도비검정을 사용한다. 그러나 랜덤표본이 아닌 집락자료에 관한 분할표의 경우에는 이들 검정법은 잘못된 결과를 나타낸다. 이러한 경우에는 공변량의 고정효과 외에 집락에 따른 변량효과를 함께 포함하는 일반화선형혼합모형을 고려함으로써 집락간의 이질성과 집락내의 종속성을 반영할 수 있다. 본 연구에서는 집락자료의 분할표에 대한 일반화선형혼합모형을 소개하고 실례를 통하여 이들 모형의 적합에 대해 논의한다.

지역빈도해석을 위한 모홍수지수모형의 적용 (Application of Population Index Flood Model for Regional Frequency Analysis)

  • 김한빈;주경원;김태림;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.299-299
    • /
    • 2018
  • 지역빈도해석은 수문관측자료의 보유기간이 짧은 지점 또는 미계측 지점에 대하여 보다 정확하며 신뢰할 수 있는 설계수문량을 산정하기 위해 널리 사용되고 있는 방법이다. 지역빈도해석에서 사용되는 가장 대표적인 모형인 홍수지수모형 (index flood model)은 각 지점의 표본평균을 홍수지수로 정의하고 이를 이용하여 설계수문량을 산정하는 방법이다. 모홍수지수모형 (population index flood model)은 표본평균을 홍수지수로 사용함으로써 발생하는 설계수문량의 왜곡과 오차를 극복하기 위해 제안된 방법으로 홍수지수를 미지의 모분포로 가정한 후 설계수문량을 산정한다. 본 연구에서는 모홍수지수모형을 국내 강우관측자료에 적용하여 지역빈도해석을 수행하고자 한다. 먼저, 이질성척도(heterogeneity)를 통해 지역동질성이 확인된 지역에 대하여 GEV 분포형을 적용한 비정상성 모홍수지수모형을 적용해 지역빈도해석을 수행하고 확률강우량을 산정하였다. 또한, 기존의 지점빈도해석 및 L-moment 기반의 지역빈도해석 결과와 비교를 통해 모홍수지수모형의 적용성을 확인하였다.

  • PDF

패널자료를 이용한 신혼가구의 주택점유형태와 출산 관계 연구 (Analysis of Relationship between Housing Tenure and Birth in Newlywed Couples by Using Panel Data)

  • 신형섭
    • 토지주택연구
    • /
    • 제13권3호
    • /
    • pp.39-55
    • /
    • 2022
  • 본 연구에서는 한국노동연구원의 '한국노동패널조사(KLIPS)' 자료를 이용하여 2011년(14차 년도)부터 2020년(23차 년도)까지 총 9개 년도의 신혼가구에 대한 패널자료를 구축하고, 가구의 이질성을 통제한 상관 확률효과 방법론을 적용하여 자가점유여부가 출산에 미치는 영향과 출산이 자가점유여부의 영향을 분석하고, 그 분석 결과를 선행연구에서 시도한 합동(pooled) 축차형 이변량 프로빗(Recursive Bivariate Probit)모형의 추정 결과와 비교하였다. 자가점유의 내생성뿐만 아니라 가구의 이질성을 고려한 모형으로 실증 분석한 결과, 자가점유는 신혼가구의 출산에 긍정적 영향을 미치는 것으로 나타났다. 전체 표본을 이용한 경우 자가점유 주택에 거주하는 신혼가구는 주택을 임차하여 거주하는 신혼가구에 비해 출산 확률이 6.2%p 높았으며, 둘째 자녀 출산에 대해서는 5.7%p 높은 것으로 분석되었다. 다만 첫째 자녀 출산에서는 자가점유와 출산변수간의 내생성이 확인되지 않아 확률효과 프로빗 모형으로 분석하였는데 이 경우 자가점유 가구가 임차가구에 비해 출산 확률이 오히려 7.5%p 낮은 것으로 나타났다. 이러한 결과는 자가점유가 출산회수에 따라 출산에 대한 영향력이 차별적으로 나타남을 시사한다. 첫 출산에서는 주택구입으로 인한 부담 등의 부정적 영향이 긍정적 영향보다 높았으며, 다자녀 출산에서는 자가점유가 제공하는 주거안정 등의 긍정적 효과가 부정적 효과보다 크게 나타난 것으로 보인다. 그리고 출산이 자가점유에 미치는 영향을 살펴보면, 출산을 최근 1년 이내에 한 가구가 그렇지 않은 가구에 비해 자가점유 확률이 출산을 최근 1년 이내에 한 가구가 그렇지 않은 가구에 비해 자가점유 확률이 전체표본에서는 4.2%p, 둘째 자녀 출산표본에서는 3.9% 가량 낮은 것으로 나타나 다자녀 출산으로 인한 양육비용 부담은 자가보유를 미루는 데 영향을 미치는 것으로 나타났다.

거시경제변수(巨視經濟變數)와 주가(株價) - 한국주식시장(韓國株式市場)에서의 실증분석 -

  • 정기웅
    • 재무관리연구
    • /
    • 제8권2호
    • /
    • pp.111-129
    • /
    • 1991
  • 본 논문에서는 재정가격결정모형(裁定價格決定模型)(Arbitrage Pricing Model)을 기초로 우리나라 주식시장에 영향을 주는 거시경제변수가 무엇인가를 찾고자 하였다. 방법론면에서는 과거변수(過去變數)(lagged variables)에 의해서만 기대치를 형성시키는 AIRMA(Autoregressike Integrated with Moving Average) 방법을 이용하기보다는 마코프속성(屬性)(Markov Property)을 갖는 상태공간모형(狀態空間模型) (State Space Model)을 이용하여 보다 합리적인 거시경제 요인의 이노베이션을 하였다. 또한 단순한 요인분석(要因分析)(factor analysis)에 의한 요인추출은 요인의 표본의존성(標本依存性)(Sample dependency)이 심하므로 그룹간 요인분석(inter-battery factor analysis)을 행하여 추정(推定)된 요인(要因)(요인값 : factor score)과 요인수를 결정하여 관련 거시경제변수를 선택한다. 그룹간 요인분석을 위한 그룹을 형성할 때 그룹내에서는 동질성을 그룹간에는 이질성을 최대한 살리는 것이 필요한데, 이를 위해 군집분석(群集分析)(Cluster Analysis)을 사용한 것이 특징이다. 결론적으로 우리나라 주식시장에 영향을 미치는 거시경제요인(巨視經濟要因)으로 단위노동비율, 제조업제품재고지수, 채권프리미엄, 수출물가지수, 정부부문 통화공급, 회사채수익률, 종합주가지수 등 7가지가 있는 것으로 분석되고 있다.

  • PDF

단일 세포 RNA 시퀀싱 데이터에 대한 컴퓨터 분석의 작업과정 (The Workflow for Computational Analysis of Single-cell RNA-sequencing Data)

  • 우성훈;정병출
    • 대한임상검사과학회지
    • /
    • 제56권1호
    • /
    • pp.10-20
    • /
    • 2024
  • RNA-시퀀싱은 표본에 대한 전사체 전체의 패턴을 제공하는 기법이다. 그러나 RNA-시퀀싱은 표본 내 전체 세포에 대한 평균 유전자 발현만 제공할 수 있으며, 표본 내의 이질성(heterogeneity)에 대한 정보는 제공하지 못한다. 단일 세포 RNA-시퀀싱 기술의 발전을 통해 우리는 표본의 단일 세포 수준에서 이질성과 유전자 발현의 동역학(dynamics)에 대한 이해를 할 수 있게 되었다. 예를 들어, 우리는 단일 세포 RNA-시퀀싱을 통해 복잡한 조직을 구성하는 다양한 세포 유형을 식별할 수 있으며, 특정 세포 유형의 유전자 발현 변화와 같은 정보를 알 수 있다. 단일 세포 RNA-시퀀싱은 처음 도입된 이후 많은 이들의 관심을 끌게 되었으며, 이를 활용하기 위한 대규모 생물정보학(bioinformatics) 도구가 개발되었다. 그러나 단일 세포 RNA-시퀀싱에서 생성된 빅데이터 분석에는 데이터 전처리에 대한 이해와 전처리 이후 다양한 분석 기술에 대한 이해가 필요하다. 본 종설에서는 단일 세포 RNA-시퀀싱 데이터분석과 관련된 작업과정의 개요를 제시한다. 먼저 데이터의 품질 관리, 정규화 및 차원 감소와 같은 데이터의 전 처리 과정에 대해 설명한다. 그 이후, 가장 일반적으로 사용되는 생물정보학 도구를 활용한 데이터의 후속 분석에 대해 설명한다. 본 종설은 이 분야에 관심이 있는 새로운 연구자를 위한 가이드라인을 제공하는 것을 목표로 한다.