• 제목/요약/키워드: 표본추출

검색결과 1,291건 처리시간 0.035초

지속가능한 산림경영에 적합한 표본조사 방법의 개발 (Development of a Forest Inventory System for the Sustainable Forest Management)

  • 신만용;한원성
    • 한국산림과학회지
    • /
    • 제95권3호
    • /
    • pp.370-377
    • /
    • 2006
  • 본 연구는 지속가능한 산림경영에 적합한 표본조사 방법을 제시하기 위해 계통적 추출법, 계통적 집락추출법, 그리고 층화집락추출법을 이용하여 경기도 양평군의 산림을 대상으로 자료를 수집한 후 통계검증을 실시하였다. 표본조사 방법은 계통적 집락추출법이 가장 효율적인 것으로 분석되었는데, 계통적 집락추출법을 적용할 경우 집락의 형태와 집락 내의 표본점 간의 거리를 결정하기 위해 5가지 집락의 형태와 표본점간의 거리 4가지에 대하여 통계검증을 실시하였다. 그 결과 집락의 형태는 삼각형 그리고 집락 내의 표본점 간의 거리는 50m가 가장 적합할 것으로 평가되었다.

효과적인 기업부도 예측모형을 위한 ROSE 표본추출기법의 적용 (Application of Random Over Sampling Examples(ROSE) for an Effective Bankruptcy Prediction Model)

  • 안철휘;안현철
    • 한국콘텐츠학회논문지
    • /
    • 제18권8호
    • /
    • pp.525-535
    • /
    • 2018
  • 분류 문제에서 특정 범주의 빈도가 다른 범주에 비해 과도하게 높은 경우, 왜곡된 기계 학습을 유발할 수 있는 데이터 불균형(imbalanced data) 문제가 발생한다. 기업부도 예측 문제도 그 중 하나인데, 일반적으로 금융기관과 거래하는 기업들의 부도율은 대단히 낮아서, 부도 사례보다 정상 사례의 빈도가 월등히 높은 데이터 불균형 문제가 발생하고 있다. 이러한 데이터 불균형 문제를 해결하기 위해서는 적절한 표본추출 기법이 적용될 필요가 있으며, 지금껏 소수 범주 데이터를 복원 추출함으로써 다수 범주 데이터와 비율을 맞추어 데이터 불균형을 해결하는 오버 샘플링(oversampling) 기법이 주로 활용되어 왔다. 그러나 전통적인 오버 샘플링은 과적합화(overfitting)가 발생할 위험이 높아질 수 있는 단점이 있다. 이러한 배경에서 본 연구는 효과적인 기업부도 예측 모형 학습을 위한 표본추출 기법으로 2014년에 Menardi와 Torelli가 제안한 ROSE(random over sampling examples) 기법을 제안한다. ROSE 기법은 학습에 사용될 사례를 반복적으로 새롭게 합성하여 생성(synthetic generation)하는 기법으로, 과적합화 문제를 회피하면서도 분류 예측 정확도 개선에 도움을 줄 수 있다. 이에 본 연구에서는 ROSE 기법을 가장 성능이 우수한 이분류기로 알려진 SVM(support vector machine)과 결합하여 국내 한 대형 은행의 기업부도 예측에 적용해 보고, 다른 표본추출 기법들과의 비교연구를 수행하였다. 실험 결과, ROSE 기법이 다른 기법에 비해 통계적으로 유의한 수준으로 SVM의 예측정확도 개선에 기여할 수 있음을 확인하였다. 이러한 본 연구의 결과는 부도예측 외에 다른 사회과학 분야 예측문제의 데이터 불균형 문제 해결에도 ROSE가 우수한 대안이 될 수 있다는 사실을 시사한다.

설계효과모형 적용에 관한 연구 (A study on design effect models for complex sample survey)

  • 박인호
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권3호
    • /
    • pp.523-531
    • /
    • 2014
  • 설계효과는 새로운 표본설계를 계획하거나 기존 표본조사에 적용된 설계요소의 효율성을 평가하는데 널리 사용된다. 본 연구에서는 Gabler 등 (2006)이 제시한 설계효과모형을 층화이단집락추출의 표본설계로 이루어진 2013 식품소비행태조사에 응용하여 적용하였다. 조사결과를 통해 표본설계모형의 유용성과 적절성에 대해 논의하였다.

2001년 국민건강.영양조사 표본설계 (A Sampling Design for the 2001 National Health.Nutrition Survey)

  • 류제복;이계오;김영원
    • 응용통계연구
    • /
    • 제14권2호
    • /
    • pp.289-304
    • /
    • 2001
  • 2001년에 실시할 $\ulcorner$국민건강.영양조사$\lrcorner$를 위한 새로운 표본설계를 하였다. 본 표본설계에서는 표본의 대표성을 높이기 위해서 기존의 표본가구수는 유지하면서 표본조사구를 증가시키고 새로운 지역 층화변수를 추가로 도입하였다. 또한 추정량의 추정오차 공식을 유도하여 추정의 신뢰성을 측정할 수 있도록 설계하였다.

  • PDF

사업체 양곡소비량 및 재고량조사 표본설계

  • 김진;변루나
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2003년도 추계 학술발표회 논문집
    • /
    • pp.59-62
    • /
    • 2003
  • 양곡소비량조사는 가구부문과 사업체부문에서 소비하는 주요식품의 소비량을 조사함과 동시에 주곡인 쌀의 재고량을 조사한다. 이 조사는 해마다 통계청에서 표본설계하여 실시하는 표본조사에 의존한다. 특히, 사업체 부문의 양곡소비량 조사는 응용절사법(Modified Cut-Off Sampling Method)에 의해 표본추출되어 매년 11월에 조사가 실시되고 있다. 2003년도 사업체 양곡소비량 및 재고량조사는 2001년 사업체기초통계조사와 광공업통계조사를 모집단으로 하여 22,320 대상업체 중에서 819업체를 전수조사하고 2,145 업체를 표본조사하여 전체를 추계한다.

  • PDF

제 3상 임상시험에서 표본수 결정

  • 남정모
    • 한국응용약물학회:학술대회논문집
    • /
    • 한국응용약물학회 1995년도 제3회 추계심포지움
    • /
    • pp.73-78
    • /
    • 1995
  • 표본수를 결정하는 방법에는 크게 sequential design과 fixed sample size design이 있다. Fixed sample size design은 연구를 시행하기 전에 표본수를 합리적으로 결정하고 정해진 표본내에서 연구를 진행하는 방법이며, sequential design은 연구를 진행하면서 결과의 차이가 있는가 또는 없는가에 대해 미리 정해진 한계영역을 기준으로 계속적으로 연구대상을 추출하여 연구를 진행하는 방법이다. 여기서는 많이 사용되는 fixed sample size design에 대해서만 생각하기로 한다.

  • PDF

영양조사 참여 자원자와 임의 선정자의 일반적 특성 및 식습관의 차이

  • 김완수;김미정;현태선
    • 대한지역사회영양학회:학술대회논문집
    • /
    • 대한지역사회영양학회 2004년도 춘계학술대회
    • /
    • pp.408.2-409
    • /
    • 2004
  • 조사연구에서 조사대상의 모집단을 대표할 수 있는 표본을 추출하는 것은 조사결과를 그 모집단에 일반화시키기 위해 서는 필수적이다. 국민건강영양조사에서는 확률표출방법을 이용하여 우리나라 국민의 영양실태에 관해 대표성 있는 정보를 얻고 있는 반면, 개개인의 연구자가 일부 지역 주민을 대상으로 하는 소규모의 영양조사에서는 과학적인 표출방법을 이용하여 표본을 추출하는 것이 매우 어렵기 때문에 대부분의 경우 자원자를 대상으로 하거나 임의로 표본을 선정하는 실정이다.(중략)

  • PDF

IAEA사찰표본 할당계산법 비교연구

  • 김현태
    • 한국원자력학회:학술대회논문집
    • /
    • 한국원자력학회 1995년도 추계학술발표회논문집(2)
    • /
    • pp.1029-1034
    • /
    • 1995
  • IAEA(International Atomic Energy Agency, 국제원자력기구)에서는 사찰활동 수행시, 비복원추출을 기술하는 초기 하분포(hypergeometric distribution) 대신 복원추출을 기술하는 이항분포(binomial distribution)를 사용하여 표본크기 (sample site)를 계산하여 최대 3가지 검증방법들에 할당한다. 본 연구에서는 사찰표본할당과 관련하여 PC사용이 요구되는 반복할당법인 초기하할당법, 개선된 이항할당법, 그리고 표준할당법과 포켓계산기에서 사용 가능한 근사 할당법인 개선된 이항할당근사법과 표준이항할당근사법을 비교 검토하였다.

  • PDF

국민건강영양조사 표본설계를 위한 추출틀 구축 (Construction of Sampling Frames for the 5th Korea National Health and Nutrition Examination Survey)

  • 박진우;변종석;박민규
    • 응용통계연구
    • /
    • 제23권5호
    • /
    • pp.923-932
    • /
    • 2010
  • 제 5기 국민건강영양조사(2010년.2012년)를 위한 표본설계의 여건은 과거에 비해 불리한데, 무엇보다 과거와 같은 추출틀 마련이 여의치 않다는 점이 두드러진다. 제5기 조사를 위한 표본설계 시기가 인구주택총조사 주기와 맞지 않음으로 인해 과거의 총조사 자료를 그대로 추출틀로 사용한다면 어쩔 수 없이 추출틀오차의 문제가 발생하게 될 것이기 때문이다. 이를 극복하기 위한 현실적인 방안을 마련하는 것은 실용적인 면에서 매우 절실한 문제라고 할 수 있다. 본 연구의 목적은 인구주택총조사 자료가 낡아 현재의 모집단 상황을 제대로 대표할 수 없는 상황에서 이를 극복할 수 있는 효과적인 추출틀을 마련하는 데 있다. 본 연구에서는 추출틀의 포함률을 높이기 위한 방안으로 아파트 가구와 일반가구(단독주택, 연립주택, 다세대주택 등)를 분리하여 각각에 대해 서로 다른 자료를 활용하는 방안을 도입한다. 다시 말해 표본설계를 위해 여러 개의 추출틀을 사용하는 방안을 제시한다.

적합탐색 관찰을 이용한 층화 공간표본설계에서의 추정 (Adaptive Searching Estimation in Stratified Spatial Sample design)

  • 변종석
    • 응용통계연구
    • /
    • 제13권2호
    • /
    • pp.353-369
    • /
    • 2000
  • 관찰 단위들간 특정한 공간 종속관계를 지닌 공간모집단에서 사각형의 칸들로 분할한 후 각 칸마다 하나의 표본점을 임의추출하여 관심 변수의 모수를 추정할 때 탐색 관찰조건을 만족하는 인접한 표본단위만을 추가 관찰하여 모수를 추정하는 적합탐색 추정 방법을 층화 공간표본설계에 적용시켜 보았다. 모의자료를 설정한 가상의 2차원 공간모집단을 층화 공간표본설계에 의해 층화시킨 후 적합 탐색 추정방법을 적용시켜 본 결과, 단순히 공간모집단을 분할하는 전통적인 공간표본설계보다 적은 수의 표본이 관찰되었으며, 효율성이 크게 감소하지 않는 결과를 얻음으로써 층화효과와 적합탐색 관찰효과가 동시에 존재하는 적절한 추정 결과를 얻을 수 있었다.

  • PDF