• 제목/요약/키워드: 표본추출방법

검색결과 614건 처리시간 0.03초

격자기반(Lattice-based) 라틴 하이퍼큐브(Latin hypercube) 계획의 제안

  • 황현식;박정수
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2001년도 추계학술발표회 논문집
    • /
    • pp.115-120
    • /
    • 2001
  • 라틴 하이퍼큐브 실험계획은 전산실험을 위하여 Mckay, Beckman과 Conover(1979)에 의해 고안된 방법으로 실험을 한번 시행하는데 많은 시간과 비용이 들거나 인자가 많은 실험에 효율적으로 사용할 수 있다. 하지만 이 실험계획 역시 실험영역 전체에서 골고루 배치되지 않을 가능성이 있으므로 이를 보완하려는 시도가 이루어져 왔으며, 여기서는 good lattice points(glp)와 계통추출을 응용하여 격자기반(lattice-based) Lhd의 두 가지 방법을 제안하였다. 모의실험 결과 glp 실험계획을 응용한 "방법 1"은 모형을 가정한 엔트로피에 기초한 최적 기준으로 검토한 경우 우수하였다. "방법 2"는 표본조사에 널리 쓰이는 계통추출을 응용하였으며 입력변수가 각기 다른 9개의 실험함수에 관하여 표본 평균의 추정치와 분산, MSE를 비교한 결과, 다른 실험계획들보다 우수하였다. 이 결과는 실험점이 실험영역 전체에서 골고루 퍼져서 나타난 것으로 보이며, 향후 전산실험계획에서의 응용을 기대할 수 있다.

  • PDF

양자화 된 범용 화자모델을 이용한 연속적 화자분류 (Sequential Speaker Classification Using Quantized Generic Speaker Models)

  • 권순일
    • 전자공학회논문지CI
    • /
    • 제44권1호
    • /
    • pp.26-32
    • /
    • 2007
  • 연속적 화자 분류에 있어서 분류 대상이 되는 화자에 대한 정보가 없거나 부족할 경우 정확한 연속적 분류가 어렵다. 이러한 문제를 해결하기 위해 표본 화자모델을 이용하는 방법이 제안되었는데, 이 방법을 이용하면 미리 준비된 화자의 데이터가 없이 화자모델 초기화와 화자분류가 가능해진다. 하지만 여전히 화자모델의 표본을 얻는 방법에 어려움이 따른다. 이 문제를 해결하기 위해 벡터 양자화에서 비롯된 화자 양자화를 제안한다. 유선전화 데이터를 이용한 실험에서 화자 양자화를 이용한 표본 화자모델 방법은 무작위 표본추출 방법을 이용할 경우 보다 25%의 성능 향상을 보였다.

극한강우를 고려한 SIR알고리즘과 Bootstrap을 활용한 강우빈도해석 (Rainfall Frequency Analysis Using SIR Algorithm and Bootstrap Methods)

  • 문기호;경민수;김형수
    • 대한토목학회논문집
    • /
    • 제30권4B호
    • /
    • pp.367-377
    • /
    • 2010
  • 본 연구에서는 기상청 산한 56개 기상관측소의 연최대치계열 일 강우자료를 대상으로 Bootstrap기법과 SIR알고리즘을 이용하여 표본을 재추출한 후, 빈도해석을 적용하여 결과를 비교검토 하였다. SIR알고리즘은 기존에 발생되었던 극한 사상에 가중치를 두어 표본을 재추출하는 방법으로 과거에 발생한 극한사상이 기후변화에 의해서 더욱 빈발하게될 것 이라는 가정에 기초한다고 할 수 있다. 반면에 Bootstrap기법은 현재 발생한 사상에 동일한 가중치를 두어 표본을 재추출하는 방법이다. 따라서 두 방법의 차이를 계산하여 기후변화로 인한 극한강우의 빈도별 확률강우량의 변화를 산정할 수 있다. 비교결과 SIR알고리즘에 의하여 재추출된 강우를 이용하여 산정된 확률강우량의 경우, Bootstrap기법에 의해서 재추출된 강우를 이용하여 산정한 확률강우량에 비해 지점에 따라 작게는 -10%정도의 감소와 크게는 60%정도의 차이를 보임을 확인하였다.

적응 기각 추출을 기반으로 하는 난수 생성기의 성능 비교 (Performance comparison of random number generators based on Adaptive Rejection Sampling)

  • 김효태;조성일;최태련
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권3호
    • /
    • pp.593-610
    • /
    • 2015
  • 적응 기각 추출 (adaptive rejection sampling)방법은 특정한 형태의 확률분포로 부터 확률표본을 추출하기 위한 대표적인 난수생성기 (random number generator)로서, 추출된 표본으로부터 제안분포 (proposal distribution)가 개선이 되는 장점을 가지고 있다. 그러나, 기존에 제안된 적응기각추출 방법은 확률분포의 형태가 로그-오목 함수 (log-concave function)인 경우에만 사용이 가능하기 때문에 적용범위가 제한적이다. 최근의 연구결과에서는, 이러한 단점을 보완하기 위해 다양한 형태의 적응기각추출이 진행되고 있으며, 이에 본 논문에서는 기존의 적응기각추출 방법을 포함한 총 5가지의 난수 생성 방법에 대해서 고찰하고, 아울러 모의실험을 통해 각 방법들간의 성능에 대하여, 적합성과 효율성의 관점에서 실증적으로 비교 분석하도록 한다.

응답률이 관심변수의 지수함수를 따를 경우 정보적 표본설계 기법을 이용한 모수추정 (Estimation using informative sampling technique when response rate follows exponential function of variable of interest)

  • 정희영;신기일
    • 응용통계연구
    • /
    • 제30권6호
    • /
    • pp.993-1004
    • /
    • 2017
  • 표본조사에서는 추정의 정확성 및 정밀성 향상을 위해 흔히 층화추출법을 사용하며 층 내에서는 동일한 표본 가중치를 이용하여 표본을 추출한다. 그러나 실제 응답률은 관심변수 값에 영향을 받을 수 있기 때문에 주어진 동일한 가중치는 응답률을 반영하여 보정되어야 한다. 또한 관심변수가 연속형 보조변수와 선형 관계가 있고 보조변수를 기준으로 층이 나누어진 경우에는 층 내에서 동일한 가중치를 사용하는 것 보다 층을 세분화한 후 얻어진 가중치를 사용하는 것이 효과적일 수 있다. 본 연구에서는 응답률이 관심변수 자료 값의 지수함수이고, 관심변수가 보조변수와 선형 관계가 있을 때 정보적 표본설계 기법을 이용하여 추정의 정확성과 정밀성을 높이는 방법을 제안하였다. 또한 모의실험을 통하여 제안된 방법의 우수성을 확인하였다.

숯검은밤나방(Agrotis tokionis B.) 유충개체군의 밀도추정방법 및 유충밀도와 연초감수량의 관계 (Sampling Methods for the 'dark grey cutworm' (Agrotis tokionis B.) Larval Population and Effect of its Larval Density on Tobacco Yield)

  • 김상석;부경생;강여규
    • 한국응용곤충학회지
    • /
    • 제20권4호
    • /
    • pp.217-222
    • /
    • 1981
  • 연초의 본포초기해충인 숯검은밤나방 유충의 경제적 피해수준 밀도를 정하기 위한 기초연구로 연초이식전 포장내 유충밀도를 확정하기 위한 표본추출방법과 유충밀도와 연초감수량(품종 : Hicks)의 관계에 관하여 실험하여 다음과 같은 결과를 얻었다. 1. 사과찌꺼기, 쌀겨 및 토끼풀더미의 표본추출방법중에서 토끼풀더미가 비교적 높은 표본추출효율을 보였으며 토끼풀더미는 유충의 령기와 실험시기에 따라 $12.5\~18.0\%$의 표본추출효율을 보였다. 2. 포장내잡초의 유${\cdot}$무에 따라 표본추출효율은 차이가 있으며 $5\~6$령충을 공시했을 때 잡초가 없는 상태에서는 $18\%$, 잡초가 있는 상태에서는 $11.8\%$의 표본추출효율을 보였다. 3. 숯검은밤나방 유충밀도(X)와 피해율(D)의 관계는 $D=3.48+1.15X(r=0.9^{**})$였으며 피해율은 액아의 생장과 결주에 따른 연초개체군의 보상결과를 감안하여 보상피해율(D')을 구하였으며 $D'=0.544D(r=0.97^{**})$의 치선회귀관계를 보였다. 4. 보상피해율(D')과 감사량(Y; kg/10a)의 관계는 $Y=2.219D'(r=0.88^{**})$였다. 5. 관측치만 이용한 접종충밀도와 감수량의 관계 (Y=2.68X) 보다는 피해율 및 보상피해율을 대입하여 얻은 추정회귀식(Y=4.2+1.38X)이 실측치에 더적합하였다.

  • PDF

The Weighting Adjustment of Korea Welfare Panel Study

  • 손창균;류제복;홍기학;이기성
    • 한국조사연구학회:학술대회논문집
    • /
    • 한국조사연구학회 2006년도 추계학술대회 발표논문집
    • /
    • pp.11-40
    • /
    • 2006
  • 시간의 흐름에 따라 사회 구성원들에 대한 행태 연구나 사회의 변화가 개인의 행동양식에 미치는 영향 등에 대한 조사에서는 어느 한 시점에서의 구성원들에 대한 횡단면 조사와는 다르게 다년간 지속적으로 조사개체를 추적조사 해야 하는 종단면 조사 또는 패널조사를 수행해야 한다. 패널조사는 횡단면 조사와는 달리 최초 표본이 시간이 지남에 따라 조사 대상 표본으로부터 탈락함으로서 발생하는 표본의 마모와 그에 따른 대표성 상실의 문제이다. 그러므로 이러한 표본의 대표성 상실 문제를 적절히 해결하기 위해 적용 가능한 방법이 가중치 조정 방법이다 횡단면 조사에서는 (1)추출가중치의 조정, (2)무응답 가중치 조정, (3)사후층화 가중치 조정과 같이 3단계의 가중치 조정과정을 수행하지만, 패널 조사의 경우 이와 더불어 원 표본의 대표성을 유지하기 위해 종단면 가중치(longitudinal weight)를 함께 고려해야 한다. 이러한 관점에서 본 연구에서는 다양한 패널형태에 따른 가중치 조정 방법에 대해 고찰하고, 향후 수행될 한국복지패널(Korea Welfare Panel Study: KWPS)의 가중치 산정에 관한 이론적 근거를 마련함과 동시에 현재 국내에서 수행되고 있는 패널조사의 가중치 조정방법과 비교하고자 한다.

  • PDF

확률적 표본추출 방법을 이용한 집단 약동학 모형의 추정과 검증에 관한 고찰 (Estimation Methods for Population Pharmacokinetic Models using Stochastic Sampling Approach)

  • 김광희;윤정화;이은경
    • 응용통계연구
    • /
    • 제28권2호
    • /
    • pp.175-188
    • /
    • 2015
  • 본 논문에서는 집단 약동/약력학 모형 추정을 위한 다양한 추정방법들을 이론적으로 비교, 분석하였다. 특히 확률적 표본을 이용한 방법들인 IMP, IMPMAP, SAEM 방법과 베이지안 방법의 이론적 배경과 이들의 성능을 자세히 살펴보고, 기존의 선형근사를 이용한 FO, FOCE 등의 방법과 비교 분석하였다. 확률적 표본을 이용한 추정방법들이 추정에 많은 시간이 소요된다는 문제점을 개선하기 위하여 좀 더 좋은 초기치를 찾는 방안으로 상대적으로 짧은 시간에 정확한 추정치를 계산해주는 ITS 방법을 이용하였다.

절사표본 설계에서 비용함수를 고려한 복합추정량 (A Composite Estimator for Cut-off Sampling using Cost Function)

  • 심효선;신기일
    • 응용통계연구
    • /
    • 제27권1호
    • /
    • pp.43-59
    • /
    • 2014
  • 왜도가 심한 사업체 조사에서는 모집단의 일부를 제외하고 표본을 추출하는 방법인 절사표본추출법이 자주 사용된다. 절사층의 경우 표본 관리가 어렵고 조사비용이 많이 들기 때문에 이를 제외한 조사를 실시함으로써 조사의 효율을 높일 수 있다. 그러나 전체 모집단 추정을 위해서는 절사층의 정확한 총합 추정이 매우 중요하다. 최근 Hwang과 Shin (2013)은 Lavallee와 Hidiroglou (1988)가 제안한 LH 알고리즘을 이용하여 표본층을 층화한 후 표본층에서 얻어진 정보와 절사층에서 얻어진 정보를 결합한 복합추정량을 제안하였다. 본 논문에서는 비용함수를 고려한 새로운 표본 설계를 제안하고, 이를 위한 새로운 복합추정량을 제안하였다. 모의실험과 실제 자료 분석을 통하여 본 논문에서 제안한 복합추정량의 우수성을 확인하였다.

잠재적 위험요인의 탐색에 관한 단일표본분석과 복합표본분석의 비교 (Comparative Analysis of Unweighted Sample Design and Complex Sample Design Related to the Exploration of Potential Risk Factors of Dysphonia)

  • 변해원
    • 한국산학기술학회논문지
    • /
    • 제13권5호
    • /
    • pp.2251-2258
    • /
    • 2012
  • 본 연구는 잠재적 위험요인을 탐색하는 방법으로 단순임의추출분석(unweighted sample design), 빈도 가중치를 적용한 단일표본분석(frequency weighted sample design), 가중치를 층화하여 적용한 복합표본분석(complex sample design)을 비교하고, 도출된 결과에 통계적인 차이가 있는지를 파악하고자 수행되었다. 자료원은 2009 국민건강영양조사의 이비인후과 검진 자료를 이용하였다. 분석 방법은 피어슨의 교차검정(Pearson chi-square test)과 라오-스콧교차검정(Rao-scott chi-square test)을 이용하였다. 분석 결과, 빈도 가중치만을 적용한 단일표본분석의 경우에는 모든 변수가 유의한 위험요인으로 과대 예측 되었고, 가중치를 적용하지 않은 단순임의추출 분석과 복합표본분석은 유의수준 및 결과에 차이가 있었다. 국가통계자료를 이용할 때, 연구의 결과가 전체 인구집단을 대표할 수 있도록 의미를 부여하기 위해서는 층화변수와 집락변수를 사용하여 가중치를 적용하는 복합표본분석이 필요하다. 나아가, 빈도 가중치만을 적용하는 경우에는 연구 결과에 대한 과잉해석의 가능성이 높기 때문에 각별한 주의가 요구된다.