• 제목/요약/키워드: 두 모집단

검색결과 86건 처리시간 0.026초

신용평가에서 두 분포의 동일성 검정에 대한 수정통계량 (Modified Test Statistic for Identity of Two Distribution on Credit Evaluation)

  • 홍종선;박하수
    • 응용통계연구
    • /
    • 제22권2호
    • /
    • pp.237-248
    • /
    • 2009
  • 신용평가 연구에서 부도와 정상의 분포함수들의 동일성을 검정하는 비모수적 방법으로 Kolmogorov-Smirnov 검정법 이외에 Clamor-Yon Mises, Anderson-Darling, Watson 검정방법을 소개한다. 부도와 정상의 분포함수들의 선형결합된 부도율의 분포함수에 관한 전체적인 정보는 파악되어 잘 알고 있다. 모집단의 분포함수를 알고 있다는 가정 하에 Clamor-Von Mises, Anderson-Darling, Watson 검정통계량의 수정통계량을 제안한다. 신용평가자료와 유사한 성격을 갖는 다양한 부도율의 확률분포로부터 스코어를 생성하여 본 연구에서 제안한 수정통계량을 비교 토론한다.

RDD 표본 대 전화번호부 표본: 2007년 대통령 선거 예측사례 (RDD Sample versus Directory - Based Sample for Telephone Surveys: The Case of 2007 Presidential Election Forecasting in Korea)

  • 허명회;김영원
    • 한국조사연구학회지:조사연구
    • /
    • 제9권3호
    • /
    • pp.55-69
    • /
    • 2008
  • 이제까지 우리나라에서 전화조사를 위한 표본목록은 거의 대부분 전화번호부로부터 나왔다. 그러나 전화번호부의 모집단 포함률이 너무 떨어진다는 지적이 있어 대응수단으로 국제적 기준인 RDD(random digit dialing, 임의번호걸기)가 구현된 바 있다. 2007년 12월의 17대 대통령선거에 대한 예측을 위해 투표일을 $5{\sim}6$일 앞서 실시된 KBS MBC 전화조사는 표본을 반씩 나누어 절반은 RDD로, 나머지 절반은 전화번호부에서 응답자 표본목록을 추출하였다. 이 사례연구는 KBS MBC 전화조사의 RDD 표본과 전화번호부 표본을 대비시켜 공통점과 상이점을 살펴본 것이다. 향후 수년 동안 전화번호부 표본과 RDD 표본이 공존할 것으로 예상되는 상황에서, 이 연구결과가 두 방식의 비교에 시사점을 제시할 것으로 기대한다.

  • PDF

통계적 수량화 방법을 이용한 효과적인 네트워크 데이터 비교 방법 (Effective and Statistical Quantification Model for Network Data Comparing)

  • 조재익;김호인;문종섭
    • 방송공학회논문지
    • /
    • 제13권1호
    • /
    • pp.86-91
    • /
    • 2008
  • 네트워크 데이터 분석에 있어서 추정모델이 얼마나 모집단을 대표하느냐는 반드시 연구되어야 한다. 본 논문에서는 네트워크 데이터의 각 추출 가능한 표준 정보를 이용하여 현재 공개되어 사용하고 있는 MIT Lincoln Lab의 네트워크 데이터와 모델링 된 KDD CUP 99 데이터를 비교 분석한다. 비교, 분석에 있어서 두 데이터에 공통으로 포함되고 표준 정보인 프로토콜 정보를 이용하여 분석한다. 분석은 통계적 분석 방법인 대응 분석 방법을 이용하여 분석하고, SVD를 이용해 2차원 공간에 표현하며, 가중 유클리드 거리를 이용해 네트워크 데이터를 수량화하였다.

패널회귀모형에서 회귀계수 추정량의 설계기반 성질 (Design-based Properties of Least Square Estimators in Panel Regression Model)

  • 김규성
    • 한국조사연구학회지:조사연구
    • /
    • 제12권3호
    • /
    • pp.49-62
    • /
    • 2011
  • 본 논문에서는 패널회귀모형에서 회귀계수 추정량으로 일반최소제곱추정량과 가중최소 제곱추정량의 설계기반 성질을 고찰한다. 회귀계수의 최소제곱추정량을 선형화하여 일반최소제곱추정량의 근사편향, 근사분산, 그리고 근사평균제곱오차의 수식과, 가중최소제곱추정량의 근사분산 수식을 유도한 후, 모의실험을 통하여 두 추정량의 근사분산 및 근사평균 제곱오차의 크기를 수치적으로 비교한다. 모의실험에서는 한국복지패널 3개년 데이터를 모집단으로 간주하고, 가구소득 변수를 관심변수로 하며 가구와 가구주 관련 7개 변수를 설명변수로 하는 유한모집단 회귀계수를 고려한다. 두 추정량의 설계기반 성질을 비교하기 위하여 표본수를 50에서 1,000까지 50 간격으로 설정하여 일반최소제곱추정량의 근사편향, 근사분산 그리고 가중최소제곱추정량의 근사분산을 계산한다. 모의실험을 통하여 다음과 같은 경향을 확인하였다. 첫째, 표본의 크기가 커지면 일반최소제곱추정량의 평균제곱오차가 가중최소제곱추정량의 분산보다 커진다. 둘째, 일반최소제곱추정량의 평균제곱오차를 가중최소제곱추정량의 분산으로 나눈비(ratio)는 설명변수에 따라 크기가 다르게 나타나고, 일반최소제곱추정량의 편향이 클수록 큰 값을 보인다. 셋째, 분산만 비교하면 일반최소제곱추정량의 분산이 가중최소제곱추정량의 분산보다 대부분의 경우에 더 작게 나타난다.

  • PDF

포아송 분포의 혼합모형을 이용한 기부 횟수 자료 분석 (The Analysis of the Number of Donations Based on a Mixture of Poisson Regression Model)

  • 김인영;박수범;김병수;박태규
    • 응용통계연구
    • /
    • 제19권1호
    • /
    • pp.1-12
    • /
    • 2006
  • 본 논문에서는 2002년에 (사)볼런티어21에서 실시한 설문조사 자료를 이용하여 2001년에 우리나라 개인들이 기부한 횟수에 영향을 주는 유의한 변수들을 식별하였다. 기부횟수의 경험적 분포로 미루어 모집단은 기부를 적게 하는 집단과 많이 하는 집단으로 구성되며 따라서 모집단 분포를 두개 포아송 분포의 혼합분포로 모형화하였다. 이 모형에 기초하여 기부횟수에 영향을 미치는 변수들을 식별하였다. EM알고리즘을 이용하여 모수를 추정하고 2.5%와 97.5%에 기초한 백분위수 신뢰구간을 보완한 BCa(bias-corrected and accelerated) 신뢰구간을 계산하여 유의한 변수들을 찾았다. 연구결과 혼합 포아송 회귀모형에서는 기부횟수가 적은 집단("작은 군")과 기부횟수가 많은 집단("큰 군") 모두에서 소득과 자원봉사의 경험 유무(1:예, 0:아니오)가 기부횟수에 유의적으로 영향을 주는 변수로 밝혀졌다. 또한 두 변수 각각에서 회귀계수가 양수로 나타나 소득이 많을수록, 혹은 자원봉사의 경험이 있는 사람일수록 기부횟수가 증가하는 것을 알 수 있다. 그러나 소득과 자원봉사 변수의 회귀계수는 "작은 군"이 "큰 군"에 비해 더욱 크게 나타나고 있다. "작은 군"보다 "큰 군"의 사람들에게 기부가 생활화되어 있고, 따라서 소득과 자원봉사의 경험 유무가 기부횟수에 미치는 영향이 상대적으로 적은 것으로 파악된다.

3 ${\times}$ 3 라틴방격모형의 검정력 분석 (Power analysis for 3 ${\times}$ 3 Latin square design)

  • 최영훈
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권2호
    • /
    • pp.401-410
    • /
    • 2009
  • 두 블럭인자와 하나의 주인자로 구성된 3 ${\times}$ 3 라틴방격모형의 특성으로 인하여 주효과를 검정하기 위한 순위변환 통계량의 검정력은 모집단의 분포유형에 상관없이 모수적 통계량의 검정력보다 전반적으로 월등히 높은 수준이다. 특히 세인자가 모두 고정인 경우, 하나의 블럭인자만이 랜덤인 경우, 두 블럭인자가 모두 랜덤인 경우의 순서로 주효과를 검정하기 위한 순위변환 통계량의 검정력이 모수적 통계량의 검정력에 비하여 상대적으로 높다. 또한 검정하고자 하는 주효과의 크기가 크되 동시에 동일크기의 하나의 블럭효과 및 또다른 블럭효과 크기는 상대적으로 작을수록 주효과를 검정하기 위한 순위변환 통계량의 검정력은 모수적 통계량의 검정력보다 상대적 우위성을 갖는다.

  • PDF

웹 3D와 가상현실 시뮬레이션 학습의 사용성 평가 비교분석 (A Comparison Analysis of Usability Evaluation for Simulation Learning based on Web 3D and Virtual Reality)

  • 소요환
    • 한국콘텐츠학회논문지
    • /
    • 제16권10호
    • /
    • pp.719-729
    • /
    • 2016
  • 본 연구는 웹 3D와 가상현실 기반 시뮬레이션 학습의 사용성 평가와 학업성취도를 비교분석하고, 각 학습방법 간의 학습효과 차이를 통해 가상현실 콘텐츠의 차별화된 특징을 확인하는 것이 목적이다. 이를 위해 생명과학전공 대학생 75명을 모집단(웹 3D=37, VR=38)으로, DNA 분석의 과학실험을 위해 두 가지 학습방법으로 개발된 Labster사의 CSI Forensics Lab 시뮬레이션 콘텐츠를 실험처치물로 학습자의 사용성 평가와 학업성취도를 비교분석하였다. 연구결과, 태스크 수행, 탐색과 내비게이션의 사용성 평가에서는 웹 3D 시뮬레이션 학습이 유의미한 차이로 긍정적이었으나 만족도의 사용성 평가에서는 가상현실 시뮬레이션 학습이 유의미한 차이로 보다 긍정적이었다. 학업성취도에서는 웹 3D 시뮬레이션 학습 평균이 다소 높았으나 두 학습 간 유의미한 차이를 확인하지 못했다.

HOG 특징 및 영상분할을 이용한 부스팅분류 기반 자동차 검출 기법 (Vehicle Detection Scheme Based on a Boosting Classifier with Histogram of Oriented Gradient (HOG) Features and Image Segmentation])

  • 최미순;이정환;노태문;심재창
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권10호
    • /
    • pp.955-961
    • /
    • 2010
  • 본 논문에서는 HOG 특정벡터와 영상분할을 이용한 부스팅 분류기반의 자동차영역 검출 알고리즘의 연구에 대해서 기술한다. 입력된 영상으로부터 차량을 검출하기위해 먼저 분할 후 합병(split-merge) 방법을 적용하여 영상을 분할한다. 그리고 가장 큰 두 영역을 검색 영역에서 제외하여 처리 속도를 향상 시킨다. 각 영역에 대해 HOG(histogram of oriented gradient) 특정을 추출한다. 분류기는 두 개의 모집단을 분류하는데 많이 사용되고 있는 AdaBoost 방법을 사용한다. 제안방법의 성능 평가를 위해 537개의 영상을 사용하여 분류기를 학습하였으며, 또한 학습에 사용하지 않은 비학습영상 500개를 사용하여 인식률을 구하였다. 실험결과 비학습영상에 대해 98.34%의 인식률을 얻었다. 결론적으로 제안된 방법이 지능형 자동차 제어 시스템에서 차량의 위치를 찾는 방법으로 활용될 수 있다.

신경망이론에 의한 비중심T분포 확률계산 (Computation of Noncentral T Probabilities using Neural Network Theory)

  • 구선희
    • 한국정보처리학회논문지
    • /
    • 제4권1호
    • /
    • pp.177-183
    • /
    • 1997
  • 비 중심t분포의 누적함수는 두 정규모집단에서 모평균의 동일성 검정에서 검정력 계산 및 모 평균에 대한 표준편차의 비에 대하여 신뢰구간을 계산할 때 요구된다. 본 논문에서는 비중심t분포의 누적함수 계산에 신경망 이론을 적용하였다. 신경망은 다 층 퍼셉트론이며 학습과정은 역전파 학습알고리즘이다. Fisher가 제시한 확률값과 신 경망이론에 의하여 계산한 결과를 비교하였다.

  • PDF

혼합 검벨분포모형을 이용한 확률강우량의 산정 (Estimating Quantiles of Extreme Rainfall Using a Mixed Gumbel Distribution Model)

  • 윤필용;김태웅;양정석;이승오
    • 한국수자원학회논문집
    • /
    • 제45권3호
    • /
    • pp.263-274
    • /
    • 2012
  • 최근 다양한 기후변동성으로 인해 전 세계적으로 극한호우사상이 동시다발적으로 일어나고 있다. 우리나라의 극한호우사상은 주로 여름철 태풍으로 인한 호우와 국지성 집중호우에 의해서 발생한다. 극한호우사상에 대한 적절한 확률강우량을 추정하기 위해서, 본 연구에서는 연최대치일강우를 태풍으로 인한 강우와 집중호우로 인한 강우로 구분하여 확률적 거동을 고려하였다. 일반적인 강우빈도해석법은 연최대치강우가 단일 모집단을 이룬다고 가정하여 단일 분포함수를 적용하여 확률강우량을 추정하는 반면, 본 연구에서는 연최대치강우를 구성하는 두 가지 호우의 통계적 특성을 수문빈도해석에서 고려하기 위해, 혼합 분포함수를 적용하였다. 비교적 긴 관측강우자료를 보유한 15개 지점을 선정하여, 일강우량에 대한 확률강우량을 산정하고 비교분석을 실시하였다. 혼합 검벨분포모형에 의한 확률강우량은 단일 검벨분포함수를 적용한 확률강우량과 비교하여 지역에 따라 증감이 나타났으며, 이러한 결과는 홍수방어시스템의 계획 및 설계에서 유용한 정보를 제공할 것이다.