• 제목/요약/키워드: 표본추출방법

검색결과 609건 처리시간 0.03초

변형된 계통추출과 최소제곱법을 이용한 모평균 추정 (Estimation of Population Mean Using Modified Systematic Sampling and Least Squares Method)

  • 김혁주
    • 응용통계연구
    • /
    • 제17권1호
    • /
    • pp.105-117
    • /
    • 2004
  • 본 논문에서는 선형추세를 갖는 모집단의 평균을 추정하기 위한 새로운 방법을 제시하였다. 이 방법은 변형계통추출에 의하여 표본을 뽑은 뒤 표본의 단순평균이 아니라 조정된 추정량을 사용하여 모평균을 추정하는 방법이다. 조정된 추정량을 정하는 데에 최소제곱법을 사용하였다. 제시된 방법은 선형 추세가 강할수록 효율적이라는 것이 밝혀졌으며, 무한초모집단 모형의 랜덤오차항의 분산인 $\sigma$$^2$이 매우 크지만 않다면 전통적인 방법들에 비해 상대적으로 효율적인 것으로 나타났다.

부분 최소제곱법 기반한 차원 축소 특징을 이용한 얼굴 인식 (Face Recognition using Dimension Reduction Features based on Partial Least Squares)

  • 이창범;김도향;박혁로;백장선
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.745-748
    • /
    • 2004
  • 얼굴 이미지의 대부분은 표본의 수보다 특징 변수의 수가 많기 때문에 이러한 점을 고려한 특징 추출 방법이 필요하다. 본 논문에서는 부분 최소제곱법을 이용하여 특징 벡터의 차원을 축소하는 방법을 제안한다. 전통적인 차원 축소 방법인 주성분 분석은 클래스의 정보를 고려하지 않고 최대 변이를 가지는 성분을 추출하기 때문에, 클래스의 구분에 필요한 특징을 필수적으로 추출하지 못한다. 이에 비해, 부분 최소제곱법은 클래스 변수에 대한 정보를 포함하여 성분을 추출한다. 그러므로, 분류를 하는데 있어서는 주성분 분석에 의해 추출된 성분보다는 부분 최소제곱법에 의해 추출된 성분이 보다 더 예측적이다. 맨체스터와 ORL 얼굴 데이터베이스를 이용하여 실험한 결과, 분류와 차원 축소 측면에서 주성분 분석 방법보다는 부분 최소제곱법을 이용한 방법이 그 성능이 우수함을 알 수 있었다.

  • PDF

표본조사에 의한 기업 연구개발활동 통계 작성방안 (Development of Sample Survey Design for the Industrial Research and Development Statistics)

  • 조성표;박선영;한기인;노민선
    • 기술혁신연구
    • /
    • 제17권2호
    • /
    • pp.1-23
    • /
    • 2009
  • 본 연구에서는 국가의 연구개발활동조사에서 기업연구개발활동 통계에 대한 효과적인 산출방법을 제시하고자 하였다. 이를 위하여 국내 외 연구개발 통계 방법을 조사한 후 이를 토대로 우리나라에서 기업연구개발활동에 대한 자료의 수집 및 분석에 대한 개선 방안을 제시 하였다. 대부분의 국가에서 대기업은 전수조사, 소규모 기업은 표본조사를 수행하고 있으나, 우리나라에서는 연구소 등록법인에 대하여 전수조사를 행하고 있다. 전수조사는 비용이 많이 들고 비표본오차로 인하여 모집단에 대한 체계적인 추정이 불가능하다는 문제점이 있다. 현재 산업기술진흥협회에 등록된 연구기관의 수가 20,000개를 넘어서고 있어 전수조사는 한계에 다다른 것으로 생각되어 표본조사 도입에 대한 타당성과 방법론을 중점적으로 검토하였다. 먼저, 표본조사의 타당성을 평가하기 위하여 현재 전수조사를 통해 수집된 자료를 이용하여 표본조사를 수행한 결과를 비교 분석하였다. 산업별(24개), 그룹별(8개)로 구분하여 216개 셀별로 모집단수/표본수를 곱하여 산정(셀별추정법)한 결과, 전수 통계치와 거의 동일하게 나타났다. 따라서, 산업별, 그룹별로 세분하여 모집단수/표본수를 곱하여 추정하는 셀별추정법이 타당한 것으로 평가할 수 있다. 이상의 분석결과를 토대로 조사설계 방안을 제시하면 다음과 같다. 직전연도 조사기업은 직전연도 연구개발비 수준과 기업종류(대기업, 벤처기업, 중소기업), 그리고 산업에 따라 셀을 분할한다. 대기업, 연구개발비 수준이 높은 기업 등 주요한 셀에 대하며는 전수조사를 실시한다. 나머지 셀에 대하여는 각 셀별 연구개발지출의 분포가 동질적이기 때문에 표본 추출 방법은 단순임의추출법(SRS)을 사용한다. 다만 전년도 미계상된(또는 미포함된) 기업에 대하여는 신규 대형 연구소 진입 등을 고려하여 규모비례확률추출법(PPS)을 고려하는 것이 바람직할 것으로 판단된다. 일부 기업들이 특정 항목에 대한 자료를 제공하지 않는 항목무응답의 경우, 누락된 자료에 대하여는 대체기법(Imputation Algorithm)에 따라 이를 추정한다. 이러한 표본조사방법은 전수조사에서 발생하는 비표본오차를 해소하고, 자료 수집비용 및 소규모기업의 행정적 부담을 경감할 수 있다는 장점이 있다. 향후 연구에서는 좀 더 구체적인 조사방법론을 강구할 필요가 있으며, 이와 함께, 연구개발에 대한 다양한 측면의 정보를 수집하기 위해 새로운 설문지를 개발할 필요성이 있다.

  • PDF

교통정보제공을 위한 구간통행시간 산출 방법론 연구 (적정표본수 결정방법을 중심으로) (A study on Link Travel Time Estimating Methodology for Traffic Information Service (Determination of an Adequate Sample Size))

  • 이영인;이정희
    • 대한교통학회지
    • /
    • 제20권3호
    • /
    • pp.55-67
    • /
    • 2002
  • 구간검지체계를 기반으로 한 첨단교통정보제공시스템(Advanced Traveler Information Systems)은 그 기능 수행시 다음의 중요 고려사항을 지닌다. 첫째는 제공 정보의 신뢰성이며, 둘째는 정보수집비용에 관련한 수집자료수의 한계이다. 본 논문에서는 이러한 한계성 극복을 위해 보다 대표성 있는 교통정보 형태의 설정 및 통계적으로 신뢰성 있는 정보산출을 위해 요구되는 적정표본수의 결정에 대한 연구를 수행하였다. 도시고속도로(올림픽대로)와 도시간선도로(천호대로)의 실측 구간통행시간분포 분석결과 단일교차로 구간의 경우 다른 구간들의 단일봉(unimodal)의 정규분포형태와는 다른 두 개의 봉우리를 지닌 분포형태(bimodal)가 나타났다. 따라서 이러한 구간은 기존과는 다른 새로운 교통정보 형태가 필요하며, 본 논문에서는 모든 통과차량들의 평균통행시간으로 정의되는 한 개의 대표치가 아닌 신호주기에 의한 정지여부에 따라 분리되는 주행시간과 지체시간 또는 주행속도와 통행속도 개념의 세분화된 정보형태를 설정하였다. 또한 중심극한정리를 기초로 한 통계적인 표본수 결정식을 이용하여 설정된 신뢰수준 하에서의 정보산출을 위해 요구되는 적정 표본수를 산출하였다. 그 결과, 교통이 혼잡할수록 요구되는 표본수는 적어지는 것으로 나타났다. 우선 적정 표본수 만큼의 표본추출을 하고 제안된 정보산출 방법에 의해 교통정보를 산출한 후 실측치와의 오차를 비교하였다. 그 결과 산출된 교통정보는 신뢰수준 95%와 허용오차 5㎞/h를 만족하였다. 다음으로 구간검지체계를 이용하여 정보를 산출하는 타시스템 교통정보와의 오차율을 비교하였다. 그 결과, 실측치와 본 연구의 산출방법에 의한 교통정보, 로티스교통정보 및 차량번호판 인식시스템의 교통정보와의 비교 결과 제안된 교통정보형태의 타당성을 볼 수 있었다.

상관관계와 표본 크기에 따른 BLS 무응답 보정의 효율성 비교 (A Study on the Efficiency of the BLS Nonresponse Adjustment According to the Correlation and Sample Size)

  • 김석;신기일
    • 응용통계연구
    • /
    • 제22권6호
    • /
    • pp.1301-1313
    • /
    • 2009
  • 미국 노동통계청에서 사용하고 있는 BLS 방법의 효율성과 민감성에 관한 연구 결과에 의하면 표본 틀 (Sample frame) 자료와 조사된 자료의 상관관계가 높을수록 BLS 무응답 보정 효과는 커지는 것으로 알려져 있다 (이석진과 신기일, 2008). 그러나 표본 틀 자료와 조사된 자료의 상관계수가 층별로 크기가 다른 경우, BLS 보정 효과는 달라질 수 있다. 따라서 일반적으로 실시되는 표본 설계에서는 층화추출 방법이 사용되기 때문에 각 층의 표본 크기와 상관계수가 다른 경우의 BLS 보정 효과률 살펴보는 것은 매우 중요하다. 본 논문에서는 층의 표본 크기와 상관계수 그리고 무응답 비율에 따른 BLS 무응답 보정 효과를 살펴보았다. 이를 위해 사용된 자료는 노동부의 월별 자료인 2007년 매월노동통계 자료이다.

배전설비도면의 전주 및 전선 인식 (A Recognition of Electric Pole and Wire on Power Distribution Facility Map)

  • 이봉재;김계영;한칠성;조선구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.446-448
    • /
    • 2000
  • 본 논문에서는 배전설비도면의 주요 기호인 전주와 전선인식 방법에 관하여 기술한다. 본 논문에서는 원형성에 근거하여 전주후보를 추출한 후 이들 사이의 연결성에 근거하여 전선을 인식한 다음, 전주후보들 중에서 전주를 확인함으로서 전주와 전선을 인식하는 방법을 제안한다. 제안된 방법은 한국전력공사의 배전설비도면들 중에서 무작위로 추출한 표본 약 30매를 대상으로 실험하고 그 결과를 제시한다.

  • PDF

표본 선택 모형을 이용한 국내 여성 임금 데이터 분석 (Korean women wage analysis using selection models)

  • 정미량;김미정
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권5호
    • /
    • pp.1077-1085
    • /
    • 2017
  • 본 연구에서는 한국노동연구원의 "2015년 한국노동패널조사 (KLIPS)" 자료를 활용하여 국내 여성의 임금 결정요인을 분석하기 한다. 일반적으로 임금 자료는 랜덤 추출이 불가능하기 때문에 분석하기가 쉽지 않다. 표본 선택 편의 (sampling bias)가 있는 자료를 분석하는 방법으로 Heckman 표본 선택 모형이 가장 널리 알려져 있다. Heckman은 크게 두 가지 모형을 제안했는데, 그 중 하나는 최대 우도 방법을 이용하는 것이고, 다른 하나는 2단계 표본 선택 모형이다. 이 중 Heckman 2단계 표본 선택 모형은 주된 결과 모형 (outcome model)과 경제 활동 여부를 결정짓는 선택 모형 (selection model)을 포함한 모형으로써, 이 모형이 최대 우도 방법을 이용한 모형에 비해 이변수 오차의 정규분포 가정에 덜 민감하다고 알려져 있다. 그럼에도 불구하고 이변수 오차에 대한 정규 분포 가정은 꽤 강한 가정이라고 볼 수 있는데, 최근에 이 모형의 단점을 보완하는 모형으로 Marchenko와 Genton (2012)의Heckman 표본 선택 t 모형이 제시되었다. Heckman 2단계 모형과 Heckman 표본 선택 t 모형을 이용하여 국내 여성의 임금 결정 요인을 분석하고 비교하도록 한다.

이중추출에서 모평균 추정 (Mean Estimation in Two-phase Sampling)

  • 김규성;김진석;이선순
    • 응용통계연구
    • /
    • 제14권1호
    • /
    • pp.13-24
    • /
    • 2001
  • 이중추출에서 모평균 추정방법을 고찰하였다. 전통적으로 널리 쓰이는 비추정량과 회귀추정량 그리고 비례배분 및 Rao 배분을 한 후의 층화평균에 대하여 주어진 기대 비용에서 최적의 표본수, 최소분산 및 분산추정량을 살펴보았다. 또한 비추정 및 층화의 효과를 모두 내포하는 결합비 추정량을 제안하고 주어진 기대 비용에서 최적의 표본수 및 최소분산을 유도하였고 분산추정량을 구하였다. 그리고 제한된 모의실험을 통하여 비추정량, 층화평균 및 결합비 추정량의 효율을 비교하였다. 모의실험 결과 비추정량과 층화평균은 경우에 따라 효율이 다르게 나타난 반면, 결합비 추정량은 대체로 두 방법보다 효율이 우수하게 나타나 결합비 추정량이 이중추출에 유용하게 쓰일 수 있음을 보였다.

  • PDF

정보전기 직종의 인력 수요에 대한 고찰 (The Investigate of Human Strength Demand of Information Electrical the Kind of Occupation)

  • 김수용;이승호
    • 공학교육연구
    • /
    • 제11권4호
    • /
    • pp.58-63
    • /
    • 2008
  • 본 논문은 중소도시의 전기 설비 및 전기공사 업체의 인력 수요와 채용과정 및 훈련기관의 교육 내용을 조사하였다. 그리고 학생의 취업 향상과 교육훈련과정개발을 위한 정보를 제공함에 목적이 있다. 인력수요 및 교육수요와 현장 실습생 수요에 대해 분석하였다. 표본추출은 업종별, 규모별 할당표본 추출방법(quota Sampling)을 사용하였다. 조사방법은 전화 및 방문하여 조사하였으며, 자료분석은 엑셀을 이용한 통계 분석을 하였다.

자동차주행거리 추정방안 연구 (A Study on Estimation of Vehicle Miles Traveled)

  • 안원철;박동주;허태영;연지윤;김찬성
    • 한국ITS학회 논문지
    • /
    • 제13권6호
    • /
    • pp.64-76
    • /
    • 2014
  • 본 연구는 자동차주행거리 추정과정에서 발생할 수 있는 오차발생 원인을 규명하였다. 그리고 각 원인이 자동차주행거리 추정 정확도에 미치는 영향을 오차율로 정량화하여 효율적인 자동차주행거리 추정방안을 제시하였다. 이를 위한 연구과정은 다음과 같다. 첫째, 시범조사 지역을 대상으로 자동차주행거리 추정 방법론의 정확도를 검증하기 위한 자동차주행거리 관측 자료를 구축하였다. 둘째, 자동차주행거리 추정 오차발생 원인은 표본크기, 표본추출방법, 단위구간 설정방법의 오류로 구분하였다. 그리고 각 원인에 따른 자동차주행거리 추정오차를 최소화하기 위한 다양한 방법론을 설정하였다. 셋째, 각 방법론에 의한 자동차주행거리 추정 오차율을 비교분석 하였다. 마지막으로 Toy-Network를 구축하여 지역특성을 고려한 자동차주행거리 추정방안을 제시하였다. 본 연구는 실험 계획적 접근방법을 통하여 효율적인 자동차주행거리 추정방안을 제시하였으며, 추정 정확도 검증을 위하여 자동차주행거리 관측 자료를 활용했다는 점에서 의의를 갖는다. 또한 본 연구에서 제시한 자료수준과 지역특성을 고려한 자동차주행거리 추정 방안은 향후 지역별 자동차주행거리 추정에 기여할 것으로 판단된다.