• Title/Summary/Keyword: 표본추출 알고리즘

Search Result 55, Processing Time 0.039 seconds

Development of the Algorithm for the Automatic Extraction of Broad Term (상위어 자동추출 알고리즘 개발)

  • 최유미;사공철
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1998.08a
    • /
    • pp.227-230
    • /
    • 1998
  • 문헌정보학분야의 용어사전을 이용한 자동시소러스 구축을 위한 첫단계로$\ulcorner$문헌정보학 용어사전$\lrcorner$ MRD를 구성하고 이를 이용하여 상위어 자동 추출알고리즘을 개발하였다. MRD구성시 전처리과정을 통하여 상위어 추출에 불필요한 정보가 수록되는 것을 방지하였다. 상위어 추출을 위한 알고리즘 개발은 무작위 표본추출을 통하여 $\ulcorner$문헌정보학 용어사전$\lrcorner$에 기술된 문장의 구문적 특성을 분석한 후, 이 구문정보를 이용하여 수행하였다. 본 연구에서 제시된 알고리즘의 효율성 평가결과 89.4%의 정확도를 보였다.

  • PDF

A Cost Effective Reference Data Sampling Algorithm Using Fractal Analysis (프랙탈 분석을 통한 비용효과적인 기준자료추출 알고리즘에 관한 연구)

  • 김창재;이병길;김용일
    • Proceedings of the KSRS Conference
    • /
    • 2000.04a
    • /
    • pp.149-154
    • /
    • 2000
  • 분류기법을 통해 얻어진 원격탐사 자료는 사용되기 이전에 그 정확성에 관한 신뢰도 검증을 해야 한다. 분류 정확도를 평가하기 위해서는 오분류행렬(confusion matrix)을 사용하여 정확도 평가를 하게 되는데, 이때 오분류행렬을 구성하기 위해서는 기준자료(reference data)에 대한 표본추출이 이루어져야 한다. 기준자료의 표본을 추출하는 기법간의 비교 및 표본 크기를 줄이고자 하는 연구는 많이 이루어져 왔으난, 추출된 표본들간의 거리를 줄임으로써 정확도 평가 비용을 감소시키고자 하는 연구는 미미한 실정이다. 따라서, 본 연구에서는 프랙탈 분석을 통하여 기준자료의 표본을 추출하였으며, 이를 바탕으로 기존의 표본추출 기법과 정확도 차이 및 비용효과 측면을 비교 분석하였다. 연구 결과, 프랙탈 분석을 통하여 표본을 추출하는 기법은 그 정확도 추정에 있어 기존적 표본 추출 기법과 큰 차이가 보이지 않았으며, 추출된 화소들이 가까운 거리에 군집해 있어 비용효과측면에서 보다 유리함을 확인하였다.

  • PDF

Automation of Sampling for Public Survey Performance Assessment (공공측량 성과심사 표본추출 자동화 가능성 분석)

  • Choi, Hyun;Jin, Cheol;Lee, Jung Il;Kim, Gi Hong
    • KSCE Journal of Civil and Environmental Engineering Research
    • /
    • v.44 no.1
    • /
    • pp.95-100
    • /
    • 2024
  • The public survey performance review conducted by the Spatial Information Quality Management Institute is conducted at the screening rate in accordance with the regulations, and the examiner directly judges the overall trend of the submitted performance based on the extracted sample. However, the evaluation of the Ministry of Land, Infrastructure and Transport, the evaluation trustee shall be specified by random extraction (Random Collection) is specified by the sample. In this study, it analyzed the details of the actual site and analyzed through securing actual performance review data. In addition, we analyzed considerations according to various field conditions and studied ways to apply the public survey performance review sampling algorithm. Therefore, detailed sampling criteria analysis by performance reviewers is necessary. A relative comparison was made feasible by comparing the data for which the real performance evaluation was performed with the outcomes of the Python automation program. This automation program is expected to be employed as a foundation program for the automated application of public survey performance evaluation sampling in the future.

A Cost Effective Reference Data Sampling Algorithm Using Fractal Analysis (프랙탈 분석을 통한 비용효과적인 기준 자료추출알고리즘에 관한 연구)

  • 김창재
    • Spatial Information Research
    • /
    • v.8 no.1
    • /
    • pp.171-182
    • /
    • 2000
  • Random sampling or systematic sampling method is commonly used to assess the accuracy of classification results. In remote sensing, with these sampling method, much time and tedious works are required to acquire sufficient ground truth data. So , a more effective sampling method that can retain the characteristics of the population is required. In this study, fractal analysis is adopted as an index for reference sampling . The fractal dimensions of the whole study area and the sub-regions are calculated to choose sub-regions that have the most similar dimensionality to that of whole-area. Then the whole -area s classification accuracy is compared to those of sub-regions, respectively, and it is verified that the accuracies of selected sub regions are similar to that of full-area . Using the above procedure, a new kind of reference sampling method is proposed. The result shows that it is possible to reduced sampling area and sample size keeping up the same results as existing methods in accuracy tests. Thus, the proposed method is proved cost-effective for reference data sampling.

  • PDF

Rainfall Frequency Analysis Using SIR Algorithm and Bootstrap Methods (극한강우를 고려한 SIR알고리즘과 Bootstrap을 활용한 강우빈도해석)

  • Moon, Ki Ho;Kyoung, Min Soo;Kim, Hung Soo
    • KSCE Journal of Civil and Environmental Engineering Research
    • /
    • v.30 no.4B
    • /
    • pp.367-377
    • /
    • 2010
  • In this study, we considered annual maximum rainfall data from 56 weather stations for rainfall frequency analysis using SIR(Sampling Important Resampling) algorithm and Bootstrap method. SIR algorithm is resampling method considering weight in extreme rainfall sample and Bootstrap method is resampling method without considering weight in rainfall sample. Therefore we can consider the difference between SIR and Bootstrap method may be due to the climate change. After the frequency analysis, we compared the results. Then we derived the results which the frequency based rainfall obtained using the data from SIR algorithm has the values of -10%~60% of the rainfall obtained using the data from Bootstrap method.

Two-dimensional Controlled Selection with Marginal Constraints (주변제약을 갖는 이차원 관리적 선정)

  • 김종호;류제복;김선웅
    • The Korean Journal of Applied Statistics
    • /
    • v.13 no.1
    • /
    • pp.145-161
    • /
    • 2000
  • 조사비용을 증대시키거나 조사실시에 어려움을 주는 바람직하지 않은 표본들의 추출확률을 줄여주기 위해서 Goodman과 Kish(1950)는 관리적 선정 방법을 제시하였다. 충화추출에서 표본의 수가 셀의 수보다 작은 경우 표본 배분에 문제가 발생한다. 이러한 문제를 해결하기 위해서 관리적 선정을 적용할 수 있는데 Causey 등 (1985)은 수송이론을 이용한 알고리즘을 제안하였고 Sitter와 Skinner(1994), Tiwaridh Nigam(1998)은 선형계획법을 이용하였다. 본 연구에서는 기존 방법들의 문제점들을 다루었으며 추출방법의 이론적 측면을 보완하기 위하여 표본들의 적합성을 고려한 관리적 선정을 제안한다. 아울러 분산을 최소화시키는 관리적 선정방법과 통합관리적 선정 방법도 제시하였다.

  • PDF

Computing Methods for Generating Spatial Random Variable and Analyzing Bayesian Model (확률난수를 이용한 공간자료가 생성과 베이지안 분석)

  • 이윤동
    • The Korean Journal of Applied Statistics
    • /
    • v.14 no.2
    • /
    • pp.379-391
    • /
    • 2001
  • 본 연구에서는 관심거리가 되고 있는 마코프인쇄 몬테칼로(Markov Chain Monte Carlo, MCMC)방법에 근거한 공간 확률난수 (spatial random variate)생성법과 깁스표본추출법(Gibbs sampling)에 의한 베이지안 분석 방법에 대한 기술적 사항들에 관하여 검토하였다. 먼저 기본적인 확률난수 생성법과 관련된 사항을 살펴보고, 다음으로 조건부명시법(conditional specification)을 이용한 공간 확률난수 생성법을 예를 들어 살펴보기로한다. 다음으로는 이렇게 생성된 공간자료를 분석하기 위하여 깁스표본추출법을 이용한 베이지안 사후분포를 구하는 방법을 살펴보았다.

  • PDF

A Composite Estimator for Cut-off Sampling using Cost Function (절사표본 설계에서 비용함수를 고려한 복합추정량)

  • Sim, Hyo-Seon;Shin, Key-Il
    • The Korean Journal of Applied Statistics
    • /
    • v.27 no.1
    • /
    • pp.43-59
    • /
    • 2014
  • Cut-off sampling has been widely used for a highly skewed population like a business survey by discarding a part of the population, so called a take-nothing stratum. For a more accurate estimate of the population total, Hwang and Shin (2013) suggested a composite estimator of a take-nothing stratum total that combined the survey results of a take-nothing stratum and a take-some sub-stratum (a part of take-some stratum). In this paper we propose a new cut-off sampling scheme by considering a cost function and a composite estimator based on the proposed sampling scheme. Small simulation studies compared the performances of known composite estimators and the new composite estimator suggested in this study. We also use Briquette Consumption Survey data for real data analysis.

Multiple face detection and tracking using active camera and skin color (액티브 카메라와 피부색상에 의한 다중 얼굴 검출 및 추적)

  • 김광희;이배호
    • Proceedings of the IEEK Conference
    • /
    • 2001.09a
    • /
    • pp.377-380
    • /
    • 2001
  • 본 논문에서는 실내에서 액티브 카메라를 사용하여 다중 인물의 얼굴의 위치를 검출하고. 추적할 수 있으며 조명과 배경 등의 영향에 강인한 추적 알고리즘을 제시하고자 한다. 알고리즘은 얼굴영역 검출, 추적의 2단계로 구성되며, 빠르고 효율적인 얼굴영역 검출은 추적 알고리즘의 성능향상으로 이어지므로, 이를 위해 독특한 색상영역 분포를 갖는 피부 색상 특징을 이용하였다. 표본영상에서 추출된 피부색상 픽셀들을 바탕으로 YCbCr 색상계를 사용하여 얼굴 색상모델을 구축한 후, Gaussian 함수를 사용하여 입력 영상의 픽셀과 얼굴색상모델과의 유사도를 결정하였다. 최종 얼굴 영역은 추출된 영역에 대한 얼굴의 타원특징, 해부학적 특징을 이용하여 결정된다. 추적은 추출된 얼굴영역과 temporal Gaussian 필터를 적용한 움직임 추정을 통한 움직임 검출의 조합으로 이루어진다. 또한, 예측버퍼의 사용으로 탐색영역의 축소로 인한 계산량 감소와 처리 속도의 증가시켰으며, pan/tilt가 가능한 카메라를 사용하여 상호 피드백이 가능하도록 하였다. 제시된 알고리즘은 PC 상에서 시뮬레이션되었으며, 좋은 결과를 얻을 수 있었다.

  • PDF