• 제목/요약/키워드: 표본추출 알고리즘

검색결과 55건 처리시간 0.023초

상위어 자동추출 알고리즘 개발 (Development of the Algorithm for the Automatic Extraction of Broad Term)

  • 최유미;사공철
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1998년도 제5회 학술대회 논문집
    • /
    • pp.227-230
    • /
    • 1998
  • 문헌정보학분야의 용어사전을 이용한 자동시소러스 구축을 위한 첫단계로$\ulcorner$문헌정보학 용어사전$\lrcorner$ MRD를 구성하고 이를 이용하여 상위어 자동 추출알고리즘을 개발하였다. MRD구성시 전처리과정을 통하여 상위어 추출에 불필요한 정보가 수록되는 것을 방지하였다. 상위어 추출을 위한 알고리즘 개발은 무작위 표본추출을 통하여 $\ulcorner$문헌정보학 용어사전$\lrcorner$에 기술된 문장의 구문적 특성을 분석한 후, 이 구문정보를 이용하여 수행하였다. 본 연구에서 제시된 알고리즘의 효율성 평가결과 89.4%의 정확도를 보였다.

  • PDF

프랙탈 분석을 통한 비용효과적인 기준자료추출 알고리즘에 관한 연구 (A Cost Effective Reference Data Sampling Algorithm Using Fractal Analysis)

  • 김창재;이병길;김용일
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2000년도 춘계 학술대회 논문집 통권 3호 Proceedings of the 2000 KSRS Spring Meeting
    • /
    • pp.149-154
    • /
    • 2000
  • 분류기법을 통해 얻어진 원격탐사 자료는 사용되기 이전에 그 정확성에 관한 신뢰도 검증을 해야 한다. 분류 정확도를 평가하기 위해서는 오분류행렬(confusion matrix)을 사용하여 정확도 평가를 하게 되는데, 이때 오분류행렬을 구성하기 위해서는 기준자료(reference data)에 대한 표본추출이 이루어져야 한다. 기준자료의 표본을 추출하는 기법간의 비교 및 표본 크기를 줄이고자 하는 연구는 많이 이루어져 왔으난, 추출된 표본들간의 거리를 줄임으로써 정확도 평가 비용을 감소시키고자 하는 연구는 미미한 실정이다. 따라서, 본 연구에서는 프랙탈 분석을 통하여 기준자료의 표본을 추출하였으며, 이를 바탕으로 기존의 표본추출 기법과 정확도 차이 및 비용효과 측면을 비교 분석하였다. 연구 결과, 프랙탈 분석을 통하여 표본을 추출하는 기법은 그 정확도 추정에 있어 기존적 표본 추출 기법과 큰 차이가 보이지 않았으며, 추출된 화소들이 가까운 거리에 군집해 있어 비용효과측면에서 보다 유리함을 확인하였다.

  • PDF

공공측량 성과심사 표본추출 자동화 가능성 분석 (Automation of Sampling for Public Survey Performance Assessment)

  • 최현;진철;이정일;김기홍
    • 대한토목학회논문집
    • /
    • 제44권1호
    • /
    • pp.95-100
    • /
    • 2024
  • 공간정보품질관리원에서 수행되는 공공측량 성과심사는 규정에 따른 심사 비율로 수행하며, 추출된 표본을 기반으로 제출된 성과의 전체적인 경향을 심사자가 직접 판단한다. 그러나 국토지리정보원고시 '측량성과 심사수탁기관의 심사업무 및 지정절차 등에 관한 규정'에는 무작위 추출(Random Collection)이라 명시되어 있으나 공공측량 성과심사 표본추출은 심사 대상별로 심사자가 직접 판단으로 표본을 추출하고 있어 성과심사 표본추출의 공정성 확보가 필요하다. 본 연구에서는 실제 현장의 여건을 확인하고 실제 성과심사 데이터 확보를 통해 심사자들의 세부적인 기준을 분석하였다. 또한, 다양한 현장 여건에 따른 고려사항을 분석하여 공공측량 성과심사 표본추출 알고리즘 적용 방안에 대해 연구하였다. 따라서 성과심사자들의 세부적인 표본추출 기준 분석이 필요하다. 실제 성과심사가 완료된 데이터와 Python을 활용한 자동화 프로그램의 결과 비교를 통해 상대적으로 비교가능하도록 하였으며, 본 자동화 프로그램은 향후 공공측량 성과심사 표본추출의 자동화 적용을 위한 기반 프로그램으로 활용이 가능할 것으로 판단된다.

프랙탈 분석을 통한 비용효과적인 기준 자료추출알고리즘에 관한 연구 (A Cost Effective Reference Data Sampling Algorithm Using Fractal Analysis)

  • 김창재
    • Spatial Information Research
    • /
    • 제8권1호
    • /
    • pp.171-182
    • /
    • 2000
  • 분류기법에 의해 원격탐사 영상으로부터 취득된 면속성 수치 지도는 GIS 의사결정자료로 사용되기 이전에 그 정확성에 관한 신뢰도 검증과정을 거쳐야 한다. 분류 정확도를 평가하기 위해서는 오분류행렬(confusion matrix)을 사용하여 전체 정확도, 사용자 정확도, 제작자 정확도 등을 얻게 되는데, 이때 오분류행렬을 구성하기 위해서는 기준자료(reference data)에 대한 표본추출이 이루어져야한다. 기준자료의 표본을 추출하는 기법간의 비교 및 표본 크기를 줄이고자 하는 연구는 많이 이루어져 왔으나, 추출된 표본들간의 거리를 줄임으로서 정확도 평가 비용을 감소시키고자 하는 연구는 미비한 실정이다. 따라서 본 연구에서는 프랙탈 분석을 통하여 기준자료의 표본을 추출하였으며, 이를 바탕으로 기존의 표본추출의 기법과 정확도 차이 및 비용효과 측면을 비교 분석하였다. 연구 결과 , 프랙탈 분석을 통하여 표본을 추출하는 기법은 그 정확도 추정에 있어 기존의 표본추출 기법과 큰 차이를 보이지 않았으며, 추출된 화소들이 가까운 저리에 군집에 있어 비용효과측면에서 유리함을 확인하였다.

  • PDF

향상된 PAIRWISE COUPLING 알고리즘에 의한 자료의 분류 (On the Classfication by an Improved Pairwise Coupling Algorithm)

  • 최대우;윤중식
    • 응용통계연구
    • /
    • 제13권2호
    • /
    • pp.415-425
    • /
    • 2000
  • 붓스트랩 표본추출과 pairwise coupling의 알고리즘을 결합한 새로운 분류 알고리즘을 제안하고, 이를 선형판별분석과 2차 판별분석에 적용하였다. 그리고 새로운 분류 알고리즘의 정확도를 비교하기위해 널리 사용되는 waveform 자료 등을 분석한 후, 그 결과를 기존 분류 방법과 비교하였다.

  • PDF

극한강우를 고려한 SIR알고리즘과 Bootstrap을 활용한 강우빈도해석 (Rainfall Frequency Analysis Using SIR Algorithm and Bootstrap Methods)

  • 문기호;경민수;김형수
    • 대한토목학회논문집
    • /
    • 제30권4B호
    • /
    • pp.367-377
    • /
    • 2010
  • 본 연구에서는 기상청 산한 56개 기상관측소의 연최대치계열 일 강우자료를 대상으로 Bootstrap기법과 SIR알고리즘을 이용하여 표본을 재추출한 후, 빈도해석을 적용하여 결과를 비교검토 하였다. SIR알고리즘은 기존에 발생되었던 극한 사상에 가중치를 두어 표본을 재추출하는 방법으로 과거에 발생한 극한사상이 기후변화에 의해서 더욱 빈발하게될 것 이라는 가정에 기초한다고 할 수 있다. 반면에 Bootstrap기법은 현재 발생한 사상에 동일한 가중치를 두어 표본을 재추출하는 방법이다. 따라서 두 방법의 차이를 계산하여 기후변화로 인한 극한강우의 빈도별 확률강우량의 변화를 산정할 수 있다. 비교결과 SIR알고리즘에 의하여 재추출된 강우를 이용하여 산정된 확률강우량의 경우, Bootstrap기법에 의해서 재추출된 강우를 이용하여 산정한 확률강우량에 비해 지점에 따라 작게는 -10%정도의 감소와 크게는 60%정도의 차이를 보임을 확인하였다.

주변제약을 갖는 이차원 관리적 선정 (Two-dimensional Controlled Selection with Marginal Constraints)

  • 김종호;류제복;김선웅
    • 응용통계연구
    • /
    • 제13권1호
    • /
    • pp.145-161
    • /
    • 2000
  • 조사비용을 증대시키거나 조사실시에 어려움을 주는 바람직하지 않은 표본들의 추출확률을 줄여주기 위해서 Goodman과 Kish(1950)는 관리적 선정 방법을 제시하였다. 충화추출에서 표본의 수가 셀의 수보다 작은 경우 표본 배분에 문제가 발생한다. 이러한 문제를 해결하기 위해서 관리적 선정을 적용할 수 있는데 Causey 등 (1985)은 수송이론을 이용한 알고리즘을 제안하였고 Sitter와 Skinner(1994), Tiwaridh Nigam(1998)은 선형계획법을 이용하였다. 본 연구에서는 기존 방법들의 문제점들을 다루었으며 추출방법의 이론적 측면을 보완하기 위하여 표본들의 적합성을 고려한 관리적 선정을 제안한다. 아울러 분산을 최소화시키는 관리적 선정방법과 통합관리적 선정 방법도 제시하였다.

  • PDF

확률난수를 이용한 공간자료가 생성과 베이지안 분석 (Computing Methods for Generating Spatial Random Variable and Analyzing Bayesian Model)

  • 이윤동
    • 응용통계연구
    • /
    • 제14권2호
    • /
    • pp.379-391
    • /
    • 2001
  • 본 연구에서는 관심거리가 되고 있는 마코프인쇄 몬테칼로(Markov Chain Monte Carlo, MCMC)방법에 근거한 공간 확률난수 (spatial random variate)생성법과 깁스표본추출법(Gibbs sampling)에 의한 베이지안 분석 방법에 대한 기술적 사항들에 관하여 검토하였다. 먼저 기본적인 확률난수 생성법과 관련된 사항을 살펴보고, 다음으로 조건부명시법(conditional specification)을 이용한 공간 확률난수 생성법을 예를 들어 살펴보기로한다. 다음으로는 이렇게 생성된 공간자료를 분석하기 위하여 깁스표본추출법을 이용한 베이지안 사후분포를 구하는 방법을 살펴보았다.

  • PDF

절사표본 설계에서 비용함수를 고려한 복합추정량 (A Composite Estimator for Cut-off Sampling using Cost Function)

  • 심효선;신기일
    • 응용통계연구
    • /
    • 제27권1호
    • /
    • pp.43-59
    • /
    • 2014
  • 왜도가 심한 사업체 조사에서는 모집단의 일부를 제외하고 표본을 추출하는 방법인 절사표본추출법이 자주 사용된다. 절사층의 경우 표본 관리가 어렵고 조사비용이 많이 들기 때문에 이를 제외한 조사를 실시함으로써 조사의 효율을 높일 수 있다. 그러나 전체 모집단 추정을 위해서는 절사층의 정확한 총합 추정이 매우 중요하다. 최근 Hwang과 Shin (2013)은 Lavallee와 Hidiroglou (1988)가 제안한 LH 알고리즘을 이용하여 표본층을 층화한 후 표본층에서 얻어진 정보와 절사층에서 얻어진 정보를 결합한 복합추정량을 제안하였다. 본 논문에서는 비용함수를 고려한 새로운 표본 설계를 제안하고, 이를 위한 새로운 복합추정량을 제안하였다. 모의실험과 실제 자료 분석을 통하여 본 논문에서 제안한 복합추정량의 우수성을 확인하였다.

액티브 카메라와 피부색상에 의한 다중 얼굴 검출 및 추적 (Multiple face detection and tracking using active camera and skin color)

  • 김광희;이배호
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.377-380
    • /
    • 2001
  • 본 논문에서는 실내에서 액티브 카메라를 사용하여 다중 인물의 얼굴의 위치를 검출하고. 추적할 수 있으며 조명과 배경 등의 영향에 강인한 추적 알고리즘을 제시하고자 한다. 알고리즘은 얼굴영역 검출, 추적의 2단계로 구성되며, 빠르고 효율적인 얼굴영역 검출은 추적 알고리즘의 성능향상으로 이어지므로, 이를 위해 독특한 색상영역 분포를 갖는 피부 색상 특징을 이용하였다. 표본영상에서 추출된 피부색상 픽셀들을 바탕으로 YCbCr 색상계를 사용하여 얼굴 색상모델을 구축한 후, Gaussian 함수를 사용하여 입력 영상의 픽셀과 얼굴색상모델과의 유사도를 결정하였다. 최종 얼굴 영역은 추출된 영역에 대한 얼굴의 타원특징, 해부학적 특징을 이용하여 결정된다. 추적은 추출된 얼굴영역과 temporal Gaussian 필터를 적용한 움직임 추정을 통한 움직임 검출의 조합으로 이루어진다. 또한, 예측버퍼의 사용으로 탐색영역의 축소로 인한 계산량 감소와 처리 속도의 증가시켰으며, pan/tilt가 가능한 카메라를 사용하여 상호 피드백이 가능하도록 하였다. 제시된 알고리즘은 PC 상에서 시뮬레이션되었으며, 좋은 결과를 얻을 수 있었다.

  • PDF