• 제목/요약/키워드: 편향 샘플링

검색결과 16건 처리시간 0.026초

심층 절리암반의 구조특성 규명을 위한 시추공 자료편향 보정법 (Corrections for Sampling biases of borehole data to characterize deep fractured rock mass)

  • 엄정기
    • 대한지질공학회:학술대회논문집
    • /
    • 대한지질공학회 2003년도 정기총회 및 학술발표회
    • /
    • pp.27-35
    • /
    • 2003
  • 시추공에서 측정된 절리자료의 샘플링 편향오류를 보정하는 절차를 기술하였다. 시추공에서 절리의 방향이 관측될 수 있는 확률은 시추공에 대한 절리의 상대적인 방향 이외에도 절리의 크기, 절리의 모양 및 시추공의 반경 과 길이와 같은 요인에 의하여 결정될 수 있으며, 이러한 요인들에 의하여 나타날 수 있는 절리자료의 방향편향을 보정할 수 있는 방법론을 제시하였다 유한 길이의 시추공으로부터 산정된 절리의 간격분포는 샘플링 영역인 시추공 길이의 영향에 의한 산정치의 오류를 내포하고 있으며, 이에 대한 보정법을 고찰하였다.

  • PDF

1D 측선에 의한 절리 자료에 대한 편향 보정 기법에 관한 연구 (A study of the Sampling Bias Correction on Joint Data from 1D Survey Line)

  • 엄정기
    • 터널과지하공간
    • /
    • 제13권5호
    • /
    • pp.344-352
    • /
    • 2003
  • 시추공 또는 선형조사선과 같은 1D측선에서 측정된 절리 자료의 샘플링 편향을 보정하는 절차를 기술하였다. ID 측선에서 절리가 관측될 수 있는 확률은 측선 방향에 대한 절리의 상대적인 방향 이외에도 절리 크기, 절리 모양 및 측선 길이 등의 복합적 요인에 의하여 결정될 수 있다. 본 연구에서는 절리의 모양을 원판형이라 가정하고 절리의 방향 및 크기에 의하여 나타날 수 있는 절리 자료의 방향 편향 효과를 동시에 보정할 수 있는 방법론을 제시하고, 현장적용을 통하여 방향 편향 보정이 절리군의 방향분포에 미치는 영향에 대하여 고찰하였다. 또한, 유한 길이의 측선으로부터 산정된 절리군의 간격분포는 샘플링 영역인 측선 길이에 따라 다르게 나타날 수 있으며, 이와 같은 간격 편향에 대한 보정절차를 기술하였다.

불균형 범주 분류를 위한 동적 샘플링 스케줄러 (Dynamic Sampling Scheduler for Unbalanced Data Classification)

  • 성수진;박원주;이용태;차정원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.221-226
    • /
    • 2021
  • 우리는 범주 불균형 분류 문제를 해결하기 위해 학습 과정 중 범주 크기 기반 배치 샘플링 방법 전환을 위한 스케줄링 방법을 제안한다. 범주별 샘플링 확률로 범주 크기의 역수(LWRS-Reciporcal)와 범주 비율의 반수(LWRS-Ratio)를 적용하여 각각 실험을 진행하였고, LWRS-Reciporcal 방법이 F1 성능 개선에 더 효과적인 것을 확인하였다. 더하여 고정된 샘플링 확률값으로 인해 발생할 수 있는 또 다른 편향 문제를 완화하기 위해 학습 과정 중 샘플링 방법을 전환하는 스케줄링 방법을 설계하였다. 결과적으로 검증 성능의 갱신 유무로 샘플링 방법을 전환하였을 때 naver shopping 데이터셋과 KLUE-TC에 대하여 f1 score와 accuracy의 성능 합이 베이스라인보다 각각 0.7%, 0.8% 향상된 가장 이상적인 성능을 보임을 확인하였다.

  • PDF

텍스트 데이터의 정보 손실을 방지하기 위한 군집화 기반 언더샘플링 기법 (A Clustering-based Undersampling Method to Prevent Information Loss from Text Data)

  • 김종휘;신사임;장진예
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.251-256
    • /
    • 2022
  • 범주 불균형은 분류 모델이 다수 범주에 편향되게 학습되어 소수 범주에 대한 분류 성능을 떨어뜨리는 문제를 야기한다. 언더 샘플링 기법은 다수 범주 데이터의 수를 줄여 소수 범주와 균형을 이루게하는 대표적인 불균형 해결 방법으로, 텍스트 도메인에서의 기존 언더 샘플링 연구에서는 단어 임베딩과 랜덤 샘플링과 같은 비교적 간단한 기법만이 적용되었다. 본 논문에서는 트랜스포머 기반 문장 임베딩과 군집화 기반 샘플링 방법을 통해 텍스트 데이터의 정보 손실을 최소화하는 언더샘플링 방법을 제안한다. 제안 방법의 검증을 위해, 감성 분석 실험에서 제안 방법과 랜덤 샘플링으로 추출한 훈련 세트로 모델을 학습하고 성능을 비교 평가하였다. 제안 방법을 활용한 모델이 랜덤 샘플링을 활용한 모델에 비해 적게는 0.2%, 많게는 2.0% 높은 분류 정확도를 보였고, 이를 통해 제안하는 군집화 기반 언더 샘플링 기법의 효과를 확인하였다.

  • PDF

층화 다단계 샘플링에서 설계 기반 분산추정 (Design-based Variance Estimation under stratified Multi-stage Sampling)

  • 김규성
    • 한국조사연구학회:학술대회논문집
    • /
    • 한국조사연구학회 2001년도 춘계학술대회
    • /
    • pp.59-71
    • /
    • 2001
  • 층화 다단계 샘플링에서 모총계 추정을 위하여 동질선형추정량을 고려하고, 이 추정량의 설계기반분산추정법을 고찰하였다. 한 방법은 분산을 일단계 분산과 이단계 분산으로 구분하여 각 층에서 각각을 비편향 추정하는 방법이고, 또 다른 방법은 이단계 표본에서 선정한 부차표본을 이용하여 일단계 분산만을 추정하여 전체분산을 비편향 추정하는 방법이다. 전자는 이단계 분산이 추정 가능할 때 이용하기 좋으며 후자는 이단계 분산을 추정할 수 없을 때 용이하게 쓸 수 있다. 각각의 추정법에 대하여 동질선형추정량에 대한 비음 비편향 분산 추정량의 형태를 제안하였다. 향후 실제 조사에서 본 논문에서 제안한 분산추정법이 효과적으로 사용될 수 있기를 기대한다.

층화 다단계 샘플링에서 설계 기반 분산추정 (Design-based Variance Estimation under Stratified Multi-stage Sampling)

  • 김규성
    • 한국조사연구학회지:조사연구
    • /
    • 제2권1호
    • /
    • pp.59-71
    • /
    • 2001
  • 층화 다단계 샘플링에서 모총계 추정을 위하여 동질선형추정량을 고려하고. 이 추정량의 설계기반 분산추정법을 고찰하였다. 한 방법은 분산을 일단계 분산과 이단계 분산으로 구분하여 각 층에서 각각을 비편향 추정하는 방법이고, 또 다른 방법은 이단계 표본에서 선정한 부하표본을 이용하여 일단계 분산만을 추정하여 전체분산을 비편향 추정하는 방법이다. 전자는 이단계 분산이 추정 가능할 때 이용하기 좋으며 후자는 이단계 분산을 추정할 수 없을 때 용이하게 쓸 수 있다. 각각의 추정법에 대하여 동질선형추정량에 대한 비음 비편향 분산 추정량의 형태를 제안하였다. 향 후 실제 조사에서 본 논문에서 제안한 분산추정법이 효과적으로 사용될 수 있기를 기대한다.

  • PDF

효율적인 몬테 칼로 시뮬레이션을 위한 중요 샘플링 기법이 내장된 실험 틀 설계 (Importance Sampling Embedded Experimental Frame Design for Efficient Monte Carlo Simulation)

  • 서경민;송해상
    • 한국콘텐츠학회논문지
    • /
    • 제13권4호
    • /
    • pp.53-63
    • /
    • 2013
  • 본 논문은 효율적인 몬테 칼로 시뮬레이션을 위하여 중요 샘플링(Importance sampling) 기법이 내장된 실험 틀을 제안한다. 제안하는 실험 틀은 중요 샘플링 기법을 적용하기 위해 기능적으로 세분화된 중요 표본기(Importance Sampler)와 편향 보상기(Bias Compensator)라는 두 개의 하위 모델을 내장(Embedded)한다. 이러한 하위 모델은 기존의 시스템 모델과 실험 틀의 경계에 플러그인 됨으로써 기존 모델들의 수정없이 재사용할 수 있는 장점이 있다. 그리고 제안하는 실험 틀은 기능적 측면에서 중요 사건에 대하여 동일한 수준의 결과를 얻는 데 있어 기존의 몬테 칼로 시뮬레이션보다 시뮬레이션 시간을 단축시킬 수 있다. 이러한 효용성을 입증하기 위해 두 가지 실험을 수행하였는데, 실험 결과, 본 실험에 대하여 기존의 몬테칼로 시뮬레이션보다 최대 400 배 가량의 시뮬레이션 시간 측면에서 성능 향상을 확인하였다. 본 논문에서 제안하는 실험 틀은 다양한 콘텐츠 분야에 적용되어 시뮬레이션 성능을 향상시킬 수 있는 도구로 활용할 수 있을 뿐 아니라, 교육적 측면에서 다양한 사회 현상을 이해하고 해석하는 도구로도 활용이 가능하다.

자동 보정 기능을 가진 직교 위상 수신기의 특성 해석 (Analysis of the Characteristics for Quadrature Receivers Adopting an Auto-Calibration Method)

  • 권순만;김석주
    • 한국전자파학회논문지
    • /
    • 제20권1호
    • /
    • pp.100-106
    • /
    • 2009
  • 본 논문에서는 직교 위상 수신기에서 발생하는 동상 성분 채널과 직교 성분 채널간의 이득과 위상 불평형의 추정문제를 다룬다. 즉, 자동 보정 기능을 가지는 직교 위상 수신기에서의 백색 Gaussian 잡음을 고려한 통계적인 특성 분석을 통하여 제안된 알고리즘에 의한 추정값이 점근적으로 비편향 최소 분산 추정(asymptotically minimum-variance unbiased estimate) 특성을 가짐을 보여준다. 이를 위하여 먼저 자동 보정 알고리즘에서 사용하는 샘플링 값들에 대한 통계적인 특성을 구하고, 이 샘플 값들의 함수의 형태로 구해지는 이득과 위상 불평형 추정값들의 통계적인 특성을 분석하기 위해 추정값들의 확률분포함수를 구한다. 이를 기반으로 평균 함수 및 분산 함수를 계산하여 추정값들이 비편향 최소 분산 추정 특성을 나타냄을 확인한다.

농지 공간격자 자료의 층화랜덤샘플링: 농업시스템 기후변화 영향 공간모델링을 위한 국내 농지 최적 층화 및 샘플 수 최적화 연구 (A stratified random sampling design for paddy fields: Optimized stratification and sample allocation for effective spatial modeling and mapping of the impact of climate changes on agricultural system in Korea)

  • 이민영;김용은;홍진솔;조기종
    • 환경생물
    • /
    • 제39권4호
    • /
    • pp.526-535
    • /
    • 2021
  • 공간 샘플링은 공간모델링 연구에 활용되어 샘플링 비용을 줄이면서 모델링의 효율성을 높이는 역할을 한다. 농업분야에서는 기후변화 영향을 예측하고 평가하기 위한 고해상도 공간자료 기반 모델링에 대한 연구 수요가 빠르게 증가하고 있으며, 이에 따라 공간 샘플링의 필요성과 중요성이 증가하고 있다. 본 연구는 국내 농지 공간샘플링 연구를 통해 농업분야 기후변화연구의 공간자료 활용의 효율성을 제고하고자 하였다. 본 연구는 층화랜덤샘플링을 기반으로 하였으며, 1 km 해상도의 농지 공간격자자료 모집단(11,386개 격자)에 대해서 RCP 시나리오별(RCP 4.5/8.5) 연대별(2030/2050/2080년대) 공간샘플링을 설계하였다. 국내 농지는 기상 및 토양 특성에 따라 계층화 되었으며, 샘플링 효율 극대화를 위해 최적 층화 및 샘플 배정 최적화를 수행하였다. 최적화는 작물수량, 온실가스 배출량, 해충 분포 확률을 포함하는 16개 목표 변수에 대해 주어진 정밀도 제한 내에서 샘플 수를 최소화하는 방향으로 진행되었다. 샘플링의 정밀도와 정확도 평가는 각각 변동계수(CV)와 상대적 편향을 기반으로 하였다. 국내 농지 공간격자 모집단 계층화 및 샘플 배정 및 샘플 수 최적화 결과, 전체 농지는 5~21개 계층, 46~69개 샘플 수 수준에서 최적화되었다. 본 연구결과물들은 국내 농업시스템 대표 공간격자로써 널리 활용될 수 있을 것으로 기대된다. 또한, 기후변화 영향예측 공간모델링 연구들에 활용되어 샘플링 비용 및 계산 시간을 줄이면서도 모델의 효율성을 높이는 데에 기여할 수 있다.

현장 조사 자료를 이용한 GIS 기반 주제도 작성을 위한 단변량 크리깅 기법의 비교 (Comparison of Univariate Kriging Algorithms for GIS-based Thematic Mapping with Ground Survey Data)

  • 박노욱
    • 대한원격탐사학회지
    • /
    • 제25권4호
    • /
    • pp.321-338
    • /
    • 2009
  • 이 연구의 목적은 비대칭 분포를 가지는 현장 조사 자료로부터 GIS 기반 주제도를 생성하기 위한 공간 내삽 방법으로 단변량 크리깅 기법을 비교하는데 있다. 기존 정규 크리깅과 비선형 자료 변환에 기반을 둔 로그 정규 크리깅, 다중 가우시안 크리깅과 지시자 크리깅을 지화학 원소 비소와 납에 대해 사례 연구를 통해 비교하였다. 예측 능력의 비교 분석을 위해 leave-one-out 기반 교차 검증을 통한 오차 분석을 수행하였으며, 샘플링 밀도의 차이에 따른 오차의 변화 양상도 분석하였다. 비교 분석 결과, 지시자 크리깅이 전반적으로 가장 높은 예측 능력을 나타내었으며, 작은 값과 높은 값의 예측 능력도 우수한 것으로 나타났다. 정규 크리깅에 비해 비선형 자료 변환 기반 크리깅 기법들이 우수한 예측 능력을 나타내었지만, 기존에 많이 적용된 로그 정규 크리깅은 샘플링 밀도와 상관없이 편향 정도가 가장 크게 나타내었다. 이 연구를 통해 얻어지는 정량적 검증 결과는 비대칭 분포를 가지는 현장 조사 자료의 내삽을 위한 크기깅 기법의 선정에 유용하게 이용될 수 있을 것으로 기대된다.