• 제목/요약/키워드: 이산형분포

검색결과 62건 처리시간 0.02초

A Study on the Estimation of Confidence Intervals for Discrete Distribution

  • 김대학;오광식;이상복
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 한국데이터정보과학회 2003년도 추계학술대회
    • /
    • pp.1-11
    • /
    • 2003
  • 일반적으로 모수에 대한 신뢰구간 추정량이 점 추정량보다 훨씬 더 선호되고 있으며 많이 알려져 있다. 그러나 이산형 분포의 경우에는 주로 대 표본 근사 이론에 입각한 근사 신뢰구간이 많이 사용되고 있다. 본 논문에서는 여러 가지 이산형 분포 가운데에서 가장 많이 활용되고 있는 이항분포와 포아송 분포의 모수에 대한 다양한 신뢰구간 추정량들을 소개하고 대 표본 근사 이론에 의한 신뢰구간뿐만 아니라 소 표본의 경우에도 유용하게 이용될 수 있는 신뢰구간 등을 살펴보고 이들 신뢰구간들을 비교하였다.

  • PDF

데이터 분포를 고려한 연속 값 속성의 이산화 (Discretization of continuous-valued attributes considering data distribution)

  • 이상훈;박정은;오경환
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 춘계 학술대회 학술발표 논문집
    • /
    • pp.217-220
    • /
    • 2003
  • 본 논문에서는 특정 매개변수의 입력 없이 속성(attribute)에 따른 목적속성(class)값의 분포를 고려하여 연속형(conti-nuous) 값을 범주형(categorical)의 형태로 변환시키는 새로운 방법을 제안하였다. 각각의 속성에 대해 목적속성의 분포를 1차원 공간에 사상(mapping)하고, 각 목적속성의 밀도, 다른 목적속성과의 중복 정도 등의 기준에 따라 구간을 군집화 한다. 이렇게 생성된 군집들은 각각 목적속성을 예측할 수 있는 확률적 수치에 기반한 것으로, 각 속성이 제공하는 정보의 손실을 최소화하는 이산화 경계선을 갖고 있다. 제안된 데이터 이산화 방법의 향상된 성능은 C4.5 알고리즘과 UCI Machine Learning Data Repository 데이터를 사용하여 확인할 수 있다.

  • PDF

Wasserstein 거리를 이용한 연속형 변수 이산화 기법 (Discretization Method for Continuous Data using Wasserstein Distance)

  • 하상원;김한준
    • 데이타베이스연구회지:데이타베이스연구
    • /
    • 제34권3호
    • /
    • pp.159-169
    • /
    • 2018
  • 연속형 변수의 이산화(Discretization)는 양적 변수(Quantitative variable)를 질적 변수(Qualitative variable)로 변형시켜 데이터 마이닝(Data mining) 기법 등 다양한 알고리즘의 성능을 향상시키는데 사용 목적이 있다. 데이터에 적절한 이산화 기법을 사용한다면 분류 알고리즘에 대해 더 좋은 성능뿐 아니라 간결한 결과 해석, 속도 향상까지 기대할 수 있다. 현재까지 다양한 이산화 기법들이 연구되었으며, 현재도 이산화와 관련한 연구에 수요가 많다. 본 논문은 데이터의 클래스에 대한 연속형 변수 값의 분포를 고려하여, Wasserstein 거리를 이용해 분할점을 자동 설정하는 이산화 기법을 제안한다. 본 논문에서 제안하는 기법과 우수함이 입증된 기존의 이산화 기법에 대해 성능비교를 통해 제안 기법의 우수성을 보인다.

Combining Independent Permutation p-Values Associated with Multi-Sample Location Test Data

  • Um, Yonghwan
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권7호
    • /
    • pp.175-182
    • /
    • 2020
  • 연속형 분포로부터 얻은 독립적인 p값들을 통합하는 Fisher의 고전적인 방법은 널리 사용되고 있지만 이산형 확률분포로부터 얻은 p값들을 통합하기에는 적절하지 않다. 대신에 유사 Fisher의 통합방법이 이산형 확률분포의 p값들을 통합하는 대안으로 사용된다. 본 논문에서는 첫째, 여러 표본들의 위치검정(Fisher-Pitman 검정과 Kruskal-Wallis 검정) 데이터와 관련된 이산형 확률분포로 부터 퍼뮤테이션 방법에 의해 p값들을 구하고, 둘째로 이 p값들을 유사 Fisher의 통합방법을 이용하여 통합한다. 그리고 Fisher의 고전적인 방법과 유사 Fisher의 통합방법의 결과를 비교한다.

이산분포 혼합의 단봉성이 성립하기 위한 조건 (Criterion of discrete unimodal mixtures)

  • 최대우
    • 응용통계연구
    • /
    • 제8권1호
    • /
    • pp.159-167
    • /
    • 1995
  • 지수족(exponential family)에 속하면서 어떤 특별한 형태를 따르는 이산분포는 그 분포함수가 정의된 정수에 대한 단봉적 순열이다. 본 논문에서 그러한 분포함수의 모수에 대한 혼합형이 어떤 조건하에서 항상 단봉적 순열을 유지하는가에 대하여 연구하였다. 그 예로써 이항분포와 포아송분포 각각에 대한 최대모수구간을 구하여, 그 모수 구간안에서의 혼합형은 항상 단봉적임을 보였다.

  • PDF

커널 판별분석의 오분류확률에 대한 붓스트랩 조정

  • 백장선
    • Communications for Statistical Applications and Methods
    • /
    • 제2권2호
    • /
    • pp.249-265
    • /
    • 1995
  • 본 논문에서는 확률분포가 알려져 있지 않은 두 모집단 중 어느 하나로 새로운 관측치를 분류할 때 오분류확률이 분석자에 의해 사전에 정해진 수준에 부합할 수 있도록 커널 판별함수의 임계치를 결정하였다. 정해진 오분류확률을 만족시키기 위한 판별함수의 임계치는 붓스트랩(bootstrap)기법을 판별 함수에 적용시켜 계산된다. 본 논문에서 제시도된 방법은 모집단에 대한 모수적 가정이 없으므로 어느 분포에도 적용가능하며, 모집단이 정규분포, 대수정규분포, 이산형과 연속형 변수가 혼합된 분포의 경우 모의실험을 통하여 그 성능에 대한 검증을 하였다.

  • PDF

프로젝트 네트워크에서 사업완성시간의 적률 추정 (Estimating the Moments of the Project Completion Time in Project Networks)

  • 조재균
    • 한국산업정보학회논문지
    • /
    • 제22권1호
    • /
    • pp.61-67
    • /
    • 2017
  • 프로젝트 네트워크 분석에서 사업완성시간의 분포를 추정하는 것은 매우 기본적이다. 본 논문에서는 활동시간이 상호 독립적이고 정규분포를 따른다는 가정 하에서 사업완성시간의 적률(평균, 분산, 왜도, 첨도)을 추정하기 위한 방법을 제안한다. 제안된 방법은 연속형의 활동시간 분포를 이산형 분포로 근사화하기 위한 이산화 기법과 난수발생을 이용한다. 제안된 방법은 대규모 네트워크에 대해서도 쉽게 적용 가능하며, 그리고 제안된 방법에 의한 결과는 몬테칼로 시뮬레이션에 의해 얻어진 결과와 비교할 때 매우 정확함을 보여준다.

이종 광섬유 센서 데이터 융합을 통한 변형률 정확도 향상 기법 (Multi-fidelity Data-fusion for Improving Strain accuracy using Optical Fiber Sensors)

  • 박영수;진승섭;유철환;김성태;박영환
    • 대한토목학회논문집
    • /
    • 제40권6호
    • /
    • pp.547-553
    • /
    • 2020
  • 노후화 시설물의 증가에 따라 선제적 유지관리의 중요성은 점차 증대되고 있다. 선제적 유지관리는 시설물의 응답 계측으로부터 시작되기 때문에 높은 정밀도를 가지는 응답을 획득하는 것이 중요하다. 국부적인 응답 중 변형률은 균열 감지 및 피로 진전 예측 등에 활용가능하다. 변형률 센서는 크게 이산형 및 분포형 센서로 구분된다. 이산형 센서의 대표적인 예가 광섬유 브래그 격자(FBG)와 전기 저항식 게이지이다. 이산형 센서는 높은 정확성과 재현성(고 정밀)을 가지지만, 측정점이 제한된다는 한계를 가진다. 브릴루앙 산란 기반 광섬유 변형률 계측 시스템 중 하나인 Brillouin Optical Correlation Domain Analysis (BOCDA)은 대표적인 분포형 센서이며, 5 cm 라는 높은 공간 분해능을 가진다. BOCDA는 투영된 광원에서 발생하는 산란파를 이용하여 광섬유 전 구간의 변형률을 계측한다. 측정점이 많아지는 장점이 있으나, 이산형 센서에 낮은 정확도와 재현성을 가진다. 본 연구에서는 고 정밀 데이터(이산형 센서)와 저 정밀 데이터(분포형 센서) 각각의 장점을 융합하는 후처리 기법을 제안하였으며, 이에 대한 가능성을 검증 실험을 통해 확인했다.

확률적 활동 네트워크에서 사업완성시간의 적률 추정: 활동시간의 일반적 분포 (Estimating the Moments of the Project Completion Time in Stochastic Activity Networks: General Distributions for Activity Durations)

  • 조재균
    • 한국산업정보학회논문지
    • /
    • 제23권3호
    • /
    • pp.49-57
    • /
    • 2018
  • Cho는 확률적 활동 네트워크 분석에서 활동시간이 상호 독립적이고 정규분포를 따른다는 가정 하에서 사업완성시간의 적률 (평균, 분산, 왜도, 첨도)을 추정하기 위한 방법을 제안하였다. 본 논문에서는 활동시간의 분포가 일반적인 분포일 때 사업완성시간의 적률을 추정하기 위한 방법을 제안한다. 제안된 방법은 활동시간 분포의 이산화를 위해 적률매칭 방법을 사용하며, 사업완성시간의 계산에 사용될 활동시간을 결정하는데 이산형 역변환 방법을 사용한다. 제안된 방법은 대규모 네트워크에 적용하기 쉽고, 몬테칼로 시뮬레이션 보다 계산적으로 효율적이며, 제안된 방법의 결과는 몬테칼로 시뮬레이션에 의한 결과와 잘 일치함을 보여준다.

다형질 Threshold 개체모형에서 Missing 기록을 포함한 이산형 자료에 대한 Bayesian 분석 (Bayesian Analysis for Categorical Data with Missing Traits Under a Multivariate Threshold Animal Model)

  • 이득환
    • Journal of Animal Science and Technology
    • /
    • 제44권2호
    • /
    • pp.151-164
    • /
    • 2002
  • 한우의 근내지방도 또는 임신 여부 등과 같이 이산형 분포의 성질을 갖는 다수의 형질들에 대한 유전모수 및 종축의 유전능력을 평가하기 위한 방법으로써 Threshold 모형하에서 Bayesian 추론방법의 일종인 Gibbs sampling방법을 모의실험을 통하여 알아보았으며 기록이 누락된 다수의 형질을 포함하는 다형질 Threshold 개체모형에서의 종축평가 방법론을 제시하였다. 이산형 형질의 관측치에 대응하는 임의의 잠재변수는 기록을 갖고 있는 형질들에 대한 사전정보를 고려한 사후조건확률분포에서 Gibbs sampling을 할 때 모수에 근접하는 확률분포를 얻을 수 있었으며 이러한 이산형 기록들에 대한 육종가 추정치는 선형모형에서 보다 Threshold 모형에서의 추정치가 실제 모수에 더욱 근접하는 것을 알 수 있었다. 따라서 기록이 누락된 개체들에 대한 이산형 분포를 갖는 형질들에 대하여 선형분포를 갖는 형질들과 함께 동시 유전분석할 때 Threshod 모형이 일반 선형모형 보다 적합함을 알 수 있었다.