• 제목/요약/키워드: 샘플 통계

검색결과 206건 처리시간 0.029초

소프트웨어 신뢰모형에 대한 베이지안 접근 (Bayesian Approach for Software Reliability Models)

  • 최기헌
    • Journal of the Korean Data and Information Science Society
    • /
    • 제10권1호
    • /
    • pp.119-133
    • /
    • 1999
  • 마코브체인 몬테칼로 방법을 소프트웨어 신뢰모형에 이용하였다. 베이지안 추론에서 조건부 분포를 가지고 사후분포를 결정하는데 있어서의 계산 문제를 고찰하였다. 특히 레코드값을 통계량을 갖고서 혼합과정과 중첩과정에 대하여 깁스샘플링 알고리즘과 메트로폴리스 알고리즘을 활용하여 베이지안 계산과 모형 선택을 제시하고 모의실험자료를 이용하여 수치적 인 계산을 시행하고 그 결과를 비교하였다.

  • PDF

통계모델링 방법의 비교 연구 (A Comparison Study on Statistical Modeling Methods)

  • 노유정
    • 한국산학기술학회논문지
    • /
    • 제17권5호
    • /
    • pp.645-652
    • /
    • 2016
  • 입력 랜덤 변수(input random variable)의 통계 모델링은 기계시스템의 신뢰성 해석(reliability analysis), 신뢰성 기반 설계(reliability-based design optimization), 해석모델의 통계적 검정(validation) 및 보정(calibration)을 위해 반드시 필요하다. 대표적인 통계모델링 기법에는 Akaike Information Criterion (AIC), AIC correction (AICc), Bayesian Information Criterion, Maximum Likelihood Estimation (MLE), Bayesian 방법 등이 있다. 이러한 방법들은 기본적으로 주어진 데이터로부터 후보 모델의 우도함수값을 이용하여 후보 모델 중 가장 적합한 모델을 선택하는 방법이며, 방법에 따라 데이터 수 혹은 파라미터의 수를 고려하여 모델을 선정한다. 하지만 실제 현장에서 데이터의 통계모델링을 하는 엔지니어는 각 방법의 장단점에 대한 이해가 부족하여 어떤 방법이 정확한 방법인지 몰라 통계모델링 수행 시 어려움이 있다. 본 논문에서는 다양한 통계모델링 방법들을 비교하고 각 방법의 장단점 분석을 통해 가장 적합한 모델링 기법을 제안하고자 한다. 각 방법의 검증을 위해 다양한 모분포를 가정하고 다양한 사이즈의 샘플을 임의로 생성하여 시뮬레이션을 수행하였으며, 실제 공학 데이터를 사용하여 통계모델링 방법의 유효성을 검증하였다.

랜섬웨어 탐지를 위한 동적 분석 자료에서의 변수 선택 및 분류에 관한 연구 (A study on variable selection and classification in dynamic analysis data for ransomware detection)

  • 이승환;황진수
    • 응용통계연구
    • /
    • 제31권4호
    • /
    • pp.497-505
    • /
    • 2018
  • 최근 랜섬웨어는 일반 PC 사용자에 비해 상대적으로 수준 높은 보안 체계를 갖추고 있는 기업과 정부 기관에 침입하여 상당한 피해를 입히는 등 기존 보안 체계의 허점을 찾아 진화하는 모습을 보이고 있다. 이처럼 계속해서 변화하는 랜섬웨어를 탐지하기 위해 랜섬웨어의 특징을 파악하는 정적 분석과 동적 분석과 관련된 연구가 활발히 이루어지고 있다. 본 연구에서는 582개의 랜섬웨어 샘플과 942개의 정상 샘플 프로그램을 쿠쿠 샌드박스 가상환경 내에서 실행시킨 뒤, PC에서 이루어지는 30,967가지의 행동 여부를 기록한 동적 분석 자료를 활용하여 랜섬웨어 분류에 유의한 변수를 탐색하기 위한 여러 변수 선택 방법의 적용과 랜섬웨어 분류를 위한 기계학습 모형들을 구축하고자 하였다. 변수 선택법으로 LASSO와 이항변수 만으로 이루어진 고차원 자료라는 특성을 활용하기 위한 카이제곱검정을 이용한 변수 선택, 선행 연구에서 이용된 방법인 상호정보를 이용한 변수 선택법을 적용하였으며 기계 학습 모형으로는 능형 로지스틱 회귀, 서포트 벡터 머신, 랜덤 포레스트, XGBoost가 활용되었다. 연구 결과, 정상 프로그램과 구별되는 랜섬웨어 프로그램만의 특징적인 행동을 확인할 수 있었으며 여러 변수 선택법과 기계학습 분류 모형들의 조합 중, 주어진 자료에서 카이제곱검정을 이용한 변수 선택법과 랜덤 포레스트 모형의 조합이 가장 높은 탐지율과 정분류율을 보이는 것을 확인하였다.

일회용품의 신뢰성분석 방안 (Reliability analysis methods to one-shot device)

  • 백재욱
    • 산업진흥연구
    • /
    • 제7권4호
    • /
    • pp.1-8
    • /
    • 2022
  • 우리 주위를 살펴보면 한 번 사용하고 버리는 일회용품이 많다. 폭죽이나 탄약과 같은 일회용품이 대표적인데 이들 일회용품은 제조 후 한 동안 저장되어 있다가 필요한 때 사용하고 나면 폐기처분하게 된다. 하지만 이런 일회용품은 일반 운영장비와 달리 신뢰성평가가 제대로 이루어지지 못했다. 이에 본 연구에서는 일회용품 중에서 탄약에 대한 저장탄약신뢰성프로그램을 통해 탄약의 경우 신뢰성 확보를 위해 정부에서 어떤 일을 하는지 먼저 살펴본다. 이어서 통계분석적인 측면에서 탄약과 같은 일회용품에 대한 신뢰성분석 방안으로 어떤 것이 있는지 알아본다. 구체적으로 통계학에서 로트의 품질수준을 파악하는 샘플링검사를 활용하여 일정한 시기에 생산된 탄약에 대한 신뢰성의 수준을 파악할 수 있다. 본 연구에서는 KS Q0001인 계수규준형 1회 샘플링검사표를 이용할 수 있음으로 보여준다. 다음으로 탄약의 저장신뢰도를 파악할 수 있는 방법으로 비모수적인 방법과 모수적인 방법을 소개한다. 비모수적인 방법중에서 특히 Kaplan-Meier 방법은 중도중단데이터가 포함된 경우에도 활용될 수 있다. 마지막으로 모수적인 방법 중에는 신뢰성분석에 많이 활용되는 와이블분포가 탄약의 저장신뢰도를 파악하는 데에도 활용될 수 있다.

기후변화 영향을 고려한 포아송 클러스터 가상강우생성모형 개발 및 검증 (Development of Poisson cluster generation model considering the climate change effects)

  • 박현진;한재문;김종호;김동균
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.189-189
    • /
    • 2015
  • 본 연구는 기후변화의 영향을 고려한 포아송 강우생성모형의 일종인 MBLRP(Modified Bartlett-Lewis Rectangular Pulse)를 개발하고, 대한민국 주요 도시에 대해 향후 100년간 강우의 변화를 살펴보았다. 기존 MBLRP 모형에서 기후변화에 따른 강우량 변화를 고려할 수 있도록 GCM 모형의 강우 자료를 활용하였고, GCM 모형으로부터 발생하는 불확실성을 고려하기 위해 IPCC의 RCP(Representative Concentration Pathways) 시나리오를 모의한 16개의 GCM 모형을 사용하였다. 2007년부터 2099년까지의 미래기간을 3개의 시 구간으로 구분하고, 16개 GCM 앙상블을 사용하여 미래기간 동안 대한민국 16개 도시에 대해 1000개의 샘플을 BWA 방법을 이용하여 생성하였다. 제어기간(1973-2005) 대비 미래기간(2007-2099)의 변화율을 나타내는 FOC(factor of change)와 온도의 연별 변화율을 나타내는 SF(scaling factor)의 개념을 결합하여 미래기간에 대한 CF(correction factor)를 산정하였다. 이때 CF는 16개 도시의 연 단위 강우량 변화 비율을 월별로 나타내며, 제어기간의 월 강우 관측치와 CF를 몬테카를로 모의를 실시하여 미래기간의 강우 시나리오를 산정한다. 이를 통해 월 평균 강우량 통계치를 연 단위로 얻을 수 있으며, 월 평균 강우량이 월 평균 분산, 무강우확률, 자기상관계수와 가지는 선형 관계를 통해 강우 통계치를 산출한다. 이와 같은 강우 통계치는 가상강우생성모형인 MBLRP 모형에 입력 자료로 활용되어 월 강우량을 시 단위의 강우 시계열 자료로 생성해낸다. 최종적으로 MBLRP 모형으로 산정된 시 단위 강우 시계열은 기후변화 영향을 고려한 GCMs 앙상블로 생성된 강우 시나리오를 기반으로 산출되기 때문에 향후 수자원 분석에 활용 가능할 것이라 기대된다.

  • PDF

소량자료를 위한 베이지안 다중 변환점 모형 (Bayesian Multiple Change-Point for Small Data)

  • 전수영
    • Communications for Statistical Applications and Methods
    • /
    • 제19권2호
    • /
    • pp.237-246
    • /
    • 2012
  • 다중 변환점(multiple change-point) 추론에 있어 소량자료에 관한 연구는 많지 않다. 본 논문에서는 소량 자료의 다중 변환점 추정을 위해 베이지안 비중심(noncentral) t 분포 변환점 모형을 제안하고, 제안된 모형 추론을 위해 메트로폴리스-해스팅스를 포함한 깁스 샘플링(Metropolis-Hastings-Within-Gibbs sampling) 알고리즘을 이용하였다. 모의실험 및 태풍 발생 수의 실증 분석결과는 제안된 모형과 알고리즘의 우수성을 보여 준다.

RTLS를 위한 위치 보정 기법의 설계 및 구현 (Design and Implementation of Location Error Correction Algorithm for RTLS)

  • 정동규;류우석;박재관;홍봉희
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2008년도 공동춘계학술대회
    • /
    • pp.286-292
    • /
    • 2008
  • RTLS 시스템은 이동 객체에 RTLS 태그를 부착한 후 태그에서 발산되는 신호를 이용하여 실시간으로 위치를 파악하는 시스템으로 최근 항만 물류 및 자산 관리 분야에서 객체의 실시간 위치를 파악하기 위해 활용되고 있다. RTLS 시스템은 태그의 위치를 측정하기 위해 삼각 측량 법이나, Proximity matching법을 사용한다. 삼각 측량법은 3개 이상의 리더에서 수신된 신호 세기나 신호의 도달 시간을 이용하여 삼각측량 방식으로 위치를 결정하는 알고리즘으로, 전파의 난반사나 장애물등에 민감하며, Proximity matching법은 위치 샘플링 값에 대한 근접성을 이용한 통계 정보를 바탕으로 하여 위치를 결정하는 알고리즘으로 위치 정확도를 높일 수 있으나, 샘플링 데이터 개수에 따라 정확도가 크게 변화하는 문제가 있다. 본 논문에서는 이러한 위치 정보의 오차를 줄이기 위하여, Fingerprint 방식의 확률 모델에 TDOA 방식에서 사용되는 요소들을 혼합하여 확률에 의한 불확실성을 줄이고 더 높은 정확도의 위치 정보를 전달하는 위치 보정 기법을 제안한다. 본 논문에서 제안하는 2단계 위치 보정 기법은 먼저, Fingerprint 데이터 셋으로부터 현재 측정된 위치의 신호정보를 이용한 확률 모델을 적용하여 단 하나의 후보자를 결정한다. 둘째, 측정된 정보와 후보자 위치 정보를 기반으로 TDOA에서 사용하는 기하학적 위치 결정 방법을 변형한 알고리즘을 이용해 측정된 위치를 보정함으로써, TDOA 방식이나, Fingerprint 방식 둘 중 하나만 사용하는 것보다 향상된 위치의 정확도를 제공한다. 그리고 본 논문에서는 제안한 위치 보정 기법을 위한 위치 보정 모듈을 설계하였으며, RTLS 미들웨어에 이를 반영하여 구현하였다.

  • PDF

Giomer와 자가 산부식 접착제의 상아질에 대한 전단 결합강도 (SHEAR BOND STRENGTH OF GIOMER AND SELF-ETCHING PRIMER ON THE DENTIN)

  • 윤은영;이난영;이상호
    • 대한소아치과학회지
    • /
    • 제37권4호
    • /
    • pp.422-428
    • /
    • 2010
  • Giomer는 글라스 아이오노머 시멘트의 불소 방출 능력과 복합레진의 물성을 동시에 가지고 있는 새로운 형태의 재료로서 소개되었다. 이에 본 연구에서는 giomer의 전단 결합강도를 기존의 심미 수복재료인 복합 레진과 컴포머와 비교하여 심미 수복재료로서의 임상적 효용성을 평가하고자 한다. 소의 전치를 자가중합 교정용 레진을 이용하여 아크릴 튜브에 매몰시킨 후, 상아질을 노출시키기 위해 실리콘 페이퍼를 이용하여 표면을 연마하였다. 샘플을 무작위로 I군(Giomer), II군(복합 레진), III군(컴포머), IV군(Giomer와 5세대 단일병 접착제)으로 분류하였다. 만능 시험기를 이용하여 각 샘플의 전단 결합강도를 측정하였다. One-way ANOVA와 Scheffe test를 이용하여 통계분석을 시행하였다. I군은 III군에 비해 통계학적으로 유의하게 높은 전단 결합강도를 나타냈다(p<0.05). I군과 II군의 전단 결합강도는 통계학적으로 유의한 차이가 없었다(p>0.05). IV군는 I군에 비해 낮은 결합강도를 보였지만, 통계학적으로 유의한 차이는 없었다(p>0.05). 실험의 결과로 보아 불소 방출의 특성을 지닌 giomer의 결합강도가 컴포머에 비해 우수하고, 복합 레진과 유사한 것으로 나타남으로써 소아 환자의 심미수복재료로서의 임상적 효용성이 있다고 사료된다.

유전자 연관성이 랜덤검정 P값과 유의 유전자군의 탐색에 미치는 영향 (Effect of Genetic Correlations on the P Values from Randomization Test and Detection of Significant Gene Groups)

  • 이미성;송혜향
    • 응용통계연구
    • /
    • 제22권4호
    • /
    • pp.781-792
    • /
    • 2009
  • 유전체 초기단계 연구에서는 비교적 소수의 마이크로어레이 샘플자료로서 실험을 진행하여 심도 깊게 연구해야 할 유전자 부분군(subsets)을 탐색하게 된다. 이러한 과정에서 요구되는 부분군 탐색에 사용되는 분석방법은 다수 샘플자료 분석의 경우와는 매우 다른 방법들이다. 유전자 극소수 샘플자료의 분석에 매우 적절한 방법인 랜덤검정법을 적용하여 정확한 P값(exact P value)의 이산형 분포가 얻어지고, 일양분포 귀무가설의 검정으로 유의 유전자가 존재하는지를 파악할 수 있다. 한 단계 더 나아가 Fuchs와 Kenett (1980)이 제시한 M 검정을 이용하여 이산형 P 값 다항분포에서 이상범주군(outlier cells)을 찾을 수 있으며 이로써 유의 유전자로서의 가능성이 있는 유전자군을 선정한다. 대다수의 마이크로어레이 유전체 연구에서 수 천 또는 수 만개의 유전자가 서로 독립이라고 가정하고 분석하는 것이 문제점이다. 그러나 본 논문에서는 유전자 연관성을 그대로 유지하는 순열에 기초한 랜덤검정법과 M 검정법으로서 유전자 연관성이 분석에 미치는 영향을 모의실험으로 알아보았으며, 그 영향이 결코 미약하지 않음을 확인할 수 있었다.

다중 자료 변환을 이용한 구성 자료의 지구통계학적 시뮬레이션 (Geostatistical Simulation of Compositional Data Using Multiple Data Transformations)

  • 박노욱
    • 한국지구과학회지
    • /
    • 제35권1호
    • /
    • pp.69-87
    • /
    • 2014
  • 이 논문에서는 구성 자료의 지구통계학적 시뮬레이션을 위해 다중 자료 변환 기반 조건부 시뮬레이션 틀을 제안하였다. 우선 일반적인 통계 기법의 적용이 가능하도록 구성 자료에 로그비 변환을 적용하였다. 다음 변환들로는 최소/최대 자기상관 인자 변환과 지시자 변환을 순차적으로 적용하였다. 독립적인 새로운 변수의 생성을 위해 최소/최대 자기상관 인자 변환을 적용하였으며, 적용 결과 개별 변수들의 독립적인 시뮬레이션이 가능해진다. 그리고 다중 가우시안 확률 모델을 따르지 않는 변수들의 비모수적 조건부 누적 확률 분포 모델링을 위해 지시자 변환을 적용하였다. 최종적으로는 적용한 변환 방법들의 역순으로 역 변환을 적용하였다. 간석지 표층 퇴적물 성분 자료를 대상으로 제안 시뮬레이션 기법의 적용 가능성을 예시하였다. 모든 시뮬레이션 결과들은 구성 자료의 제한 조건을 만족하면서 샘플 자료의 통계 특성을 잘 반영하였다. 구성 자료의 다수의 시뮬레이션 결과들을 이용한 표층 퇴적물 분류를 통해 기존 크리깅에서는 얻을 수 없는 분류 결과의 확률론적 평가가 가능하였다. 따라서 제안 시뮬레이션 틀은 다양한 구성 자료의 지구통계학적 시뮬레이션에 효과적으로 이용될 수 있을 것으로 기대된다.