• Title/Summary/Keyword: 기록값 통계량

Search Result 26, Processing Time 0.15 seconds

수명분포가 감마족인 기록값 통계량에 기초한 무한고장 NHPP 소프트웨어 신뢰성장 모형에 관한 비교 연구 (A Study of Infinite Failure NHPP Software Reliability Growth Model base on Record Value Statistics with Gamma Family of Lifetime Distribution)

  • 김희철;신현철
    • 융합보안논문지
    • /
    • 제6권3호
    • /
    • pp.145-153
    • /
    • 2006
  • 본 논문에서는 기록값 통계량을 이용한 무한 고장 NHPP 모형들이 제안되었다. 이 모형들은 결함당 고장 발생률이 단조 증가하거나 단조 감소하는 패턴을 가진다. 그리고 수명 분포에서는 어랑 분포, 랄리 분포와 굼벨를 이용한 소프트웨어 신뢰성 모형을 적용하여 비교연구에 초점을 두었다. 고장 간격 시간 자료를 이용한 무한 고장 NHPP 모형들에 대한 모수 추정법은 최우 추정법을 사용하였고 적용 분포들의 적용을 용이하게 하기 위하여 특수한 형태를 제시하였다. 고장 자료의 분석을 위하여 산술 및 라플라스 추세 검정과 적합도 및 치우침 검정을 실시하여 그 결과를 나열하였다.

  • PDF

기록값 통계량을 이용한 소프트웨어 최적 방출시기에 관한 비교 연구 (The Comparative Study of Software Optimal Release Time Based on Record Value Statistics)

  • 김희철;박형근
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2009년도 춘계학술발표논문집
    • /
    • pp.659-662
    • /
    • 2009
  • 본 연구에서는 소프트웨어 제품을 개발하여 테스팅을 거친 후 사용자에게 인도하는 시기를 결정하는 방출문제에 대하여 연구되었다. 소프트웨어의 결함을 제거하거나 수정 작업 중에도 새로운 결함이 발생될 가능성이 있는 무한고장수를 가진 비동질적인 포아송 과정에 기초하고 수명분포는 신뢰도 측면에서 여러 분포들을 적합시키는데 효율적인 특성을 가진 와이블분포를 이용한 최적 방출시기에 관한 문제를 제시하여 소프트웨어 요구 신뢰도를 만족시키고 소프트웨어 개발 및 유지 총비용을 최소화 시키는 최적 소프트웨어 방출 정책에 대하여 논의되었다.

  • PDF

전자의무기록 데이터에서의 적대적 생성 알고리즘 기반 결측값 대치 알고리즘 성능분석 (Performance Evaluation of an Imputation Method based on Generative Adversarial Networks for Electric Medical Record)

  • 조용연;정민영;황보율
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.879-881
    • /
    • 2019
  • 전자의무기록 (EMR)과 같은 의료 현장에서 수집되는 대용량의 데이터는 임상 해석적으로 잠재가치가 크고 활용도가 다양하나 결측값이 많아 희소성이 크다는 한계점이 있어 분석이 어렵다. 특히 EMR의 정보수집과정에서 발생하는 결측값은 무작위적이고 임의적이어서 분석 정확도를 낮추고 예측 모델의 성능을 저하시키는 주된 요인으로 작용하기 때문에, 결측치 대체는 필수불가결하다. 최근 통상적으로 활용되어지던 통계기반 알고리즘기반의 결측치 대체 알고리즘보다는 딥러닝 기술을 활용한 알고리즘들이 새로이 등장하고 있다. 본 논문에서는 Generative Adversarial Network를 기반한 최신 결측값 대치 알고리즘인 Generative Adversarial Imputation Nets을 적용하여 EMR에서의 성능을 분석해보고자 하였다.

한국프로야구에서 타자능력지수 제안 - 대체선수대비승수(WAR)을 중심으로 (Suggestion of batter ability index in Korea baseball - focusing on the sabermetrics statistics WAR)

  • 이제영;김현규
    • 응용통계연구
    • /
    • 제29권7호
    • /
    • pp.1271-1281
    • /
    • 2016
  • 야구에서 타자의 능력을 측정하는 많은 세이버메트릭스 통계량들 중에서 대체선수대비승수(wins above replacement; WAR)은 가장 많이 쓰이는 통계량이다. WAR은 선수의 공격능력과 주루능력, 수비능력 등을 하나의 수치로 표현하는 방법이란 점에서 큰 장점을 가지고 있다. 본 논문에서는 지난 3년간(2013-2015년) 한국프로야구 기록 자료를 바탕으로 세이버메트릭스 변수들의 값을 구한 뒤, 이를 이용하여 WAR을 대체할 수 있는 타자능력지수를 제안하였다. 타자능력지수는 산술평균방법, 가중평균방법, 주성분회귀분석 등을 통해 산출하고 WAR과 비교하여 가장 관계가 높은 방법을 선택하였다.

POT 방법을 이용한 이변량 빈도해석 적정 표본크기 연구 (Study on Optimal Sample Size for Bivariate Frequency Anlaysis using POT)

  • 주경원;김한빈;남우성;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.38-38
    • /
    • 2015
  • 최근 다변량 확률모형을 이용한 빈도해석이 여러 수문분야에 걸쳐 연구되고 있다. 기존 일변량 빈도해석에 비해 변수활용에 대한 자유도와 물리적 현상을 정확하게 표현할 수 있다는 장점이 있으나, 표본자료의 부족, 매개변수 추정 및 적합도 검정 등의 어려움으로 실제 분야에 사용되기 어려운 점이 있다. 본 연구에서는 copula 모형에 대하여 Cramer-von Mises(CVM) 적합도 검정 시 표본자료의 적정 크기를 결정하기 위하여 Peaks-Over-Threshold(POT) 방법을 이용하였다. 서울지점의 기상청 시강우 자료를 이용하여 빈도해석을 수행하였으며, Gumbel copula 모형에 대하여 매개변수 추정은 maximum pseudolikelihood method(MPL) 방법을 이용하였다. 50년의 기록 자료에 대하여 표본크기를 50개부터 2500개까지 조절하여 CVM 통계값과 p-value를 기준으로 적정 표본크기를 산정하였다.

  • PDF

돼지의 QTL 검색을 위한 유의적 임계수준(Threshold) 결정 (Determination of Significance Threshold for Detecting QTL in Pigs)

  • 이학교;전광주
    • Journal of Animal Science and Technology
    • /
    • 제44권1호
    • /
    • pp.31-38
    • /
    • 2002
  • 양적형질 유전자좌위(Quantitative trait loci; QTL) 연관지도 작성을 위해 regression interval mapping method에 의해 Berkshire종과 Yorkshire종간 교배를 통해 생산된 $F_2$ 집단에서 실시하였다. 염색체내 QTL 위치를 결정하기 위해 regression 모델을 통해 계산된 검정통계량(F-statistic)에 대한 유의적인 threshold 수준의 설정은 permutation test 및 Lander와 kruglyak (1995)에 의해 제시된 방법으로 산출하였다. 525두 $F_2$ 개체에 대해 조사된 기록 중 5형질(도체중, 등심 단면적, 근내지방 교잡도, 콜레스테롤 함량, 척추 늑골 등지방 두께) 기록을 분석에 이용하였고 genome 전체에 걸친 125개의 microsatellite marker에 대해 3세대 집단 모두 개체에 대해 유전자형을 조사하였다. 회귀분석 모형에 따라 additive 및 dominance 효과를 추정하였으며 이때 모든 회귀계수 값과 F-검정 통계량은 각각 1cM 단위로 추정하였다. 각 형질별, 염색체별로 10,000회의 permutation에 의해 genome-wise 및 chromosome-wise threshold를 추정하였다. Lander와 Kruglyak(1995)에 의해 제시된 방법으로 산출된 threshold 값은 매우 높게 추정되어 이러한 threshold의 적용시 실제로 QTL 존재 여부를 인정할 수 있는 경우의 수가 permutation에 의해 유도된 threshold를 적용했을 때보다 상대적으로 적은 결과를 보였다. 5% genome-wise threshold의 경우 형질별로 다소 상이한 경향을 나타냈으며 분석에 활용된 5개 형질에 대해 총 4개의 QTL이 5% genome-wise 수준에서 검색되었다.

메이저리그 타자들의 명예의 전당 입성과 탈락에 대한 Mahalanobis-Taguchi System의 적용과 비교 (Implementation of Mahalanobis-Taguchi System for the Election of Major League Baseball Hitters to the Hall of Fame)

  • 김수환;박창순
    • 응용통계연구
    • /
    • 제26권2호
    • /
    • pp.223-236
    • /
    • 2013
  • 미국 프로야구(Major League Baseball) 명예의 전당의 입성과 탈락을 예측할 수 있는 여러 가지 통계적인 분류분석법을 실시하고 그 결과의 정확성을 비교하였다. 이를 위해 명예의 전당 가입 조건을 만족하는 타자들 중 1980년 이후 기록된 데이터의 17개의 독립변수를 사용하여 분류분석에서 널리 사용되는 기준으로 판별분석, 로지스틱 회귀분석과 상대적으로 최근에 제안된 Mahalanobis-Taguchi System(MTS)을 실시하여 비교하였다. 이 세 가지 방법 중 MTS가 상대적으로 더 나은 효율을 보였으며 이는 다변량 관측 값이 방향성이 없어 속성에 따른 도형적 그룹을 형성하지 못하는 경우에 효율적인 MTS의 특성에 의한 것으로 판단된다.

기록값 통계량에 기초한 무한고장 NHPP 소프트웨어 혼합 신뢰성장 모형에 관한 연구 (Infinite Failure NHPP Software Mixture Reliability Growth Model Base on Record Value Statistics)

  • 김희철;신현철;김경수
    • 융합보안논문지
    • /
    • 제7권3호
    • /
    • pp.51-60
    • /
    • 2007
  • 무한고장수를 가진 비동질적인 포아송 과정에 기초한 모형들에서 잔존 결함 1개당 고장 발생률은 일반적으로 상수, 혹은 단조증가 및 단조 감소 추세를 가지고 있다. 본 논문에서는 소프트웨어 신뢰성 모형인 지수분포모형과 어랑 분포 모형을 재조명하고 보다 현실적인 혼합분포모형을 제안 하였다. 고장 간격시간으로 구성된 자료를 이용한 모수추정 방법은 최우추정법과 일반적인 수치해석 방법인 이분법을 사용하여 모수 추정을 실시하고 효율적인 모형 선택은 편차자 승합(SSE) 및 콜모고로프 거리를 적용하여 모형들에 대한 효율성 입증방법을 설명하였다. 소프트웨어 고장 자료 분석에서는 41개의 고장 수를 가진 S27[12] 자료를 통하여 분석하였다. 이 자료들에서 지수분포 모형과 어랑분포 모형 및 혼합분포 모형의 비교를 위하여 산술적 및 라플라스 검정, 편의 검정 등을 이용하였다.

  • PDF

Log-Logistic 분포 모형에 근거한 소프트웨어 최적방출시기에 관한 비교연구 (The Comparative Study of Software Optimal Release Time Based on Log-Logistic Distribution)

  • 김희철
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권7호
    • /
    • pp.1-9
    • /
    • 2008
  • 본 연구에서는 소프트웨어 제품을 개발하여 테스팅을 거친 후 사용자에게 인도하는 시기를 결정하는 방출문제에 대하여 연구되었다. 소프트웨어의 결함을 제거하거나 수정 작업 중에도 새로운 결함이 발생될 가능성이 있는 무한 고장수를 가진 비동질적인 포아송 과정에 기초하고 수명분포는 단위당 고장발생률이 증가하다가 감소하는 속성을 가진 로그-로지스틱 분포를 이용한 최적 방출시기에 관한 문제를 제시하여 소프트웨어 요구 신뢰도를 만족시키고 소프트웨어 개발 및 유지 총비용을 최소화시키는 최적 소프트웨어 방출 정책에 대하여 논의 되었다. 본 논문의 수치적인 예에서는 고장간격 시간자료를 적용하고 모수추정 방법은 최우추정법과 추세분석을 통하여 자료의 효율성을 입증한 후 최적 방출시기를 추정하였다.

  • PDF

형상모수에 근거한 소프트웨어 최적방출시기에 관한 비교 연구 (The Comparative Study of Software Optimal Release Time for the Distribution Based on Shape parameter)

  • 신현철;김희철
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권8호
    • /
    • pp.1-9
    • /
    • 2009
  • 본 연구에서는 소프트웨어 제품을 개발하여 테스팅을 거친 후 사용자에게 인도하는 시기를 결정하는 방출문제에 대하여 연구되었다. 소프트웨어의 결함을 제거하거나 수정 작업 중에도 새로운 결함이 발생될 가능성이 있는 무한고장수를 가진 비동질적인 포아송 과정에 기초하고 수명분포는 단위당 고장발생률이 증가하거나 감소하는 속성을 가진 형상모수가 2인 확률 분포를 이용한 최적 방출시기에 관한 문제를 제시하여 소프트웨어 요구 신뢰도를 만족시키고 소프트웨어 개발 및 유지 총비용을 최소화 시키는 최적 소프트웨어 방출 정책에 대하여 논의 되었다. 본 논문의 수치적인 예에서는 고장 간격 시간 자료를 적용하고 모수추정 방법은 최우추정법과 추세분석을 통하여 자료의 효율성을 입증한 후 최적 방출시기를 추정하였다.