• 제목/요약/키워드: 베이즈 위험

검색결과 21건 처리시간 0.024초

베이즈 규칙을 활용한 배전선로 위험도 평가모델 -가공배전분야- (A Risk Evaluation Model of Power Distribution Line Using Bayesian Rule -Overhead Distribution System-)

  • 정종만;박용우
    • 전기학회논문지
    • /
    • 제62권6호
    • /
    • pp.870-875
    • /
    • 2013
  • After introducing diagnosis equipment power failure prevention activities for distribution system have become more active. To do facility diagnosis and maintenance work more efficiently we need to evaluate reliability for the system and should determine the priority line with appropriate criteria. Thus, to calculate risk factor for the power distribution line that are composed of many component facilities its historical failure events for the last 5 years are collected and analysed. The failure statics show that more than 60% of various failures are related to environment factors randomly and about 20% of the failures are refer to the aging. As a strategic evaluation system reflecting these environmental influence is needed, a system on the basis of the probabilistic approach related statical variables in terms of failure rate and failure probability of electrical components is proposed. The figures for the evaluation are derived from the field failure DB. With adopting Bayesian rule we can calculate easily about conditional probability query. The proposed evaluation system is demonstrated with model system and the calculated indices representing the properties of the model line are discussed.

건강행위정보기반 고혈압 위험인자 및 예측을 위한 통계분석 (Statistical Analysis for Risk Factors and Prediction of Hypertension based on Health Behavior Information)

  • 허병문;김상엽;류근호
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권4호
    • /
    • pp.685-692
    • /
    • 2018
  • 본 연구는 통계분석을 이용한 중년 성인의 고혈압 예측모델 개발이 목적이다. 국민건강영양조사자료(2013년-2016년)를 사용하여 통계분석과 예측모델을 개발하였다. 이진 로지스틱 회귀분석으로 통계적 유의한 고혈압 위험인자를 제시하였으며, Wrapper 변수선택기법을 적용한 로지스틱회귀와 나이브베이즈 알고리즘을 이용하여 예측모델을 개발하였다. 통계분석에서 고혈압에 가장 높은 연관성을 갖는 인자는 남성에서 WHtR (p<0.0001, OR = 2.0242), 여성에서 AGE(p<0.0001, OR = 3.9185)로 나타났다. 예측모델의 성능평가에서, 로지스틱 회귀 모델이 남성(AUC = 0.782)과 여성(AUC = 0.858)에서 가장 좋은 예측력을 보였다. 우리의 연구 결과는 고혈압에 대한 대규모 스크리링 도구를 개발하는데 중요한 정보를 제공하며, 고혈압 연구에 대한 기반정보로 활용할 수 있다.

고기능·장수명 차선도료의 교통사고 감소효과 분석 (Analysis of Traffic Accident Reduction Performance of High-quality and Long-life Pavement Marking Materials)

  • 이명환;최기주;오인섭;김정화
    • 대한토목학회논문집
    • /
    • 제35권4호
    • /
    • pp.921-929
    • /
    • 2015
  • 광원이 없는 야간이나 비가 오는 날에 차선이 잘 보이지 않아 사고위험이 크게 증가하고 있는 가운데, 한국도로공사에서는 교통안전성을 높이기 위해 경부고속도로 판교~대전에 고기능 장수명 차선도료를 시범 적용하였다. 하지만 이러한 고기능 장수명 차선도료에 대한 실질적인 연구가 부족하였다. 본 연구에서는 고기능 장수명 차선 도료에 대한 소개 및 설문조사에 기반한 기술통계분석과 고기능 장수명 차선도료의 사용에 대한 시범 설치 구간의 사고 자료를 분석하였다. 설문조사 결과 시범적용에 대한 긍정적인 응답이 87%이상으로 높은 만족도를 보였다. 사고자료 분석은 한국도로공사 교통사고속보자료를 활용하였으며 효과를 평가하기 위한 목적으로 단순사고건수 비교방법과 경험적 베이즈 방법을 사용했다. 단순사고건수 분석 결과, 설치 전 62건에서 설치 후 48건으로 사고 감소 효과의 증진이 있는 것으로 확인되었다. 또한 경험적 베이즈 방법 분석 결과, 약 41.7%의 교통사고 감소효과가 있는 것으로 나타났다.

자동차보험 신뢰도 적용에 대한 베이지안 추론 방식 연구 (A study of Bayesian inference on auto insurance credibility application)

  • 김명준;김영화
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권4호
    • /
    • pp.689-699
    • /
    • 2013
  • 본 연구는 가격 경쟁으로 인하여 최근 들어 요율 세분화가 심화되고 있는 자동차보험 시장에서, 부분 신뢰도의 적용 대상에 대한 경험적 사전분포 (empirical prior distribution) 함수 또는 무정보적 사전분포 (noninformative prior distribution) 정보의 가정을 통한 신뢰도 산출 방식에 대하여 살펴보았다. 요율 세분화의 확대로 가격 산출 단위의 수가 증가될 경우, 부분 신뢰도의 적용 대상은 점차 증가되게 될 것으로 판단되기 때문에, 기존에 제시된 신뢰도 적용 방식을 베이지안 프레임에서 적용, 추론함으로써 보다 다양하고 정교한 방식으로 그 활용 범위를 넓히고자 한다. 즉, 경험적으로 사용되는 사전 분포함수 또는 무정보적 사전 정보를 통하여 적절한 사후분포 (posterior distribution)함수를 도출하고 오차를 최소화하는 베이즈 통계량을 적용한 신뢰도를 추정하여 적용함으로써, 위험도 예측에 있어 기존에 제시된 방법과 비교하여 그 효용성을 입증하고자 한다. 현재 가장 많이 활용되는 제곱근 법칙 (square root rule)의 신뢰도 추정 방식에 베이지안 추론에서 도출된 통계량을 반영한 결과를 분석하여 실질적인 위험도에 수렴하는 수준을 비교하게 된다. 이는 이론적으로 위험도 예측에서 오차를 줄이는 방식에 대한 대안 제시와 더불어 신뢰도 적용 방식에 대한 추가적인 활용 대안을 보험업계에 제시함으로써 요율 세분화로 인한 부분 신뢰도 적용방식에 대한 그 이해와 활용의 폭을 넓히고자 한다.

자연어 처리 및 기계학습을 활용한 제조업 현장의 품질 불량 예측 방법론 (A Method for Prediction of Quality Defects in Manufacturing Using Natural Language Processing and Machine Learning)

  • 노정민;김용성
    • Journal of Platform Technology
    • /
    • 제9권3호
    • /
    • pp.52-62
    • /
    • 2021
  • 제조업 현장에서 제작 공정 수행 전 품질 불량 위험 공정을 예측하여 사전품질관리를 수행하는 것은 매우 중요한 일이다. 하지만 기존 엔지니어의 역량에 의존하는 방법은 그 제작공정의 종류와 수가 다양할수록 인적, 물리적 한계에 부딪힌다. 특히 원자력 주요기기 제작과 같이 제작공정이 매우 광범위한 도메인 영역에서는 그 한계가 더욱 명확하다. 본 논문은 제조업 현장에서 자연어 처리 및 기계학습을 활용하여 품질 불량 위험 공정을 예측하는 방법을 제시하였다. 이를 위해 실제 원자력발전소에 설치되는 주기기를 제작하는 공장에서 6년 동안 수집된 제작 기록의 텍스트 데이터를 활용하였다. 텍스트 데이터의 전처리 단계에서는 도메인 지식이 잘 반영될 수 있도록 단어사전에 Mapping 하는 방식을 적용하였고, 문장 벡터화 과정에서는 N-gram, TF-IDF, SVD를 결합한 하이브리드 알고리즘을 구성하였다. 다음으로 품질 불량 위험 공정을 분류해내는 실험에서는 k-fold 교차 검증을 적용하고 Unigram에서 누적 Trigram까지 여러 케이스로 나누어 데이터셋에 대한 객관성을 확보하였다. 또한, 분류 알고리즘으로 나이브 베이즈(NB)와 서포트 벡터 머신(SVM)을 사용하여 유의미한 결과를 확보하였다. 실험결과 최대 accuracy와 F1-score가 각각 0.7685와 0.8641로서 상당히 유효한 수준으로 나타났다. 또한, 수행해본 적이 없는 새로운 공정을 예측하여 현장 엔지니어들의 투표와의 비교를 통해서 실제 현장에 자연스럽게 적용할 수 있음을 보여주었다.

COTS 하드웨어 컴포넌트 기반 임베디드 소프트웨어 신뢰성 모델링 (Embedded Software Reliability Modeling with COTS Hardware Components)

  • 구태완;백종문
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권8호
    • /
    • pp.607-615
    • /
    • 2009
  • 최근 IT 산업은 국방, 항공, 자동차, 의료와 같은 전통 산업분야와 서로 융합하는 추세이다. 그러므로 시스템의 하드웨어를 주로 담당하는 임베디드 소프트웨어는 높은 신뢰성, 가용성, 유지보수성이 보장되어야 한다. 이를 위해 최근 COTS (Commercial Off The Shelf) 하드웨어 컴포넌트 기반 임베디드 소프트웨어를 개발하는 추세이다. 그러나 이러한 개발방법에는 일반적 소프트웨어 결함 외에 하드웨어와의 상호작용에 기인하는 결함이 추가적으로 발생할 수 있다. 이를 연동결함(Linkage Fault)라고 정의한다. 이는 발생 빈도가 낮음에도 불구하고 전체 시스템의 중단을 야기할 정도로 위험하다. 본 논문에서는 COTS 하드웨어 컴포넌트 기반 임베디드 소프트웨어 개발 시 이러한 연동결함의 발생을 고려한 신뢰성 모델을 제안한다. 또한 제안된 모델의 타당성을 분석하기 위해 베이지안 분석과 마코프 체인 몬테카를로 방법으로 계산한 베이즈 요인을 이용한다. 끝으로 IT 융합 분야의 실제 데이터를 활용하여 제안된 모델의 이론적 결과를 뒷받침한다.

Random Forests 기법을 이용한 백내장 예측모형 - 일개 대학병원 건강검진 수검자료에서 - (A Prediction Model for the Development of Cataract Using Random Forests)

  • 한은정;송기준;김동건
    • 응용통계연구
    • /
    • 제22권4호
    • /
    • pp.771-780
    • /
    • 2009
  • 백내장 질환은 노령인구가 증가하고 있는 시점에서 사회, 경제적으로 심각한 문제로 부각되고 있는 질병으로 조기 진단이 이루어진다면 발병률을 크게 줄일 수 있는 질병이다. 본 연구에서는 백내장을 조기 진단하기 위한 예측 모형을 구축하고자 1994년부터 2001년까지 연세대학병원에서 2회 이상 건강검진을 받고 의사진단을 통해 백내장 여부를 확인할 수 있는 30세 이상 남 녀 3,237명에 대한 건강검진 수검 자료를 활용하여 백내장 발생 위험 예측모형을 개발하였다. 모형개발에는 데이터마이닝 기법인 Random Forests를 사용하였고, 기존의 로지스틱 회귀분석, 판별분석, 의사결정나무 모형(Decision tree), 나이브베이즈(Naive Bayes), 앙상블 모형인 배깅(Bagging)과 아킹(Arcing)을 이용하여 그 성능을 비교 분석하였다. Random Forests를 통해 개발한 백내장 발생 예측모형은 정확도가 67.16%, 민감도가 72.28%였고, 주요 영향요인은 연령, 혈당, 백혈구수치(WBC), 혈소판수치(platelet), 중성지질(triglyceride), BMI였다. 이 결과는 의사의 안과검진 정보 없이 건강검진 수검 자료만으로 백내장 질환 유 무에 관한 정보를 70% 정도 예측할 수 있음을 보여주는 것으로, 백내장의 조기 진단에 많은 기여를 할 것으로 판단된다.

API 특성 정보기반 악성 애플리케이션 식별 기법 (A Scheme for Identifying Malicious Applications Based on API Characteristics)

  • 조태주;김현기;이정환;정문규;이정현
    • 정보보호학회논문지
    • /
    • 제26권1호
    • /
    • pp.187-196
    • /
    • 2016
  • 안드로이드 애플리케이션은 악성코드를 삽입한 후 재서명하여 배포하는 리패키징 공격에 취약하다. 이러한 공격을 통해 사용자의 사생활 정보나 개인정보 유출 등의 피해가 자주 발생하고 있는 실정이다. 모든 안드로이드 애플리케이션은 사용자가 직접 작성한 메소드와 API로 구성된다. 이중 플랫폼의 리소스에 접근하며 실제 애플리케이션의 기능적인 특징을 나타내는 것은 API이고, 사용자가 작성한 메소드 역시 API를 이용하며 기능적 특징을 나타낸다. 본 논문에서는 악성 애플리케이션이 주로 활용하는 민감한 API들을 분석 대상으로 하여 악성애플리케이션이 어떤 행위를 하고, 어떤 API 를 사용하는지 사전에 식별할 수 있는 분석 기법을 제안한다. 사용하는 API를 토대로 API의 특성정보를 기반으로 나이브 베이즈 분류 기법을 적용하여 비슷한 기능을 하는 API에 대해 기계 학습하도록 한다. 이렇게 학습된 결과를 토대로 악성 애플리케이션이 주로 사용하는 API를 분류하고, 애플리케이션의 악성 위험 정도에 대한 정량적 판단 기준을 제시한다. 따라서, 제안 기법은 모바일 애플리케이션의 취약점 정도를 정량적으로 제시해 줌으로써 모바일 애플리케이션 개발자들이 앱 보안성을 사전에 파악하는데 많은 기여를 할 수 있을 것으로 기대된다.

베이지안 확률적 접근법을 이용한 건설업체 부도 예측에 관한 연구 (Predicting Default of Construction Companies Using Bayesian Probabilistic Approach)

  • 홍성문;황재연;권태환;김주형;김재준
    • 한국건설관리학회논문집
    • /
    • 제17권5호
    • /
    • pp.13-21
    • /
    • 2016
  • 주수급자 역할을 하는 건설기업의 부실화는 발주자에게 공사계약 미이행에 따른 피해를 초래할 수 있고, 전문건설업체 및 자재공급업체의 재무건전성에 악영향을 줄 수 있다. 건설업은 프로젝트를 수주하고 진도에 따라 기성을 받는 현금흐름의 재무적 특성이 존재하고, 사업 진행 중의 부실화는 투입한 자금의 손실로 이어질 수 있으므로 건설업체의 부실화 예측은 중요하다. 국내 건설업체의 부실화 예측은 90년도 초 미국에서 개발된 KMV (Kealhofer McQuown and Vasicek)사의 KMV모형으로 수행되는 경우도 있지만, 이 모형은 일반적인 기업 및 은행의 신용위험 평가에 개발되어져 건설기업 예측력에는 부족함이 있다. 또한, KMV값의 부도확률 예측력에 대해서는 분석대상의 기업수 및 데이터의 부족으로 의문점이 지속적으로 제기되고 있다. 따라서 이러한 의문점을 해결하기 위해 기존 부도예측확률모형에 베이지안 확률적 접근법(Bayesian Probabilistic Approach)을 접목하고자 한다. 베이즈 통계학의 사전확률(Prior Probability)만 적절하게 예측가능하다면 적은 정보라도 증거에 대한 조건부 획득으로 신뢰성 있는 사후확률(Posterior Probability)을 예측할 수 있기 때문이다. 이에 본 연구에서는 기존 부도예측확률모형에 베이지안 확률적 접근법을 활용하여 예상부도확률(Expected Default Frequency, EDF)을 측정하고, 기존 모형의 예상부도확률과 비교하여 정확성을 예측하고자 한다.

안면 정보를 이용한 나이브 베이즈 기반 고중성지방혈증 예측 모델 (Prediction Model for Hypertriglyceridemia Based on Naive Bayes Using Facial Characteristics)

  • 이주원;이범주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권11호
    • /
    • pp.433-440
    • /
    • 2019
  • 최근에 이르러, 기계학습 및 데이터마이닝은 수많은 질병 예측 및 진단에 활용되고 있다. 만성질환은 전체 사망률의 약 80%를 차지하는 질병으로, 점점 증가하는 추세이다. 만성질환 관련 예측 모델을 연구한 기존 연구들은 예측 모델을 구성하는 데이터로 혈당, 혈압, 인슐린 수치 등의 건강검진 수준의 데이터를 이용한다. 본 논문은 만성질환의 위험 요인인 이상지질혈증과 안면 정보의 연관성을 검증하고, 기계학습 기반 안면 정보를 이용한 이상지질혈증 예측 모델을 세계 최초로 개발한다. 본 연구는 5390명의 임상 데이터 중 안면 정보와 중성지방혈증 정보를 바탕으로 수행하였다. 중성지방혈증은 이상지질혈증을 판단하는 척도이다. 연구의 결과로 얼굴의 하악(mandibular) 간의 거리를 나타내는 FD_43_143_aD(p<0.0001, Area Under the receiver operating characteristics Curve(AUC)=0.652) 와 고중성지방혈증이 매우 높은 연관성을 가진 것을 밝혀냈고, 이를 기반으로 구축한 모델은 0.662의 AUC값을 획득하였다. 이러한 연구결과는 향후 질병 역학 및 대중 보건 영역의 스크리닝 단계에서 안면정보만으로 다양할 질병을 예측할 수 있는 기반을 제공할 수 있을 것이다.