• Title/Summary/Keyword: 베이지안 확률

Search Result 322, Processing Time 0.043 seconds

Bayesian Network-based Probabilistic Management of Software Metrics for Refactoring (리팩토링을 위한 소프트웨어 메트릭의 베이지안 네트워크 기반 확률적 관리)

  • Choi, Seunghee;Lee, Goo Yeon
    • Journal of KIISE
    • /
    • v.43 no.12
    • /
    • pp.1334-1341
    • /
    • 2016
  • In recent years, the importance of managing software defects in the implementation stage has emerged because of the rapid development and wide-range usage of intelligent smart devices. Even if not a few studies have been conducted on the prediction models for software defects, their outcomes have not been widely shared. This paper proposes an efficient probabilistic management model of software metrics based on the Bayesian network, to overcome limits such as binary defect prediction models. We expect the proposed model to configure the Bayesian network by taking advantage of various software metrics, which can help in identifying improvements for refactoring. Once the source code has improved through code refactoring, the measured related metric values will also change. The proposed model presents probability values reflecting the effects after defect removal, which can be achieved by improving metrics through refactoring. This model could cope with the conclusive binary predictions, and consequently secure flexibilities on decision making, using indeterminate probability values.

A research on Bayesian inference model of human emotion (베이지안 이론을 이용한 감성 추론 모델에 관한 연구)

  • Kim, Ji-Hye;Hwang, Min-Cheol;Kim, Jong-Hwa;U, Jin-Cheol;Kim, Chi-Jung;Kim, Yong-U
    • Proceedings of the Korean Society for Emotion and Sensibility Conference
    • /
    • 2009.11a
    • /
    • pp.95-98
    • /
    • 2009
  • 본 연구는 주관 감성에 따른 생리 데이터의 패턴을 분류하고, 임의의 생리 데이터의 패턴을 확인하여 각성-이완, 쾌-불쾌의 감성을 추론하기 위해 베이지안 이론(Bayesian learning)을 기반으로 한 추론 모델을 제안하는 것이 목적이다. 본 연구에서 제안하는 모델은 학습데이터를 분류하여 사전확률을 도출하는 학습 단계와 사후확률로 임의의 생리 데이터의 패턴을 분류하여 감성을 추론하는 추론 단계로 이루어진다. 자율 신경계 생리변수(PPG, GSR, SKT) 각각의 패턴 분류를 위해 1~7로 정규화를 시킨 후 선형 관계를 구하여 분류된 패턴의 사전확률을 구하였다. 다음으로 임의의 사전 확률 분포에 대한 사후 확률 분포의 계산을 위해 베이지안 이론을 적용하였다. 본 연구를 통해 주관적 평가를 실시하지 않고 다중 생리변수 인식을 통해 감성을 추론 할 수 있는 모델을 제안하였다.

  • PDF

Machine Learning-based Multiple Fault Localization with Bayesian Probability (베이지안 확률을 적용한 기계학습 기반 다중 결함 위치 식별 기법)

  • Song, Jihyoun;Kim, Jeongho;Lee, Eunseok
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2017.01a
    • /
    • pp.151-154
    • /
    • 2017
  • 소프트웨어의 개발과정 중 결함을 제거하는 작업인 디버깅을 위해서는 가장 먼저 그 결함의 정확한 위치를 찾아야한다. 이 작업은 많은 시간이 소요되며, 이 시간을 단축시키기 위한 결함 위치 식별 기법들이 소개되었다. 많은 기법들 중 프로그램 커버리지 정보를 학습하여 규칙을 분석하는 인공신경망 기반 선행 연구가 있다. 이를 기반으로 본 논문에서는 문장들 간의 관계를 추가적으로 파악하여 학습 데이터로 사용하는 기법을 제안한다. 특정 문장이 항상 지나는 테스트케이스들 중 나머지 다른 문장들이 지나는 테스트케이스의 비율을 통해 문장들 간의 관계를 나타낸다. 해당 비율을 계산하기 위해 조건부 확률인 베이지안 확률을 사용한다. 베이지안 확률을 통해 얻은 문장들의 관계에 따라 인공신경망 내에서 의심도를 결정하는 웨이트(weight)가 기존 기법과는 다르게 학습된다. 이 차이는 문장들의 의심도를 조정하며, 결과적으로 다중 결함 위치 식별의 정확도를 향상시킨다. 본 논문에서 제안한 기법을 이용하여 실험한 결과, Tarantula 대비 평균 39.8%, 기존 역전파 인공신경망(BPNN) 기반 기법 대비 평균 60.5%의 정확도 향상이 있었음을 확인할 수 있다.

  • PDF

Comparison Study of Uncertainty between Stationary and Nonstationary GEV Models using the Bayesian Inference (베이지안 방법을 이용한 정상성 및 비정상성 GEV모형의 불확실성 비교 연구)

  • Kim, Hanbeen;Joo, Kyungwon;Jung, Younghun;Heo, Jun-Haeng
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2016.05a
    • /
    • pp.298-298
    • /
    • 2016
  • 최근 기후변화의 영향으로 시간에 따라 자료 및 통계적 특성이 변하는 비정상성이 다양한 수문자료에서 관측됨에 따라 비정상성 빈도해석에 대한 연구가 활발히 진행되고 있다. 비정상성 빈도해석에 사용되는 비정상성 확률 모형은 기존의 매개변수를 시간에 따라 변하는 공변량이 포함된 함수의 형태로 나타내기 때문에, 정상성 확률 모형에 비해 매개변수의 개수가 많으며 복잡한 형태를 가지게 된다. 따라서 본 연구에서는 비정상성 고려 시 모형이 복잡해짐에 따라 매개변수 및 확률 수문량의 불확실성이 어떻게 변하는지 알아보고자 하였다. 베이지안 방법은 매개변수 추정 및 확률 수문량의 산정 뿐 아니라 이에 대한 불확실성을 정량화할 수 있는 방법 중 하나이다. 따라서 베이지안 방법에서 매개변수 추정에 주로 쓰이는 Monte Carlo Markov Chain (MCMC) 방법 중 하나인 Metropolis-Hastings 알고리즘을 이용하여 정상성 및 비정상성 GEV모형에 대한 매개변수 및 확률수문량의 사후분포를 산정하였다. 산정된 사후분포의 사후구간을 통해 각 모형의 불확실성을 정량화하였으며, 계산된 불확실성의 비교를 통해 모형의 복잡성이 불확실성에 미치는 영향을 평가하였다.

  • PDF

Bayesian Testing for the Equality of K-Lognormal Populations (부분 베이즈요인을 이용한 K개로 로그정규분포의 상등에 관한 베이지안 다중검정)

  • 문경애;김달호
    • The Korean Journal of Applied Statistics
    • /
    • v.14 no.2
    • /
    • pp.449-462
    • /
    • 2001
  • 베이지안 다중 검정방법(multiple hypothesis test)은 여러 통계모형에서 성공적인 결과를 주는 것으로 알려져있다. 일반적으로, 베이지안 가설검정은 고려중인 모형에 대한 사후확률을 계산하여 가장 높은 확률은 갖는 모형을 선택하기 때문에 귀무가설의 기각여부에만 관심을 가지는 고전적인 분산분석 검정과는 달리 좀 더 구체적인 모형을 선택할 수 있는 장점이 있다. 이 논문에서는 독립이면서 로그정규분포를 따르는 K($\geq$3)개 모집단의 모수에 대한 가설 검정방법으로 O’Hagan(1995)이 제안한 부분 베이즈 요인을 이용한 베이지안 방법을 제안한다. 이 때 모수에 대한 사전분포로는 무정보적 사전분포를 사용한다. 제안한 검정 방법의 유용성을 알아보기 위하여 실제 자료의 분석과 모의 실험을 이용하여 고전적인 검정방법과 그 결과를 비교한다.

  • PDF

Bayesian Validation Method based on Fuzzy c-Means Algorithm for Analysis of Optimal Gene Clustering (최적의 유전자 클러스터 분석을 위한 퍼지 c-Means 알고리즘 기반의 베이지안 검증 방법)

  • 유시호;원홍희;조성배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.736-738
    • /
    • 2003
  • 수천 개의 유전자 발현 정보를 가지고 있는 DNA 마이크로어레이 기술의 발달로 대량의 생물정보를 빠른 시간 내에 분석하는 것이 가능하게 되었다. 유전자를 분석하는 방법 중 하나인 클러스터링 방법은 비슷한 기능을 가진 유전자들을 집단화시켜서 집단내의 유전자들의 기능을 밝히거나, 미지의 유전자를 분석하는데 이용되고 있다. 본 논문에서는 유전자 데이터를 분석하기 위한 퍼지 클러스터링 방법과 이를 효과적으로 검증할 수 있는 베이지안 검증 방법을 제안한다. 퍼지 c-means 알고리즘을 사용하여 클러스터를 생성하고, 클러스터 결과를 기존의 퍼지 클러스터 검증 방법들과 본 논문에서 제안하는 베이지안 검증 방법을 사용하여 비교 평가한다. 베이지안 검증 방법은 각 유전자의 클러스터 멤버쉽을 확률로 이용하여 각 클러스터에 속할 확률을 계산하고, 이 값을 가장 크게 해주는 클러스터 집단을 선택한다. 이 방법은 기존의 퍼지 클러스터 검증 방법들과는 달리 클러스터 수에 무관한 평가가 가능한 장점을 가지고 있다. Serum과 Yeast 데이터에 대한 실험 결과, 베이지안 검증 방법의 유용성을 확인할 수 있었다.

  • PDF

A Probabilistic Estimation of Changing Points of Seoul Rainfall using BH Bayesian Analysis (BH 베이지안 분석을 통한 서울지점 강우자료의 확률적 변화시점 추정)

  • Hwang, Seok-Hwan;Kim, Joong-Hoon;Yoo, Chul-Sang;Jung, Sung-Won;Kim, Min-Seok
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2009.05a
    • /
    • pp.1197-1201
    • /
    • 2009
  • 본 논문에서는 각각의 시점에서의 변화확률을 산정하여 변화시점을 추정하는 Barry와 Hartigan(BH)의 베이지안 변화시점 추정 방법(Bayesian changing points estimation method)을 이용하여 측우기 관측자료계열(CWK)과 근대우량계 관측자료계열(MRG)간의 변화에 대한 상대확률적 절점의 발생여부를 분석하였다. 각 강우특성별로 상대확률적인 변화시점 분석을 통하여 CWK와 MRG 간의 동질성 분석을 실시하였다. 분석 결과, CWK의 정성적인(본질적인) 통계적 특성은 MRG와 큰 차이가 없어 보인다. 다만, 관측정밀도의 한계로 인한 정량적인 차이가 존재하는 것으로 판단되었다.

  • PDF

Rainfall Frequency Analysis and Uncertainty Quantification Using Dempster-Shafer Theory (Dempster-Shafer 이론을 이용한 강우빈도분석 및 불확실성의 정량화)

  • Seo, Young-Min;Jee, Hong-Kee;Lee, Soon-Tak
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2010.05a
    • /
    • pp.1390-1394
    • /
    • 2010
  • Dempster-Shafer 이론은 미지의 매개변수 추정시 베이지안 기법의 제약을 완화시키기 위한 베이지안 접근법의 일반화로 해석될 수 있으며, 상호배타적인 싱글톤에만 확률이 할당되는 것이 아니라 가능한 결과의 부분집합들이 기본확률할당을 위한 대상으로 고려된다. 베이지안 접근은 우연적 불확실성 및 지식의 불확실성을 효율적으로 구분할 수 없으며, 특정도가 낮고 애매한 증거들을 다룰 수 없는 반면, Dempster-Shafer 증거추론은 이러한 문제들을 효율적으로 평가할 수 있다. 따라서 본 논문에서는 홍수위험평가 및 수자원 계획 수립시 가장 기본이 되는 강우빈도해석에서 확률분포의 매개변수에 대한 불확실성 고려한 확률강우량의 산정 및 불확실성의 영향을 평가하기 위하여 Dempster-Shafer 이론을 이용하여 불확실성을 고려한 강우빈도해석모델 구축 및 적용을 통해 홍수위험평가 및 수자원 계획 등에 있어서 불확실성 표현 및 처리기법을 제시하였다.

  • PDF

Nonparametric Bayesian Statistical Models in Biomedical Research (생물/보건/의학 연구를 위한 비모수 베이지안 통계모형)

  • Noh, Heesang;Park, Jinsu;Sim, Gyuseok;Yu, Jae-Eun;Chung, Yeonseung
    • The Korean Journal of Applied Statistics
    • /
    • v.27 no.6
    • /
    • pp.867-889
    • /
    • 2014
  • Nonparametric Bayesian (np Bayes) statistical models are popularly used in a variety of research areas because of their flexibility and computational convenience. This paper reviews the np Bayes models focusing on biomedical research applications. We review key probability models for np Bayes inference while illustrating how each of the models is used to answer different types of research questions using biomedical examples. The examples are chosen to highlight the problems that are challenging for standard parametric inference but can be solved using nonparametric inference. We discuss np Bayes inference in four topics: (1) density estimation, (2) clustering, (3) random effects distribution, and (4) regression.

Bayesian Model for Probabilistic Unsupervised Learning (확률적 자율 학습을 위한 베이지안 모델)

  • 최준혁;김중배;김대수;임기욱
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.11 no.9
    • /
    • pp.849-854
    • /
    • 2001
  • GTM(Generative Topographic Mapping) model is a probabilistic version of the SOM(Self Organizing Maps) which was proposed by T. Kohonen. The GTM is modelled by latent or hidden variables of probability distribution of data. It is a unique characteristic not implemented in SOM model, and, therefore, it is possible with GTM to analyze data accurately, thereby overcoming the limits of SOM. In the present investigation we proposed a BGTM(Bayesian GTM) combined with Bayesian learning and GTM model that has a small mis-classification ratio. By combining fast calculation ability and probabilistic distribution of data of GTM with correct reasoning based on Bayesian model, the BGTM model provided improved results, compared with existing models.

  • PDF