• 제목/요약/키워드: 베이지안 망 구조 학습

검색결과 9건 처리시간 0.054초

베이지안 망 연결 구조에 대한 데이터 군집별 기여도의 정량화 방법에 대한 연구 (Quantitative Annotation of Edges in Bayesian Networks with Condition-Specific Data)

  • 정성원;이도헌;이광형
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2007년도 춘계학술대회 학술발표 논문집 제17권 제1호
    • /
    • pp.85-88
    • /
    • 2007
  • 본 연구에서는 베이지안 망 구조 학습에서, 학습 데이터의 특정 부분집합이 학습된 망의 각연결 구조(edge)의 형성에 기여하는 정도를 정량화하는 방법을 제안한다. 생물학 정보의 분석 등에 베이지안 망 학습을 이용하는 경우, 제안된 방법은 망의 각 연결 구조의 형성에 특정 군집 데이터가 기여하는 정도의 정량화가 가능하다. 제안된 방법의 유효성을 보이기 위해, 벤치마크 베이지안 망을 이용하여 제안된 방법이 망 연결 구조에 대한 데이터 군집별 기여도를 효과적으로 정량화 할 수 있음을 보인다.

  • PDF

베이지안 망 연결 구조에 대한 데이터 군집별 기여도의 정량화 방법에 대한 연구 (Quantitative Annotation of Edges, in Bayesian Networks with Condition-Specific Data)

  • 정성원;이도헌;이광형
    • 한국지능시스템학회논문지
    • /
    • 제17권3호
    • /
    • pp.316-321
    • /
    • 2007
  • 본 연구에서는 베이지안 망 구조 학습에서, 학습 데이터의 특정 부분집합이 학습된 망의 각 연결 구조(edge)의 형성에 기여하는 정도를 정량화하는 방법을 제안한다. 생물학 정보의 분석 등에 베이지안 망 학습을 이용하는 경우, 제안된 방법은 망의 각 연결 구조의 형성에 특정 군집 데이터가 기여하는 정도의 정량화가 가능하다. 제안된 방법의 유효성을 보이기 위해, 벤치마크 베이지안 망을 이용하여 제안된 방법이 망 연결 구조에 대한 데이터 군집별 기여도를 효과적으로 정량화 할 수 있음을 보인다.

클러스터링을 이용한 효율적인 대규모 베이지안 망 학습 방법 (An Efficient Learning Method for Large Bayesian Networks using Clustering)

  • 정성원;이광형;이도헌
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.700-702
    • /
    • 2005
  • 본 논문에서는 대규모 베이지안 망을 빠른 시간 안에 학습하기 위한 방법으로, 클러스터링을 이용한 방법을 제안한다. 제안하는 방법은 베이지안 구조 학습에 있어서 DAG(Directed Acyclic Graph)를 탐색하는 영역을 제한하기 위해 클러스터링을 사용한다. 기존의 베이지안 구조 학습 방법들이 고려하는 후보 DAG의 수가 전체 노드 수에 의해 제한되는 데 반해, 제안되는 방법에서는 미리 정해진 클러스터의 최대 크기에 의해 제한된다. 실험 결과를 통해, 제안하는 방법이 기존의 대규모 베이지안 망 학습에 활용되었던 SC(Sparse Candidate) 방법 보다 훨씬 적은 수의 후보 DAG만을 고려하였음에도 불구하고, 비슷한 정도의 정확도를 나타냄을 보인다.

  • PDF

R-CORE를 통한 베이지안 망 구조 학습의 탐색 공간 분석 (Search Space Analysis of R-CORE Method for Bayesian Network Structure Learning and Its Effectiveness on Structural Quality)

  • 정성원;이도헌;이광형
    • 한국지능시스템학회논문지
    • /
    • 제18권4호
    • /
    • pp.572-578
    • /
    • 2008
  • 본 논문에서는 대규모 베이지안 망 구조 학습을 위해 제안되었던 R-CORE 방법의 탐색 공간의 크기에 대한 개략적인 분석과 실제 문제에 적용하였을 경우의 효과에 대한 실험적 결과를 제시한다. R-CORE 방법은 베이지안 망 구조 학습의 탐색 공간을 축소하기 위해 제안된 확률변수들의 재귀적 군집화와 오더 제한 방법이다. 알려진 벤치마크 베이지안 망을 이용한 분석을 통해, 제안되었던 R-CORE 방법이 worst case에는 기존의 방법과 유사한 탐색 공간을 가지나 평균적으로 기존방법보다 훨씬 적은 탐색 공간만을 고려한다는 것을 보인다. 또한 평균적으로 훨씬 적은 탐색 공간만을 고려하는 결과, 구조 탐색에서 기존 방법에 비해 상대적으로 적은 overfitting이 일어남을 실험적으로 보인다.

퍼지신경망을 사용한 네이브 베이지안 분류기의 분산 그래프 학습 (Learning Distribution Graphs Using a Neuro-Fuzzy Network for Naive Bayesian Classifier)

  • 전설위;임준식
    • 디지털융복합연구
    • /
    • 제11권11호
    • /
    • pp.409-414
    • /
    • 2013
  • Naive Bayesian classifiers 네이브 베이지안 분류기는 샘플 데이터로부터 쉽게 구현될 수 있는 강력하고도 많이 사용되는 형식의 분류기다. 그러나 강한 조건부 독립성으로 인하여 효율이 저하되는 분류 결과를 초래한다. 일반적으로 네이브 베이지안 분류기는 연속성을 가진 특징 데이터의 우도를 처리하기 위해 가우시안 분산을 사용한다. 속성들의 확률밀도는 항상 가우시안 분산에 적합한 것만은 아니다. 또 다른 형식의 분류기는 지도학습을 통해 퍼지 규칙과 퍼지집합을 학습할 수 있는 퍼지신경망이다. 퍼지신경망과 네이브 베이지안 분류기간에는 구조적 유사성을 가지고 있기 때문에 퍼지신경망으로 학습된 분산 그래프를 네이브 베이지안 분류기에 적용하고자 하는 방안이 본 연구의 목적이다. 따라서 네이브 베이지안 분류기에 가우시안 분산 그래프를 사용한 결과와 퍼지 분산 그래프를 사용한 결과를 비교하였다. 이를 위해 leukemia와 colon의 DNA 마이크로어레이 데이터를 적용하여 분류하였다. 네이브 베이지안 분류기에 퍼지 분산 그래프를 사용한 결과 가우시안 분산 그래프를 사용한 결과보다 더 신뢰성이 있음을 보여주었다.

대사증후군의 예측 모델링을 위한 베이지안 네트워크의 속성 순서 최적화 (An Attribute Ordering Optimization in Bayesian Networks for Prognostic Modeling of the Metabolic Syndrome)

  • 박한샘;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.1-3
    • /
    • 2006
  • 대사증후군은 당뇨병, 고혈압, 복부 비만, 고지혈증 등의 질병이 한 개인에게 동시에 발현하는 것을 말하며, 최근 경제여건의 향상 및 식생활 습관의 변화와 함께 우리나라에서도 심각한 문제가 되고 있다. 한편 불확실성의 처리를 위해 많이 사용되는 베이지안 네트워크는 사람이 분석 가능한 확률 기반의 모델로 최근 의학분야에서 질병의 진단이나 예측모델을 구성하기 위한 방법으로 유용하게 사용되고 있다. 베이지안 네트워크의 구조를 학습하는 대표적인 알고리즘인 K2 알고리즘은 속성이 입력되는 순서의 영향을 받으며, 따라서 이 또한 하나의 주제로써 연구되어 왔다. 본 논문에서는 유전자 알고리즘을 이용하여 베이지안 네트워크에 입력되는 속성 순서를 최적화하며 이 과정에서 의학지식을 적용해 효율적인 최적화가 가능하도록 하였다. 제안하는 모델을 통해 1993년의 데이터를 가지고 1995년의 상태를 예측하는 분류 실험을 수행한 결과 속성 순서 최적화 후에 이전보다 향상된 예측율을 보였으며 또한 다층 신경망, k-최근접 이웃 등을 이용한 다른 모델보다 더 높은 예측율을 보였다.

  • PDF

A Comparison study of Hybrid Monte Carlo Algorithm

  • 황진수;전성해;이찬범
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2000년도 추계학술발표회 논문집
    • /
    • pp.135-140
    • /
    • 2000
  • 베이지안 신경망 모형(Bayesian Neural Networks Models)에서 주어진 입력값(input)은 블랙 박스(Black-Box)와 같은 신경망 구조의 각 층(layer)을 거쳐서 출력값(output)으로 계산된다. 새로운 입력 데이터에 대한 예측값은 사후분포(posterior distribution)의 기대값(mean)에 의해 계산된다. 주어진 사전분포(prior distribution)와 학습데이터에 의한 가능도함수(likelihood functions)를 통해 계산되어진 사후분포는 매우 복잡한 구조를 갖게 됨으로서 기대값의 적분계산에 대한 어려움이 발생한다. 이때 확률적 추정에 의한 근사 방법인 몬테칼로 적분을 이용한다. 이러한 방법으로서 Hybrid Monte Carlo 알고리즘은 우수한 결과를 제공하여준다(Neal 1996). 본 논문에서는 Hybrid Monte Carlo 알고리즘과 기존에 많이 사용되고 있는 Gibbs sampling, Metropolis algorithm, 그리고 Slice Sampling등의 몬테칼로 방법들을 비교한다.

  • PDF

변종 몬테 칼로 신경망을 이용한 패턴 분류 (Pattern Classification Using Hybrid Monte Carlo Neural Networks)

  • 전성해;최성용;오임걸;이상호;전홍석
    • 정보처리학회논문지B
    • /
    • 제8B권3호
    • /
    • pp.231-236
    • /
    • 2001
  • 일반적인 다층 신경망에서 가중치의 갱신 알고리즘으로 사용하는 오류 역전과 방식은 가중치 갱신 결과를 고정된(fixed) 한 개의 값으로 결정한다. 이는 여러 갱신의 가능성을 오직 한 개의 값으로 고정하기 때문에 다양한 가능성들을 모두 수용하지 못하는 면이 있다. 하지만 모든 가능성을 확률적 분포로 표현하는 갱신 알고리즘을 도입하면 이런 문제는 해결된다. 이러한 알고리즘을 사용한 베이지안 신경망 모형(Bayesian Neural Networks Models)은 주어진 입력값(Input)에 대해 블랙 박스(Black-Box)와같은 신경망 구조의 각 층(Layer)을 거친 출력값(Out put)을 계산한다. 이 때 주어진 입력 데이터에 대한 결과의 예측값은 사후분포(posterior distribution)의 기댓값(mean)에 의해 계산할 수 있다. 주어진 사전분포(prior distribution)와 학습데이터에 의한 우도함수(likelihood functions)에 의해 계산한 사후확률의 함수는 매우 복잡한 구조를 가짐으로 기댓값의 적분계산에 대한 어려움이 발생한다. 따라서 수치해석적인 방법보다는 확률적 추정에 의한 근사 방법인 몬테 칼로 시뮬레이션을 이용할 수 있다. 이러한 방법으로서 Hybrid Monte Carlo 알고리즘은 좋은 결과를 제공하여준다(Neal 1996). 본 논문에서는 Hybrid Monte Carlo 알고리즘을 적용한 신경망이 기존의 CHAID, CART 그리고 QUEST와 같은 여러 가지 분류 알고리즘에 비해서 우수한 결과를 제공하는 것을 나타내고 있다.

  • PDF

소량 및 불균형 능동소나 데이터세트에 대한 딥러닝 기반 표적식별기의 종합적인 분석 (Comprehensive analysis of deep learning-based target classifiers in small and imbalanced active sonar datasets)

  • 김근환;황용상;신성진;김주호;황수복;추영민
    • 한국음향학회지
    • /
    • 제42권4호
    • /
    • pp.329-344
    • /
    • 2023
  • 본 논문에서는 소량 및 불균형 능동소나 데이터세트에 적용된 다양한 딥러닝 기반 표적식별기의 일반화 성능을 종합적으로 분석하였다. 서로 다른 시간과 해역에서 수집된 능동소나 실험 데이터를 이용하여 두 가지 능동소나 데이터세트를 생성하였다. 데이터세트의 각 샘플은 탐지 처리 이후 탐지된 오디오 신호로부터 추출된 시간-주파수 영역 이미지이다. 표적식별기의 신경망 모델은 다양한 구조를 가지는 22개의 Convolutional Neural Networks(CNN) 모델을 사용하였다. 실험에서 두 가지 데이터세트는 학습/검증 데이터세트와 테스트 데이터세트로 번갈아 가며 사용되었으며, 표적식별기 출력의 변동성을 계산하기 위해 학습/검증/테스트를 10번 반복하고 표적식별 성능을 분석하였다. 이때 학습을 위한 초매개변수는 베이지안 최적화를 이용하여 최적화하였다. 실험 결과 본 논문에서 설계한 얕은 층을 가지는 CNN 모델이 대부분의 깊은 층을 가지는 CNN 모델보다 견실하면서 우수한 일반화 성능을 가지는 것을 확인하였다. 본 논문은 향후 딥러닝 기반 능동소나 표적식별 연구에 대한 방향성을 설정할 때 유용하게 사용될 수 있다.