• 제목/요약/키워드: 베이지안 확률기법

검색결과 114건 처리시간 0.022초

강우빈도해석에서 Bayesian 기법을 이용한 Gumbel 확률분포 매개변수의 불확실성 평가 (Assessment of uncertainty associated with parameter of gumbel probability density function in rainfall frequency analysis)

  • 문장원;문영일;권현한
    • 한국수자원학회논문집
    • /
    • 제49권5호
    • /
    • pp.411-422
    • /
    • 2016
  • 우리나라는 수공구조물 설계할 때 강우빈도해석과 강우-유출 모형으로 홍수량을 산정하여 사용하고 있다. 그러나 강우자료의 확률분포 및 자료기간 등에 따른 매개변수 추정에 많은 불확실성이 존재하나 이를 고려한 해석은 이루어지지 않고 있다. 이러한 점에서 Gumbel 분포형과 확률가중 모멘트법을 기준으로 확률강우량의 신뢰구간을 평가함과 동시에 매개변수의 불확실성을 평가하는데 있어서 우수한 성능을 발휘하는 Bayesian방법을 도입하여 서울지역의 확률강우량의 불확실성을 정량적으로 평가하였다. 두 가지 방법의 비교결과 확률가중모멘트법의 신뢰구간이 Bayesian 방법의 불확실성 구간보다 전반적으로 크게 나타났다. 신뢰구간의 경우 정규분포를 따르기 때문에 좌우대칭의 형태를 갖는 반면에 Bayesian 방법의 불확실성은 Gumbel 분포로부터 유도되어, 보다 현실적인 불확실성 평가가 가능하였다. 자료의 구간 및 기간에 따른 확률강우량의 불확실성을 평가한 결과 자료에 증가에 따른 불확실성 감소를 확인할 수 있었으며, Bayesian 방법이 자료 증가에 따른 불확실성 범위 감소가 보다 뚜렷하게 나타나는 것을 확인할 수 있었다.

유연한 선부합 ICM 방식에 의한 탁본영상복원 (A Flexible Line-Fitting ICM Approach for Takbon Image Restoration)

  • 황재호
    • 정보처리학회논문지B
    • /
    • 제13B권5호
    • /
    • pp.525-532
    • /
    • 2006
  • 아이징(Ising)모델화 된 이진 탁본영상을 유연한 선부합 ICM(Iterated conditional modes) 방식으로 영상복원하는 새로운 기법을 제시한다. 기본적으로 탁본영상은 획 구성상 정보 영역과 배경 영역의 두 극단으로 나누어져야 한다. 종래의 ICM적 접근이 부분적 사각구도(四角構圖)의 점처리에 근거하였음에 비해 본 연구의 주된 아이디어는 선처리이다. 기하학적 구조를 구하기 위해 현재고려중인 화소의 배열 위치를 중심으로 다수의 선형부합함수들을 발생시킨다. 부합함수들의 경사도와 크기들의 집합에 베이즈적 판별 논리를 적용하여 현재고려중인 화소의 영역을 판단한다. 영역판별 결과는 이진 색도이다. 이 경우 매 단계별 영역귀속 판단은 영역 안과 밖에서의 차별된 추적 양상에 관한 확률적 반복성에 의존한다. 마지막으로 시뮬레이션을 통해 이진 탁본영상에 대하여 본 알고리즘의 효과를 확인하였다.

효과적인 추천 시스템을 위한 협업적 태그 기반의 여과 기법 (Collaborative Tag-based Filtering for Recommender Systems)

  • 연철;지애띠;김흥남;조근식
    • 지능정보연구
    • /
    • 제14권2호
    • /
    • pp.157-177
    • /
    • 2008
  • 최근 웹 2.0의 영향으로 태깅을 지원하는 인터넷 서비스들이 많아졌다. 태깅의 원래 목적은 컨텐츠를 분류하고 재검색을 용이하게 하는 것이지만, 컨텐츠에 태깅되어 있는 태그들을 분석하여 컨텐츠의 특성을 파악할 수 있다. 본 논문에서는 내용 파악이 힘든 컨텐츠들이 증가함에 따라 이러한 컨텐츠들의 효과적인 추천을 위해, 여러 사용자들에 의해 협업적으로 태깅된 정보를 이용한 여과 기법을 제시한다. 제안하는 방법은 사용자가 태깅한 정보들을 바탕으로 사용자의 관심을 파악하는 부분과 파악된 관심에 맞는 컨텐츠를 선별하는 부분으로 나뉘어진다. 사용자의 관심을 파악하는 부분은 사용자가 태깅한 정보들을 협업적 여과를 이용하고, 컨텐츠 선별은 확률적인 방법인 나이브 베이지안 분류자를 이용한다. 이를 통해 협업적 여과 방법의 문제점인 희박성 문제(sparsity problem)와 초기 사용자 문제(cold-start user probleam) 대해 기존의 방법들과 비교하여 그 효과를 보인다.

  • PDF

일반 순서 통계량을 이용한 소프트웨어 신뢰확률 중첩모형에 관한 베이지안 접근에 관한 연구 (A Study on Bayesian Approach of Software Stochastic Reliability Superposition Model using General Order Statistics)

  • 이병수;김희철;백수기;정관희;윤주용
    • 한국정보처리학회논문지
    • /
    • 제6권8호
    • /
    • pp.2060-2071
    • /
    • 1999
  • 소프트웨어 시스템이 복잡해지면 고장의 원인이 하나의 강도함수에 의해서만 일어나지 않고 여러 원인이 중첩되어 발생할 수 있다. 이러한 복잡한 시스템에 의한 우도함수의 계산상의 어려움 때문에 반복표본을 이용하는 깁스 샘플링 기법이 고려되었다. 관찰된 고장시점은 중첩모형으로 표현이 가능한 잠재(latent)변수들을 이용하여 깁스 알고리즘을 적용하였다. 단순모형과 중첩모형의 비교를 위해 사후베이즈 요인과 상대오차의 합을 이용하여 모형선택을 시도하였다. 수치적인 예에서 GOS 속성을 가진 Goel-Okumoto 모형과 Weibull 모형을 선택하고 NHPP의 자료는 Lewis와 Shedler[25]에 의해 제시된 Thining 알고리즘을 이용하여 발생된 자료를 이용하고 사전분포는 상대적으로 확산분포(diffuse priors)를 이용한 모수추정과 사후베이즈요인과 상대오차를 이용한 모형선택을 한 결과 단순모형들 보다 중첩모형이 좋은 형으로 간주할 수 있음을 보여 주었다.

  • PDF

혼합분포 기반 비정상성 강우 빈도해석 기법 개발 (A development of nonstationary rainfall frequency analysis model based on mixture distribution)

  • 최홍근;권현한;박문형
    • 한국수자원학회논문집
    • /
    • 제52권11호
    • /
    • pp.895-904
    • /
    • 2019
  • 극치 강우 자료는 정상성 빈도모델에서 효과적으로 구현되지 않는 비정상성 거동을 종종 보인다. 또한, 극치 사상의 확률밀도함수는 여름 장마와 태풍 등의 서로 다른 강우 패턴에 의해 2개 이상의 첨두를 가지는 혼합분포형태이다. 이러한 강우 패턴의 변화에 대해 Bayesian 이론을 활용한 비정상성 혼합분포(mixture distribution based nonstationary frequency, MDNF)모델을 제안하였다. 2개의 Gumbel 분포형이 혼합된 MDNF 모델은 Gumbel 분포형 매개변수 중 하나인 위치매개변수의 시변성을 효과적으로 설명한다. 제안한 모델의 성능평가를 위해 정상성 혼합분포모델과의 다양한 통계치 결과를 비교하였다. 정상성 혼합분포모델보다 전반적으로 향상된 성능을 보여주는 MDNF 모델을 통해 극치 강우 패턴이 비정상성을 보인다는 가정을 확인할 수 있다.

베이지안 딥러닝 기법을 이용한 확률적 적설심 예측 모델 개발 (Development of a Stochastic Snow Depth Prediction Model Using a Bayesian Deep Learning Method)

  • 정영준;이상익;이종혁;서병훈;김동수;서예진;최원
    • 한국농공학회논문집
    • /
    • 제64권6호
    • /
    • pp.35-41
    • /
    • 2022
  • Heavy snow damage can be prevented in advance with an appropriate security system. To develop the security system, we developed a model that predicts snow depth after a few hours when the snow depth is observed, and utilized it to calculate a failure probability with various types of greenhouses and observed snow depth data. We compared the Markov chain model and Bayesian long short-term memory models with varying input data. Markov chain model showed the worst performance, and the models that used only past snow depth data outperformed the models that used other weather data with snow depth (temperature, humidity, wind speed). Also, the models that utilized 1-hour past data outperformed the models that utilized 3-hour data and 6-hour data. Finally, the Bayesian LSTM model that uses 1-hour snow depth data was selected to predict snow depth. We compared the selected model and the shifting method, which uses present data as future data without prediction, and the model outperformed the shifting method when predicting data after 11-24 hours.

효과적인 이메일 분류를 위한 빈발 항목집합 기반 최적 이메일 폴더 추천 기법 (A proper folder recommendation technique using frequent itemsets for efficient e-mail classification)

  • 문종필;이원석;장중혁
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권2호
    • /
    • pp.33-46
    • /
    • 2011
  • 이메일이 중요한 정보 전달과 의사소통의 수단으로 널리 활용된 이래 사람들은 이메일을 내용에 따라 적절하게 분류하는 작업에 많은 노력을 기울려 왔다. 이메일은 문서의 길이나 문체가 다양하며 사용되는 단어들이 비정규적이다. 또한 이메일 분류 기준은 일반적으로 해당 이메일 사용자의 주관에 따라 정의된다. 따라서 기존의 일반적인 문서분류 기법으로는 이메일을 효율적으로 분류하는데 어려움이 있다. 상업용 이메일 프로그램에서 제공되는 분류 기능은 메일 클라이언트에서 지원하는 텍스트 필터링을 이용한다. 한편 이메일의 자동 분류에 관한 연구는 확률 기반의 나이브 베이지안 기법을 응용하여 정확도를 높일 수 있는 연구가 주로 진행되어 왔으며, 대부분 영문 이메일에 대한 연구이다. 본 논문에서는 빈발 패턴 마이닝 기법을 적용하여 한글 이메일에 대한 개인 맞춤형 폴더 추천기법을 제시한다. 이메일의 맞춤형 폴더 추천 기법은 이메일에 대한 전처리 과정과 빈발 항목집합을 이용한 메일 폴더의 프로파일 생성과정으로 구성된다. 생성된 프로파일은 분류 대상이 되는 각 메일이 개인별 맞춤형 기준에 따라 가장 적합한 이메일 폴더로 효과적으로 분류되는데 활용된다. 또한 제안된 기법을 적용한 이메일 분류 시스템을 구현한다.

계층적 Bayesian 모형 기반 지역빈도해석 모형 개발 (A Development of Regional Frequency Model Based on Hierarchical Bayesian Model)

  • 권현한;김진영;김운기;이정주
    • 한국수자원학회논문집
    • /
    • 제46권1호
    • /
    • pp.13-24
    • /
    • 2013
  • 본 연구에서는 계층적 Bayesian 기법을 이용한 새로운 지역빈도해석 모형을 개발하는데 목적이 있으며 이를 통해서 신뢰성 있는 매개변수를 추정과 동시에 지역빈도해석 절차의 불확실성 평가를 용이하게 접근할 수 있도록 하였다. 본 연구에서 제안되는 계층적 Bayesian 기반 지역빈도해석 모형(HBRFA)의 적합성을 평가하기 위해서 모의실험을 수행하였다. 즉, 10개의 모의 관측소를 대상으로 Monte-Carlo 모의를 통한 평가를 수행하였으며 전체적으로 HBRFA 모형이 기존 L-모멘트 방법에 비해 편의를 줄여주는 것으로 평가되었다. 특히 재현기간이 증가될수록 편의가 두드러지게 감소되는 것을 확인할 수 있었다. 전라북도의 6개 강우지점을 대상으로 HBRFA 모형과 기존 L-모멘트 기반 지역빈도해석 결과를 비교하였다. 계층적 Bayesian 모형의 특징을 평가하고자 매개변수의 Shrinkage 과정을 정량적으로 도출하여 제시하였으며 추정된 지역확률강수량이 기존 L-모멘트 기법과 유사한 결과를 갖는 것을 확인할 수 있었다. 더불어 빈도별 확률강수량의 불확실성을 정량적으로 제시할 수 장점을 확인할 수 있었다.

Bayesian 기법을 이용한 혼합 Gumbel 분포 매개변수 추정 및 강우빈도해석 기법 개발 (A Bayesian Approach to Gumbel Mixture Distribution for the Estimation of Parameter and its use to the Rainfall Frequency Analysis)

  • 최홍근;오랑치맥솜야;김용탁;권현한
    • 대한토목학회논문집
    • /
    • 제38권2호
    • /
    • pp.249-259
    • /
    • 2018
  • 우리나라의 기후 지형적 특성에 따라 연강수량의 50% 이상이 여름철에 내린다. 이러한 짧은 기간에 집중적으로 내리는 강수량 조건하에 수공구조물을 설계할 경우 대부분 극치빈도분석을 활용한다. 특히 우리나라의 경우 Gumbel 분포를 활용한 극치빈도분석을 많이 이용한다. 하지만, 최근 이상기후로 인하여 전세계적으로 강수량의 특징이 급격히 변하고 있으며, 우리나라 연강수량 특징도 바뀌고 있다. 즉, 기존의 단일 분포형으로 재현이 가능했던 수문기상 자료들이 혼합분포형의 특징을 가지게 되었으며 이러한 변화를 고려할 수 있는 극치빈도분석 개발이 요구되고 있는 실정이다. 본 연구에서는 두 개 이상의 첨두를 가지는 형태의 극치강수량 자료에 대해서 기존의 단일 Gumbel 분포형 기반 극치빈도분석과 혼합 Gumbel 분포형 기반의 극치빈도분석 결과를 비교하였다. 확률분포의 매개변수 산정시 우도함수를 Bayesian 기법을 통해 산정하여 각 분포형의 Bayesian information criterion (BIC) 값을 비교하였다. 분석한 결과, 앞서 제안된 혼합 Gumbel 분포형은 하나의 첨두를 가지는 단일 Gumbel 분포형에서 반영되지 못한 꼬리(tail)부분의 이중첨두 부분의 거동을 효과적으로 모의하는 것을 확인할 수 있었다. 결과적으로 설계강수량을 추정할 때 보다 신뢰성있는 접근이 가능하였다. 이러한 점에서 우리나라 극치강우자료 분석시 기존 단일분포기반의 빈도해석기법에 대안으로 적용이 가능할 것으로 판단된다.

트위터 기반 이벤트 탐지에서의 기계학습을 통한 지명 노이즈제거 (Geographical Name Denoising by Machine Learning of Event Detection Based on Twitter)

  • 우승민;황병연
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권10호
    • /
    • pp.447-454
    • /
    • 2015
  • 본 논문에서는 트위터 기반 이벤트 탐지에서의 기계학습을 통한 지명 노이즈제거 방식을 제안한다. 최근 스마트폰 이용자의 증가로 소셜 네트워크 서비스(SNS) 이용자가 증가하고 있는 추세이다. 그중 트위터는 140자 이내의 단문서비스와 팔로우 기능으로 정보의 빠른 전달력과 확산성을 가지고 있다. 이러한 특성과 모바일에 최적화된 트위터의 특성상 정보 전달 속도가 매우 빠르기 때문에 재난 상황이나 이벤트 전달의 매개체 역할을 하고 있다. 이와 관련된 연구로는 트위터 사용자 개개인을 이벤트 탐지의 센서로 사용하여 현실에서 발생하는 이벤트를 탐지하였는데 이벤트가 특정 장소에서 발생한다는 특성을 이용해서 지명 키워드를 사용하였다. 그러나 지명과 동형이의어 관계에 관한 노이즈제거에 대한 부분이 누락되어있어서 이벤트 탐지의 정확도를 낮추는 요인이 된다. 이에 본 논문에서는 제거와 예측 두 가지 방식으로 노이즈제거 기법을 적용하였다. 먼저 노이즈 관련 데이터베이스 구축을 이용하여 제거 필터링을 진행한 후에 나이브 베이지안 분류를 이용해서 지명 유무를 결정하였다. 실험 데이터를 이용해서 기계학습을 위한 확률값을 구했으며, 지명마다 본 논문에서 제시하는 예측기법을 검증했을 때 89.6%의 신뢰도로 노이즈제거 기법의 필요성을 보였다.