• 제목/요약/키워드: 베이지언

검색결과 52건 처리시간 0.026초

다항시행접근 단순 베이지안 문서분류기의 개선 (Improving Multinomial Naive Bayes Text Classifier)

  • 김상범;임해창
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권3_4호
    • /
    • pp.259-267
    • /
    • 2003
  • 단순 베이지언 분류모형은 구현이 간단하고 효율적이기 때문에 실용적으로 사용하기에 적합하다. 그러나 이 분류모형은 많은 기계학습 도메인에서 우수한 성능을 보임에도 불구하고 문서분류에 적용되었을 경우에는 그 성능이 매우 낮은 것으로 알려져왔다. 본 논문에서는 단순 베이지언 분류모형중 가장 성능이 우수한 것으로 알려진 다항 시행접근 단순 베이지언 분류모형을 개선하는 세가지 방법을 제안한다. 첫 번째는 범주에 대한 단어의 확률추정방법을 문서모델에 기반하여 개선하는 것이고, 두 번째는 문서의 길이에 따라 범주와의 관련성이 선형적으로 증가하는 것을 억제하기 위해 길이에 대한 정규화를 수행하는 것이며, 마지막으로 범주판정에 중요한 역할을 하는 단어들의 영향력을 높여주기 위하여 상호정보가중 단순 베이지언 분류방법을 사용하는 것이다. 제안하는 방법들은 문서분류기의 성능 평가를 위한 벤치마크 문서집합인 Reuters21578과 20Newsgroup에서 기존의 방범에 비해 상당한 성능향상을 가져옴을 알 수 있었다.

우리나라 저체중아 출생의 공간적 변동성 지도화: 베이지언적 접근 (Mapping the Geographic Variations of the Low Birth Weight cases in South Korea: Bayesian Approaches)

  • 노영희;박기호
    • 대한지리학회지
    • /
    • 제51권3호
    • /
    • pp.367-380
    • /
    • 2016
  • 본 연구에서는 우리나라에서 발생한 저체중아 출생 집계 자료를 공간적으로 지도화하기 위한 기법들을 검토 비교하고, 이를 기반으로 우리나라의 LBW 지도를 작성하였다. 표준화사망률이나 조사망률 등은 역학 분야에서 지속적으로 광범위하게 사용되고 있는 지표이다. 그러나 이러한 표준화사망률은 집계 단위의 샘플 수에 영향을 많이 받는다는 단점을 가지고 있다. 이에, 본 연구에서는 베이지언 기법을 활용하여 샘플 수에 따른 통계적 변동성을 감소시키고자 하였다. 이를 위해 경험적 베이지언 기법과 풀 베이지언 기법을 모두 활용하였고, 결과적으로 유사한 통계량을 산출한 것을 확인할 수 있었다. 반면, SMR 기반의 통계량은 높은 분산을 가지고 있음을 확인하였다. 연구의 결과에 따른 통계 지도는 우리나라 저체중아 출생의 높은 위험도를 가지는 지역들을 파악할 수 있도록 한다.

  • PDF

용어 가중치와 역범주 빈도에 의한 자동문서 범주화 (Automatic Text Categorization by Term Weighting and Inverted Category Frequency)

  • 이경찬;강승식
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.14-17
    • /
    • 2003
  • 문서의 확률을 이용하여 자동으로 문서를 분류하는 문서 범주화 기법의 대표적인 방법이 나이브 베이지언 확률 모델이다. 이 방법의 기본 형식은 출현 용어의 확률 계산 방법이다. 하지만 실제 문서 범주화 과정에서 출현하지 않는 용어들도 성능에 많은 영향을 줄 수 있으며, 출현 용어들에 대한 빈도 이외의 역범주 빈도나 용어가중치를 적용하여 문서 범주화 시스템의 성능을 향상시킬 수 있다. 본 논문에서는 나이브 베이지언 확률 모델에 출현 용어와 출현하지 않는 용어들에 대한 smoothing 기법을 적용하여 실험하였다. 성능 평가를 위해 뉴스그룹 문서들을 이용하였으며, 역범주 빈도와 가중치를 적용했을 때 나이브 베이지언 확률 모델에 비해 약 7% 정도 성능 개선 효과가 있었다.

  • PDF

베이지언 추론에 기반한 확률론적 피로수명 평가 (Stochastic Fatigue Life Assesment based on Bayesian-inference)

  • 박명진;김유일
    • 대한조선학회논문집
    • /
    • 제56권2호
    • /
    • pp.161-167
    • /
    • 2019
  • In general, fatigue analysis is performed by using deterministic model to estimate the optimal parameters. However, the deterministic model is difficult to clearly describe the physical phenomena of fatigue failure that contains many uncertainty factors. With regard to this, efforts have been made in this research to compare with the deterministic model and the stochastic models. Firstly, One deterministic S-N curve was derived from ordinary least squares technique and two P-S-N curves were estimated through Bayesian-linear regression model and Markov-Chain Monte Carlo simulation. Secondly, the distribution of Long-term fatigue damage and fatigue life were predicted by using the parameters obtained from the three methodologies and the long-term stress distribution.

전력시장의 경직성에 따른 국가 재생에너지 정책이 거시경제에 미치는 영향 분석: 베이지언 DSGE 모형 접근 (Comparing the Impacts of Renewable Energy Policies on the Macroeconomy with Electricity Market Rigidities: A Bayesian DSGE Model)

  • 최봉석;김기환
    • 자원ㆍ환경경제연구
    • /
    • 제31권3호
    • /
    • pp.367-391
    • /
    • 2022
  • 본 연구에서는 베이지언 확률적 동태일반균형(DSGE) 모형을 이용하여 재생에너지 보급 정책이 거시경제에 미치는 영향을 분석하였다. 전통적 발전원(원자력·화력)과 재생에너지 발전원 간 불완전 대체적 관계를 활용하여 재생에너지 발전산업 고유의 기술진보만으로는 에너지 전환에 따른 국가 전체의 온실가스 감축 목표를 달성하기 어려우며, 산업 전반적인 온실가스 감축 기술이 함께 향상될 때 비로소 온실가스 배출량이 감축된다는 점을 보였다. 전력시장 경직성에 의하여 발전사업자의 투자에 대한 합리적 보상이 이루어지지 않는 상황에서는 오히려 총소비가 위축되는 결과가 도출되었다.

베이지언 사용한 패키지 소프트웨어 인증을 위한 시험 메트릭 선택 기법 (A Method of Selecting Test Metrics for Certifying Package Software using Bayesian Belief Network)

  • 이종원;이병정;오재원;우치수
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권10호
    • /
    • pp.836-850
    • /
    • 2006
  • 오늘날 급속한 패키지 소프트웨어 제품의 증가 추세에 따라서, 소프트웨어 제품에 대한 품질 시험 요구 또한 증가하였다. 소프트웨어 제품 시험 시 중요한 요소는 무엇을 시험할지 기준이 되는 메트릭의 선정이다. 본 연구에서는 패키지 소프트웨어 종류를 특성 벡터들로 표현하여 메트릭들과의 연관 관계를 확률로서 세밀하게 표현한다. 특성 벡터란 소프트웨어의 형식 분류 지시자라고 할 수 있으며 특정한 패키지 소프트웨어가 다른 것들과 어떻게 구별되는지 나타낼 수 있다. 분류된 각각의 소프트웨어 형식별로 메트릭을 선정하기 위해서 과거 시험 데이타를 분석하여 활용한다. 베이지언망이 과거 데이타 분석에 이용되며 특성 벡터와 메트릭 간의 의존 관계 네트워크를 구축한다. 구축된 베이지언망은 새로운 패키지 소프트웨어 시험 작업에 적절한 메트릭을 찾아내는데 활용된다.

워터쉐드 영역병합을 이용한 스테레오 정합의 베이지언 접근방법 (A Bayesian Approach to Stereo Matching via Merging Watershed Regions)

  • 길우성;김신형;장종환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.809-812
    • /
    • 2005
  • 본 논문은 세그멘테이션 기반의 스테레오 정합에서 복잡한 장면 정합 시 발생되는 오 정합을 최소화 하는 방법을 제안한다. 이를 위하여, 스테레오 영상의 좌측 영상에 대해 워터쉐드 영상 분할을 이용하여 정합을 위한 feature 를 생성한 다음, 베이지언 프레임웍을 적용하여, 각각의 영역을 비슷한 변이 정보를 가진 것들로 병합한다. 생성되는 정합 패치들은 정합의 모호성이 작게 되어 오 정합이 현저히 줄어 들 뿐만 아니라, 영역간의 콘트라스트가 적은 영상에서도 신뢰할 만한 변이 영상을 생성하게 된다.

  • PDF

컴퓨터 대수와 베이지언 추론망을 이용한 이공계 수학용 적응적 e-러닝 시스템 개발 (Development of an Adaptive e-Learning System for Engineering Mathematics using Computer Algebra and Bayesian Inference Network)

  • 박홍준;전영국
    • 한국콘텐츠학회논문지
    • /
    • 제8권5호
    • /
    • pp.276-286
    • /
    • 2008
  • 본 논문에서는 컴퓨터 대수 시스템을 기반으로 하는 웹 저작 환경과 베이지언 추론망을 적용한 학습자 진단 환경이 포함된 이공계 수학용 적응적 이러닝 시스템 개발에 대하여 소개하였다. 본 시스템을 활용하면 교수자는 컴퓨터 대수 시스템을 수식처리 엔진으로 하며 웹을 인터페이스로 하는 이공계 수학용 웹 콘텐츠를 쉽게 생성할 수 있다. 구체적으로 선형대수, 미분방정식 및 이산수학의 영역에서 콘텐츠 개발의 예를 소개하였다. 또한 학습자의 지식 영역별 수준을 조건부 확률을 이용한 통계적 추론에 의해 진단하여 그 결과에 따라 피드백을 생성하는 적응적 이러닝 웹 콘텐츠를 만들 수 있다. 본 시스템을 사용하여 개발한 이공계 수학용 웹 콘텐츠를 평가하기 위하여 그 결과물을 대학 강의에 적용하였고, 설문지 조사를 통하여 콘텐츠 사용에 대한 학습자의 반응을 평가하였다.

확률론적 베이지언 모델링에 의한 케이블 교량의 복합열화 리스크 평가 및 예측시스템 (The Risk Assessment and Prediction for the Mixed Deterioration in Cable Bridges Using a Stochastic Bayesian Modeling)

  • 조태준;이정배;김성수
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제16권5호
    • /
    • pp.29-39
    • /
    • 2012
  • 상관관계가 높은 복합열화의 완벽한 개별예측모델의 개발은 매우 어려운 문제로, 본 논문에서는 현수교 시스템의 미래열화와 유지 예산을 예측하기 위하여, 10년간의 유지 데이터가 주어진 매개변수(파손지표와 사용성)의 사후 확률 밀도함수를 찾기 위해 베이지언 추론을 적용하였다. 마르코프 연쇄 몬테카를로법을 이용하여 매개변수의 사후 분포를 조사하였다. 감소한 사용성의 모의위험예측은 사전분포와 연간유지 업무에서 업데이트한 데이터의 가능성에 따라 작성한 사후 분포이다. 기존의 선형 예측 모델과 비교하면, 제안된 2차 모델은 교량부품의 사용성, 위험요소, 그리고 유지 예산의 측정 데이터에 대하여 매우 개선된 수렴성과 근접성을 제공한다. 따라서 제안된 2차 추계학적 회귀 모델을 기반으로 복잡한 사회간접설비의 미래 성능과 유지관리예산을 예측하고 제어할 수 있는 기회를 제공할 것으로 기대한다.

유전자 알고리즘과 나이브 베이지언 기법을 이용한 의료 노모그램 생성 방법 (A Clinical Nomogram Construction Method Using Genetic Algorithm and Naive Bayesian Technique)

  • 이건명;김원재;윤석중
    • 한국지능시스템학회논문지
    • /
    • 제19권6호
    • /
    • pp.796-801
    • /
    • 2009
  • 복잡한 진단이나 예측 모델은 계산이 복잡하고 추론 과정을 해석하기 어렵기 때문에 임상현장에서 널리 사용되지 않고 있다. 의료 종사자들은 이러한 복잡한 모델 대신에, 복잡한 함수를 컴퓨터 등을 사용하지 않고도 쉽게 계산할 수 있도록 수치 관계를 그래픽으로 표현한 노모그램을 사용해 왔다. 의료분야에서 질병의 진단과 질병예후의 예측은 매우 주요한 관심사이다. 노모그램은 증상검사결과치료이력질병의 진단 결과 등의 속성을 포함한 임상 데이터들로부터 만들어진다. 노모그램을 만들 때는 가용한 여러 가지 속성 중에서 효과적인 것들을 찾아야 하고, 경우에 따라서는 속성에 대한 파라미터를 함께 결정해야 한다. 이 논문에서는 효과적인 속성과 파라미터를 선택하기 위해 유전자 알고리즘을 사용하고, 노모그램을 생성하기 위해 나이브 베이지언 기법을 사용하는 방법을 제안한다. 또한 제안한 방법을 실제 임상 데이터에 적용한 결과를 보인다.