• 제목/요약/키워드: 베이지언 추정

검색결과 8건 처리시간 0.02초

다항시행접근 단순 베이지안 문서분류기의 개선 (Improving Multinomial Naive Bayes Text Classifier)

  • 김상범;임해창
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권3_4호
    • /
    • pp.259-267
    • /
    • 2003
  • 단순 베이지언 분류모형은 구현이 간단하고 효율적이기 때문에 실용적으로 사용하기에 적합하다. 그러나 이 분류모형은 많은 기계학습 도메인에서 우수한 성능을 보임에도 불구하고 문서분류에 적용되었을 경우에는 그 성능이 매우 낮은 것으로 알려져왔다. 본 논문에서는 단순 베이지언 분류모형중 가장 성능이 우수한 것으로 알려진 다항 시행접근 단순 베이지언 분류모형을 개선하는 세가지 방법을 제안한다. 첫 번째는 범주에 대한 단어의 확률추정방법을 문서모델에 기반하여 개선하는 것이고, 두 번째는 문서의 길이에 따라 범주와의 관련성이 선형적으로 증가하는 것을 억제하기 위해 길이에 대한 정규화를 수행하는 것이며, 마지막으로 범주판정에 중요한 역할을 하는 단어들의 영향력을 높여주기 위하여 상호정보가중 단순 베이지언 분류방법을 사용하는 것이다. 제안하는 방법들은 문서분류기의 성능 평가를 위한 벤치마크 문서집합인 Reuters21578과 20Newsgroup에서 기존의 방범에 비해 상당한 성능향상을 가져옴을 알 수 있었다.

한국어 띄어쓰기 모델에서 사용자 입력을 고려한 베이지언 파라미터 추정 (Bayesian Parameter Estimation Considering User-input for Korean Word Spacing Model)

  • 이정훈;홍금원;이도길;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.5-11
    • /
    • 2008
  • 한국어 띄어쓰기에서 통계적 모델을 사용한 기존의 연구들은 최대우도추정(Maximum Likelihood Estimation)에 기반하고 있다. 그러나 최대우도추정은 자료부족 시 부정확한 결과를 주는 단점이 있다. 본 연구는 이에 대한 대안으로 사용자 입력을 고려하는 베이지언 파라미터 추정(Bayesian parameter estimation)을 제안한다. 기존 연구가 사용자 입력을 교정 대상으로만 간주한 것에 비해, 제안 방법은 사용자 입력을 교정 대상이면서 동시에 학습의 대상으로 해석한다. 제안하는 방법에서 사용자 입력은 학습 말뭉치의 자료부족에서 유발되는 부정확한 파라미터 추정(parameter estimation)을 방지하는 역할을 수행하고, 학습 말뭉치는 사용자 입력의 불확실성을 보완하는 역할을 수행한다. 실험을 통해 문어체 말뭉치, 통신환경 구어체 말뭉치, 웹 게시판 등 다양한 종류의 말뭉치와 다양한 통계적 모델에 대해 제안 방법이 효과적임을 알 수 있다.

  • PDF

베이지언 기법 추정의 DSGE 모형을 이용한 고용보조금정책 효과 (Effects of Wage Subsidies through the Lens of the Bayesian-Estimated DSGE Model)

  • 문외솔;송승주
    • 노동경제논집
    • /
    • 제43권3호
    • /
    • pp.63-100
    • /
    • 2020
  • 본 연구는 Diamond-Mortensen-Pissarides 유형의 노동시장 마찰을 DSGE 모형에 통합하고, 1991년 1분기부터 2020년 1분기 기간을 대상으로 베이지언 기법을 적용하여 모형의 모수들을 추정하였다. COVID-19 발생 이후 논의되는 직접적인 고용보조금 지급의 효과를 모의실험을 통해 정량적으로 분석하였다. 분석모형에서의 고용보조금 지급은 고용관계를 형성한 기업의 노동비용을 낮추고 이윤을 높이는 효과가 있다. 이에 따라 신규 구인자 수가 늘어나고 매칭이 증가한다. 결과적으로 채용확률은 상승하고 고용은 늘어나며 총생산도 증가한다. 총생산의 1% 규모로 고용보조금을 지급하면 누적 총생산은 1% 이상 증가하는 것으로 나타났다.

  • PDF

베이지언 추정을 이용한 웹 서비스 공격 탐지 (SAD : Web Session Anomaly Detection based on Bayesian Estimation)

  • 조상현;김한성;이병희;차성덕
    • 정보보호학회논문지
    • /
    • 제13권2호
    • /
    • pp.115-125
    • /
    • 2003
  • 본웹 서비스는 일반적으로 침입 차단 시스템에 의해 통제되지 않은 채 외부에 공개되어 있어 공격의 수단으로 이용될 수 있고, 다양한 웹 어플리케이션의 특성에 따라 많은 형태의 취약성을 내포하고 있다. 본 논문에서는 웹 서비스의 정상적인 이용 사례를 모델링하고, 이와 다른 사용례를 보이는 이상 사례를 베이지언 추정 기법을 이용하여 통계적으로 찾아내는 SAD(Session Anomaly Detection)을 제안한다. SAD의 성능을 평가하기 위하여 1개월간 수집된 웹로그 자료를 이용하였고 침입은 웹 스캐너 프로그램(Whisker)을 이용하여 수행하였다. 기존 NIDS인 Snort를 이용한 실험 결과 평균적으로 36%의 탐지율을 보인 반면 SAD의 경우 윈도우 사이즈, 훈련데이터의 크기, 이상탐지 필터, 웹토폴로지 정보의 이용유무에 따라 다소 차이는 있지만 전반적으로 90%가 넘는 탐지율을 보여 주었다.

거시경제 및 통화정책 기조 변화가 통화정책의 유효성에 미친 영향 분석 (Effectiveness of Monetary Policy in Korea Due to Time Varying Monetary Policy Stance)

  • 김태봉
    • KDI Journal of Economic Policy
    • /
    • 제36권3호
    • /
    • pp.1-23
    • /
    • 2014
  • 본고는 4개의 거시변수들을 포함한 Time Varying VAR 모형을 통해 한국의 통화정책 변화를 평가하였다. 첫째, 외환위기나 금융위기 때와 같이 통화정책이 환율변동에 대해 민감하게 변화하는 시기가 존재하므로 위기를 포함한 긴 표본 안에서 한국의 통화정책을 평가할 때는 환율을 모형안에 포함시키는 것이 필요하다. 둘째, 표본기간 내에서 이례적인 큰 변동성이 때때로 나타나는 한국 거시변수들을 설명하기 위해서는 stochastic volatilities를 TVP-VAR 모형 내에서 설정할 필요가 있다. 한편, 2000년대 거시변수들의 안정화는 stochastic volatilities의 감소에 의해 설명되며, 부분적으로는 거시경제의 구조를 반영하는 충격반응함수에 의해서도 설명된다. 셋째, 통화정책의 인플레이션에 대한 유효성의 크기는 예전에 비해 최근 약화된 편이나 유효성의 지속성은 비교적 높아진 것으로 나타났다. 마지막으로 인플레이션 안정화에 대한 통화정책의 기조는 물가안정목표제가 도입되기 전에 비해 그 후에 적극적인 방향으로 개선되어 왔음을 보이고 있다. 하지만 우리나라의 통화정책은 그 기조가 경기변동에 비해 인플레이션 안정화에 대하여 여전히 덜 적극적인 것을 감안할 때 개선될 여지가 있는 것으로 판단된다.

  • PDF

역학과 유전학적 데이터를 이용한 한국에서 2014년 발생한 H5N8 조류독감 전염경로의 유추 (Inferring transmission routes of avian influenza during the H5N8 outbreak of South Korea in 2014 using epidemiological and genetic data)

  • 최상철
    • 미생물학회지
    • /
    • 제54권3호
    • /
    • pp.254-265
    • /
    • 2018
  • 최근 양계업에 막대한 피해를 끼치는 조류독감은 한국에서 수천억원의 거대한 경제적 손실을 초래하였다. 병원균의 전염경로를 파악할 수 있다면 막대한 손해를 끼치는 생물학적 피해의 확산을 막고 일부 지역으로 제한하는데 큰 도움이 될 것이다. 병원균 DNA 서열의 계통학적인 분석을 통하여 감염된 숙주들을 방향성이 있는 연결선으로 연관짓는 전염 계통수를 얻을 수 있다. 지난 10여년간 유전적 데이터뿐만 아니라 역학 데이터를 이용한 전염 계통수 추론의 방법론적 발전이 이루어졌다. 이에, 본 연구에서는 전염 계통수 추론 방법을 이용하여 지난 2014년 한국에 발병한 고병원성 조류독감 H5N8에서 유래한 DNA 서열을 재분석하였다. 당시, H5N8 바이러스는 전라북도에서 시작하여 지역적으로 접해있는 4개의 지역으로 확산되어 나갔던 것으로 알려져 있다. 전염 계통수를 추론하는 베이지언 통계 방법인 Markov chain Monte Carlo를 반복적으로 시행하고 이를 종합하여 철새 외래종과 국내종 조류 숙주들의 전염 계통수를 추정하였다. 비록 연결선의 불확실성은 높았으나 추정된 전염 계통수를 통하여 당시 H5N8 바이러스는 전라북도에서 시작하고 충청남도를 거쳐 경기도로 퍼져나간 것을 확인할 수 있었다. 사육하는 오리와 같은 국내종 조류는 전염 계통수의 말단 노드에 위치하는 것으로 추정되었다. 이러한 결과를 통하여 야생 철새종이 2014년 한국의 H5N8 조류독감의 감염 매개자로 주된 역할을 하였다는 것을 재확인하였다.

제 18대 국회 기명투표 분석: 베이즈(Bayesian) 방법론 적용 (The Analysis of Roll Call Data from the 18th Korean National Assembly: A Bayesian Approach)

  • 한규섭;김윤응;임종호;임요한;권수현;이경은
    • 응용통계연구
    • /
    • 제27권4호
    • /
    • pp.523-541
    • /
    • 2014
  • 본 연구는 국회의 기명투표 분석에 적용될 수 있는 베이즈 방법론을 사용하여 지난 18대 국회에서 처리된 2,389개의 법안에 대한 표결기록을 분석하였다. 기명투표 분석은 의정연구에 관련된 이론적 가설의 실증적 검증을 위한 기초 데이터를 제공하는 경우가 많아 정치학 연구 전반의 발전을 위해 매우 중요한 의미를 가진다. 기명투표 분석에 있어 베이즈 방법론은 기존의 빈도주의적 방법론을 적용할 때 발생할 수 있는 통계적 문제들에 대한 훌륭한 대안을 제시한다. 본 연구에서는 Clinton 등 (2004)가 제안한 베이지언 방법론을 적용, 18대 국회에서 처리된 모든 법안에 대한 표결기록을 분석하여 개별 의원들의 최대선호점(ideal points)과 신뢰구간을 추정했다. 본 연구에서 제안한 방법론의 유용성 을 보여주기 위해 시범적으로 두 가지 경우에 대한 분석을 실시하였다. 하나는 널리 알려진 세 개의 의원 소모임의 최대선호점을 살펴봄으로써 한국 의회 내에 유의미한 표결성향의 스펙트럼이 존재하는지를 살펴보았다. 다른 하나는 제안된 방법론을 활용하여 어떻게 이론적 가설의 검증이 이루어질 수 있는지를 보여주기 위해 18대 국회의 '중간축'과 '몸싸움 방지축'의 위치와 두 중추적 위치에 해당할 가능성이 높은 의원들이 누구인지를 살펴보았다.

노인자살예방을 위한 통합적 위기개입모델 다층효과 연구: 자살생각·우울을 중심으로 (Study on the Multilevel Effects of Integrated Crisis Intervention Model for the Prevention of Elderly Suicide: Focusing on Suicidal Ideation and Depression)

  • 김은주;육성필
    • 한국노년학
    • /
    • 제37권1호
    • /
    • pp.173-200
    • /
    • 2017
  • 본 연구의 목적은 노인자살예방을 위해 개발된 통합적 위기개입모델을 경기도를 중심으로 적용한 후 위기개입서비스의 실제 개입효과를 검증하는 것이다. 통합적 위기개입모델은 지역사회 통합시스템 접근과 스트레스 취약성 이론을 포함하는 위기개입 이론에 기초하여 개발되었다. 효과성 검증을 위해 노인우울(GDS-K) 및 자살생각(SSI)척도를 활용하였고, 1차 사전검사 258명, 통합적 위기개입 서비스 6개월 제공 후 2차 사후검사 184명, 2-3년 후 역추적을 통해 3차 추수검사 124명의 자료를 수집하여 분석하였다. 분석은 R Statistics computing을 이용하였고, 서로 다른 시점의 다른 검사를 비교하기 위해 검사 동등화 및 측정 시점 간 수직 척도화를 수행한 후 기술통계와 일변량 분산분석을 실시하였고, 마지막으로 베이지언 추정을 이용해 다층모형 분석을 실시하였다. 연구결과 노인자살예방을 위해 개발된 통합적 위기개입모델 적용 후 사전점수에 비해 사후측정에서 통계적으로 유의하게 노인우울과 자살생각을 감소시키는 것으로 나타났는데, 노인우울 감소에 .56의 효과크기를, 자살생각의 감소에 .39의 효과크기를 나타내 모델의 전체적인 효과성이 입증되었다. 그러나 위기개입 후 2-3년 후 추수검사에서 노인우울 및 자살생각이 다시 높아져 원래 상태를 회복하는 것으로 나타나 개입의 장기적인 유지효과는 확인되지 않았다. 노인우울 및 자살생각 변화량에 영향을 주는 요인을 찾기 위해 다층분석을 통해 위기개입 서비스의 각 유형(위기개입 전문상담, 약물치료, 동료상담)과 내담자특성(성별, 연령), 상담자 특성(전문가 연령, 경력, 전공)들 및 위기개입 서비스 유형(위기개입 전문상담)과 상담자 특성(전문가 연령, 경력, 전공)의 상호작용 효과를 살펴본 결과, 유일하게 약물치료가 단독으로 자살생각을 의미있게 낮추는 것으로 나타났으며, 전문가의 전공이 상담전공일 때 전문상담과 상호작용하여 자살생각을 의미있게 감소시키는 것으로 나타났다. 본 연구는 노인자살예방을 위해 개발된 통합적 위기개입모델의 전체효과와 각 개입서비스 유형의 효과를 검증하여 현장 적용의 근거를 확보했다는 데에 의의가 있다.