• Title/Summary/Keyword: 사전정보 모형

Search Result 361, Processing Time 0.032 seconds

Bayesian Interval Estimation of Tobit Regression Model (토빗회귀모형에서 베이지안 구간추정)

  • Lee, Seung-Chun;Choi, Byung Su
    • The Korean Journal of Applied Statistics
    • /
    • v.26 no.5
    • /
    • pp.737-746
    • /
    • 2013
  • The Bayesian method can be applied successfully to the estimation of the censored regression model introduced by Tobin (1958). The Bayes estimates show improvements over the maximum likelihood estimate; however, the performance of the Bayesian interval estimation is questionable. In Bayesian paradigm, the prior distribution usually reflects personal beliefs about the parameters. Such subjective priors will typically yield interval estimators with poor frequentist properties; however, an objective noninformative often yields a Bayesian procedure with good frequentist properties. We examine the performance of frequentist properties of noninformative priors for the Tobit regression model.

Improvement of streamflow forecast using a Bayesian inference approach (베이지안 기법을 통한 유량예측 정확도 개선)

  • Seo, Seung Beom;Kim, Young-Oh;Kang, Shin-Uk
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2018.05a
    • /
    • pp.303-303
    • /
    • 2018
  • 안정적인 수자원 운용을 위해서는 정확한 유량예측 기술이 필요하다. 본 연구에서는 유량예측 정확도의 개선을 위해 베이지안 추론(Bayesian inference) 기법과 앙상블 유량 예측(Ensemble Streamflow Prediction, ESP) 기법의 결합을 통한 새로운 유량예측 기법(Bayesian ESP)을 제안하였다. ESP를 통한 유량 예보 앙상블은 베이지안 추론의 사전정보로 활용되며, 관측 유량과 ESP 전망 결과의 선형관계를 통해 우도함수가 추정된다. 우도함수는 관측 유량이 존재하는 과거 기간에 대한 ESP를 수행한 후 예보 시점의 관측 유량(concurrent observed flow)과 선행 관측 유량(lagged observed flow)과의 다중선형회귀 모형을 통해 추정된다. 사전정보와 우도함수는 정규분포로 가정되며, 따라서 최종 유량예측인 사후정보 역시 정규분포함수로 산정되게 된다. Bayesian ESP은 ESP에서 발생하는 강우-유출모형 오차의 개선을 통해 수문예측의 정확도를 개선하게 되며 정규분포함수로 최종 결과가 산정되므로 확률예보 형태의 수문 전망도 가능하다. 본 기법을 전국 35개 댐 유역에 시범적용을 한 결과, 모든 유역에서 기존 ESP 기법 대비 수문예측 정확도의 개선을 가져왔으며, 우도함수 추정에 있어 선행 유량의 포함 여부가 수문 예측 정확도의 추가적인 개선을 가져왔다. 본 기법은 주간 예보부터 계절 예보까지 탄력적으로 구축이 가능하며 적용 결과 리드 타임이 길어질수록 예측 능력이 감소되었지만 전체 구간에 있어서 Bayesian ESP 기법이 가장 우수한 예측 정확도를 보여주었다.

  • PDF

Knowledge Representation of Concept Word Using Cognitive Information in Dictionary (사전에 나타난 인지정보를 이용한 단어 개념의 지식표현)

  • Yun, Duck-Han;Ock, Cheol-Young
    • Annual Conference on Human and Language Technology
    • /
    • 2004.10d
    • /
    • pp.118-125
    • /
    • 2004
  • 인간의 언어지식은 다양한 개념 관계를 가지며 서로 망(network)의 모습으로 연결되어 있다. 인간의 언어지식의 산물 중에서 가장 체계적이며 구조적으로 언어의 모습을 드러내고 있는 결과물이 사전이라고 할 수 있다. 본 논문에서는 이러한 사전 뜻풀이 말에서 개념 어휘와 자동적인 지식획득을 통하여 의미 정보를 구조적으로 추출한다. 이러한 의미 정보가 추출되면서 동시에 자동적으로 개념 어휘의 의미 참조 모형이 구축된다. 이러한 것은 사전이 표제어 리스트와 표제어를 기술하는 뜻풀이말로 이루어진 구조의 특성상 가능하다. 먼저 172,000여 개의 사전 뜻풀이말을 대상으로 품사 태그와 의미 태그가 부여된 코퍼스에서 의미 정보를 추출하는데, 의미분별이 처리 된 결과물을 대상으로 하기 때문에 의미 중의성은 고려하지 않아도 된다. 추출된 의미 정보를 대상으로 정제 작업을 거쳐 정보이론의 상호 정보량(Ml)을 이용하여 개념 어휘와 의미 정보간에 연관도를 측정한 후, 개념 어휘간의 유사도(SMC)를 구하여 지식표현의 하나로 연관망을 구축한다.

  • PDF

The Composition of Korean-English Transfer Dictionary for Proper Selection of Verb Translation (적절한 동사 대역어 선택을 위한 한영 변환 사전 구성)

  • Song, Jung-Keun
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.294-301
    • /
    • 2001
  • 기계번역이 인간의 언어 능력을 기계로 구현한다는 점에서 전산학적 성격이 강하다면, 변환 사전은 인간의 어휘부(lexicon) 정보를 그대로 기계에 표상한다는 점에서 언어학적 성격이 강하다. 여기서는 다양한 어휘부 정보 중에서 한영 기계번역에서 필요한 언어학적 정보를 추출하고 이러한 정보를 바탕으로 적절한 동사 대역어 선택을 위한 변환 사전의 모형을 만들어 보고자 하였다. 한영 기계번역에서 적절한 동사 대역어 선택의 어려움은 한국어 동형어 처리 문제와 한국어에서는 포착되지 않지만 영어로 번역하는 과정에서 발생하는 영어 표현의 특수성 때문에 기인한 것으로 볼 수 있다. 이 논문에서는 이러한 문제를 논항과 문법 형태소, 선택제약, 개별 어휘 등의 기초적인 언어학적 개념을 이용한 변환사전을 통해 해결한다. 또한 동사 대역어 선택에 영향을 미치는 이러한 개별적인 요인들은 실제 변환사전의 기술에 있어서는 복합적으로 적용됨을 동사 '먹다'의 기술을 통해 확인할 수 있다.

  • PDF

Negative DEA를 이용한 기업도산예측

  • Min, Jae-Hyeong;Jeong, Cheol-U
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 2005.10a
    • /
    • pp.405-408
    • /
    • 2005
  • 현대 기업 환경에서 리스크 관리의 중요성이 증가함에 따라 기업도산예측을 위한 다양한 통계모형들이 개발되었다. 그러나 이러한 모형들은 기업도산에 영향을 미치는 변수들에 대한 사후적 정보와 함께 도산여부에 대한 사전적 정보를 반드시 필요로 하는 한계가 있다. 이에 따라 DEA가 기업도산예측을 위한 대안으로 연구되고 있다. DEA는 도산여부에 대한 사전적 정보 없이 사후적인 정보만을 가지고 의사결정단위(DMU)의 효율성(재무신뢰도)을 측정할 수 있는 장점이 있다. 그러나 지금까지 기업도산예측에 활용된 DEA 모형은 바람직하지 않은 산출물(negative outputs)은 다루지 못하는 한계가 있었다. 이에 본 논문에서는 Negative DEA 방법을 소개하고, 이를 기존의 DEA 방법과 병행하여 기업도산예측에 적용함으로써 기업도산예측을 위한 대안적 방법을 제시하고자 한다.

  • PDF

An Experimental Study on an Effective Word Sense Disambiguation Model Based on Automatic Sense Tagging Using Dictionary Information (사전 정보를 이용한 단어 중의성 해소 모형에 관한 실험적 연구)

  • Lee, Yong-Gu;Chung, Young-Mee
    • Journal of the Korean Society for information Management
    • /
    • v.24 no.1 s.63
    • /
    • pp.321-342
    • /
    • 2007
  • This study presents an effective word sense disambiguation model that does not require manual sense tagging Process by automatically tagging the right sense using a machine-readable and the collocation co-occurrence-based methods. The dictionary information-based method that applied multiple feature selection showed the tagging accuracy of 70.06%, and the collocation co-occurrence-based method 56.33%. The sense classifier using the dictionary information-based tagging method showed the classification accuracy of 68.11%, and that using the collocation co-occurrence-based tagging method 62.09% The combined 1a99ing method applying data fusion technique achieved a greater performance of 76.09% resulting in the classification accuracy of 76.16%.

Complete preordering of alternatives by metric distance measure (거리측정속도에 의한 대안의 전체적 유사순서결정)

  • 김영겸;이강인;이진규
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 1993.10a
    • /
    • pp.63-65
    • /
    • 1993
  • 전통적 의사결정 이론에 입각한 기존의 다기준 의사결정 모형은 명확하게 정의된 문제에 대해서 실함수로 표현된 사전의 선호정보에 의하여 모호함이 없이 확실한 선호의 판별을 산출하는 true-criterion 모형이다. 그러나 현실적인 의사결정 환경하에서 선호정보가 사전에 명확하게 하나의 실함수로 얻어지기는 매우 어렵다. 이는 곧 선호의 불확실성(fuzziness)이나 선호판별을 할 수 없는 비교불가능성(incomparability)등이 있을 수 있음을 의미한다. 1980년대 이후의 다기준의사결정 이론에 대한 연구는 불명확한 문제의 정형화나 선호의 불확실성을 인정하고, 이를 fuzzy 이론을 이용하여 모형의 설정에 반영하고 있다. 심지어는 선호관계의 비추이성(intransitivity)이나 비교불가능성까지도 인정하는 등 모형의 강건성(robustness)을 고려하는 연구가 활발하게 이루어지고 있다.

  • PDF

A Survey on Deep Learning-based Pre-Trained Language Models (딥러닝 기반 사전학습 언어모델에 대한 이해와 현황)

  • Sangun Park
    • The Journal of Bigdata
    • /
    • v.7 no.2
    • /
    • pp.11-29
    • /
    • 2022
  • Pre-trained language models are the most important and widely used tools in natural language processing tasks. Since those have been pre-trained for a large amount of corpus, high performance can be expected even with fine-tuning learning using a small number of data. Since the elements necessary for implementation, such as a pre-trained tokenizer and a deep learning model including pre-trained weights, are distributed together, the cost and period of natural language processing has been greatly reduced. Transformer variants are the most representative pre-trained language models that provide these advantages. Those are being actively used in other fields such as computer vision and audio applications. In order to make it easier for researchers to understand the pre-trained language model and apply it to natural language processing tasks, this paper describes the definition of the language model and the pre-learning language model, and discusses the development process of the pre-trained language model and especially representative Transformer variants.

A Bayesian Method to Semiparametric Hierarchical Selection Models (준모수적 계층적 선택모형에 대한 베이지안 방법)

  • 정윤식;장정훈
    • The Korean Journal of Applied Statistics
    • /
    • v.14 no.1
    • /
    • pp.161-175
    • /
    • 2001
  • Meta-analysis refers to quantitative methods for combining results from independent studies in order to draw overall conclusions. Hierarchical models including selection models are introduced and shown to be useful in such Bayesian meta-analysis. Semiparametric hierarchical models are proposed using the Dirichlet process prior. These rich class of models combine the information of independent studies, allowing investigation of variability both between and within studies, and weight function. Here we investigate sensitivity of results to unobserved studies by considering a hierachical selection model with including unknown weight function and use Markov chain Monte Carlo methods to develop inference for the parameters of interest. Using Bayesian method, this model is used on a meta-analysis of twelve studies comparing the effectiveness of two different types of flouride, in preventing cavities. Clinical informative prior is assumed. Summaries and plots of model parameters are analyzed to address questions of interest.

  • PDF

A Bayesian Prediction of the Generalized Pareto Model (일반화 파레토 모형에서의 베이지안 예측)

  • Huh, Pan;Sohn, Joong Kweon
    • The Korean Journal of Applied Statistics
    • /
    • v.27 no.6
    • /
    • pp.1069-1076
    • /
    • 2014
  • Rainfall weather patterns have changed due to global warming and sudden heavy rainfalls have become more frequent. Economic loss due to heavy rainfall has increased. We study the generalized Pareto distribution for modelling rainfall in Seoul based on data from 1973 to 2008. We use several priors including Jeffrey's noninformative prior and Gibbs sampling method to derive Bayesian posterior predictive distributions. The probability of heavy rainfall has increased over the last ten years based on estimated posterior predictive distribution.