• 제목/요약/키워드: Bayesian modeling

검색결과 237건 처리시간 0.03초

An Extended Generative Feature Learning Algorithm for Image Recognition

  • Wang, Bin;Li, Chuanjiang;Zhang, Qian;Huang, Jifeng
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권8호
    • /
    • pp.3984-4005
    • /
    • 2017
  • Image recognition has become an increasingly important topic for its wide application. It is highly challenging when facing to large-scale database with large variance. The recognition systems rely on a key component, i.e. the low-level feature or the learned mid-level feature. The recognition performance can be potentially improved if the data distribution information is exploited using a more sophisticated way, which usually a function over hidden variable, model parameter and observed data. These methods are called generative score space. In this paper, we propose a discriminative extension for the existing generative score space methods, which exploits class label when deriving score functions for image recognition task. Specifically, we first extend the regular generative models to class conditional models over both observed variable and class label. Then, we derive the mid-level feature mapping from the extended models. At last, the derived feature mapping is embedded into a discriminative classifier for image recognition. The advantages of our proposed approach are two folds. First, the resulted methods take simple and intuitive forms which are weighted versions of existing methods, benefitting from the Bayesian inference of class label. Second, the probabilistic generative modeling allows us to exploit hidden information and is well adapt to data distribution. To validate the effectiveness of the proposed method, we cooperate our discriminative extension with three generative models for image recognition task. The experimental results validate the effectiveness of our proposed approach.

자료기반 물환경 모델의 현황 및 발전 방향 (Data-Driven Modeling of Freshwater Aquatic Systems: Status and Prospects)

  • 차윤경;신지훈;김영우
    • 한국물환경학회지
    • /
    • 제36권6호
    • /
    • pp.611-620
    • /
    • 2020
  • Although process-based models have been a preferred approach for modeling freshwater aquatic systems over extended time intervals, the increasing utility of data-driven models in a big data environment has made the data-driven models increasingly popular in recent decades. In this study, international peer-reviewed journals for the relevant fields were searched in the Web of Science Core Collection, and an extensive literature review, which included total 2,984 articles published during the last two decades (2000-2020), was performed. The review results indicated that the rate of increase in the number of published studies using data-driven models exceeded those using process-based models since 2010. The increase in the use of data-driven models was partly attributable to the increasing availability of data from new data sources, e.g., remotely sensed hyperspectral or multispectral data. Consistently throughout the past two decades, South Korea has been one of the top ten countries in which the greatest number of studies using the data-driven models were published. Among the major data-driven approaches, i.e., artificial neural network, decision tree, and Bayesian model, were illustrated with case studies. Based on the review, this study aimed to inform the current state of knowledge regarding the biogeochemical water quality and ecological models using data-driven approaches, and provide the remaining challenges and future prospects.

비디오 셧의 감정 관련 특징에 대한 통계적 모델링 (Statistical Model for Emotional Video Shot Characterization)

  • 박현재;강행봉
    • 한국통신학회논문지
    • /
    • 제28권12C호
    • /
    • pp.1200-1208
    • /
    • 2003
  • 비디오 데이터에 존재하는 감정을 처리하는 것은 지능적인 인간과 컴퓨터와의 상호작용을 위해서 매우 중요한 일이다. 이러한 감정을 추출하기 위해서는 비디오로부터 감정에 관련된 특징들을 검출하기 위한 컴퓨팅 모델을 구축하는 것이 바람직하다. 본 논문에서는 비디오 셧에 존재하는 저급 특징들의 확률적인 분포를 이용하여 감정 이벤트 발생에 관련된 통계학적인 모델을 제안한다. 즉, 비디오 셧의 기본적인 특징을 추출하고 그 특징을 통계적으로 모델화 하여 감정을 유발하는 셧을 찾아낸다. 비디오 셧의 특징으로는 칼라, 카메라 모션 및 셧 길이의 변화를 이용한다. 이러한 특징들을 EM(Expectation Maximization) 알고리즘을 이용하여 GMM(Gaussian Mixture Model) 으로 모델링하고, 감정과 시간과의 관계를 MLE(Maximum Likelihood Estimation)를 이용하여 시간에 따른 확률분포 모델로 구성한다. 이런 두 개의 통계적인 모델들을 융합하여 베이시안 분류법을 적용하여 비디오 데이터로부터 감정에 관련된 셧을 찾아낸다.

Particle Filtering에 근거한 낙하하는 꽃잎의 운동궤적의 통계적 추정 (Statistical Estimation of Motion Trajectories of Falling Petals Based on Particle Filtering)

  • 이재우
    • 대한기계학회논문집A
    • /
    • 제40권7호
    • /
    • pp.629-635
    • /
    • 2016
  • 이 논문은 꽃잎들, 나비나 민들레 씨앗들과 같은 생물체 시스템의 불규칙한 운동을 파티클 필터링 이론에 근거하여 예측하고 추적하는 유용한 방법을 제안한다. 생물체 모사 시스템 설계에 있어서, 생체 시스템의 운동에 대한 관측과 생체 시스템 운동학에 대한 새로운 설계원리가 어떻게 자연스럽게 운동하는가에 대한 인상을 얻는데 중요하다. 공기 중에서 비행하는 꽃잎에 대한 시스템 모델링이 베이지안 확률 규칙을 사용하여 수행되었다. 실험결과는 제안된 방법이 공기의 난류로부터 유도된 랜덤한 외란이 있는 경우에도 잘 예측함을 보여준다.

서비스 로봇의 물체 탐색 성능 향상을 위한 온톨로지 기반 베이지안 네트워크 모델링 (Bayesian Network Modeling based on Ontology for Improving Object Detection Performance of Service Robots)

  • 송윤석;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.112-114
    • /
    • 2006
  • 최근 영상 인식 정보를 서비스 로봇 도메인에서 사용하기 위한 연구와 함께 전통적인 영상 인식 방법의 성능을 높이기 위한 연구가 진행되고 있다. 기존의 방법들은 기하학적 모델을 기반으로 예측 가능한 환경에서 상황을 인식하였기에 이를 실내 환경과 같은 동적인 환경에 적용하는 것은 정확도나 인식의 효율 면에서 한계를 갖는다. 이에 지식 기반 접근 방법을 통해 정확도를 항상 시키거나 계산 비용을 감소시킴으로써 영상 인식성능을 높이기 위한 다양한 연구가 있어 왔다. 본 논문에서는 서비스 로봇이 물체를 탐색할 때, 대상 물체가 다른 물체에 의해 가려짐으로써 발생하는 불확실한 상황을 해결하기 위한 방법을 제안한다. 제안하는 방법은 발견된 물체를 컨텍스트 정보로 사용하여 대상 물체의 존재 여부를 추론하며, 이를 위해 신뢰도를 모델링할 수 있는 확률적 모델인 베이지안 네트워크와 도메인 지식을 모델링 할 수 있는 온톨로지를 함께 사용한다. 효과적인 모델링을 위해 본 논문에서는 기본적인 물체 관계를 모듈화 하여 설계하기 위한 베이지안 네트워크 구조와 확률 값 선정 방법. 이들을 온톨로지를 기반으로 주어진 상창에 따라 결합하는 방법을 제안한다. 이는 물체 관계를 모델링할 때 발생하는 중복 설계를 감소시켜주고 유지 및 보수를 용이하게 한다. 설계된 추론 모듈은 실험 결과 5가지 장소에서 높은 정확도를 보여주었다.

  • PDF

Bayesian and maximum likelihood estimations from exponentiated log-logistic distribution based on progressive type-II censoring under balanced loss functions

  • Chung, Younshik;Oh, Yeongju
    • Communications for Statistical Applications and Methods
    • /
    • 제28권5호
    • /
    • pp.425-445
    • /
    • 2021
  • A generalization of the log-logistic (LL) distribution called exponentiated log-logistic (ELL) distribution on lines of exponentiated Weibull distribution is considered. In this paper, based on progressive type-II censored samples, we have derived the maximum likelihood estimators and Bayes estimators for three parameters, the survival function and hazard function of the ELL distribution. Then, under the balanced squared error loss (BSEL) and the balanced linex loss (BLEL) functions, their corresponding Bayes estimators are obtained using Lindley's approximation (see Jung and Chung, 2018; Lindley, 1980), Tierney-Kadane approximation (see Tierney and Kadane, 1986) and Markov Chain Monte Carlo methods (see Hastings, 1970; Gelfand and Smith, 1990). Here, to check the convergence of MCMC chains, the Gelman and Rubin diagnostic (see Gelman and Rubin, 1992; Brooks and Gelman, 1997) was used. On the basis of their risks, the performances of their Bayes estimators are compared with maximum likelihood estimators in the simulation studies. In this paper, research supports the conclusion that ELL distribution is an efficient distribution to modeling data in the analysis of survival data. On top of that, Bayes estimators under various loss functions are useful for many estimation problems.

온도인자를 활용한 Hargreaves 모형 기반의 잠재증발산량 대체 모형 개발 (Surrogate Model for Potential Evapotranspiration Using a difference in Maximum and Minimum Temperature within a Hargreaves Modeling Framework)

  • 김호준;김태정;이강욱;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.184-184
    • /
    • 2020
  • 수자원 계획 및 관리 시 증발산량의 정량적 분석은 필수적으로 고려되는 사항 중 하나이다. 일단위 이하의 잠재증발산량 산정은 세계식량기구(FAO)가 Penman-Monteith 방법을 기반으로 개발한 FAO56 PM 방법을 주로 활용하며, 이는 다른 방법에 비하여 높은 정확성과 적용성이 뛰어나다. 그러나 FAO56 PM 방법의 입력 매개변수는 다양한 기상자료이며, 장기간의 신뢰성 높은 자료를 구축하는 것은 어려운 실정이다. 이에 본 연구에서는 증발산량 공식인 Hargreaves 공식을 활용하여 FAO56 PM 방법으로 산정된 잠재증발산량과 기온차 사이의 시계열 관계를 재구성한 회귀분석 기법을 개발하였다. 개발된 모형에 유역면적을 적용하여 유역면적별 잠재증발산량을 산정하였으며, 이를 기존의 잠재증발산량과의 비교를 통해 모형의 적합성을 평가하였다. 결과적으로, 복잡한 잠재증발산량식을 단순한 대체모형(surrogate model)으로 제시함으로써 효율적인 증발산량 정량적 평가와 제한적인 기상자료 조건에 보편적 활용이 가능하다. 향후 연구에서는 회귀분석방법에 Bayesian 추론기법을 활용하여 구성함으로 잠재증발산량의 불확실성을 정량적으로 표현하고자 한다.

  • PDF

Soil Water Balance 모델을 이용한 강우유출 모형의 초기함수 조건 추정 (Estimation of Antecedent Moisture Condition in Rainfall-Runoff Modeling Based on Soil Water Balance Model)

  • 이예린;강수빈;심은증;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.307-307
    • /
    • 2021
  • 개념적 강우-유출모형에서 토양수분과 관련된 물리적 거동은 간략화 된 형태로 강우 및 온도자료를 활용하여 중간변량(state variable)으로 간접적으로 고려되고 있다. 특히 강우-유출모형에 초기함수 조건은 선행함수조건을 고려하여 수문지질학적 평가를 통하여 결정되어야 하나, 일반적으로 가정되거나 모형에서 간략화 된 분석과정을 통해 추정되고 있다. 본 연구에서는 토양의 Water Balance 모형 기반의 개념적 토양수분 추정모형을 활용하였다. 토양수분의 시간적 변동성을 평가하는데 있어서 연속적으로 측정된 In-situ 토양수분 자료를 이용하여 모형의 적합성을 평가하였다. Green-Ampt 방법과 중력식 침투방법과 온도를 활용한 증발산 추정기법을 연계한 토양함수 평가 모형을 개발하였다. In-situ 토양수분 자료와 유역의 강수량 및 온도자료를 이용한 관련 매개변수를 Bayesian 기법을 통해 추정하였으며 매개변수의 민감도를 평가하여 제시하였다. 최종적으로 제안된 모형의 활용측면에서 강우-유출모형의 초기함수 조건으로써의 역할을 평가하였다. 구체적으로 첨두유량 및 유출고와 초기함수조건과의 관계를 제시하고 강우-유출모형에서 활용방안을 제시하고자 한다.

  • PDF

Genetic Algorithm based hyperparameter tuned CNN for identifying IoT intrusions

  • Alexander. R;Pradeep Mohan Kumar. K
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제18권3호
    • /
    • pp.755-778
    • /
    • 2024
  • In recent years, the number of devices being connected to the internet has grown enormously, as has the intrusive behavior in the network. Thus, it is important for intrusion detection systems to report all intrusive behavior. Using deep learning and machine learning algorithms, intrusion detection systems are able to perform well in identifying attacks. However, the concern with these deep learning algorithms is their inability to identify a suitable network based on traffic volume, which requires manual changing of hyperparameters, which consumes a lot of time and effort. So, to address this, this paper offers a solution using the extended compact genetic algorithm for the automatic tuning of the hyperparameters. The novelty in this work comes in the form of modeling the problem of identifying attacks as a multi-objective optimization problem and the usage of linkage learning for solving the optimization problem. The solution is obtained using the feature map-based Convolutional Neural Network that gets encoded into genes, and using the extended compact genetic algorithm the model is optimized for the detection accuracy and latency. The CIC-IDS-2017 and 2018 datasets are used to verify the hypothesis, and the most recent analysis yielded a substantial F1 score of 99.23%. Response time, CPU, and memory consumption evaluations are done to demonstrate the suitability of this model in a fog environment.

머신러닝 알고리즘 기반의 의료비 예측 모델 개발 (Development of Medical Cost Prediction Model Based on the Machine Learning Algorithm)

  • Han Bi KIM;Dong Hoon HAN
    • Journal of Korea Artificial Intelligence Association
    • /
    • 제1권1호
    • /
    • pp.11-16
    • /
    • 2023
  • Accurate hospital case modeling and prediction are crucial for efficient healthcare. In this study, we demonstrate the implementation of regression analysis methods in machine learning systems utilizing mathematical statics and machine learning techniques. The developed machine learning model includes Bayesian linear, artificial neural network, decision tree, decision forest, and linear regression analysis models. Through the application of these algorithms, corresponding regression models were constructed and analyzed. The results suggest the potential of leveraging machine learning systems for medical research. The experiment aimed to create an Azure Machine Learning Studio tool for the speedy evaluation of multiple regression models. The tool faciliates the comparision of 5 types of regression models in a unified experiment and presents assessment results with performance metrics. Evaluation of regression machine learning models highlighted the advantages of boosted decision tree regression, and decision forest regression in hospital case prediction. These findings could lay the groundwork for the deliberate development of new directions in medical data processing and decision making. Furthermore, potential avenues for future research may include exploring methods such as clustering, classification, and anomaly detection in healthcare systems.