• Title/Summary/Keyword: 베이지안 분류

Search Result 200, Processing Time 0.027 seconds

Bayesian Classification Method for Diagnosing Heart Disease (심장 질환 진단을 위한 베이지안 분류 기법)

  • Shon Ho-Sun;Lee Heon-Gyu;Cho Kyung-Hwan;Ryu Keun-Ho;Noh Ki-Yong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.05a
    • /
    • pp.39-42
    • /
    • 2006
  • 심전도는 각종심장질환 들을 예측하는데 널리 사용되고 있다. 이러한 심전도에서 ST-분절은 허혈성 심장 질환, 확장성 심근성, 비후성 심근증 등을 예측하는데 이용되고 있다. 이 논문에서는 환자들의 임상 정보와 심전도로부터 심장 질환 예측을 위한 중요 파라미터인 ST-부절을 추출하였다. 그리고 이러한 추출된 데이터 분석을 위해서 데이터마이닝 기법을 적용한다. 데이터마이닝의 분류 알고리즘인 베이지안 네트워크를 적용 심장 질환을 효율적으로 분류하기 위한 방법을 제시 하였다.

  • PDF

k-최근접 이웃 정보를 활용한 베이지안 추론 분류

  • No, Yeong-Gyun;Kim, Gi-Eung;Lee, Tae-Hun;Yun, Seong-Ro;Lee, Daniel D.
    • Information and Communications Magazine
    • /
    • v.31 no.11
    • /
    • pp.27-34
    • /
    • 2014
  • 본 리뷰 논문에서는 많은 데이터 환경에서 얻어진 k-최근접 이웃들(k-nearest neighbors)의 이론적 성질로부터 어떻게 분류를 위한 알고리즘을 만들어낼 것인가에 대한 여러 가지 방법들을 설명한다. 많은 데이터 환경에서의 최근접 이웃 데이터의 정보는 다양한 기계학습 문제를 푸는데 아주 좋은 이론적인 성질을 가지고 있다. 하지만, 이런 이론적인 특성들이 데이터가 많지 않은 환경에서는 전혀 나타나지 않을 뿐 아니라 오히려 다른 다양한 알고리즘들에 비해 성능이 많이 뒤쳐지는 결과를 보여주고 있다. 본 리뷰 논문에서는 많은 데이터 환경 하에서 k-최근접 이웃들의 정보가 어떤 이론적인 특성을 가지는지 설명하고, 특별히 이런 특성들을 가지고 k-최근접 이웃을 이용한 분류 문제를 어떻게 베이지안 추론(Baysian inference) 문제로 수식화 할 수 있는지 보인다. 마지막으로 현재의 빅데이터 환경에서 실용적으로 사용할 수 있는 알고리즘들을 소개한다.

Improving the Classification Accuracy Using Unlabeled Data: A Naive Bayesian Case (나이브 베이지안 환경에서 미분류 데이터를 이용한 성능향상)

  • Lee Chang-Hwan
    • The KIPS Transactions:PartB
    • /
    • v.13B no.4 s.107
    • /
    • pp.457-462
    • /
    • 2006
  • In many applications, an enormous amount of unlabeled data is available with little cost. Therefore, it is natural to ask whether we can take advantage of these unlabeled data in classification learning. In this paper, we analyzed the role of unlabeled data in the context of naive Bayesian learning. Experimental results show that including unlabeled data as part of training data can significantly improve the performance of classification accuracy. The effect of using unlabeled data is especially important in case labeled data are sparse.

Ecological Network on Benthic Diatom in Estuary Environment by Bayesian Belief Network Modelling (베이지안 모델을 이용한 하구수생태계 부착돌말류의 생태 네트워크)

  • Kim, Keonhee;Park, Chaehong;Kim, Seung-hee;Won, Doo-Hee;Lee, Kyung-Lak;Jeon, Jiyoung
    • Korean Journal of Ecology and Environment
    • /
    • v.55 no.1
    • /
    • pp.60-75
    • /
    • 2022
  • The Bayesian algorithm model is a model algorithm that calculates probabilities based on input data and is mainly used for complex disasters, water quality management, the ecological structure between living things or living-non-living factors. In this study, we analyzed the main factors affected Korean Estuary Trophic Diatom Index (KETDI) change based on the Bayesian network analysis using the diatom community and physicochemical factors in the domestic estuarine aquatic ecosystem. For Bayesian analysis, estuarine diatom habitat data and estuarine aquatic diatom health (2008~2019) data were used. Data were classified into habitat, physical, chemical, and biological factors. Each data was input to the Bayesian network model (GeNIE model) and performed estuary aquatic network analysis along with the nationwide and each coast. From 2008 to 2019, a total of 625 taxa of diatoms were identified, consisting of 2 orders, 5 suborders, 18 families, 141 genera, 595 species, 29 varieties, and 1 species. Nitzschia inconspicua had the highest cumulative cell density, followed by Nitzschia palea, Pseudostaurosira elliptica and Achnanthidium minutissimum. As a result of analyzing the ecological network of diatom health assessment in the estuary ecosystem using the Bayesian network model, the biological factor was the most sensitive factor influencing the health assessment score was. In contrast, the habitat and physicochemical factors had relatively low sensitivity. The most sensitive taxa of diatoms to the assessment of estuarine aquatic health were Nitzschia inconspicua, N. fonticola, Achnanthes convergens, and Pseudostaurosira elliptica. In addition, the ratio of industrial area and cattle shed near the habitat was sensitively linked to the health assessment. The major taxa sensitive to diatom health evaluation differed according to coast. Bayesian network analysis was useful to identify major variables including diatom taxa affecting aquatic health even in complex ecological structures such as estuary ecosystems. In addition, it is possible to identify the restoration target accurately when restoring the consequently damaged estuary aquatic ecosystem.

Recommendation System using Baysian Network in IoT Environment (IoT 환경에서의 베이지안 네트워크를 이용한 추천시스템)

  • Jeong, Soo-Yeon;Kim, Young-Kuk
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2016.07a
    • /
    • pp.125-127
    • /
    • 2016
  • 본 논문에서는 IoT(Internet of Things) Device와 스마트폰을 이용하여 사용자의 상황을 인지하고 상황에 적합한 상품을 추천하는 추천시스템을 제안한다. 기존 추천시스템과 다르게 제안하는 IoT 환경에서의 추천시스템은 IoT Device와 스마트폰에서 얻을 수 있는 날씨, 위치, 사용자 정보 등을 파악하여 추천하는 것으로 다양하고 많은 데이터를 제공하므로 정확도를 높일 수 있다. 베이지안 네트워크(BN, Bayesian Network)는 불확실성을 효율적으로 관리하고 정확도와 실시간성을 높일 수 있는 방법으로, 상품의 특징에 따라 종류를 분류하여 추론하고 선호도가 높은 상품의 종류를 추천하는 시스템을 제안한다.

  • PDF

Bayesian Model based Korean Semantic Role Induction (베이지안 모형 기반 한국어 의미역 유도)

  • Won, Yousung;Lee, Woochul;Kim, Hyungjun;Lee, Yeonsoo
    • 한국어정보학회:학술대회논문집
    • /
    • 2016.10a
    • /
    • pp.111-116
    • /
    • 2016
  • 의미역은 자연어 문장의 서술어와 관련된 논항의 역할을 설명하는 것으로, 주어진 서술어에 대한 논항인식(Argument Identification) 및 분류(Argument Labeling)의 과정을 거쳐 의미역 결정(Semantic Role Labeling)이 이루어진다. 이를 위해서는 격틀 사전을 이용한 방법이나 말뭉치를 이용한 지도 학습(Supervised Learning) 방법이 주를 이루고 있다. 이때, 격틀 사전 또는 의미역 주석 정보가 부착된 말뭉치를 구축하는 것은 필수적이지만, 이러한 노력을 최소화하기 위해 본 논문에서는 비모수적 베이지안 모델(Nonparametric Bayesian Model)을 기반으로 서술어에 가능한 의미역을 추론하는 비지도 학습(Unsupervised Learning)을 수행한다.

  • PDF

Bayesian Model based Korean Semantic Role Induction (베이지안 모형 기반 한국어 의미역 유도)

  • Won, Yousung;Lee, Woochul;Kim, Hyungjun;Lee, Yeonsoo
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.111-116
    • /
    • 2016
  • 의미역은 자연어 문장의 서술어와 관련된 논항의 역할을 설명하는 것으로, 주어진 서술어에 대한 논항 인식(Argument Identification) 및 분류(Argument Labeling)의 과정을 거쳐 의미역 결정(Semantic Role Labeling)이 이루어진다. 이를 위해서는 격틀 사전을 이용한 방법이나 말뭉치를 이용한 지도 학습(Supervised Learning) 방법이 주를 이루고 있다. 이때, 격틀 사전 또는 의미역 주석 정보가 부착된 말뭉치를 구축하는 것은 필수적이지만, 이러한 노력을 최소화하기 위해 본 논문에서는 비모수적 베이지안 모델(Nonparametric Bayesian Model)을 기반으로 서술어에 가능한 의미역을 추론하는 비지도 학습(Unsupervised Learning)을 수행한다.

  • PDF

Approximation Method for Failure Rates in a General Event Tree (사건 가지상의 사고율 추정을 위한 근사적인 방법)

  • Yang, Hee Joong
    • Journal of Korean Society of Industrial and Systems Engineering
    • /
    • v.22 no.52
    • /
    • pp.181-189
    • /
    • 1999
  • 사건 가지 상의 파라메터 추정을 위한 베이지안 접근방식이 제시된다. 먼저 일반적인 사건 가지를 따라 발생하는 사고를 예측하기 위한 모형에 대해 설명한다. 이 경우 이론적으로 베이지안 기법을 적용하는 방법에 대해 논하고 실제로 문제를 풀 경우에 발생하는 다차원 수치적분 문제를 다룬다. 감마 분포와 베타분포가 이용될 경우 위 문제를 쉽게 해결할 수 있는 근사적 방법에 대해 연구한다. 또한 사건가지상의 여러 경로가 같은 수준의 사고로 분류 될 수 있는 경우에 대해서도 위와 같은 방법에 관한 연구를 한다. 결과적으로 한 사고율이 여러 개의 파라메터의 함수로 표현되어 다차원의 수치적분이 요구되는 경우 이를 쉽게 해결 할 수 있는 근사적인 방법이 제시되어 베이지안 기법의 적용이 용이해 질 수 있다.

  • PDF

Nonparametric Bayesian Statistical Models in Biomedical Research (생물/보건/의학 연구를 위한 비모수 베이지안 통계모형)

  • Noh, Heesang;Park, Jinsu;Sim, Gyuseok;Yu, Jae-Eun;Chung, Yeonseung
    • The Korean Journal of Applied Statistics
    • /
    • v.27 no.6
    • /
    • pp.867-889
    • /
    • 2014
  • Nonparametric Bayesian (np Bayes) statistical models are popularly used in a variety of research areas because of their flexibility and computational convenience. This paper reviews the np Bayes models focusing on biomedical research applications. We review key probability models for np Bayes inference while illustrating how each of the models is used to answer different types of research questions using biomedical examples. The examples are chosen to highlight the problems that are challenging for standard parametric inference but can be solved using nonparametric inference. We discuss np Bayes inference in four topics: (1) density estimation, (2) clustering, (3) random effects distribution, and (4) regression.

A Study on Anomalous Propagation Echo Identification using Naive Bayesian Classifier (나이브 베이지안 분류기를 이용한 이상전파에코 식별방법에 대한 연구)

  • Lee, Hansoo;Kim, Sungshin
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2016.05a
    • /
    • pp.89-90
    • /
    • 2016
  • Anomalous propagation echo is a kind of abnormal radar signal occurred by irregularly refracted radar beam caused by temperature or humidity. The echo frequently appears in ground-based weather radar. In order to improve accuracy of weather forecasting, it is important to analyze radar data precisely. Therefore, there are several ongoing researches about identifying the anomalous propagation echo all over the world. This paper conducts researches about a classification method which can distinguish anomalous propagation echo in the radar data using naive Bayes classifier and unique attributes of the echo such as reflectivity, altitude, and so on. It is confirmed that the fine classification results are derived by verifying the suggested naive Bayes classifier using actual appearance cases of the echo.

  • PDF