• 제목/요약/키워드: Bayesian Classification

검색결과 253건 처리시간 0.038초

바이러스 핵산중합효소의 아미노산 서열에 의한 바이러스 분류 (Classification of Viruses Based on the Amino Acid Sequences of Viral Polymerases)

  • 남지현;이동훈;이건명;이찬희
    • 미생물학회지
    • /
    • 제43권4호
    • /
    • pp.285-291
    • /
    • 2007
  • 볼티모어의 분류체계에 의하면 바이러스는 복제 및 단백질합성 전략에 따라 6개의 집단으로나눌 수 있다. 몇 종류의 작은 DNA 바이러스를 제외한 대부분의 바이러스는 게놈 복제를 위한 자신의 핵산중합효소를 유전자로 암호화하고 있다. 바이러스 핵산중합효소에는 DNA-의존DNA 중합효수, RNA-의존RNA 중합효소, RNA-의존 DNA 중합효소 세 종류가 있으며, 이들은 모두 4개의 공통된 모티프(motif)를 가진다. 우리는 볼티모어의 분류체계와 바이러스의 핵산중합효소와의 관계를 아미노산 서열을 통해 분자 계통분류학적 분석을 통해 알아보고자 하였다. NCBI GenBank에서 얻은 바이러스 중합효소의 아미노산 서열을 CLUSTAL X 프로그램으로 다중서열하고, Neighbor-joining, Maximum-likelihood, Bayesian의 세 가지 방법으로 계통도를 그려보았다. 미세한 차이는 있었으나, 세 가지 방법 모두에서 볼티모어의 분류법과 일치하는 결과를 보였고, 특이하게도 두 가닥 RNA 바이러스는 숙주의 종류에 따라, (-)RNA 바이러스는 게놈의 절편화에 따라 각각2개의 소집단으로 나뉘어지는 것을 볼 수 있었다.

코바기반 협업지원 의료영상 분석 및 가시화 시스템 (A CORBA-Based Collaborative Work Supported Medical Image Analysis and Visualization System)

  • 전준철;손재기
    • 정보처리학회논문지D
    • /
    • 제10D권1호
    • /
    • pp.109-116
    • /
    • 2003
  • 본 논문에서는 분산환경에서 사용자들에게 효과적인 접근성과 사용성을 제공하는 코바기반 협업 지일 의료영상 분석 덴 가시화 시스템을 소개한다. 개발된 시스템은 분산환경에서 의료영상 분활 및 모델링과 같은 의료영상 분석 및 처리 기능을 제공하며 아울러 의료영상 데이터의 효율적 관리 기능을 제공한다. 영상의 분류 및 특정 세포조직의 추출은 베이지안 방법과 활성 윤곽선 모델등 적용하여 수행되며, 획득된 영상의 특성정보는 의료영상의 실시간 3차원 모델링에 사용된다. 개발된 시스템은 브로드 케스팅과 동기화 메커니즘에 기반하여 시스템을 사용하는 다중 사용자들간의 협동작업을 지원한다. 본 시스템은 분산 프로그램을 지원하는 자바 및 코바에 의해 개발되었으며, 따라서 클라이언트는 분산 객체의 위치나 분산객체가 수행되는 운영체제에 관한 정보가 없이도 메소드 호출방법에 의해 서버 객체에 접근할 수 있다.

나이브 베이지안 분류기를 이용한 이상전파에코 식별방법에 대한 연구 (A Study on Anomalous Propagation Echo Identification using Naive Bayesian Classifier)

  • 이한수;김성신
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 춘계학술대회
    • /
    • pp.89-90
    • /
    • 2016
  • 이상전파에코는 대기 관측을 위해서 사용되는 레이더 전파가 온도나 습도에 의해서 발생하는 이상굴절 신호로, 지상에 설치된 기상레이더에 자주 발생하는 대표적인 비기상에코 중 하나이다. 기상예보의 정확도를 높이기 위해서는 레이더 데이터의 정확한 분석이 요구되기 때문에 전 세계적으로 이상전파에코의 식별 및 제거에 대한 연구가 수행되어 오고 있다. 본 논문에서는 레이더 관측변수인 반사도와 고도 정보와 나이브 베이지안 분류기를 이용하여 이상전파에코를 식별 및 제거하는 방법에 대한 연구를 수행하였다. 실제 이상전파에코 발생 사례를 통하여 구현한 나이브 베이지안 분류기를 검증한 결과, 우수한 정확도를 가지고 분류가 수행되는 것을 확인할 수 있었다.

  • PDF

n-Gram 색인화와 Support Vector Machine을 사용한 스팸메일 필터링에 대한 연구 (A study on the Filtering of Spam E-mail using n-Gram indexing and Support Vector Machine)

  • 서정우;손태식;서정택;문종섭
    • 정보보호학회논문지
    • /
    • 제14권2호
    • /
    • pp.23-33
    • /
    • 2004
  • 인터넷 환경의 급속한 발전으로 인하여 이메일을 통한 메시지 교환은 급속히 증가하고 있다. 그러나 이메일의 편리성에도 불구하고 개인이나 기업에서는 스팸메일로 인한 시간과 비용의 낭비가 크게 증가하고 있다. 이러한 스팸메일에 대한 문제들을 해결하기 위하여 많은 방법들이 연구되고 있으며, 대표적인 방법으로 키워드를 이용한 패턴매칭이나 나이의 베이지안 방식과 같은 확률을 이용한 방법들이 있다. 본 논문에서는 기존의 연구에 대한 문제점을 보완하기 위하여 패턴 분류문제에 있어서 우수한 성능을 보이는 Support Vector Machine을 사용하여 정상적인 메일과 스팸메일을 분류하는 방안을 제시하였으며, 특히 n-Gram을 사용하여 생성된 색인어와 단어사전을 학습데이터 생성에 사용함으로서 효율적인 학습을 수행하도록 하였다. 결론에서는 제안된 방법에 대한 성능을 검증하기 위하여 기존의 연구 결과와 비교함으로서 제안된 방법의 성능을 검증하였다.

Native API 의 효과적인 전처리 방법을 이용한 악성 코드 탐지 방법에 관한 연구 (Malicious Code Detection using the Effective Preprocessing Method Based on Native API)

  • 배성재;조재익;손태식;문종섭
    • 정보보호학회논문지
    • /
    • 제22권4호
    • /
    • pp.785-796
    • /
    • 2012
  • 본 논문에서는 악성코드의 시스템 콜 빈도수를 특징값으로 행위 기반 탐지(behavior-based detection)를 할 때, 시스템 콜의 속성 개수보다 학습데이터 개수가 적더라도 효과적으로 악성 코드를 탐지하는 기법을 제안한다. 이 연구에서는, 프로그램 코드가 동작할 때, 발생시키는 윈도우 커널 데이터인 Native API를 수집하여 빈도수로 정규화한 것을 기본적인 속성 값으로 사용하였다. 또한 악성코드와 정상 코드를 효과적으로 분류할 수 있으면서, 악성코드를 분류하기 위한 기본적인 속성의 개수보다 학습데이터 개수가 적어도 적용 가능한 GLDA(Generalized Linear Discriminant Analysis)를 사용하여, 새로운 속성 값들로 전환하였다. 분류 기법으로는 베이지언 분류법의 일종인 kNN(k-Nearest Neighbor) 분류법을 이용하여 악성 코드를 탐지하였다. 제안된 탐지 기법의 성능을 검증하기 위하여 수집된 Native API 로 기존의 연구 방법과 비교 검증하였다. 본 논문에 제안된 기법이 탐지율(detection rate) 100%인 Threshold 값에서, 다른 탐지 기법보다 낮은 오탐율(false positive rate)을 나타내었다.

New genotype classification and molecular characterization of canine and feline parvoviruses

  • Chung, Hee-Chun;Kim, Sung-Jae;Nguyen, Van Giap;Shin, Sook;Kim, Jae Young;Lim, Suk-Kyung;Park, Yong Ho;Park, BongKyun
    • Journal of Veterinary Science
    • /
    • 제21권3호
    • /
    • pp.43.1-43.13
    • /
    • 2020
  • Background: Canine parvovirus (CPV) and feline panleukopenia (FPV) cause severe intestinal disease and leukopenia. Objectives: In Korea, there have been a few studies on Korean FPV and CPV-2 strains. We attempted to investigate several genetic properties of FPV and CPV-2. Methods: Several FPV and CPV sequences from around world were analyzed by Bayesian phylo-geographical analysis. Results: The parvoviruses strains were newly classified into FPV, CPV 2-I, CPV 2-II, and CPV 2-III genotypes. In the strains isolated in this study, Gigucheon, Rara and Jun belong to the FPV, while Rachi strain belong to CPV 2-III. With respect to CPV type 2, the new genotypes are inconsistent with the previous genotype classifications (CPV-2a, -2b, and -2c). The root of CPV-I strains were inferred to be originated from a USA strain, while the CPV-II and III were derived from Italy strains that originated in the USA. Based on VP2 protein analysis, CPV 2-I included CPV-2a-like isolates only, as differentiated by the change in residue S297A/N. Almost CPV-2a isolates were classified into CPV 2-III, and a large portion of CPV-2c isolates was classified into CPV 2-II. Two residue substitutions F267Y and Y324I of the VP2 protein were characterized in the isolates of CPV 2-III only. Conclusions: We provided an updated insight on FPV and CPV-2 genotypes by molecular-based and our findings demonstrate the genetic characterization according to the new genotypes.

하지근력증강로봇 제어를 위한 착용자의 보행단계구분 (Human Gait-Phase Classification to Control a Lower Extremity Exoskeleton Robot)

  • 김희영
    • 한국통신학회논문지
    • /
    • 제39B권7호
    • /
    • pp.479-490
    • /
    • 2014
  • 하지근력증강로봇은 인간의 하체에 착용하여 보행능력을 강화하거나 보조하기 위한 장비다. 보행능력을 향상하기 위해 로봇은 착용자의 걷는 움직임을 감지하고 이에 적합한 로봇의 동작을 구동한다. 본 논문에서는 로봇이 착용자의 움직임을 감지하는 방법을 소개하고, 감지된 데이터를 착용자의 현재 보행단계를 의미하는 보행단계상태 정보로 변환하는 보행단계구분 알고리즘을 제시한다. 로봇은 보행단계상태 정보에 따라 현재 필요한 제어모드를 결정하고 로봇구동기를 작동하기 때문에 잘못된 정보가 전달된다면 로봇은 착용자의 보행능력을 향상할 수 없거나 착용자에게 오히려 불편을 줄 수 있다. 따라서 보행단계구분 알고리즘은 항상 정확한 정보를 제공할 수 있어야 한다. 하지만 본 연구에서 사용하는 센서장치의 경우 작은 움직임에도 민감하게 반응하는 특성이 있어 센서데이터를 임계기준으로 구분하는 방법으로는 항상 정확한 보행단계상태 정보를 구할 수 없다. 이러한 특성을 극복하면서 정확한 정보를 제공하기 위해 확률적 구분 방법을 응용한 나이브-플렉시블 베이지안 보행단계구분 알고리즘을 제안하였고, 실험을 통해 제안 방법의 정확성을 비교 분석하였다.

Bayesian Approach to Users' Perspective on Movie Genres

  • Lenskiy, Artem A.;Makita, Eric
    • Journal of information and communication convergence engineering
    • /
    • 제15권1호
    • /
    • pp.43-48
    • /
    • 2017
  • Movie ratings are crucial for recommendation engines that track the behavior of all users and utilize the information to suggest items the users might like. It is intuitively appealing that information about the viewing preferences in terms of movie genres is sufficient for predicting a genre of an unlabeled movie. In order to predict movie genres, we treat ratings as a feature vector, apply a Bernoulli event model to estimate the likelihood of a movie being assigned a certain genre, and evaluate the posterior probability of the genre of a given movie by using the Bayes rule. The goal of the proposed technique is to efficiently use movie ratings for the task of predicting movie genres. In our approach, we attempted to answer the question: "Given the set of users who watched a movie, is it possible to predict the genre of a movie on the basis of its ratings?" The simulation results with MovieLens 1M data demonstrated the efficiency and accuracy of the proposed technique, achieving an 83.8% prediction rate for exact prediction and 84.8% when including correlated genres.

로지스틱 회귀 분석을 이용한 스펨 필터링의 특징 축소 (Features Reduction using Logistic Regression for Spam Filtering)

  • 정용규;이범준
    • 한국인터넷방송통신학회논문지
    • /
    • 제10권2호
    • /
    • pp.13-18
    • /
    • 2010
  • 오늘날의 스팸 메일이 메일 서버와 네트워크 저장장치의 대부분을 차지함으로 인해 네트워크 부하와 같은 부정적인 문제가 발생하고 있으며 사용자 입장에서는 스팸을 삭제하기 위한 시간과 자원 소모 같은 문제를 가지고 있다. 자동 스팸 메일 필터링은 문제 해결위한 필수적인 요소로 부각 되었다. 대표적인 방법은 나이브 베이지안 방법과 달리 PCA를 통하여 많은 차원을 가지는 스팸 테이터 집합을 몇 개의 주축으로 차원을 축소 시켜 연차 처리의 부담을 줄이고 특정 집으로 분류를 위한 로지스틱 회귀 분석 방법을 사용하여 스팸 필터링을 하였다. 이를 통하여 속도와 성능 두가지의 성과를 얻을 수 있었다.

Model selection algorithm in Gaussian process regression for computer experiments

  • Lee, Youngsaeng;Park, Jeong-Soo
    • Communications for Statistical Applications and Methods
    • /
    • 제24권4호
    • /
    • pp.383-396
    • /
    • 2017
  • The model in our approach assumes that computer responses are a realization of a Gaussian processes superimposed on a regression model called a Gaussian process regression model (GPRM). Selecting a subset of variables or building a good reduced model in classical regression is an important process to identify variables influential to responses and for further analysis such as prediction or classification. One reason to select some variables in the prediction aspect is to prevent the over-fitting or under-fitting to data. The same reasoning and approach can be applicable to GPRM. However, only a few works on the variable selection in GPRM were done. In this paper, we propose a new algorithm to build a good prediction model among some GPRMs. It is a post-work of the algorithm that includes the Welch method suggested by previous researchers. The proposed algorithms select some non-zero regression coefficients (${\beta}^{\prime}s$) using forward and backward methods along with the Lasso guided approach. During this process, the fixed were covariance parameters (${\theta}^{\prime}s$) that were pre-selected by the Welch algorithm. We illustrated the superiority of our proposed models over the Welch method and non-selection models using four test functions and one real data example. Future extensions are also discussed.