• Title/Summary/Keyword: 분류 알고리즘

Search Result 3,132, Processing Time 0.031 seconds

Bayesian Automatic Document Categorization Using Apriori-Genetic Algorithm (Apriori-Genetic 알고리즘을 이용한 베이지안 자동 문서 분류)

  • Go, Su-Jeong;Lee, Jeong-Hyeon
    • The KIPS Transactions:PartB
    • /
    • v.8B no.3
    • /
    • pp.251-260
    • /
    • 2001
  • 기존의 베이지안 문서 분류는 문서의 특징 표현에 있어서 단어간의 의미를 정확하게 반영하지 못하는 문제점이 있다. 이러한 문제점을 해결하기 위해, 본 논문에서는 Apriori-Genetic 알고리즘을 이용한 베이지안 문서 분류 방법을 제안한다. Apriori 알고리즘은 단어간의 의미를 반영한 연관 단어의 형태로 문서의 특징을 추출하며 추출된 연관 단어로 연관 단어 지식베이스를 구축한다. Aprrori 알고리즘만으로 연관 단어 지식베이스를 구축할 경우, 지식베이스 안에 부적당한 연관 단어가 포함된다. 따라서 문서 분류의 정확도가 낮아지는 단점이 있다. 이러한 단점을 보완하기 위해, Genetic 알고리즘을 이용하여 연관 단어 지식베이스를 최적화하는 방법을 사용한다. 베이지안 확률을 이용하는 분류자는 최적화된 연관 단어 지식베이스를 기반으로 문서를 클래스별로 분류한다. Apriori-Genetic 알고리즘을 이용한 베이지안 문서 분류의 성능을 평가하기 위해, Apriori 알고리즘을 이용한 베이지안 문서 분류 방법, 역문헌빈도를 사용한 베이지안 문서 분류 방법, 기존의 단순 베이지안 분류 방법과 비교하였다.

  • PDF

Integrating Classification Method using PCM Algorithm and Bayesian Method (PCM 알고리즘과 베이시안 분류의 통합기법)

  • 전영준;김진일
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.790-792
    • /
    • 2004
  • 본 논문은 PCM(Possibilistic C-Means) 알고리즘과 베이시안 분류 알고리즘을 통합한 고해상도 위성영상의 효과적인 분류방법을 제안하였다. 제안된 알고리즘은 학습데이터를 참고로 하여 PCM 알고리즘을 반복적인 과정 없이 수행한다. 각 분류항목별로 분류된 데이터에서 평균내부거리 내부에 해당되는 데이터들을 선정하여 각 항목별 비율을 구한 후 베이시안 분류기법의 사전확률로 적용하여 분류를 수행한다 PCM 알고리즘은 각 데이터와 특정 클러스터와의 거리에 소속도를 부여하는 퍼지 C-Means 알고리즘과 달리 소속도를 각 데이터와 클러스터 중심간의 절대거리에 의존하는 방법으로 퍼지 C-Means 알고리즘이 가지는 상대성 문제를 해결하였다. 제안된 분류 기법을 고해상도 다중분광 데이터인 IKONOS 위성영상에 적용하여 분류를 수행한 후 최대우도 분류기법과 비교한다.

  • PDF

Classification System Model Design for Algorithm Education for Elementary and Secondary Students (초중등학생 대상 알고리즘 교육을 위한 분류체계 모형 설계)

  • Lee, Young-ho;Koo, Duk-hoi
    • Journal of The Korean Association of Information Education
    • /
    • v.21 no.3
    • /
    • pp.297-307
    • /
    • 2017
  • The purpose of this study is to propose algorithm classification system for algorithm education for Elementary and Secondary Students. We defines the components of the algorithm and expresses the algorithm classification system by the analysis synthesis method. The contents of the study are as follows. First, we conducted a theoretical search on the classification purpose and classification. Second, the contents and limitations of the classification system for the proposed algorithm contents were examined. In addition, we examined the contents and selection criteria of algorithms used in algorithm education research. Third, the algorithm components were redefined using the core idea and crosscutting concept proposed by the NRC. And the crosscutting concept of algorithm is subdivided into algorithm data structure and algorithm design strategy, and its contents are presented using analytic synthesis classification scheme. Finally, the validity of the proposed contents was verified by the review of the expert group. It is expected that the study on the algorithm classification system will provide many implications for the contents selection and training method in the algorithm education.

New Automatic Taxonomy Generation Algorithm for the Audio Genre Classification (음악 장르 분류를 위한 새로운 자동 Taxonomy 구축 알고리즘)

  • Choi, Tack-Sung;Moon, Sun-Kook;Park, Young-Cheol;Youn, Dae-Hee;Lee, Seok-Pil
    • The Journal of the Acoustical Society of Korea
    • /
    • v.27 no.3
    • /
    • pp.111-118
    • /
    • 2008
  • In this paper, we propose a new automatic taxonomy generation algorithm for the audio genre classification. The proposed algorithm automatically generates hierarchical taxonomy based on the estimated classification accuracy at all possible nodes. The estimation of classification accuracy in the proposed algorithm is conducted by applying the training data to classifier using k-fold cross validation. Subsequent classification accuracy is then to be tested at every node which consists of two clusters by applying one-versus-one support vector machine. In order to assess the performance of the proposed algorithm, we extracted various features which represent characteristics such as timbre, rhythm, pitch and so on. Then, we investigated classification performance using the proposed algorithm and previous flat classifiers. The classification accuracy reaches to 89 percent with proposed scheme, which is 5 to 25 percent higher than the previous flat classification methods. Using low-dimensional feature vectors, in particular, it is 10 to 25 percent higher than previous algorithms for classification experiments.

Pattern Classification of Multi-Spectral Satellite Images based on Fusion of Fuzzy Algorithms (퍼지 알고리즘의 융합에 의한 다중분광 영상의 패턴분류)

  • Jeon, Young-Joon;Kim, Jin-Il
    • Journal of KIISE:Software and Applications
    • /
    • v.32 no.7
    • /
    • pp.674-682
    • /
    • 2005
  • This paper proposes classification of multi-spectral satellite image based on fusion of fuzzy G-K (Gustafson-Kessel) algorithm and PCM algorithm. The suggested algorithm establishes the initial cluster centers by selecting training data from each category, and then executes the fuzzy G-K algorithm. PCM algorithm perform using classification result of the fuzzy G-K algorithm. The classification categories are allocated to the corresponding category when the results of classification by fuzzy G-K algorithm and PCM algorithm belong to the same category. If the classification result of two algorithms belongs to the different category, the pixels are allocated by Bayesian maximum likelihood algorithm. Bayesian maximum likelihood algorithm uses the data from the interior of the average intracluster distance. The information of the pixels within the average intracluster distance has a positive normal distribution. It improves classification result by giving a positive effect in Bayesian maximum likelihood algorithm. The proposed method is applied to IKONOS and Landsat TM remote sensing satellite image for the test. As a result, the overall accuracy showed a better outcome than individual Fuzzy G-K algorithm and PCM algorithm or the conventional maximum likelihood classification algorithm.

Genetic Algorithm for Designing the Optimal Fuzzy Rule-base Systems (최적 퍼지 룰 베이스 시스템의 설계를 위한 유전 알고리즘)

  • Kim, Dong-Hun;Kim, Jong-Ryul
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2008.05a
    • /
    • pp.772-775
    • /
    • 2008
  • 본 논문은 퍼지 분류 시스템을 위한 퍼지 규칙베이스에 대한 최적화 해법으로서 유전 알고리즘에 대해 살펴본다. 즉 퍼지 규칙베이스를 이용하는 퍼지 분류 시스템을 최적화를 하는 유전 알고리즘을 제안한다. 제안하는 유전 알고리즘은 분류 성능을 보다 더 향상시키기 위해서 인식에 사용된 규칙에 대한 확실성 정도를 개선하는 방법을 포함한다. 본 논문에서 다루는 최적화는 추출되는 퍼지 규칙의 수와 퍼지 분류 시스템의 입력 패턴을 정확하게 분류하는 지에 대한 성능을 포괄적으로 수행하는 것을 의미한다. 마지막으로 본 논문에서 제안하는 유전 알고리즘을 이용하여 수치실험을 수행하고 그 결과를 통해 제안하는 알고리즘의 유효성과 효율성을 생성된 퍼지 규칙의 수와 퍼지 분류 시스템의 성능의 관점에서 논의한다.

  • PDF

Design of Optimal Fuzzy Rule-base Systems with Genetic Algorithm (유전알고리즘을 이용한 최적퍼지 규칙베이스 시스템의 설계)

  • Kim, Jong-Ryul
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.10c
    • /
    • pp.439-442
    • /
    • 2007
  • 본 논문은 퍼지 분류를 위한 퍼지 규칙베이스 시스템에 대한 최적화 해법으로서 유전 알고리즘에 대해 살펴본다. 즉 퍼지 규칙베이스를 이용하는 퍼지 분류 시스템을 최적화률 하는 유전 알고리즘을 제안한다. 본 논문에서 다루는 최적화는 추출되는 퍼지 규칙의 수와 퍼지 분류 시스템의 입력 패턴을 정확하게 분류하는 지에 대한 성능을 포괄적으로 수행하는 것을 의미한다. 마지막으로 본 논문에서 제안하는 유전 알고리즘을 이용하여 수치실험을 수행하고 그 결과를 통해 제안하는 알고리즘의 유효성과 효율성을 생성된 퍼지 규칙의 수와 퍼지 분류 시스템의 성능의 관점에서 논의한다.

  • PDF

분류 알고리즘에 대한 경험적 비교연구

  • 전홍석;이주영
    • Proceedings of the Safety Management and Science Conference
    • /
    • 2000.05a
    • /
    • pp.411-422
    • /
    • 2000
  • 본 연구에서는 결정트리 분야에서 각 분류알고리즘을 살펴보고 통계학의 판별분석과 기계학습(Machine Learning)분야에서 분류알고리즘을 비교하고, 자료에 따라 오분류율을 분석 하였다.

  • PDF

Accelerating the EM Algorithm through Selective Sampling for Naive Bayes Text Classifier (나이브베이즈 문서분류시스템을 위한 선택적샘플링 기반 EM 가속 알고리즘)

  • Chang Jae-Young;Kim Han-Joon
    • The KIPS Transactions:PartD
    • /
    • v.13D no.3 s.106
    • /
    • pp.369-376
    • /
    • 2006
  • This paper presents a new method of significantly improving conventional Bayesian statistical text classifier by incorporating accelerated EM(Expectation Maximization) algorithm. EM algorithm experiences a slow convergence and performance degrade in its iterative process, especially when real online-textual documents do not follow EM's assumptions. In this study, we propose a new accelerated EM algorithm with uncertainty-based selective sampling, which is simple yet has a fast convergence speed and allow to estimate a more accurate classification model on Naive Bayesian text classifier. Experiments using the popular Reuters-21578 document collection showed that the proposed algorithm effectively improves classification accuracy.

CS-RANSAC Algorithm using Machine Learning Technique (머신러닝 기법올 적용한 CS-RANSAC 알고리즘)

  • Ko, Seunghyun;Yoon, Ui-Nyoung;Alikhanov, Jumabek;Jo, Geun-Sik
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2016.10a
    • /
    • pp.632-635
    • /
    • 2016
  • 증강현실에서 영상과 증강된 콘텐츠 간의 이질감을 줄이기 위해서 정확한 호모그래피 행렬을 추정해야 하며, 정확한 호모그래피 행렬을 추정할때 RANSAC 알고리즘이 널리 사용된다. 그러나 RANSAC 알고리즘은 랜덤 샘플링 과정을 반복적으로 거치기 때문에 불필요한 연산 과정이 발생하고 이로 인해 알고리즘의 효율이 저하된다. 이러한 단점을 극복하기 위해 DCS-RANSAC 알고리즘이 제안되었다. 제안된 DCS-RANSAC 알고리즘은 이미지를 특징점 분포 패턴에 따라 그룹으로 분류하고 각 그룹에 제약조건 문제를 적용하여 불필요한 연산 과정을 줄이고 정확도를 향상시킨 알고리즘이다. 그러나 DCS-RANSAC 알고리즘에서 사용된 이미지 그룹 데이터는 수동적인 방법을 통해 직관적으로 분류되어 있지만 특징점 분포 패턴이 다양하지 않아 분류시 정확도가 저하되는 경우가 있다. 위의 문제점을 해결하기 위해 본 논문에서는 머신러닝 기법을 통해 이미지들을 자동으로 분류하고 각 그룹마다 각기 다른 제약조건을 적용하는 MCS-RANSAC 알고리즘을 제안한다. 제안하는 알고리즘은 머신러닝 기법을 사용하여 전처리 단계에서 이미지를 분류하고 분류된 이미지에 제약조건을 적용시켜 알고리즘의 처리시간을 줄이고 정확도를 향상시켰다. 실험 결과 본 논문에서 제안하는 MCS-RANSAC은 DCS-RANSAC 알고리즘에 비해 수행시간이 약 6% 단축되었고 호모그래피 오차율은 약 15% 줄어들었으며 참정보 비율은 2.8% 증가한 것으로 확인되었다.