• Title/Summary/Keyword: 군분류 기법

Search Result 193, Processing Time 0.037 seconds

HPV Risk Classification Using Kernel Based Learning (Kernel 기반 학습을 이용한 HPV의 위험군 분류)

  • 정제균;오석준;장병탁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.428-430
    • /
    • 2003
  • 인유두종바이러스(human papillomavirus: HPV)는 감염되었을 때 각종 악성 종양을 유발할 수 있는 작은 DNA 바이러스이다. 고위험군에 속하는 HPV의 감염은 암으로 진행될 수 있는 가능성이 크다. 본 논문은 HPV를 분류할 수 있는 기계 학습 기법을 제안하고자 한다. 제안된 학습 기법은 단백질 서열을 효과적으로 분류할 수 있는 커널(kernel) 방법에 기반을 두고 있다. 위험군 분류는 감염의 메커니즘의 이해와 유전자칩과 같은 새로운 의학 도구의 개발 등에 있어서 중요한 정보를 제공해 줄 수 있다. 실험 결과는 중요한 부위의 탐색에 의한 커널 기반의 학습 방법이 우수한 성능을 보이는 것으로 나타났다.

  • PDF

An Integrated Data Mining Model for Customer Relationship Management (고객관계관리를 위한 데이터마이닝 통합모형에 관한 연구)

  • Song, Im-Young;Oh, R.D.;Yi, T.S.;Shin, K.J.;Kim, K.C.
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10c
    • /
    • pp.154-159
    • /
    • 2006
  • 본 논문은 웹 서버에 의해 자동으로 수집되는 로그 파일로부터 고객 가치 판단 기준을 고객의 행동 기반에 두고 군집화 기법을 이용하여 고객을 세분화하고 세분화 결과에 의사결정나무를 적용함으로써 고객을 분류하는 통합 모형을 제안하였다. 또한, 분류된 고객들의 주 서비스 활용 패턴을 분석하기 위하여 연관규칙기법을 적용하여 고객의 과학기술정보 활용의 연관성을 분석함으로써, 과학정보포털 서비스를 제공하는 사이트 이용자의 분류군에 해당하는 정보와 인터페이스를 제공하는 새로운 방법에 대하여 연구하였다. 고객 관리 측면에서 본 논문은 정보 서비스를 제공하는 웹 사이트의 기존고객을 분류하여 패턴을 분석함으로써 고객 위주의 사이트 운영정책과 동적 인터페이스를 제공하기 위한 웹사이트 활용 방안을 제시하였다. 또한, 고객의 지속적인 관리라 각 고객 분류군별에 안는 서비스를 제공하고 고객의 관리에도 기여할 수 있을 것이다.

  • PDF

Feature Selection and Classification of Web Pages (웹 페이지에서의 자질 선택과 분류)

  • 송무희;임수연;박성배;강동진;이상조
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10a
    • /
    • pp.796-798
    • /
    • 2004
  • 본 논문에서는 웹 문서의 분류 성능을 향상시키기 위해 웹 페이지에서의 자질선택과 그에 따른 웹 문서 분류 방법을 제안한다. 문서 분류에는 문서에 포함된 단어를 분류 자질로 사용하게 되며 이때 한 문서의 모든 단어를 분류 자질로 이용한다고 좋은 성능을 보인다고 보장할 수는 없다. 그러므로 문서에 필요한 단어만을 자동으로 추출하여 문서데이터의 자질을 축소하는 작업이 필요하다. 따라서 본 논문에서는 모집군 내의 자질벡터의 범위가 큰 것을 적은 수의 주요성분으로 감소시키기 위해 통계적 분석 기법중의 하나인 주성분분석 방법을 이용하여 자질감소와 그에 따른 문서분류의 성능 향상을 실험을 통하여 보인다. 야후 스포츠 뉴스 웹 페이지가 분류를 위해 사용되었으며, 분류기로는 Naive Bayesian 분류 방법을 사용하였다. 실험 결과를 통해 본 논문에서 제안한 뉴스 웹페이지 분류 방법이 스포츠 뉴스 데이터 군에서 만족할 만한 분류 정확도를 제공한다는 것을 알 수 있다.

  • PDF

Groundwater Recharge Using New Hydrologic Soil Group to the Island Area (신 수문학적 토양군에 따른 도서지역의 지하수함양량)

  • Lee, Seung-Hyun;Bae, Sang-Keun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2008.05a
    • /
    • pp.1909-1913
    • /
    • 2008
  • 수자원의 공급적인 측면에서 내륙지역에 비하여 불리한 도서지역은 단기간의 가뭄에도 생활용수가 고갈되어 매년 상습적인 식수난을 겪고 있는 상태이다. 전국 3,170개 섬 중 491개 유인도에 831,295명(2003년)이 거주하고 있으나 상수도 보급률은 28.7%에 불과하다(환경부, 2005). 나머지 71.3%의 도서지역 주민들은 간이 급수시설, 우물, 지붕수 등을 생활용수로 이용하고 있다. 이와같이 도서지역은 상수도 보급율이 열악하여 지하수자원에 대한 의존도가 내륙지역에 비하여 높아 지하수자원을 통해 부족한 용수를 공급받아야 할 실정이다. 용수공급을 위한 지하수의 개발을 위해서 무엇보다 선행되어야 할 것은 도서지역의 지하수개발가능량 평가이며 이의 평가를 위해서는 지하수함양량의 파악이 이루어져야 한다. 지하수함양량 산정 기법 중 하나인 NRCS-CN방법은 선행강우조건, 토지피복상태, 수문학적 토양군 등의 인자들에 의해 산정되어진다. 수문학적 토양군의 경우 대부분의 연구에서 정정화 등 (1995)에 의해 분류된 자료가 이용되고 있었으나 최근 정광호 등(2007)에 의하여 수문학적 토양군이 재분류 되었다. 본 연구에서는 NRCS-CN방법을 이용하여 식수난에 어려움을 겪고 있는 우리나라 서남해안의 14개 도서지역에 대하여 수문학적 토양군의 1995년 분류와 2007년 분류를 적용하여 지하수함양량을 산정하고 비교하였다. 1995년 분류와 2007년 분류에서 지하수함양량과 함양률은 개도, 생일도, 보길도를 제외한 도서지역은 1%미만의 차이로 변화가 거의 없는 것으로 나타났다. 개도, 생일도, 보길도는 1995년 분류에 비하여 2007년 분류에서 $2.2%{\sim}2.8%$ 감소하였다. 따라서 대상지역의 수문학적토양군의 재분류에 의한 지하수함양량 및 함양률의 차이가 미미함을 알 수 있었다. 연평균 함양량은 1995년 분류와 2007년 분류에서 수도가 590.8mm, 583.5mm로 최대값을 가지며 가파도가 270.2mm, 270.5mm로 최소값을 가지는 것으로 나타났다. 함양률의 경우 1995년 분류에서는 개도가 29.8%의 최대값을 나타내었고 가파도가 23.3%의 최소값을 가지는 것으로 나타났으며 2007년 분류에서는 사량도 상도가 28.5%의 최대값을 나타내었고 가파도가 23.3%의 최소값으로나타났다.

  • PDF

The Application of Genetic Algorithm for the Identification of Discontinuity Sets (불연속면 군 분류를 위한 유전자알고리즘의 응용)

  • Sunwoo Choon;Jung Yong-Bok
    • Tunnel and Underground Space
    • /
    • v.15 no.1 s.54
    • /
    • pp.47-54
    • /
    • 2005
  • One of the standard procedures of discontinuity survey is the joint set identification from the population of field orientation data. Discontinuity set identification is fundamental to rock engineering tasks such as rock mass classification, discrete element analysis, key block analysis. and discrete fracture network modeling. Conventionally, manual method using contour plot had been widely used for this task, but this method has some short-comings such as yielding subjective identification results, manual operations, and so on. In this study, the method of discontinuity set identification using genetic algorithm was introduced, but slightly modified to handle the orientation data. Finally, based on the genetic algorithm, we developed a FORTRAN program, Genetic Algorithm based Clustering(GAC) and applied it to two different discontinuity data sets. Genetic Algorithm based Clustering(GAC) was proved to be a fast and efficient method for the discontinuity set identification task. In addition, fitness function based on variance showed more efficient performance in finding the optimal number of clusters when compared with Davis - Bouldin index.

Distribution and Conservation plan of Vascular Plants in Outstanding Forest Wetlands in Jeonnam Area (전남권역 우량 산림습원의 관속식물상 변화 및 보전방안)

  • Lee, Jong-Won;Yun, Ho-Geun;Kang, Shin-Ho;An, Jong-Bin
    • Journal of Wetlands Research
    • /
    • v.24 no.4
    • /
    • pp.224-255
    • /
    • 2022
  • This study was carried out to examine the changes in vascular flora in the first and second surveys targeting 32 outstanding forest wetlands in Jeonnam area including Gwangju metropolitan city, and based on this, establish a future monitoring system and effectively manage the excellent forest wetlands. The survey investigated the area seasonally every 4-5 years from 2015 to 2021. The change of flora of 32 excellent forest wetlands in Jeollanam-do increased from 103 families, 311 genera, 496 species, 16 subspecies, 38 varieties, 6 varieties, 556 taxa, to 111 families, 362 genera, 599 species, 16 subspecies, 51 varieties, 8 varieties, 674 taxa. Remarkable plants such as Red list and plants endemic to the Korean Peninsula increased also. However, Nepeta cataria and the like are exterminated locally, so an in situ and ex situ conservation strategy must be established. In the case of plants categorized according to wetland preference, the distribution ratio of such wetland plants slightly decreased and the distribution ratio of such terrestrial plants lightly increased for absolute wetland plants. It is necessary to prepare countermeasures for the terrestrialization of forest wetlands and to develop research techniques that can distinguish boundaries. In addition, the forest wetland should be systematically managed and supervised by designating it as a Forest Genetic Resources Reserve that can effectively conserve it.

Group Classification on Management Behavior of Diabetic Mellitus (당뇨 환자의 관리행태에 대한 군집 분류)

  • Choi, Soon-Ho
    • Proceedings of the KAIS Fall Conference
    • /
    • 2010.11b
    • /
    • pp.759-762
    • /
    • 2010
  • 본 연구는 당뇨인지환자들의 당뇨 조절에 관계되는 요인들을 포괄적으로 반영하는 집단으로 분류한 후 이를 기반으로 보다 효율적인 당뇨관리사업을 할 수 있는 기초자료를 제공하기 위해 수행되었다. 연구를 위해 2007년, 2008년도 국민건강영양조사를 통해 검진에 참여한 당뇨인지환자 666명의 자료를 수집하여 분석하였다. 당뇨인지환자의 관리행태에 대한 군집분류는 K-means 기법을 이용하였다. 당뇨인지환자의 군집은 건강행태사업 대상군, 중점관리사업 대상군, 합병증검사사업 대상군으로 분류되었다. 당뇨 조절율을 높이기 위해서는 각 군집의 특성에 따라 보다 특화된 당뇨관리 프로그램이 적용되어야 할 것이다.

  • PDF

A Study on Efficient Topography Classification of High Resolution Satelite Image (고해상도 위성영상의 효율적 지형분류기법 연구)

  • Lim, Hye-Young;Kim, Hwang-Soo;Choi, Joon-Seog;Song, Seung-Ho
    • Journal of Korean Society for Geospatial Information Science
    • /
    • v.13 no.3 s.33
    • /
    • pp.33-40
    • /
    • 2005
  • The aim of remotely sensed data classification is to produce the best accuracy map of the earth surface assigning each pixel to its appropriate category of the real-world. The classification of satellite multi-spectral image data has become tool for generating ground cover map. Many classification methods exist. In this study, MLC(Maximum Likelihood Classification), ANN(Artificial neural network), SVM(Support Vector Machine), Naive Bayes classifier algorithms are compared using IKONOS image of the part of Dalsung Gun, Daegu area. Two preprocessing methods are performed-PCA(Principal component analysis), ICA(Independent Component Analysis). Boosting algorithms also performed. By the combination of appropriate feature selection pre-processing and classifier, the best results were obtained.

  • PDF

BERT-based Two-Stage Classification Models for Alzheimer's Disease and Schizophrenia Diagnosis (BERT 기반 2단계 분류 모델을 이용한 알츠하이머병 치매와 조현병 진단)

  • Jung, Min-Kyo;Na, Seung-Hoon;Kim, Ko Woon;Shin, Byong-Soo;Chung, Young-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.558-563
    • /
    • 2021
  • 알츠하이머병 치매와 조현병 진단을 위한 2단계 분류 모델을 제안한다. 정상군과 환자군의 발화에 나타난 페어 언어 모델 간의 Perplexity 차이에 기반한 분류와 기존 단일 BERT 모델의 미세조정(fine-tuning)을 이용한 분류의 통합을 시도하였다. Perplexity 기반의 분류 성능이 알츠하이머병, 조현병 모두 우수한 결과를 보임을 확인 하였고, 조현병 분류 모델의 성능이 소폭 증가하였다. 향후 설명 가능한 인공지능 기법을 적용에 따른 성능 향상을 기대할 수 있었다.

  • PDF

Phylogenetic Relationships of Morus Species on the Basis of RAPD (RAPD를 이용한 뽕나무속 식물의 유전적 유연관계 분석)

  • 성규병;남학우;구태원
    • Journal of Sericultural and Entomological Science
    • /
    • v.44 no.2
    • /
    • pp.59-63
    • /
    • 2002
  • Phylogenetic relationships among mulberry varieties (Morus species) were analyzed on the basis of RAPD in order to identify the possibility of classification for the species. Polymorphisms under RAPD method were compared among 41 mulberry varieties. From the results of RAPD for 41 mulberry varieties by use of 30 different primers, 151 polymorphic bands were formed out of 201 ones. Under the dendrogram based on cluster analysis with the polymorphic bands, the varieties were classified into 7 groups including two large and five small ones on 0.747 value of genetic similarity coefficient. In the large groups 19 and 16 varieties were belong to group I and III, respectively. On the other hand, relatively high genetic similarity was shown among the varieties belonging to the group I, II and III. While, relatively low similarity were done between them in the group IV-Ⅵ and the other groups, and Mohusang in the group Ⅶ showed the lowest phylogenetic relationship with the other varieties.