• 제목/요약/키워드: 군분류 기법

검색결과 193건 처리시간 0.057초

Kernel 기반 학습을 이용한 HPV의 위험군 분류 (HPV Risk Classification Using Kernel Based Learning)

  • 정제균;오석준;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.428-430
    • /
    • 2003
  • 인유두종바이러스(human papillomavirus: HPV)는 감염되었을 때 각종 악성 종양을 유발할 수 있는 작은 DNA 바이러스이다. 고위험군에 속하는 HPV의 감염은 암으로 진행될 수 있는 가능성이 크다. 본 논문은 HPV를 분류할 수 있는 기계 학습 기법을 제안하고자 한다. 제안된 학습 기법은 단백질 서열을 효과적으로 분류할 수 있는 커널(kernel) 방법에 기반을 두고 있다. 위험군 분류는 감염의 메커니즘의 이해와 유전자칩과 같은 새로운 의학 도구의 개발 등에 있어서 중요한 정보를 제공해 줄 수 있다. 실험 결과는 중요한 부위의 탐색에 의한 커널 기반의 학습 방법이 우수한 성능을 보이는 것으로 나타났다.

  • PDF

고객관계관리를 위한 데이터마이닝 통합모형에 관한 연구 (An Integrated Data Mining Model for Customer Relationship Management)

  • 송임영;오염덕;이태석;신기정;김경창
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (C)
    • /
    • pp.154-159
    • /
    • 2006
  • 본 논문은 웹 서버에 의해 자동으로 수집되는 로그 파일로부터 고객 가치 판단 기준을 고객의 행동 기반에 두고 군집화 기법을 이용하여 고객을 세분화하고 세분화 결과에 의사결정나무를 적용함으로써 고객을 분류하는 통합 모형을 제안하였다. 또한, 분류된 고객들의 주 서비스 활용 패턴을 분석하기 위하여 연관규칙기법을 적용하여 고객의 과학기술정보 활용의 연관성을 분석함으로써, 과학정보포털 서비스를 제공하는 사이트 이용자의 분류군에 해당하는 정보와 인터페이스를 제공하는 새로운 방법에 대하여 연구하였다. 고객 관리 측면에서 본 논문은 정보 서비스를 제공하는 웹 사이트의 기존고객을 분류하여 패턴을 분석함으로써 고객 위주의 사이트 운영정책과 동적 인터페이스를 제공하기 위한 웹사이트 활용 방안을 제시하였다. 또한, 고객의 지속적인 관리라 각 고객 분류군별에 안는 서비스를 제공하고 고객의 관리에도 기여할 수 있을 것이다.

  • PDF

웹 페이지에서의 자질 선택과 분류 (Feature Selection and Classification of Web Pages)

  • 송무희;임수연;박성배;강동진;이상조
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.796-798
    • /
    • 2004
  • 본 논문에서는 웹 문서의 분류 성능을 향상시키기 위해 웹 페이지에서의 자질선택과 그에 따른 웹 문서 분류 방법을 제안한다. 문서 분류에는 문서에 포함된 단어를 분류 자질로 사용하게 되며 이때 한 문서의 모든 단어를 분류 자질로 이용한다고 좋은 성능을 보인다고 보장할 수는 없다. 그러므로 문서에 필요한 단어만을 자동으로 추출하여 문서데이터의 자질을 축소하는 작업이 필요하다. 따라서 본 논문에서는 모집군 내의 자질벡터의 범위가 큰 것을 적은 수의 주요성분으로 감소시키기 위해 통계적 분석 기법중의 하나인 주성분분석 방법을 이용하여 자질감소와 그에 따른 문서분류의 성능 향상을 실험을 통하여 보인다. 야후 스포츠 뉴스 웹 페이지가 분류를 위해 사용되었으며, 분류기로는 Naive Bayesian 분류 방법을 사용하였다. 실험 결과를 통해 본 논문에서 제안한 뉴스 웹페이지 분류 방법이 스포츠 뉴스 데이터 군에서 만족할 만한 분류 정확도를 제공한다는 것을 알 수 있다.

  • PDF

신 수문학적 토양군에 따른 도서지역의 지하수함양량 (Groundwater Recharge Using New Hydrologic Soil Group to the Island Area)

  • 이승현;배상근
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2008년도 학술발표회 논문집
    • /
    • pp.1909-1913
    • /
    • 2008
  • 수자원의 공급적인 측면에서 내륙지역에 비하여 불리한 도서지역은 단기간의 가뭄에도 생활용수가 고갈되어 매년 상습적인 식수난을 겪고 있는 상태이다. 전국 3,170개 섬 중 491개 유인도에 831,295명(2003년)이 거주하고 있으나 상수도 보급률은 28.7%에 불과하다(환경부, 2005). 나머지 71.3%의 도서지역 주민들은 간이 급수시설, 우물, 지붕수 등을 생활용수로 이용하고 있다. 이와같이 도서지역은 상수도 보급율이 열악하여 지하수자원에 대한 의존도가 내륙지역에 비하여 높아 지하수자원을 통해 부족한 용수를 공급받아야 할 실정이다. 용수공급을 위한 지하수의 개발을 위해서 무엇보다 선행되어야 할 것은 도서지역의 지하수개발가능량 평가이며 이의 평가를 위해서는 지하수함양량의 파악이 이루어져야 한다. 지하수함양량 산정 기법 중 하나인 NRCS-CN방법은 선행강우조건, 토지피복상태, 수문학적 토양군 등의 인자들에 의해 산정되어진다. 수문학적 토양군의 경우 대부분의 연구에서 정정화 등 (1995)에 의해 분류된 자료가 이용되고 있었으나 최근 정광호 등(2007)에 의하여 수문학적 토양군이 재분류 되었다. 본 연구에서는 NRCS-CN방법을 이용하여 식수난에 어려움을 겪고 있는 우리나라 서남해안의 14개 도서지역에 대하여 수문학적 토양군의 1995년 분류와 2007년 분류를 적용하여 지하수함양량을 산정하고 비교하였다. 1995년 분류와 2007년 분류에서 지하수함양량과 함양률은 개도, 생일도, 보길도를 제외한 도서지역은 1%미만의 차이로 변화가 거의 없는 것으로 나타났다. 개도, 생일도, 보길도는 1995년 분류에 비하여 2007년 분류에서 $2.2%{\sim}2.8%$ 감소하였다. 따라서 대상지역의 수문학적토양군의 재분류에 의한 지하수함양량 및 함양률의 차이가 미미함을 알 수 있었다. 연평균 함양량은 1995년 분류와 2007년 분류에서 수도가 590.8mm, 583.5mm로 최대값을 가지며 가파도가 270.2mm, 270.5mm로 최소값을 가지는 것으로 나타났다. 함양률의 경우 1995년 분류에서는 개도가 29.8%의 최대값을 나타내었고 가파도가 23.3%의 최소값을 가지는 것으로 나타났으며 2007년 분류에서는 사량도 상도가 28.5%의 최대값을 나타내었고 가파도가 23.3%의 최소값으로나타났다.

  • PDF

불연속면 군 분류를 위한 유전자알고리즘의 응용 (The Application of Genetic Algorithm for the Identification of Discontinuity Sets)

  • 선우춘;정용복
    • 터널과지하공간
    • /
    • 제15권1호
    • /
    • pp.47-54
    • /
    • 2005
  • 암반 불연속면의 조사 및 분석 과정에서 거쳐야할 필수적인 단계 중 하나는 방대한 불연속면 자료로부터 군을 판별하는 것이다. 불연속면 군 분류는 암반분류, 키블록 해석. 개별요소해석 및 불연속연결망 생성과 같은 암반공학적 업무에 있어서 필수적이다. 일반적으로 등고선도를 이용한 수작업 군 분류가 적용되었으나 이 방법은 수작업에 의존한 주관적인 결과를 제공한다는 단점이 있다. 본 연구에서는 유전자알고리즘을 이용한 불연속면 군 분석기법을 도입하였으며 방향성 자료에 적용하기 위해 기본적인 유전자알고리즘을 변경하였다. 최종적으로 이러한 이론을 적용한 FORTRAN 프로그램 GAC를 개발하였으며 두 가지 형태의 불연속면 자료의 군 분석에 적용하였다. 적용 결과 GAC를 적용한 군 분류는 빠르고 효율적인 군 분석방법임을 확인하였으며 최적의 불연속면 군 수를 결정하는 데 있어서 분산에 근거한 적합도 함수가 Davis-Bouldin 지수에 근거한 적합도 함수보다 효율적인 것으로 나타났다.

전남권역 우량 산림습원의 관속식물상 변화 및 보전방안 (Distribution and Conservation plan of Vascular Plants in Outstanding Forest Wetlands in Jeonnam Area)

  • 이종원;윤호근;강신호;안종빈
    • 한국습지학회지
    • /
    • 제24권4호
    • /
    • pp.224-255
    • /
    • 2022
  • 본 연구는 전남권역 우량 산림습원 32개소를 대상으로 1차 조사와 2차 조사에서의 관속식물상 변화를 살펴보고, 이를 바탕으로 우량 산림습원의 향후 모니터링 체계구축과 효과적인 관리를 진행하고자 수행되었다. 조사는 2015년부터 2021년까지 조사지역을 4-5년 주기로 계절별로 2회 이상 조사를 실시하였다. 전남권역 우량 산림습원 32개소의 식물상 변화는 103과 311속 496종 16아종 38변종 6품종 556분류군에서 111과 362속 599종 16아종 51변종 8품종 674분류군으로 증가하였다. 한반도 특산식물은 12분류군에서 16분류군, 한반도 관속식물 적색목록은 18분류군에서 24분류군, 식물구계학적 특정식물은 95분류군에서 123분류군, 한반도 석호식물은 286분류군에서 328분류군, 침입외래식물은 17분류군에서 26분류군으로 전체 식물상이 증가함에 따라 특기할만한 식물도 동시에 증가하였다. 하지만 느리미고사리, 나도고사리삼, 개쓴풀, 개박하 등은 지역적으로 절멸하여 현지 내외 복원 전략이 수립되어야 한다. 습지선호도에 따른 유형이 구분된 식물은 절대습지식물은 69분류군에서 78분류군, 임의습지식물은 63분류군에서 69분류군, 양생식물은 64분류군에서 82분류군, 임의육상식물은 85분류군에서 96분류군, 절대육상식물은 275분류군에서 348분류군으로 확인되었다. 습지식물류의 분포 비율은 약간 감소하고 육상식물의 분포 비율은 다소 증가하여 산림습원 육화에 대한 대책을 마련하고 경계를 구분할 수 있는 조사기법 등을 개발되어야한다. 그리고 산림습원을 효과적으로 보전할 수 있는 산림유전자원보호구역으로 확대 지정하여 체계적으로 관리·감독해야 한다.

당뇨 환자의 관리행태에 대한 군집 분류 (Group Classification on Management Behavior of Diabetic Mellitus)

  • 최순호
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2010년도 추계학술발표논문집 2부
    • /
    • pp.759-762
    • /
    • 2010
  • 본 연구는 당뇨인지환자들의 당뇨 조절에 관계되는 요인들을 포괄적으로 반영하는 집단으로 분류한 후 이를 기반으로 보다 효율적인 당뇨관리사업을 할 수 있는 기초자료를 제공하기 위해 수행되었다. 연구를 위해 2007년, 2008년도 국민건강영양조사를 통해 검진에 참여한 당뇨인지환자 666명의 자료를 수집하여 분석하였다. 당뇨인지환자의 관리행태에 대한 군집분류는 K-means 기법을 이용하였다. 당뇨인지환자의 군집은 건강행태사업 대상군, 중점관리사업 대상군, 합병증검사사업 대상군으로 분류되었다. 당뇨 조절율을 높이기 위해서는 각 군집의 특성에 따라 보다 특화된 당뇨관리 프로그램이 적용되어야 할 것이다.

  • PDF

고해상도 위성영상의 효율적 지형분류기법 연구 (A Study on Efficient Topography Classification of High Resolution Satelite Image)

  • 임혜영;김황수;최준석;송승호
    • 대한공간정보학회지
    • /
    • 제13권3호
    • /
    • pp.33-40
    • /
    • 2005
  • 위성영상에서 실제 지표면의 형태와 지상물체를 구분하여 분류하는 것은 원격탐사의 중요한 목적중의 하나이다. 다중분광영상을 이용한 분류는 일반적인 토지피복도의 제작에 이용되어지고 있으며 영상분류의 방법에는 많은 이론들이 사용되어지고 있다. 본 연구는 대구 달성군 지역의 IKONOS 영상을 MLC(Maximum Likelihood Classification), ANN(Artificial neural network), SVM(Support Vector Machine), Naive Bayes 분류기법들을 이용하여 각각의 분류정확도를 비교 분석하였다. 또한 PCA/ICA 전처리 과정을 거친 분류기법들 결과와, Boosting 알고리즘 과정을 거친 후의 결과를 비교하였다. 본 연구의 목적은 적절한 전처리과정과 분류기법을 수행함으로써 가장 효율적인 지형분류 방법을 획득하는데 그 목적이 있다.

  • PDF

BERT 기반 2단계 분류 모델을 이용한 알츠하이머병 치매와 조현병 진단 (BERT-based Two-Stage Classification Models for Alzheimer's Disease and Schizophrenia Diagnosis)

  • 정민교;나승훈;김고운;신병수;정영철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.558-563
    • /
    • 2021
  • 알츠하이머병 치매와 조현병 진단을 위한 2단계 분류 모델을 제안한다. 정상군과 환자군의 발화에 나타난 페어 언어 모델 간의 Perplexity 차이에 기반한 분류와 기존 단일 BERT 모델의 미세조정(fine-tuning)을 이용한 분류의 통합을 시도하였다. Perplexity 기반의 분류 성능이 알츠하이머병, 조현병 모두 우수한 결과를 보임을 확인 하였고, 조현병 분류 모델의 성능이 소폭 증가하였다. 향후 설명 가능한 인공지능 기법을 적용에 따른 성능 향상을 기대할 수 있었다.

  • PDF

RAPD를 이용한 뽕나무속 식물의 유전적 유연관계 분석 (Phylogenetic Relationships of Morus Species on the Basis of RAPD)

  • 성규병;남학우;구태원
    • 한국잠사곤충학회지
    • /
    • 제44권2호
    • /
    • pp.59-63
    • /
    • 2002
  • 본 연구에서는 형태적인 특성에 의해 분류가 이루어져, 객관성이 부족한 뽕나무를 대상으로 분자생물학적인 기법을 활용하여 유연관계를 분석하여 뽕나무 품종분류의 기초자료를 얻기 위하여 본 실험을 수행하였다. 30개의 primer를 이용하여 41개의 뽕나무품종에 대하여 RAPD를 수행한 결과 201개의 band를 얻었으며, 이중 151개의 polymorphic band를 집괴분석하여 dendrogrom을 작성하였다. 이 계통수에서 유사도 0.747을 기준으로 41개의 공시 계통을 19개 품종과 16품종이 각각 속해있는 2개의 대분류군과 2품종이 속하는 1개의 군 그리고 1품종씩 속하는 4개의 군으로 모두 7개의 분류군으로 나눌 수 있었다. 분류군별 관계를 보면 I군, II군, III군에 속하는 품종들은 유전적 상동성이 비교적 높았으나, IV-Ⅶ군에 속하는 품종들은 다른 품종군들과 유연관계가 비교적 낮았으며, 특히 단독으로 하나의 군을 형성(Ⅶ군)하는 모후상은 다른 품종군들과의 유연관계가 매우 낮았다.