• 제목/요약/키워드: 과도 분류

검색결과 8,497건 처리시간 0.042초

새로운 규칙 생성 알고리즘 (A New Rule-Generation Algorithm)

  • 김상귀;윤충화
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.721-723
    • /
    • 2005
  • 패턴 분류에 많이 사용되는 MBR(Memory Based Reasoning) 기법은 메모리에 저장된 학습패턴과 테스트 패턴간의 거리를 계산하여 가장 가까운 학습패턴의 클래스로 분류하기 때문에 테스트 패턴을 분류하는 기준을 설명할 수 없다는 문제점을 가지고 있다. 본 논문에서는 RPA(Recursive Partition Averaging) 기법을 이용하여 분류 기준을 설명할 수 있는 IF-THIN 형태의 규칙을 생성하고 생성된 규칙의 일반화 성능을 향상시키기 위하여 불필요한 조건을 제거하는 규칙 pruning 알고리즘과 생성되는 규칙의 개수를 줄일 수 있는 점진적 규칙 추출 알고리즘을 제안한다.

  • PDF

경상남도 함안군 대평늪.질날늪의 식물상 (Flora of Daepyungnup and Jilnalnup Wetlands in Haman-gun, Gyeongsangnam-do)

  • 김수승;김용식
    • 한국환경생태학회:학술대회논문집
    • /
    • 한국환경생태학회 2008년도 정기총회 및 학술논문발표회
    • /
    • pp.74-76
    • /
    • 2008
  • 본 조사지역의 식물상은 대평늪에서 51과 98속 104종 11변종 1품종 총 116분류군, 질날늪에서 50과 97속 99종 16변종으로 총 115분류군을 각각 확인하였다. 또한 두 습지에서 환경부지정 멸종위기야생 동식물II급인 가시연꽃과 국외반출 승인대상 식물인 자라풀을 확인하였다. 귀화식물은 대평늪에서 16분류군, 질날늪에서는 15분류군을 기록하였고, 귀화율은 각각 13.8%, 13.0%, 도시화지수는 각각 5.9%, 5.5%로 분석되었다.

  • PDF

범주 대표어의 가중치 계산 방식에 의한 자동 문서 분류 시스템 (Automatic Document Classification by Term-Weighting Method)

  • 이경찬;강승식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.475-477
    • /
    • 2002
  • 자동 문서 분류는 범주 특성 벡터와 입력 문서 벡터의 유사도 비교에 의해 가장 유사한 범주를 선택하는 방법이다. 문서 분류 시스템을 구현하기 위하여 각 범주의 특성 벡터를 정보 검색 시스템의 역파일 형태로 구축하였으며, 용어 가중치를 계산하는 방법을 달리하여 문서 분류 시스템의 정확도를 실험하였다. 실험 문서는 일간지의 신문기사들을 무작위로 추출한 문서 집합을 대상으로 하였으며, 정보 검색 모델에서 보편적으로 사용되는 TF-lDF 방식이 변형된 방식에 비해 더 나은 성능을 보였다.

  • PDF

Co-Trained Support Vector Machines을 이용한 문서분류 (Text Categorization Using Co-Trained Support Vector Machines)

  • 박성배;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.259-261
    • /
    • 2002
  • 대부분의 자동문서분류 시스템은 문서에 사용된 단어의 분포만 고려하고, 또 하나의 중요한 정보인 통사 정보는 무시한다. 본 논문에서는 통사정보와 어휘정보를 모두 사용함으로써 대규모의 비구조 문서를 분류하는 방법을 제시한다. 이를 위해, 학습 데이터에 대해 독립된 두 개의 관점을 요구하는 일종의 부분 감독 학습 알고리즘인 co-training 알고리즘을 사용한다. 어휘정보와 통사정보가 각각 문서의 독립된 관점이 될 수 있으므로, 이 두 정보와 레이블이 없는 문서를 사용하여 문서 분류의 성능을 높일 수 있다. Reelers-21578 문서집합과 TREC-7 filtering 문서집합에 대한 실험 결과는 제시된 방법의 유효성을 보인다.

  • PDF

이메일 분류를 위한 추천 에이전트 시스템 (A Recommendation Agent System for E-Mail Classification)

  • 정옥란;조동섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.94-96
    • /
    • 2003
  • 급속도로 발전하는 인터넷의 발달로 인한 정보의 과부하와 이메일의 급증은 이젠 모든 네티즌들이 겪는 불편함이 아닐 수 없다. 본 논문에서는 이런 이메일 관리를 사용자가 효율적으로 할 수 있도록 추천 에이전트(Recommendation Agent)를 제안하고자 한다. 추천 에이전트 시스템에서는 이메일의 자동 분류에서 가장 핵심인 정확도(Accuracy)를 개선시키기 위해 최종 결정을 사용자가 하는 방식으로 접근하였으며, 또한 절기에 이용되는 학습 및 분류 알고리즘을 동적 임계치를 적용한 베이지안 학습 알고리즘을 이용하여 알고리즘적 방법도 병행하였다. 새로운 메일이 도착했을 때 최적의 분류를 할 수 있도록 메일 카테고리를 추천하는 시스템이다. 또한 사용자 편의를 위하여 필요없는 메일이나 스팸으로 간주되는 메일은 자동 삭제하는 기능을 추가하였다.

  • PDF

지능적 웹 이미지 검색 엔진의 설계 (Design of Intelligeng Web Image Search Engine)

  • 박명선;이석호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.51-53
    • /
    • 1999
  • 기존의 웹 이미지 검색 엔진은 웹 이미지를 검색할 때 웹 이미지의 특징과, 웹 이미지를 포함한 HTML 문서의 텍스트를 이용한다. 그러나, 텍스트는 문맥에 따라 의미가 달라질 수 있으므로, 검색 대상을 미리 분류하면 검색 효율을 높일 수 있다. 본 논문은 웹 문서의 텍스트에서 이미지와 관련이 있는 이미지 설명 텍스트를 자동으로 추출하고, 검색 효율을 높이기 위하여 웹 이미지를 자동으로 분류하는 지능적 웹 이미지 검색 엔진을 제안한다. 지능적 웹 이미지 검색 엔진은 분류와 용어, 용어와 용어 사이의 연관도를 이용하여 분류의 정확도를 높인다.

  • PDF

클러스터링 기법을 통한 대사 네트웍의 진화적 분류 (Evolutionary Classification of Metabolic Networks by Hierarchical Clustering)

  • 오석준;정제균;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.226-228
    • /
    • 2002
  • 현재 유전자 서열 분석이 완료된 유전체들이 점점 늘어나고 있다. 따라서 이에 대한 방대한 정보가 생성됨에 따라 다양한 생물체들에 대하여 대사 네트웍을 통한 다차원적 분석이 가능하게 되었다. 대사 네트웍은 단백질 또는 효소들의 전체적인 상호작용을 표현하기 때문에 생물학적 메카니즘에 대하여 보다 풍부한 정보를 제공해 준다. 본 논문에서는 일차원적인 유전자 서열에 의한 종의 계통 분류가 아니라 메타 수준의 생리 구조적 비교를 통하여 계통분류학에 대하여 새로운 방법의 접근을 제안하고자 한다. 제안된 방법은 기존의 상동성 비교에 의한 계통 분류와 함께 좀 더 포괄적이고 거시적인 분석을 가능하게 한다.

  • PDF

침입감내 시스템의 분류 (Classify of Intrusion Tolerant System)

  • 김기한;조현철;윤영태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.448-450
    • /
    • 2002
  • 현재의 보안활동은 침입방지, 침입탐지 및 패치 제공과 같은 수동적인 보안이 주로 수행된다. 그러나 소프트웨어에서 취약성이 존재하지 않는다는 것을 증명하는 것은 불가능한 일이다. 침입감내 시스템은 수동적인 보안이 아닌 적극적인 보안의 개념으로 침입이 발생하더라도 시스템이 제공하는 서비스를 지속적으로 제공하는 것을 목표로 하고 무결성과 가용성을 강조하는 개념이다. 본 논문에서는 현재 진행 중인 침입감내 시스템에 대한 프로젝트에 대해 알아보고 침입감내 시스템에 대해 계층기반과 복제기반으로 분류를 수행한다. 그리고 계층기반과 복제기반은 프로그램과 데이터의 관점에서 나누어 분류하고 각 4가지 분류에서 고려해야할 기술적 기능적 특징을 알아본다.

  • PDF

전자상거래에 적용 가능한 고객분류기 (A Customer Classifier for EC Mall)

  • 김선철;이준욱;이용준;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.138-140
    • /
    • 1999
  • 분류기법은 과거데이터를 분석하여 새로운 데이터에 대한 예측에 사용되며, 결정트리 알고리즘을 많이 사용한다. 따라서, 이 기법은 전자상거래에서 DB 마케팅을 위해 데이터베이스에 저장되어 있는 고객데이터를 분석하여 암시적인 고객들의 행위규칙을 찾고, 예측하기 위하여 사용할 수 있다. 기존의 분류알고리즘들은 전자상거래에서 일반적인 연속형 고객데이터를 처리하는데는 많은 문제점을 가지고 있다. 이러한 문제를 해결하기 위하여 연속형 데이터를 범주형 데이터로 변환하는 알고리즘을 구현하였다. 이 논문은 전자상거래에 적용하기 위한 고객분류기로서 ID3 알고리즘에 1차원 클러스터링알고리즘을 결합하여 사용한다.

  • PDF

Decision Tree 분류기를 사용한 심전도 데이터 정확도 향상에 관한 연구 (A research on improving correctness of cardiac disorder data by using the Decision Tree Classifier)

  • 이현주;신동일;신동규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.507-509
    • /
    • 2012
  • 심전도 질환 데이터는 일반적으로 분류기를 사용한 실험이 많다. 심전도 신호는 QRS-Complex와 R-R interval을 추출하는 경우가 많은데 본 실험에서는 R-R interval을 추출하여 실험하였다. 심전도 데이터의 분류 실험은 일반적으로 SVM(Support Vector Machine)과 MLP(Multilayer Perceptron)으로 실험되지만 본 실험은 Decision Tree를 사용하여 정확도 향상을 추구하였다. 그리고 정확도 비교 분석을 위해 SVM과 MLP 분류기 실험을 같이 수행하였고, 동일한 데이터와 간격으로 실험한 타 논문의 결과와 비교해 보았다. Decision Tree를 다른 분류기와 타 논문의 결과와 비교해 보니 정확도 부분에서는 Decision Tree가 가장 우수하였다.