• 제목/요약/키워드: 의사 결정 트리

검색결과 240건 처리시간 0.025초

비트맵을 활용한 분류 구현 (BBC;Bit-map Based Classification)

  • 조용준;이상원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.63-66
    • /
    • 2005
  • 분류란 여러 분야에서 쌓인 정보 데이터를 분석하여, 결과값에 대한 공통속성을 찾아내어 새로운 입력 데이터에 대해 보다 보편적인 결과를 분석하거나 예측하는 기법이다. 의사 결정 트리는 이러한 분류의 한 형태로 저장된 데이터를 활용하여 선험적 지식을 취득하고, 새로운 데이터에 대한 예측을 발생시키는 데이터 분석 방법이다. 그러나, 의사 결정 트리의 여러 가지 장점에도 불구하고 트리 구성에 많은 비용이 소요되는 단점이 존재한다. 점점 대량의 데이터를 다루어야 하는 현대 사회에서는 이러한 단점이 더욱더 커질 수 밖에 없다. 본 논문에서는 이러한 문제점을 해결하고자 비트맵을 활용한 의사 결정 트리의 구현을 제안한다. 비트맵을 사용하게 되면 의사 결정 트리 생성의 가장 큰 비용인 속성값 측정에서 높은 효율을 유지할 수 있게 된다. 또한 보다 효율적이고, 확장성이 높은 의사 결정 트리를 구현할 수가 있다.

  • PDF

데이터 웨어하우스에서 의사결정 트리를 이용한 실체화 뷰 선택 기법 (Materialized View Selection using Decision Tree in Data Warehouse)

  • 장윤경;유병섭;어상훈;김경배;배해영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.63-66
    • /
    • 2006
  • 실체화 뷰 선택은 질의 수행 시간과 제한된 저장 공간 등의 유지 비용을 고려하여 최적의 실체화 뷰 집합을 선택하고 유지하는 것이다. 본 논문에서는 의사결정 트리를 이용한 실체화 뷰 선택기법을 제안한다. 제안기법은 의사결정 트리를 이용하여 실체화 뷰로 생성될 질의를 판단하고 실체화 뷰 교체가 필요한 경우 메타데이터 테이블을 이용하여 교체 대상을 결정한다. 의사결정 트리는 높은 우선순위를 가진 속성으로부터 차례대로 데이터를 분류하기 때문에 이용도가 높은 실체화 뷰를 선택하는 방법을 제공하고 메타데이터 테이블은 실체화 뷰 집합의 빠른 교체 수행과 효율적인 유지보수를 제공한다. 성능평가를 통해 제안된 기법은 실체화 뷰 비율에 따른 질의처리 시간이 기존기법보다 약 13%의 성능 향상을 보였다.

  • PDF

중요도를 고려한 의사 결정 트리 기반 DDoS 공격 분석 (DDoS attack analysis based on decision tree considering importance)

  • 염성관;박상윤;신광성
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.652-654
    • /
    • 2021
  • 침입 탐지 시스템에 의해서 DDoS와 같은 공격을 탐지되며 조기에 차단할 수 있다. 의사 결정 트리를 이용하여 DDoS 공격 트래픽을 분석하였다. 중요도가 높은 결정적인 속성(Feature)을 찾아서 해당 속성에 대해서만 의사 결정 트리를 진행하여 정확도를 확인하였다. 그리고 위양성 및 위음성 트래픽의 내용을 분석하였다. 그 결과 하나의 속성은 98%, 두 가지 속성은 99.8%의 정확도를 각각 나타냈다.

  • PDF

의사결정 트리의 효용성 제고 방안에 관한 비교 연구 (A Comparative Study on The Effective Use of Decision Tree Algorithms)

  • 석현태
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2008년도 제39차 동계학술발표논문집 16권2호
    • /
    • pp.321-324
    • /
    • 2009
  • 비교적 적은 크기이면서 예측력에 있어 만족할 만한 의사결정목을 생성하는 방법으로서 적절한 크기의 샘플링을 제안하였다. 일반적으로 샘플의 크기가 작을수록 작은 의사결정목이 생성되므로 적절한 예측 정확도를 갖는 작은 트리를 생성하기를 원할 경우 적당한 크기의 샘플링을 하는 것이 트리의 최적화를 위한 계산을 더 시행하는 것보다 바람직하다고 할 수 있으며, 이와 같은 사실은 현재 알려진 가장 대표적 의사결정목 생성 알고리즘인 C4.5 및 CART를 사용하여 실험으로서 보여주었다.

  • PDF

데이터 마이닝을 이용한 의사결정지원 시스템 (Decision Support System Using Data Mining)

  • 조성진;정인정
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.45-47
    • /
    • 1999
  • 데이터 베이스에 저장하고 취급하는 자료가 폭발적으로 증가함에 따라서, 데이터 베이스 이용자가 필요로 하는 자료를 검색하고 유용한 정보를 획득하는 일은 더욱 더 어려워지고 있다. 이러한 문제들은 데이터에 내재되어 있는 유용한 패턴이나 변수들 간의 관계를 정교한 분석 모형을 찾아내는 데이터 마이닝이란 정보기술로 해결할 수 있다. 본 논문에서는 여러 가지 데이터 마이닝 기법들을 알아보고 데이터 마이닝에 의해 만들어진 규칙들을 사용하여 의사결정에 도움을 줄 수 있는 분석적인 트리를 구성한다. 제안하는 트리가 어떻게 생성되는지 보이고 생성된 트리를 의사결정지원 시스템에 적용한다. 다양한 관점에서 분석을 요구하는 사용자를 충족시키는 트리를 구성하여 시각적인 효과와 각 계층간의 분석을 할 수 있는 의사결정지원 시스템을 소개한다.

  • PDF

의사결정트리를 사용한 방학 중의 효과적 학습 방법 (Decision Tree-based Analysis to Effective Studying Methods during Vacation)

  • 김혜숙;문양세;김진호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (C)
    • /
    • pp.37-39
    • /
    • 2006
  • 본 논문에서는 방학 중 효과적인 학습 방법을 분석하기 위해 의사결정트리를 사용한 접근법을 제안한다. 이를 위해, 우선 학업성취도에 영향을 미치는 방학 중의 학습방법에 대한 다양한 요소를 도출한다. 다음으로, 의사결정트리를 사용하기 위한 데이터 변환 및 분석 방법을 제안한다. 마지막으로, 설문조사를 통해 수집한 현실의 구체적 데이터에서 의사결정트리를 생성한다. 중학교 학생들에 대한 설문조사를 분석한 결과, 세 가지 의미 있는 결과를 도출하였다. 첫째, 인터넷 학습사이트 이용은 성적 하락에 영향을 미치는 것으로 나타났다. 둘째, 성적 변화에 큰 영향을 미칠 것으로 예상했던 과외는 실제로 큰 영향을 미치지 못하는 것으로 나타났다. 셋째, 다양한 학습방법의 병행은 오히려 성적 하락의 요인이 되는 것으로 파악되었다. 본 논문에서 제시한 분석 방법 및 결과는 학생들의 방학 중 생활 지도나 학습 계획 수립에 많은 도움이 될 수 있다고 사료된다.

  • PDF

퍼지 의사 결정 트리 기반 한방 자가 진단 (Fuzzy Decision Tree Based Self Health Diagnosis of Oriental Medicine)

  • 정세훈;안하준;김광백
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 추계학술대회
    • /
    • pp.383-385
    • /
    • 2018
  • 기존의 한방 자가 진단 방법에서는 PCM 기반의 알고리즘을 적용시켰으나 고질적인 문제점 중의 하나인 증상 수가 급격하게 증가할 경우에는 진단 결과가 정확하게 도출되지 않는 현상이 발생한다. 이러한 문제점을 개선하는데 효율적인 퍼지 의사 결정 트리 알고리즘을 적용한다. 퍼지 의사 결정 트리는 과거의 데이터를 미리 학습시킨 후에 엔트로피에 따라 경계 값을 구한 후, 사용자가 여러 증상을 입력하면 입력된 증상에 해당되는 상위 질병 5개를 도출한다. 그리고 도출된 상위 5개의 질병과 도출된 질병의 원인과 치료하기 위한 민간요법을 제공한다. 질병과 증상에 대한 데이터베이스는 한의사가 추천한 여러 한의학 전문 서적을 기반으로 증상과 질병의 데이터베이스를 설계한 후, 한의학 전문의의 검증을 거쳐 구현하였다. 제안된 한방 자가 진단 시스템은 과거의 데이터를 바탕으로 증상을 학습함으로써 기존의 질병 진단 시스템보다 정확하고 신속한 진단 결과를 도출하는 것을 확인하였다.

  • PDF

의사결정 트리 앙상블을 구축하기 위한 상관성 기반 기법을 이용한 속성 중복성 제거 (Removing the Feature Redundancy using Correlation-Based Approach for Decision Tree Ensemble)

  • 박영준;박명호;손호선;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.1229-1231
    • /
    • 2011
  • 대량의 분류 규칙 탐사 과정은 앙상블기법을 사용하여 다양한 연구들이 이루어지고 있다. 본 논문에서는 의사결정 트리의 분열 문제와 singleton 포함 한계를 해결하기 위하여 Cascading-and-Sharing 앙상블 기법을 적용하여 점진적 다중 의사결정 트리를 구축하였다. 또한 분류의 정확도를 향상시키고, 트리의 복잡도와 모델 과잉접합을 피하기 위하여 다중 트리 구축과정에서 선형 상관분석기법을 기반으로 훈련 데이터 속성들의 중복성을 제거하였다. 실험 결과, 속성들의 중복성을 제거하여 구축한 트리들은 원래 기법보다 더 좋은 결과를 보여주었다.

의사결정 트리 기법을 이용한 그리드 자원선택 시스템 (Grid Resource Selection System Using Decision Tree Method)

  • 노창현;조규철;마용범;이종식
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권1호
    • /
    • pp.1-10
    • /
    • 2008
  • 이 기종의 네트워크와 시스템 자원으로 구성된 그리드 컴퓨팅 환경에서 대용량 데이터를 빠르고 정확하게 처리하기 위해서는 효과적인 그리드 자원선택이 필수적이다. 이를 위해 본 논문은 의사결정 트리 기법을 이용한 그리드 자원선택 시스템을 제안한다. 이 시스템은 자원 정보를 기록한 데이터 셋을 바탕으로 사용자들이 선택하는 자원들을 처리 할 데이터의 특성과 사용자의 요구사항으로 분석해서 자원선택을 위한 의사결정 트리를 구축한다. 그리드 사용자의 자원 요청 시 의사결정 트리를 탐색하여 사용자 요구 및 작업 특성에 적합한 자원들을 선택하여 작업을 할당함으로써 사용자 만족도를 향상시킴은 물론 전체 그리드 시스템의 성능을 개선한다. 실험결과는 본 논문에서 제안한 의사결정 트리 기반의 그리드 자원선택 시스템이 기존 그리드 자원선택 시스템인 Condor-G 및 Nimrod-G와 비교하여 더 높은 작업 처리율 및 자원 이용률과 더 적은 작업 손실 및 처리시간을 제공함으로써 그리드 자원선택 및 데이터 분산 처리에 효과적이라는 사실을 증명한다

  • PDF

사용자 프로파일 구축을 위한 TDIDT기반 관심단어 추출기법 (Attribute extract method based TDIDT for construction of user profile)

  • 이선미;박영택
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2002년도 추계정기학술대회
    • /
    • pp.321-327
    • /
    • 2002
  • 본 논문은 기존의 귀납적 결정 트리 방식에서의 문제점 개선을 통한 사용자 관심 프로파일 구축을 목적으로 한다. 특히 사용자 관심 프로파일의 정확도 향상을 위한 속성 선택에 대한 연구에 초점을 맞추고 있다. 사용자의 관심, 비관심 문서를 대상으로 사용자 관심 키워드를 생성하고 이를 바탕으로 초기 문서들을 재표현한다. 재표현된 문서를 입력 집합으로 하여 기계학습을 진행한다. 본 논문의 의사 결정 트리 생성 알고리즘은 입력 집합을 클래스별로 가장 잘 나누는 속성을 선택하여 노드를 구성하는 면에서는 기존의 알고리즘과 같다. 그러나 기존의 의사 결정 트리 알고리즘에서는 hill-climbing.방식을 사용함으로써 사용자의 관심을 나타내는 중요한 단어가 사용자 관심 프로파일에서 숨겨질 경우가 발생한다. 이를 최소화하기 위해 특징 추출을 통해 선택된 속성을 그대로 학습의 입력 데이터로 사용하는 것이 아니라 입력데이터를 가장 잘 나누는 속성과 그 다음 속성을 대상으로 disjunctive 연산을 통해 새로운 속성을 생성하여 이것을 속성 집합에 포함시키고 이를 학습의 입력 데이터로 이용한다. 이와 같이 disjunctive operator를 이용하여 새로운 속성을 의사 결정 트리 형성 시 이용하면 사용자의 중요한 관심을 포함하는 의미 있는(semantic) 사용자 관심 프로파일 구축이 가능해지고, 사용자 관심 프로파일을 기반으로 사용자가 관심 있는 문서를 제공할 수 있는 개인화 서비스를 제공한다.

  • PDF