• 제목/요약/키워드: decision tree(C4.5)

검색결과 84건 처리시간 0.022초

데이터 마이닝을 활용한 외과수술환자의 회복실 체류시간 분석 (Length of stay in PACU among surgical patients using data mining technique)

  • 유제복;장희정
    • 한국산학기술학회논문지
    • /
    • 제14권7호
    • /
    • pp.3400-3411
    • /
    • 2013
  • 본 연구의 목적은 회복실 환자의 평균 체류시간을 알아보고, 체류시간에 미치는 요인들을 파악하여 회복실 체류 시간 예측을 위한 분석을 하기 위함이다. 본 연구의 대상자는 상급 종합병원에 입원한 전신 마취 하에 일반외과 수술을 받은 18세 이상 성인 남녀 환자 중 회복실로 입실한 환자를 1,500명을 대상으로 하였고 이중 1,293건을 분석하였다. 회복실 체류시간에 영향을 미치는 요인으로 32항목을 측정하였다. 평균 회복실 체류시간은 72.02분이었다. 수술주기별 관련요인과 회복실 체류시간의 관계를 살펴본 결과 나이, 수술종류, 수술시간, 진통제사용회수가 유의미한 관계를 나타내었다 회복실 체류시간에 가장 영향을 많이 주는 변수는 수술종류이며 그 다음 EKG 이상여부, 나이, 마취제, 수술시간으로 나타났다. 범주 I(30분~60분)은 2개의 경우, 범주 II(61분~90분)도 2개의 경우, 범주 III(91분~120분)은 4개의 경우로 분석되었다.

C4.5 알고리즘을 이용한 피로도 식별 시스템 구현 (Implementation of Fatigue Identification System using C4.5 Algorithm)

  • 김우진;이덕진
    • 한국융합학회논문지
    • /
    • 제10권8호
    • /
    • pp.21-26
    • /
    • 2019
  • 본 논문은 C4.5 알고리즘을 이용한 피로 인식 방법을 제안한다. 피로 평가에 대한 국내외 연구를 바탕으로 중국인의 생활습관 및 문화적 특성과 결합하여 피로 자기평가 척도를 완성하였다. 본문에서 사용한 척도는 58개 하위항목에 적용되어 있으며 피로의 유형과 정도를 평가하는 데 사용되었다. 이 항목들은 육체적 피로, 정신적 피로, 개인의 습관 및 피로의 결과 등을 측정하는 4가지 분류 항목에 포함된다. 본 연구의 목적은 피로 형성의 주요 원인을 분석하고 그에 따른 피로 정도를 인식함으로써 피로에 대한 주관적 관심을 증가시키고 과도한 피로로 인한 심뇌혈관계 질환의 위험을 감소시키는 데 있다. C4.5 알고리즘을 활용한 피로 인식 시스템의 인식률은 평균 85%로 나타나 본 제안의 유용성을 확인하였다.

기계학습을 이용한 문서 자동분류에 관한 연구 (A Study on the Documents's Automatic Classification Using Machine Learning)

  • 김성희;엄재은
    • 정보관리연구
    • /
    • 제39권4호
    • /
    • pp.47-66
    • /
    • 2008
  • 본 논문에서는 수작업 분류 시 초래하는 여러 가지 한계점을 극복하고, 이용자에게 보다 빠르고 정확한 분류 서비스를 제공하기 위해 4개의 다양한 기계학습 알고리즘을 적용하였다. 연구대상으로는 MeSH의 8개의 주제별 범주로 각각 100개의 문헌 타이틀을 선정하였으며, 4개의 기계학습 알고리즘으로 실험을 수행하였다. 그 결과 신경망 기법과 C5.0 기법을 병행하여 사용했을 경우 단일 기법을 사용했을 경우보다 2.5%, 3.75%가 상승하여 분류 효율이 83.75%로 측정되었다. 이 수치는 4개의 분류 실험 결과 중 가장 높은 정확률을 나타내었다. 따라서 신경망 기법과 C5.0 기법의 장점을 이용하여 분류 서비스를 실행하면 단일 기법을 사용한 경우보다 높은 정확률을 나타낼 수 있을 것이라 기대된다.

과학 기술 문헌 분석을 위한 기계학습 기반 범용 전문용어 인식 시스템 (Terminology Recognition System based on Machine Learning for Scientific Document Analysis)

  • 최윤수;송사광;전홍우;정창후;최성필
    • 정보처리학회논문지D
    • /
    • 제18D권5호
    • /
    • pp.329-338
    • /
    • 2011
  • 문헌에서의 전문용어 인식 연구는 정보검색, 정보추출, 시맨틱 웹, 질의응답 분야 등의 연구를 위한 선행 연구로서, 지금까지 대부분 특정 분야, 특히 생의학 분야에서 집중되어 연구되어 왔다. 그러나 기존 연구들이 특정 도메인 또는 문헌 내부 통계 정보를 활용함으로써 범용적인 전문용어 인식에 한계점을 보여 왔기 때문에, 본 연구에서는 웹 검색 결과와 사전, 후보용어의 문형 특징 등을 활용하는 기계 학습 기반 범용 전문용어 인식 방법을 제안하였다. 제안한 방법을 문헌의 지역 통계 정보를 사용하는 방법(C-value)과 비교 실험하여 80.8%의 F-값으로 6.5%의 성능향상을 보였다. 다양한 응집도 자질들을 접목한 두 번째 실험에서는 Normalized Google Distance 방법과 접목한 방식이 F-값 81.8%의 성능으로 최고의 성능을 나타냈다. 기계 학습 방법으로는 로지스틱 회귀분석, C4.5, SVMs 등을 적용하였는데, 일반적으로 이진 분류에 좋은 성능을 보이는 SVMs과 로지스틱 회귀분석 방법보다 결정 트리 방식의 C4.5가 전반적으로 좋은 성능을 보였다.

속성 변동 최소화에 의한 러프집합 누락 패턴 부합 (Missing Pattern Matching of Rough Set Based on Attribute Variations Minimization in Rough Set)

  • 이영천
    • 한국전자통신학회논문지
    • /
    • 제10권6호
    • /
    • pp.683-690
    • /
    • 2015
  • 러프집합에서 누락된 속성 값들은 Reduct와 Core 계산, 더 나아가서 결정 트리 구축에 있어서 식별 불능의 패턴 부합 문제를 가진다. 현재 누락된 속성 값들의 추정과 관련하여 보편적인 속성 값으로의 대체, 속성들의 모든 가능한 값 할당, 이벤트 포장 방법, C4.5, 특수한 LEM2 알고리즘과 같은 접근방식들이 적용되고 있다. 그렇지만, 이들 접근방식은 결국 전형적으로 자주 등장하는 속성 값 혹은 가장 보편적인 속성 값으로의 단순 대체를 나타내기 때문에, 주요 속성 값들이 누락된 경우에 정보 손실이 큰 의사 결정 규칙들이 유도되기 때문에 의사결정 규칙들의 교차 검증에서 문제가 된다. 본 연구에서는 이러한 문제점을 개선시키기 위해 속성들간에 엔트로피 변동을 활용하여 정보 이득이 높은 방향으로 누락된 속성 값들을 대체하는 방식을 제안한다. 제안된 접근방식에 관한 타당성 검토는 비교적 가까운 유사 관계에 의해 누락 값 대체 방식을 적용하는 ROSE 프로그램과의 비교를 나타낸다.

토지특성 고저조사를 위한 공간정보 데이터 구축과 데이터 마이닝 분석 (Spatial Information Data Construction and Data Mining Analysis for Topography Investigation of Land Characteristics)

  • 최진호;김준현
    • 한국측량학회지
    • /
    • 제37권6호
    • /
    • pp.507-516
    • /
    • 2019
  • 토지특성조사는 토지가격비준표 작성 및 표준지와 개별지의 특성차이 비교를 통한 지가 산정 과정에서 매우 중요한 과정이다. 따라서 토지특성조사는 최대한 객관적이고 합리적이며 일관성 있게 이루어져야 한다. 그러나 현재 토지특성조사는 지자체 공무원과 감정평가사의 경험이 상당수 반영되고 있기 때문에 객관성과 일관성을 보장하기 어렵다. 본 연구에서는 현행 토지특성조사 항목 중 고저의 조사방식을 분석하여 문제를 정의하고, 고저 분류를 위해 토지의 고저 정보를 공간정보 기술 기반으로 수치화하여 이를 데이터 마이닝 기법 중 하나인 C4.5을 적용하여 고저를 분류하는 방법을 제시하였다. 서울시의 표준지 고저 조사 결과와 필지의 공간정보를 C4.5 모델에 적용한 결과에서는 기존 감정평가사의 조사 결과 약 93.5% 일치 하는 것으로 나타났다.

근 실시간 조건을 달성하기 위한 효과적 속성 선택 기법 기반의 고성능 하이브리드 침입 탐지 시스템 (Efficient Feature Selection Based Near Real-Time Hybrid Intrusion Detection System)

  • 이우솔;오상윤
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제5권12호
    • /
    • pp.471-480
    • /
    • 2016
  • 최근 국가 기반 시스템, 국방 및 안보 시스템 등에 대한 사이버 공격의 피해 규모가 점차 커지고 있으며, 군에서도 사이버전에 대한 중요성을 인식하고 전 평시 구분 없이 대비하고 있다. 이에 네트워크 보안에서 탐지와 대응에 핵심적인 역할을 하는 침입 탐지 시스템의 중요성이 증대되고 있다. 침입 탐지 시스템은 탐지 방법에 따라 오용 탐지, 이상 탐지 방식으로 나뉘는데, 근래에는 두 가지 방식을 혼합 적용한 하이브리드 침입 탐지 방식에 대한 연구가 진행 중이다. 그렇지만 기존 연구들은 높은 계산량이 요구된다는 점에서 근 실시간 네트워크 환경에 부적합하다는 문제점이 있었다. 본 논문에서는 기존의 하이브리드 침입 탐지 시스템의 성능 문제를 보완할 수 있는 효과적인 속성 선택 기법을 적용한 의사 결정 트리와 가중 K-평균 알고리즘 기반의 고성능 하이브리드 침입 탐지 시스템을 제안하였다. 상호 정보량과 유전자 알고리즘 기반의 속성 선택 기법을 적용하여 침입을 더 빠르고 효율적으로 탐지할 수 있으며, 오용 탐지 모델과 이상 탐지 모델을 위계적으로 결합하여 구조적으로 고도화된 하이브리드 침입 탐지 시스템을 제안하였다. 실험을 통해 제안한 하이브리드 침입 탐지 시스템은 98.68%로 높은 탐지율을 보장함과 동시에, 속성 선택 기법을 적용하여 고성능 침입 탐지를 수행할 수 있음을 검증하였다.

병렬확장을 활용한 규칙생성 기법 (A Rule Generation Technique Utilizing a Parallel Expansion Method)

  • 이기철;김진봉
    • 한국정보처리학회논문지
    • /
    • 제5권4호
    • /
    • pp.942-950
    • /
    • 1998
  • 가공되지 않은 데이터에서 직접 규칙 형태의 지식을 추출하는 문제는 자료의 홍수 속에서 정보의 부족을 느끼는 모순을 해결하기 위한 데이터 마이닝 분야에서 매우 중요하다. 논리 최적화 도구는 주어진 ON 집합과 DC 집합을 이용하여 최적화된 형태의 지식을 추출하는 도구인데, 본 논문에서는 논리 최적화 기법 중 병렬 확장 기법을 이용하여 초기 지식을 생성한 후 정렬, 축소, 규칙 확장 등의 방법을 이용하여 실 세계 데이터에 적용할 수 있는 규칙이 생성될 수 있음을 보였다. 이와 같은 새로운 접근 방법이 종래의 C4.5 등의 결정 트리 기법에 손색없는 규칙을 생성할 수 있음을 실험을 통해 입증하였다.

  • PDF

유전자 알고리즘 및 국소 적응 오퍼레이션 기반의 의료 진단 문제 자동화 기법 연구 (Medical Diagnosis Problem Solving Based on the Combination of Genetic Algorithms and Local Adaptive Operations)

  • 이기광;한창희
    • 지능정보연구
    • /
    • 제14권2호
    • /
    • pp.193-206
    • /
    • 2008
  • 의료 진단 문제는 기정의된 특성치들로 표현되는 환자의 상태 데이터로부터 병의 유무를 판단하는 일종의 분류 문제로 간주할 수 있다. 본 연구는 혼용 유전자 알고리즘 기반의 분류방법을 도입함으로써 의료 진단 문제와 같은 다차원의 패턴 분류 문제를 해결할 수 있는 방안을 제안하고 있다. 일반적으로 분류 문제는 데이터 패턴에 존재하는 여러 클래스 간 구분경계를 생성하는 접근방법을 사용하는데, 이를 위해 본 연구에서는 일단의 영역 에이전트들을 도입하여 이들을 유전자 알고리즘 및 국소 적응조작을 혼용함으로써 데이터 패턴에 적응하도록 유도하고 있다. 일반적인 유전자 알고리즘의 진화단계를 거친 에이전트들에 적용되는 국소 적응조작은 영역 에이전트의 확장, 회피 및 재배치로 이루어지며, 각 에이전트의 적합도에 따라 이들 중 하나가 선택되어 해당 에이전트에 적용된다. 제안된 의료 진단용 분류 방법은 UCI 데이터베이스에 있는 잘 알려진 의료 데이터, 즉 간, 당뇨, 유방암 관련 진단 문제에 적용하여 검증하였다. 그 결과, 기존의 대표적인 분류기법인 최단거리이웃방법(the nearest neighbor), C4.5 알고리즘에 의한 의사 결정트리(decision tree) 및 신경망보다 우수한 진단 수행도를 나타내었다.

  • PDF

Stream-based Biomedical Classification Algorithms for Analyzing Biosignals

  • Fong, Simon;Hang, Yang;Mohammed, Sabah;Fiaidhi, Jinan
    • Journal of Information Processing Systems
    • /
    • 제7권4호
    • /
    • pp.717-732
    • /
    • 2011
  • Classification in biomedical applications is an important task that predicts or classifies an outcome based on a given set of input variables such as diagnostic tests or the symptoms of a patient. Traditionally the classification algorithms would have to digest a stationary set of historical data in order to train up a decision-tree model and the learned model could then be used for testing new samples. However, a new breed of classification called stream-based classification can handle continuous data streams, which are ever evolving, unbound, and unstructured, for instance--biosignal live feeds. These emerging algorithms can potentially be used for real-time classification over biosignal data streams like EEG and ECG, etc. This paper presents a pioneer effort that studies the feasibility of classification algorithms for analyzing biosignals in the forms of infinite data streams. First, a performance comparison is made between traditional and stream-based classification. The results show that accuracy declines intermittently for traditional classification due to the requirement of model re-learning as new data arrives. Second, we show by a simulation that biosignal data streams can be processed with a satisfactory level of performance in terms of accuracy, memory requirement, and speed, by using a collection of stream-mining algorithms called Optimized Very Fast Decision Trees. The algorithms can effectively serve as a corner-stone technology for real-time classification in future biomedical applications.