• 제목/요약/키워드: 의사결정트리

검색결과 239건 처리시간 0.042초

의사결정트리 프로그램 개발 및 갑상선유두암에서 질량분석법을 이용한 단백질 패턴 분석 (Development of Decision Tree Software and Protein Profiling using Surface Enhanced laser Desorption/lonization - Time of Flight - Mass Spectrometry (SELDI-TOF-MS) in Papillary Thyroid Cancer)

  • 윤준기;이준;안영실;박복남;윤석남
    • Nuclear Medicine and Molecular Imaging
    • /
    • 제41권4호
    • /
    • pp.299-308
    • /
    • 2007
  • 본 연구의 목적은 의사결정트리를 생성하는 생물정보학 프로그램을 개발하고, 이를 갑상선유두암 혈청의 질량분석자료로 시험해 보는 것이다. 대상 및 방법: C4.5를 커스터마이징하여 의사결정트리 분석을 수행할 수 있는 'Protein analysis'라는 프로그램을 개발하였다 61개의 혈청시료(갑상선유두암 27, 자가면역성 갑상선염 17, 대조군 17)를 일정 기간 동안 순차적으로 냉동한 후 실온에서 일시에 해동하여 분석에 사용하였다. 모든 시료는 탈지질화 과정을 거쳐 준비한 후, 2종류의 단백질칩(CM10, IMAC3)에 각각 60개, 50개 시료를 적용하였다. 갑상선유두암의 특징적인 단백질 패턴을 찾기 위해 질량분석기를 이용하여 단백질칩을 분석했다. 'Protein analysis' 프로그램을 이용하여 단백질분포 자료로부터 의사결정트리를 작성하고, 생체표지자 후보물질을 검출하였다. CM10칩에서 발견된 생체표지자 후보물질을 무작위 표본추출 방법을 이용하여 검증하였다. 결과: 단백질분포 자료의 훈련과 검증이 가능한 의사결정트리 프로그램이 개발되었으며, 이 프로그램은 트리 구조와 노드 정보, 트리 구성 과정을 표시하는 3개의 창으로 구성되었다. CM10칩을 이용한 분석에서 총 113개의 단백질 피크 중 23개가 3그룹 간에 유의한 차이가 있었으며, IMAC3는 41개의 단백질 피크 중 8개가 3그룹 간에 유의한 차이가 있었다. 3그룹 분석에서 의사결정트리는 CM10칩과 IMAE3의 단백질분포 자료로부터 각각 60개와 50개의 시료를 높은 정확도로 분류하였으며(오차율 = 각각 3.3%, 2.0%), 각각 4개와 7개의 생체표지자 후보물질을 검출하였다. 암시료와 비암시료를 구분하는 2그룹 분석 에서, 의사결정트리는 모든 암시료를 정확히 구분하였으며(모두 오차율 = 0%), CM10칩을 이용한 분석에서는 단일 노드를 사용하고, IMAC3칩을 이용한 분석에서는 여러 개의 노드를 사용하였다. CM10칩의 단백질 분포자료를 5번의 무작위 추출에 의해 시행한 검증에서 암시료와 비암시료를 구분하는데 높은 정확도를 보였으나(정확도 = 98%, 54/55), 3그룹을 구분할 때는 중등도의 정확도를 보였다(정확도 = 65%, 36/55). 결론: 우리가 개발한 프로그램은 질량분석 자료로부터 성공적으로 의사결정트리를 생성하고, 생체표지자 후보물질을 검출할 수 있었다. 따라서 이 프로그램은 혈청 시료를 이용한 생체표지자 발굴 및 갑상선유두암의 추적관찰에 유용하게 사용될 수 있을 것이다.

약체연결뉴런 제거법에 의한 부도예측용 인공신경망 모형에 관한 연구 (Weak-linked Neurons Elimination Method based Neural Network Models for Bankruptcy Prediction)

  • 손동우;이웅규
    • 한국정보시스템학회:학술대회논문집
    • /
    • 한국정보시스템학회 2000년도 춘계학술대회
    • /
    • pp.115-121
    • /
    • 2000
  • 본 연구는 인공신경망 모형에서 최적 입력 변수를 선정하기 위하여 새로운 선처리 기법인 약체연결뉴런 제거법을 제안하고 그 예측력의 우월성을 순수 인공신경망과 의사결정트리로 선처리한 인공신경망 모델과 각각 비교했으며, 그 결과를 보면 본 연구에서 제안하고 있는 약체연결뉴런 제거법에 의해 입력변수 선정과정을 거친 모델의 성과가 순수 인공신경망이나 의사결정트리로 선처리한 인공신경망 모델에 비해 예측적중율이 우수한 것으로 나타났다.

  • PDF

CART 알고리즘 기반의 의사결정트리 기법을 이용한 규칙기반 전문가 시스템 구축 방법론 (The Construction Methodology of a Rule-based Expert System using CART-based Decision Tree Method)

  • 고윤석
    • 한국전자통신학회논문지
    • /
    • 제6권6호
    • /
    • pp.849-854
    • /
    • 2011
  • 시스템 이벤트들로부터 그 파급효과를 최소화하기 위해서는 실시간 조건에 기반한 규칙기반 전문가 시스템이 매우 효과적인데, 그 이벤트가 다양하고 부하조건이 매우 가변적이기 때문에 규칙 기반 전문가 시스템을 구축하기가 쉽지 않다. 따라서 본 연구에서는 CART 알고리즘 기반의 의사결정 트리 기법을 적용하여 상정사고 사례들로부터 규칙기반 전문가 시스템을 구축하는 방법론에 대해서 연구하고자 한다.

콘텐츠 디자인교육을 위한 의사 결정 트리 활용 방법과 사례연구 (Method and Case Study of Decision Tree for Content Design Education)

  • 김성곤
    • 문화기술의 융합
    • /
    • 제5권4호
    • /
    • pp.283-288
    • /
    • 2019
  • 수강생들의 정보와 경험 부족을 극복하기 위해, 의사 결정 트리를 활용한 콘텐츠 기획 트리를 개발하였다. 콘텐츠 기획 트리는 수강생들이 개발할 주제와 스토리를 선택하는 나무 몸통 생성단계, 해당 스토리를 바탕으로 개발 가능한 형태 '범주'를 선택하는 부모 가지 생성단계, 해당 콘텐츠를 효과적으로 제작하는 흥미 '효과'를 선택하는 자식가지 생성단계 그리고 시각화할 멀티미디어 표현 '요소'를 선택하는 잎사귀 생성단계로 구성된다. 교육 모델은 게임기획 디자인과 정보시각화 강의에 적용되었고, 각 강의에서 사용된 범주, 효과 그리고 요소의 예를 사례로 제시한다. 교육 모델은 145개 팀 프로젝트에 사용되었고, 단계별 학습 프로세스로 효율성을 확인하였다.

빅 데이터 기반의 체납 수용가 예측 모델 (Prediction Model for Unpaid Customers Using Big Data)

  • 정재안;이규환;정회경
    • 한국정보통신학회논문지
    • /
    • 제24권7호
    • /
    • pp.827-833
    • /
    • 2020
  • 본 논문에서는 지자체의 요금 체납을 줄이기 위해 특정 지자체를 대상으로 검침원의 면담 등을 통해 지방상수도 통합정보시스템에서 체납에 영향을 미치는 내부 데이터 요소를 찾았다. 또한 국가 통계 데이터 중에서 체납에 영향을 미치는 후보 데이터를 도출하였다. 독립변수가 종속변수에 미치는 영향도는 정보이득이라는 데이터 집합에서 종속변수에 대한 무질서도를 조사하여 표본 데이터를 수집하였다. 그리고 빅 데이터 분석 알고리즘인 의사결정트리와 로지스틱 회귀기법 중 어느 알고리즘이 더 높은 예측율을 나타내는지 n-fold cross-validation 방법을 사용하여 평가하였다. 이를 통해 지자체의 데이터를 기초로 알고리즘의 성능을 비교한 결과 의사결정트리가 로지스틱회귀보다 더 정확한 수용가 납부 패턴을 찾을 수 있음을 확인하였다. 머신러닝을 이용한 분석 알고리즘 모델 개발의 과정에서는 알고리즘의 정확성 향상을 위해 의사결정트리의 복잡성과 정확성에 직접적인 영향을 주는 최소 데이터 개수와 최대 순도라는 두 개의 환경변수의 최적값을 도출하였다.

지역적 정보를 이용한 장면 전환 검출 (Scene Change Detection Using Local Information)

  • 신성윤;신광성;이현창;진찬용;이양원
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 춘계학술대회
    • /
    • pp.151-152
    • /
    • 2012
  • 본 논문은 지역의 의사 결정 트리와 클러스터링을 사용하여 장면 전환 검출 방법을 제시한다. 지역 의사 결정 트리는 클러스터 경계선 검출 장면과 그 인접 프레임의 사이의 차이 값을 시간 유사분포를 비교하기 위해 같은 방식으로 검출하고, 그리고 클러스터 단위로 차이 값의 유사성과 그룹 프레임의 끊어지지 않는 시퀀스를 감지한다.

  • PDF

지역적 정보를 이용한 장면 전환 검출 (Scene Change Detection Using Local Information)

  • 신성윤;진찬용;이양원
    • 한국정보통신학회논문지
    • /
    • 제16권6호
    • /
    • pp.1199-1203
    • /
    • 2012
  • 본 논문은 지역의 의사 결정 트리와 클러스터링을 사용하여 장면 전환 검출 방법을 제시한다. 지역 의사 결정 트리는 클러스터 경계 검출 장면과 그 인접 프레임의 사이의 차이 값을 시간 유사 분포를 비교하기 위해 같은 방식으로 검출하고, 그리고 클러스터 단위로 차이 값의 유사성과 그룹 프레임의 끊어지지 않는 시퀀스를 감지한다.

특징공간을 사선 분할하는 퍼지 결정트리 유도 (Fuaay Decision Tree Induction to Obliquely Partitioning a Feature Space)

  • 이우향;이건명
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권3호
    • /
    • pp.156-166
    • /
    • 2002
  • 결정트리 생성은 특징값들로 기술된 사례들로부터 분류 규칙을 추출하는 유용한 기계학습 방법중 하나이다. 결정트리는 특징공간을 분할하는 형태에 따라 단변수(univariate) 결정트리와 다변수(multivariate) 결정트리로 대별된다. 실제 현장에서 얻어지는 데이터는 관측오류, 불확실성, 주관적인 판단 등의 이유로 특징값 자체에 오류를 포함하는 경우가 많다. 이러한 오류에 대해 강건한 결정트리를 생성하기 위한 방법으로 퍼지 기법을 도입한 결정트리 생성 방법에 대한 연구가 진행되어 왔다. 현재까지 대부분의 퍼지 결정트리에 대한 연구는 단변수 결정트리에 퍼지 기법을 도입한 것들이며, 다변수 결정트리에 퍼지 기법을 적용한 것은 찾아보기 힘들다. 이 논문에서는 다변수 결정트리에 퍼지 기법을 적용하여 퍼지사선형 결정트리라고 하는 퍼지 결정트리를 생성하는 방법을 제안한다. 또한 제안한 결정트리 생성 방법의 특성을 보이기 위한 실험 결과를 보인다.

의사결정트리를 이용한 개별 공시지가 비교표준지의 자동 선정 (An Automatic Method for Selecting Comparative Standard Land Parcels in Land Price Appraisal Using a Decision Tree)

  • 김종윤;박수홍
    • 한국지리정보학회지
    • /
    • 제7권1호
    • /
    • pp.9-19
    • /
    • 2004
  • 개별 공시지가 산정에 있어 비교 표준지의 선정은 가장 중요한 작업으로서, 최대한 객관적이고 합리적으로 이루어져야 한다. 그러나 현재 비교표준지를 선정하는 작업은 담당 공무원의 수작업에 의해 이루어지기 때문에 효율성이나 객관성을 보장하기가 어렵다. 본 연구에서는 현행 비교표준지 선정방식을 분석하여 문제를 정의하고 비교표준지 선정 업무의 자동화에 적용가능한 기계학습 알고리즘으로 의사결정트리를 선정하고 비교표준지를 선정하여 규칙을 주제지향적인 데이터베이스를 기반으로 학습하였다. 이렇게 학습된 규칙을 이용하여 비교표준지를 선정하고 그 결과를 평가 분석하여 새로운 비교표준지 선정 방법을 제안하였다.

  • PDF

데이터마이닝과 텍스트마이닝을 활용한 영화 흥행 예측 (Box Office Hit Prediction Using Data mining and Text mining)

  • 조효정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.316-318
    • /
    • 2021
  • 영화 수익에 있어 영화의 흥행 여부는 중요한 영향을 끼친다. 영화 흥행 요인은 영화 산업의 규모가 커지면서 많은 제작사들 및 투자자들이 고려해야 하는 사항이 되었다. 따라서 영화의 흥행을 예측하기 위한 많은 모델이 연구되었다. 본 연구의 목적은 선행연구에서 흥행에 유의미한 영향을 끼친다고 밝혀진 스크린 수, 감독명, 제작사명 등의 내재적인 속성과 더불어 온라인 구전 변수를 사용하여 영화 흥행 예측 모델을 만드는 것이다. 이때 기사 수, 블로그 수와 같이 온라인 구전의 크기를 나타내는 변수들을 사용하는 대신 개봉 후 첫 주간의 관람객 리뷰를 텍스트마이닝을 이용하여 전체 리뷰 중 긍정 리뷰의 비율에 따라 점수를 매긴 후 독립변수로 사용한다. 그 후, 데이터 마이닝 기법을 활용하여 만든 모델에 앞서 언급한 독립변수를 입력 값으로 사용하여 영화의 흥행을 예측한다. 최종적으로 의사결정트리와 로지스틱회귀를 수행한 결과 영화 흥행에 영향을 주는 독립변수를 찾고 모델의 성능을 평가하였다. 로지스틱회귀의 결과 관객 수, 평점이 영화의 흥행에 특히 유의한 영향을 끼치는 변수로 선정되었고 리뷰 역시 유의한 변수로 선정되었다. 이때 만들어진 모델은 약 90%의 높은 수준의 정확도를 보여주었다. 의사결정트리의 결과 관객 수가 가장 중요한 변수로 선정되었다.