• 제목/요약/키워드: ID3 결정트리

검색결과 20건 처리시간 0.029초

재처리를 통한 결정트리의 정확도 개선 (Improvement of Accuracy of Decision Tree By Reprocessing)

  • 이계성
    • 정보처리학회논문지B
    • /
    • 제10B권6호
    • /
    • pp.593-598
    • /
    • 2003
  • 기계학습은 효율적이고 정확한 재사용을 위해 지식을 재구성한다. 본 논문은 이미 알려진 학습 객체들로부터 지식을 추출하는 '예제에 의한 개념학습 방법에 관한 연구이다. 대부분 학습 시스템은 처리와 표현에 대한 제약으로 인해 학습 결과를 새로운 객체에 적용할 때 효율성과 정확도가 기대에 못 미치는 경우가 있다. 본 논문에서는 ID3의 바이어스에 대해 조사하고, 다양한 표현 양식을 통해 보다 정확하고 학습적으로 이해하기 쉬운 분류 방법을 제안한다.

전자상거래에 적용 가능한 고객분류기 (A Customer Classifier for EC Mall)

  • 김선철;이준욱;이용준;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.138-140
    • /
    • 1999
  • 분류기법은 과거데이터를 분석하여 새로운 데이터에 대한 예측에 사용되며, 결정트리 알고리즘을 많이 사용한다. 따라서, 이 기법은 전자상거래에서 DB 마케팅을 위해 데이터베이스에 저장되어 있는 고객데이터를 분석하여 암시적인 고객들의 행위규칙을 찾고, 예측하기 위하여 사용할 수 있다. 기존의 분류알고리즘들은 전자상거래에서 일반적인 연속형 고객데이터를 처리하는데는 많은 문제점을 가지고 있다. 이러한 문제를 해결하기 위하여 연속형 데이터를 범주형 데이터로 변환하는 알고리즘을 구현하였다. 이 논문은 전자상거래에 적용하기 위한 고객분류기로서 ID3 알고리즘에 1차원 클러스터링알고리즘을 결합하여 사용한다.

  • PDF

서울시 도심제조업 집적지에서의 Cloud 기반 인공지능 Fulfillment 서비스 Platform 연구 (Cloud-based Artificial Intelligence Fulfillment Service Platform in the Urban Manufacturing Cluster in Seoul)

  • 김효영;박대우
    • 한국정보통신학회논문지
    • /
    • 제26권10호
    • /
    • pp.1447-1452
    • /
    • 2022
  • 세계 10대 도시이며 Metro City인 서울특별시는 인쇄, 봉제, 기계금속 등 전통적인 도심제조업이 분포되어있다. 이들 제조업 집적지 내 소상공인은 서로 상부상조 하는 형태로 발전해왔다. 집적지의 특성상 각 공정은 개별 업체가 담당한다. 상대적으로 영세한 소상공인이 공정 간 실시간 물류 이동 정보를 제공하는 주문처리 서비스를 준비하기에 어려운 현실이다. 본 논문에서는 패키지(Package) 제조 및 특수인쇄 분야 소상공인의 원활한 수주, 배송 처리를 위해 기존 물류 Data를 수집, 분석하고 CRNN, k-NN, ID3 Decision Tree algorithm을 적용한 인공지능 Fulfillment Service Platform 시스템을 설계한다. 본 연구를 통하여 집적지 소상공인 누구나 Cloud 네트워크를 통하여, 개별 수주, 배송 맞춤서비스를 사용할 수 있게 함으로써 매출 증대 및 역량 향상에 크게 기여할 것으로 기대한다.

소셜 복마킹 시스템의 스패머 탐지를 위한 기계학습 기술의 성능 비교 (Comparative Study of Machine learning Techniques for Spammer Detection in Social Bookmarking Systems)

  • 김찬주;황규백
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권5호
    • /
    • pp.345-349
    • /
    • 2009
  • 소결 북마킹(social bookmarking) 시스템은 사용자가 북마크를 저장하고 공유할 수 있는 플랫폼을 제공하는 웹 기반(web-based) 시스템으로 폭소노미(folksonomy)를 이용한 대표적인 웹2.0 서비스이다. 소셜 북마킹 시스템에서의 스패머(spammer)란 자신들의 이익을 위해서 시스템을 고의적으로 악용하는 사람을 말한다. 스패머는 많은 양의 잘못된 정보를 시스템에 포스팅(posting)하기 때문에 전체 소셜 북마킹 시스템의 리소스(resource)를 쓸모없게 만들어 버린다. 따라서, 스패머를 빠른 시간 안에 탐지하고 그들의 접근을 차단하는 것은 시스템의 붕괴를 방지하기 위해 중요하다. 본 논문에서는 사용자가 사용한 태그에 대한 데이터를 추출하여, 사용자가 스패머 인지 아닌지를 예측하는 모델을 기계학습의 다양한 방법을 적용하여 생성한 후 그 성능을 비교해 보았다. 구체적으로, 결정테이블 (decision table, DT), 결정트리(decision tree, ID3), 나이브 베이즈 분류기($na{\ddot{i}}ve$ Bayes classifier), TAN(tree-augmented $na{\ddot{i}}ve$ Bayes) 분류기, 인공신경망(artificial neural network)의 방법을 비교하였다. 그 결과 AUC(area under the ROC curve)와 모델 생성시간을 고려하였을 때 나이브 베이즈 분류기가 가장 만족할 만한 성능을 보였다. 나이브 베이즈 분류기의 분류 결과가 가장 좋았던 이유는 성능을 비교하는 데 사용된 AUC가 결정트리 계열의 방법(ID3 등)보다 나이브 베이즈 분류기에서 일반적으로 높게 나오는 경향이 있다는 것과, 스패머 탐지 문제가 선형으로 분리 가능한 경우(lineally separable)와 유사할 가능성이 높기 때문으로 여겨진다.

3단계의 사고 작용 모델을 응용한 사회적 감성지능 에이전트 프레임워크 (Framework for Socially Intelligent Agent using Three-Layered Affect Functioning Model)

  • 신헌용;우운택
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.522-527
    • /
    • 2008
  • 사회적 감성 에이전트는 인간과 유사한 사회지능(Social Intelligence)을 가지고 있는 에이전트로서, 인간의 감정을 인지 및 학습하고 적응을 통하여 상대방의 감정과 상함에 따라 적절한 반응을 할 수 있는 능력을 가기고 있다. 이 에이전트는 인간이 에이전트를 더 살아 있는 것처럼(Believable) 느끼게 하여, 인간과 컴퓨터간의 상호작용을 도와줌으로써 인간에게 더욱더 개인화되고 적합한 서비스 창출하고 제공할 수 있는 에이전트 모델이다. 본 논문에서는 인간의 사고 과정과 동일한 3단계 사고 작용 모델(Three-Layered Affect Functioning Model)을 통해서, 에이전트가 사용자의 감정과 상황을 인식하여, 지능적 반응이나 행동을 가능하게 하는 프레임워크를 제안한다. 그리고 에이전트의 감정과 상황인식을 위해서는 심리학 모델인 OCC 모델과 결정트리 구성 알고리즘인 ID3를 활용하였다. 이를 통해서 교육, 예술, 연예, 디자인, 의료 등 다양한 분야에서 응용될 수 있는 사회적 감성지능형 에이전트를 개발할 수 있을 것으로 기대 된다.

  • PDF

개선된 타임 슬롯 방법을 이용한 효과적인 태그 인식 알고리즘 (An Efficient Tag Identification Algorithm Using Improved Time Slot Method)

  • 김태희;김선경
    • 한국산업정보학회논문지
    • /
    • 제15권3호
    • /
    • pp.1-9
    • /
    • 2010
  • 최근 유비쿼터스 환경 구축의 가장 핵심은 센서 네트워크와 RFID 시스템이다. 이 중 RFID 시스템은 태그의 전자정보를 RF 신호를 이용하여 리더에게 전송한다. RFID 시스템은 다중 태그의 존재로 인해 충돌이 발생하고 태그 인식 성능이 저하된다. 그래서 태그 충돌을 중재할 수 있는 방법이 필요하다. 본 논문은 태그 간 충돌을 줄이며 좀 더 빠른 태그 인식이 가능한 하이브리드 방법을 제안한다. 본 논문에서 제안하는 방법은 트리기반 알고리즘의 장점인 확실성을 기반으로 동작하며 충돌을 줄이기 위해 태그 아이디를 이용하여 전송 타임 슬롯을 결정한다. 시뮬레이션을 통한 성능평가에서 다른 트리기반의 알고리즘과 다른 하이브리드 알고리즘에 비하여 충돌 횟수와 쿼리 수에서 높은 성능을 가진다는 것을 보여준다.

정보 엔트로피에 의한 RC 교량 상판의 상태속성 및 등급 영향 구조 분석 (The State Attribute and Grade Influence Structure for the RC Bridge Deck Slabs by Information Entropy)

  • 황진하;박종회;안승수
    • 한국전산구조공학회논문집
    • /
    • 제23권1호
    • /
    • pp.61-71
    • /
    • 2010
  • 기 수행된 1, 2종 교량에 관한 정밀안전진단 등의 많은 사례를 분석해 보면, 실제로 많은 경우 외관상태가 교량의 대표등급 결정에 지배적인 요인이 되는 것을 볼 수 있다. 본 연구는 기 시행된 점검 및 진단 자료를 학습사례집합으로 인공지능 분야의 귀납적 학습법을 활용하여 철근 콘크리트 교량 바닥판의 상태평가를 지배하는 상태속성들의 교량등급에 대한 계층적 영향도와 구조적 연관성을 분석하였다. 이는 세부적으로 목표속성은 평가등급으로, 평가속성은 1방향균열, 2방향균열, 백태, 박락 및 층분리, 재료분리 등 7가지로 구성하고, 엔트로피 분석을 통해 주요 속성의 정보량, 정보기대값 및 정보 이득을 산정하고 범주별 상태 등급 분포를 분석하였다. 이를 위해 본 논문은 먼저 6개 교량에 대한 안전진단보고서를 토대로 상태등급 평가 과정에서 각 속성이 미치는 간접적 영향을 개관하고 정보공학적 분석의 동기를 부여하였다. 아울러 본 연구는 정보 변별력에 대한 순서로 평가를 지배하는 주 속성 및 조건별 하위 속성 연관성을 의사결정트리 형태로 나타내어 계층적 영향 및 속성간의 구조적 연관성을 보임으로써 손상에 대한 이해도를 높이고 차후 상태평가를 위한 합리적 접근을 지원할 수 있도록 하였다.

효율적인 RFID 시스템을 위한 Adaptive Group Separation 충돌방지 알고리듬 (Adaptive Group Separation Anti-Collision Algorithm for Efficient RFID System)

  • 이현수;이석희;김상기;방성일
    • 대한전자공학회논문지TC
    • /
    • 제46권5호
    • /
    • pp.48-55
    • /
    • 2009
  • 본 논문에서는 효율적인 RFID 시스템을 위한 Adaptive Group Separation 알고리듬을 제안하였다. AGS 알고리듬은 최적의 초기 prefix size j을 결정하고 개의 그룹으로 태그를 나눈다. 리더는 그룹을 차례로 하나씩 호출하여 태그 ID를 검색한다. 만약 충돌이 발생하면 리더는 충돌이 발생한 첫 번때 비트에 '0' 또는 '1'을 추가한다. 결과적으로, 태그를 인식하기 위한 전송비트와 인신 시간이 감소한다. 본 논문에서 제안한 AGS 충돌방지 알고리듬은 태그의 개수를 256개까지 변화시켜 가면서 반복횟수와 전송비트수를 기존의 충돌방지 알고리듬과 비교하였다. 본 논문에서 제안한 AGS 알고리듬은 모의실험 결과를 통한 성능평가에서 슬롯 이진 트리 알고리듬보다 반복횟수는 약 32.3% 개선되었으며, 전송비트수는 약 1/40배 감소하였다.

APT 공격 탐지를 위한 호스트 기반 특징 표현 방법 (Host based Feature Description Method for Detecting APT Attack)

  • 문대성;이한성;김익균
    • 정보보호학회논문지
    • /
    • 제24권5호
    • /
    • pp.839-850
    • /
    • 2014
  • 3.20 사이버 테러 등 APT 공격이 사회적, 경제적으로 막대한 피해를 초래함에 따라 APT 공격을 방어하기 위한 기술적인 대책이 절실히 요구되고 있으나, 시그너쳐에 기반한 보안 장비로는 대응하는데 한계가 있다. 이에 본 논문에서는 기존 시그너쳐 기반 침입탐지 시스템의 한계를 극복하기 위해서 호스트 PC에서 발생하는 행위정보를 기반으로 악성코드를 탐지하는 방법을 제안한다. 먼저, 악성코드와 정상 실행파일을 구분하기 위한 39개의 특성인자를 정의하고, 악성코드 및 정상 실행파일이 실행되는 동안 발생하는 870만 개의 특성인자 데이터를 수집하였다. 또한, 수집된 데이터에 대해 각 특성인자의 발생빈도를 프로세스 ID 별로 재구성하여 실행파일이 호스트에서 실행되는 동안의 행위정보를 83차원의 벡터로 표현하였다. 특히, 자식 프로세스에서 발생하는 특성인자 이벤트의 발생빈도를 포함함으로써 보다 정확한 행위정보의 표현이 가능하였다. C4.5 결정트리 방법을 적용하여 악성코드와 정상파일을 분류한 결과 각각 2.0%의 오탐률과 5.8%의 미탐률을 보였다.

3차원 가속 센서 및 RFID 센서를 이용한 ADL 자동 분류 (Automatic ADL Classification Using 3 Axial Accelerometers and RFID Sensor)

  • 임새미;김익재;안상철;김형곤
    • 전자공학회논문지CI
    • /
    • 제45권3호
    • /
    • pp.135-141
    • /
    • 2008
  • 본 논문은 3차원 가속 센서들과 장갑 형태로 제작한 RFID 리더기를 사용하여, 사용자의 신체 상태에 따른 동작 분석을 통해, 일상생활에서 사용자의 액티비티(Activity)를 자동으로 인식하는 새로운 방법을 제안한다. 두 개의 가속 센서로부터 획득한 움직임 정보로부터 선택 트리(Decision Tree) 방법을 통해 사용자의 5가지 자세 정보(Posture Information)를 구별하고, 손목에 장착된 가속 센서와 장갑 형태로 제작된 RFID 리더를 통해 인식한 객체와의 상호 작용을 통해서 도구를 사용하는 액티비티(Instrumental Activity)를 인식하는데 사용한다. 이를 위해, 객체 의존적인 손의 움직임을 학습에 의해 미리 5가지 카테고리로 분류한 후, 해당 객체와 인식된 움직임의 일치 여부를 확인한 후, 최종적으로 사용자의 신체 상태와 액티비티를 결정한다. 실험 결과에 의하면, 제안된 계층적 움직임 분석 방법은 20가지의 일상생활 액티비티들을 인식하는데 있어서 90%이상의 정확도를 보였다.