• 제목/요약/키워드: Data Tree

검색결과 3,320건 처리시간 0.034초

판단 트리 분류를 위한 SQL 기초 기능의 구현에 관한 연구 (A Study on the Implementation of SQL Primitives for Decision Tree Classification)

  • 안형근;고재진
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권12호
    • /
    • pp.855-864
    • /
    • 2013
  • 판단 트리 분류는 데이터 마이닝의 중요한 문제의 하나이고, 데이터 마이닝은 대형 데이터베이스 기술의 중요한 과제가 되고 있다. 그러므로 데이터베이스와 데이터 마이닝 시스템의 결합 노력은 판단 트리 분류와 같은 데이터 마이닝 기능을 지원하는 데이터베이스 기초 기능의 개발로 이어지고 있다. 이런 기초 기능은 분류 알고리즘의 SQL 구현을 지원하는 특수한 데이터베이스 연산들로 구현되며, 특정 알고리즘을 구현하여 데이터베이스 시스템의 구성 모듈로 사용하고 있다. 데이터마이닝 기능을 제공하는 데이터베이스 기초 기능의 개발에는 두 가지 관점이 있다. 하나는 데이터 마이닝 기능을 분석해서 그런 기능들을 제공하는 데이터베이스 공통 기초 기능을 확인하는 것, 다른 하나는 데이터베이스 시스템의 인터페이스의 한 부분으로 이런 기초 기능의 구현을 위한 확장된 메커니즘을 제공하는 것이다. 데이터마이닝에서 어떤 기초 기능들을 DBMS에 저장할 것인가는 어려운 문제 중에 하나이다. 따라서 본 논문에서는 이러한 문제를 해결하기 위하여, 최적화된 판단 트리 분류기를 만들고 데이터베이스 기초 기능에 대해서 기술한다. 판단 트리 분류 알고리즘의 유용한 연산들을 확인하고, 상업적 DBMS에서 이러한 기초 기능의 구현에 대해서 기술하고, 성능 비교를 위한 실험 결과를 제시한다.

고차원 데이터의 효율적인 최근접 객체 검색 기법 (Efficient Searching Technique for Nearest Neighbor Object in High-Dimensional Data)

  • 김진호;박영배
    • 정보처리학회논문지D
    • /
    • 제11D권2호
    • /
    • pp.269-280
    • /
    • 2004
  • 피라미드 기법은 n-차원 공간 데이터를 1차원 데이터로 변환하여 B+-트리로 표현하며, n-차원 데이터 공간에서 하이퍼큐브 영역질의 처리로 발생하는 “차원의 저주현상”에 영향을 받지 않게 검색 시간 문제를 해결하고 있다. 또 구형 피라미드 기법(SPY-TEC)은 피라미드 기법의 공간 분할 전략을 응용하여 유사도 검색에 적합한 구 영역질의 방법을 사용하고 검색 성능을 개선하고 있다. 하지만 유사도 검색의 응용에서 영역질의는 범위를 지정하는데 어려움이 있어 최근접 질의가 더 효율적이며, 기존의 제안된 인덱스 기법들은 특정 분포의 데이터에 대해서만 우수한 성능을 보이는 단점이 있다. 따라서 이 논문에서는 멀티미디어 데이터와 같은 고차원 데이터의 검색 성능을 향상시키기 위해 제안되었던 PdR-트리를 이용하여 최근접 객체 검색 기법을 제안한다. 다양한 분포의 모의 데이터와 실제 데이터를 이용하여 실험한 결과, PdR-트리가 피라미드 기법과 구형 피라미드 기법보다 검색 성능이 향상되었음을 보이고 있다.

배경자료를 이용한 나무구조의 군집분석 (Tree Based Cluster Analysis Using Reference Data)

  • 최대우;구자용;최용석
    • 응용통계연구
    • /
    • 제17권3호
    • /
    • pp.535-545
    • /
    • 2004
  • 이 논문에서 제안하는 군집분석방법은 분석자료와 동일한 구조의 배경자료를 생성하고 이를 나무모형의 분류기법을 이용하여 분리해 냄으로써 변수들의 규칙으로 정의되는 군집을 형성한다. 배경자료는 reverse-arcing 알고리즘을 통하여 분석자료와 공간상에서 대비되도록 생성되며 군집이 효과적으로 식별되도록 돕는다. 이 방법은 분석자료에 이산형 변수가 혼합된 경우에도 적용할 수 있으며 모의실험자료와 실제 자료를 이용하여 제안된 알고리즘의 성능을 규명하였다.

의사결정트리와 인공 신경망 기법을 이용한 침입탐지 효율성 비교 연구 (A Comparative Study on the Performance of Intrusion Detection using Decision Tree and Artificial Neural Network Models)

  • 조성래;성행남;안병혁
    • 디지털산업정보학회논문지
    • /
    • 제11권4호
    • /
    • pp.33-45
    • /
    • 2015
  • Currently, Internet is used an essential tool in the business area. Despite this importance, there is a risk of network attacks attempting collection of fraudulence, private information, and cyber terrorism. Firewalls and IDS(Intrusion Detection System) are tools against those attacks. IDS is used to determine whether a network data is a network attack. IDS analyzes the network data using various techniques including expert system, data mining, and state transition analysis. This paper tries to compare the performance of two data mining models in detecting network attacks. They are decision tree (C4.5), and neural network (FANN model). I trained and tested these models with data and measured the effectiveness in terms of detection accuracy, detection rate, and false alarm rate. This paper tries to find out which model is effective in intrusion detection. In the analysis, I used KDD Cup 99 data which is a benchmark data in intrusion detection research. I used an open source Weka software for C4.5 model, and C++ code available for FANN model.

무선 센서 네트워크에서 주기적인 트래픽의 효율적인 모니터링을 위한 MAC 프로토콜 (PM-MAC : An Efficient MAC Protocol for Periodic Traffic Monitoring In Wireless Sensor Networks)

  • 김동민;김성철
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권7호
    • /
    • pp.157-164
    • /
    • 2008
  • 본 논문에서는 센서 노드들이 트리(tree) 구조를 가지며 주기적인 트래픽을 전송하는 무선센서 네트워크에서 싱크 노드로 데이터를 효율적으로 전송하기 위한 스케줄링 알고리즘을 치안한다. 관련 연구[1]에서는 주기적인 트래픽을 효율적으로 전송하는 알고리즘을 제안하였으나, 트리구조가 깊어지고, 자식 노드들이 많아짐에 따라 에너지 소모가 증가하고, 데이터 처리율이 떨어지는 문제점을 보였다. 제안하는 알고리즘은 유휴 타임 슬롯(Time Slot)을 활용하고, 데이터를 중복되지 않게 전송함으로 효율적인 모니터링을 가능케 한다. 또한 유사 데이터에 대한 효율적인 전송 방안 및 긴급 데이터가 발생할 경우 EDP(Emergency Data Period)를 추가하여 전송대기시간을 줄이게 하는 방법도 제안하고자 한다. 성능 분석을 통하여 제안하는 알고리즘이 기존연구보다 더 높은 데이터 처리율을 보이고, 에너지 소모를 적게 함을 보였다.

  • PDF

새만금 간척지 수림대 조성 방안 - 곰솔과 졸참나무의 초기 생장량 분석 - (Plan to Construct Tree Belt around Saemangeum Reclaimed Land - Analysis of Initial Growth Amount of Pinus thunbergii and Quercus serrata -)

  • 김현
    • 한국환경복원기술학회지
    • /
    • 제20권1호
    • /
    • pp.117-129
    • /
    • 2017
  • This research was conducted to construct a tree belt around Saemangeum reclaimed land using various planting methods and to analyze initial growth amount, to provide practical data to construct tree belt of various purposes. Tree species used in tree belt construction were Pinus thunbergii and Quercus serrata, and the main planting treatment methods used were categorized by existence of windy fence, mixed planting, and un-mixed planting. Growth amount analysis was conducted using ANOVA to compare growth amounts in different experimental groups and Duncan's multiple range test. Growth amount analysis results of tree belt by planting method showed that it is most statistically plausible to install 50% porous windy fence from the direction of wind and frost, followed by planting P. thunbergii and Q. serrata in areas that require mixed tree species tree belt around Saemangeum reclaimed land. In areas where un-mixed planting tree belt is required, it was appropriate to use P. thunbergii alone without a windy fence. Lastly, if the purpose of the tree belt is limited to rapid growth, it was most ideal to plant P. thunbergii alone (without windy fence) or install 50% porous windy fence from the direction of wind and frost, followed by planting P. thunbergii and Q. serrata. This research is based on initial growth amount of tree belt and there is a need for a long-term monitoring of tree belt growth to increase tree-planting success rate in establishing tree belt according to Saemangeum internal development.

Tmr-트리 : 주기억 데이터베이스에서 효율적인 공간 색인 기법 (Tmr-Tree : An Efficient Spatial Index Technique in Main Memory Databases)

  • 윤석우;김경창
    • 정보처리학회논문지D
    • /
    • 제12D권4호
    • /
    • pp.543-552
    • /
    • 2005
  • 최근 들어 계속되는 램 가격 하락으로 인해 대용량의 램을 사용하는 주기억 데이터베이스 시스템의 구축이 실현 가능하게 되었다. 그러나 기존의 디스크 기반 공간 색인 기법은 디스크 접근 시간만을 주로 고려하기 때문에, 주기억 색인 기법으로 디스크 기반 색인 기법을 직접적으로 적용시키는 것은 부적절하다. 주기억 장치 색인 기법은 모든 색인 노드들이 주기억 장치에 상주하기 때문에 노드에 대한 접근 시간이 디스크 기반 기법에 비해 상당히 미미하고, 결국 효율적인 색인 기법을 위해서는 노드 접근시간 뿐만 아니라 노드내의 키 비교시간을 고려해야 한다. 이러한 주기억 장치 색인 기법의 특성을 고려하여, 본 논문에서는 Tmr-트리라는 새로운 색인 기법을 제시한다. Tmr-트리는 T-트리의 장점과 R-트리의 장점을 결합한 이진 색인 구조로서, 색인 노드는 데이터 객체들을 위한 엔트리들, 왼쪽/오른쪽 자식 노드에 대한 포인터, 그리고 3개의 추가 필드들로 구성된다. 여기서 3개의 추가 필드들은 현재 노드에 저장된 키 값들의 범위를 포함하는 MBR과 왼쪽 서브트리에 저장된 키 값들의 범위를 포함하는 MBR, 오른쪽 서브트리에 저장된 키 값들의 범위를 포함하는 MBR에 해당한다. 본 논문의 실험에서 Tmr-트리는 R-트리와 달리 검색 시 항상 리프노드까지 방문할 필요가 없기 때문에 모든 데이터 분포에서 R-트리에 비해 더 나은 실험 결과를 보여주었다. 노드 크기 측면에서 노드안 엔트리 수를 증가시킨 초반에 상당한 검색성능 향상을 보여주었으며, 그 후로 약간씩 검색시간 증가를 나타냈다. 한편, 삽입시간 측면에서 Tmr-트리는 R-트리에 비해 약간의 더 많은 삽입시간이 필요했다.

플래시 메모리 기반 인덱스 구조에서 대리블록 이용한 가비지 컬렉션 기법 (Garbage Collection Method using Proxy Block considering Index Data Structure based on Flash Memory)

  • 김선환;곽종욱
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권6호
    • /
    • pp.1-11
    • /
    • 2015
  • 낸드 플래시 메모리는 빠른 접근 시간과 저전력의 특성을 가지고 있어 저장장치로 많이 사용되고 있는 추세이다. 하지만 저사양의 임베디드 장치에서는 메모리 요구사항과 구현상의 복잡성으로 FTL을 적용하기에는 비용이 많이 든다. 이러한 이유로 FTL을 구현하기 힘든 임베디드 장치에 적용할 수 있는 B+ 트리 연구들이 다수 제안되었다. 이런 연구들은 낸드 플래시 메모리에서 제자리 업데이트가 불가하다는 단점을 고려하여 삽입과 갱신의 성능을 최적화 하였다. 하지만 B+ 트리에 기존의 가비지 컬렉션 기법들을 적용하면 낸드 플래시 메모리의 페이지 위치를 변경하게 되고 B+ 트리의 재구성을 발생시켜 전체적인 성능을 저하시킨다. 이러한 문제를 해결하고자 본 논문에서는 낸드 플래시 메모리를 기반으로 하는 B+ 트리와 이와 유사한 인덱스 트리 구조에 적용할 수 있는 가비지 컬렉션 기법을 제안한다. 제안하는 가비지 컬렉션 기법은 블록 정보 테이블과 대리 블록을 이용하여 B+ 트리의 재구성을 발생시키지 않는다. 제안된 기법의 성능평가를 위해, 낸드 플래시 메모리가 장착된 실험 장치에 B+ 트리와 ${\mu}$-Tree를 구현하고 제안된 기법을 적용하였다. 구현 결과 B+ 트리에서 제안된 기법이 GAGC(Greedy Algorithm Garbage Collection)보다 삽입된 키의 개수가 약 73% 많았으며, ${\mu}$-Tree에서 제안된 기법이 GAGC보다 시간 오버헤드가 약39% 적었다.

AgNO$_3$을 이용한 수트리의 실시간 열화계측 (The Aging Measurement of Water Tree Using AgNO$_3$Solution)

  • 김덕근;오수홍;이진;이은학;김태성
    • 한국전기전자재료학회:학술대회논문집
    • /
    • 한국전기전자재료학회 1997년도 추계학술대회 논문집
    • /
    • pp.409-412
    • /
    • 1997
  • The phenomenon of water tree degradation of underground distribution power cables is taking place in polymeric insulation materials under the existence of water and application of electric stress, but water tree is not easy to observe, o water tree features in power cables are shown after cutting and dying with methyleneblue. In previous method, it is impossible to acquire continuous treeing data, and when the insulation material has been cut, the micro crack(water tree) has been damaged. In this paper, to overcome these deflects, the etching method is made use of making needle electrode about 170[${\mu}{\textrm}{m}$] diameter, and AgNO$_3$(silver nitrate) solution is used as liquid electrode to accelerate the growth of water trees. As a result of this study, water tree is observed in real-time with microscope. Electrical tree owing to water treeing is initiated at low electric field and grown with discontinuous. Namely, water tree is shown up a different characteristics of tree growth.

  • PDF

오픈플로우 기반의 과학실험데이터센터 네트워크의 성능 향상을 위한 스케줄링 알고리즘 (A Scheduling Algorithm for Performance Enhancement of Science Data Center Network based on OpenFlow)

  • 공정욱;민석홍;이재용;김병철
    • 한국정보통신학회논문지
    • /
    • 제21권9호
    • /
    • pp.1655-1665
    • /
    • 2017
  • 최근 많은 클라우드 서비스 제공자, 기업, 연구소 등에서 데이터센터를 활발히 구축하고 있다. 일반적으로 데이터 센터는 부하 분산을 위해 ECMP 데이터 포워딩 기법을 사용하여 트리 토폴로지 형태로 구축된다. 본 논문에서는 트리 토폴로지와 팻트리 토폴로지를 살펴보고, 또한 MLAG와 ECMP 같은 부하 분산 기술을 알아본다. 그리고 데이터 센터내의 호스트에 저장되어 있는 특정 파일을 데이터센터 외부로 효율적으로 송신할 수 있는 스케줄링 알고리즘을 제안한다. 제안된 알고리즘은 팻트리 토폴로지와 오픈플로우 프로토콜을 이용한다. 수치해석을 통해 성능 분석을 수행하며, ECMP의 성능과 비교한다. 이러한 성능 비교를 통해 평균처리율과 파일전송완료시간에 있어서 제안된 알고리즘의 성능이 우수함을 보인다.