• 제목/요약/키워드: Data Tree

검색결과 3,320건 처리시간 0.028초

이동객체의 현재 위치정보 관리를 위한 셀 기반 색인 기법 (A Cell-based Indexing for Managing Current Location Information of Moving Objects)

  • 이응재;이양구;류근호
    • 정보처리학회논문지D
    • /
    • 제11D권6호
    • /
    • pp.1221-1230
    • /
    • 2004
  • 모바일 환경에서 정보 제공 및 처리의 대상이 되는 사람, 자동차, 비행기 둥과 같은 이동객체는 시간이 경과함에 따라 끊임없이 자신의 위치를 변경하는 특징을 가지며, 이러한 정보들을 데이터베이스에서 효과적으로 처리하기 위해서는 연속적인 위치 변경을 수용할 수 있는 저장공간과 색인 유지 및 관리 기술이 필요하다. 기존의 색인 기법들은 색인의 유지 성능보다 질의 처리 능력을 향상시키는데 노력을 기울여 왔기 때문에 복잡하게 이동하며 매우 빈번하게 위치 정보를 갱신하는 이동객체 정보를 관리하기 어렵다. 이 논문에서는 질의 처리 성능뿐만 아니라 이동객체의 빈번한 위치 갱신을 효율적으로 처리하기 위해 고정 그리드 방식의 색인과 R-Tree의 장점을 결합한 ACAR-Tree(Adaptive Cell index with Auxiliary R-Tree)를 제안한다. 제안된 ACAR-Tree는 R-Tree에서 색인의 재구성으로 인하여 갱신 성능이 저하되는 단점을 보완하기 위하여 고정 그리드 방법의 셀 기반의 색인 방법을 기초로 한다. 또한 고정 그리드 방법에서의 데이터 분포가 편중되었을 경우의 색인 성능저하 문제를 해결하기 위하여, 셀과 버켓이 1 : 1로 매핑되는 셀에서 오버플로가 발생하였을 경우 해당 버켓이 부가적인 색인 구조인 보조R-Tree로 전환하여 처리한다. 제안된 방법을 다양한 데이터 분포 및 데이터 크기에서 실험한 결과, 기존의 R-Tree 기반의 색인 방법과 비교하여 색인의 크기가 크게 감소하였으며, 질의 및 갱신 성능에 대해서도 뛰어난 성능을 보였다.

Encoding of XML Elements for Mining Association Rules

  • Hu Gongzhu;Liu Yan;Huang Qiong
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제14권3호
    • /
    • pp.37-47
    • /
    • 2005
  • Mining of association rules is to find associations among data items that appear together in some transactions or business activities. As of today, algorithms for association rule mining, as well as for other data mining tasks, are mostly applied to relational databases. As XML being adopted as the universal format for data storage and exchange, mining associations from XML data becomes an area of attention for researchers and developers. The challenge is that the semi-structured data format in XML is not directly suitable for traditional data mining algorithms and tools. In this paper we present an encoding method to encode XML tree-nodes. This method is used to store the XML data in Value Table and Transaction Table that can be easily accessed via indexing. The hierarchical relationship in the original XML tree structure is embedded in the encoding. We applied this method to association rules mining of XML data that may have missing data.

  • PDF

압축 지역성 수준에 기반한 캐쉬 인식 압축 색인 (A Cache-Conscious Compression Index Based on the Level of Compression Locality)

  • 김원식;유재준;이진수;한욱신
    • 한국멀티미디어학회논문지
    • /
    • 제13권7호
    • /
    • pp.1023-1043
    • /
    • 2010
  • 최근 메인 메모리의 용량 증가와 가격하락으로 데이터베이스 시스템에서 사용하고 있는 색인 전체를 메인 메모리상에 상주시키는 것이 가능해지고 있다. 그러나 CPU와 메인 메모리의 연산속도와 메인 메모리의 접근 속도의 차이는 해마다 커지고 있다. 이러한 접근 속도 차이로 생기는 문제를 해결하기 위한 많은 연구가 진행 중에 있다. 이러한 연구 중 캐시 인식 트리는 데이터 압축을 통해서 캐시 미스를 줄이고, 메인 메모리의 접근 비용을 감소시킬 수 있다. 기존의 캐시 인식 트리는 데이터의 특성과 관계없이 오직 한 가지 방법의 압축방법을 사용하는 한계가 있다. 본 논문에서는 이러한 한계를 극복 할 수 있는 방법을 제안한다. 첫 번째로, 데이터의 특성을 설명 할 수 있는 압축 지역성의 개념을 제안한다. 두 번째로, 데이터의 특성에 따라 최대한 캐시 미스를 줄일 수 있도록 여러 가지 압축 방법을 지원하는 DC-Tree를 제안한다. 캐시 미스 수 측면에서 DC-Tree는 B+-Tree, Simple prefix DC-Tree, pkB-Tree에 비해 각각 1.7배, 1.5배, 1.3배의 성능 향상을 보였다. 본 논문에서 제안한 DC-Tree는 사업 데이터베이스 시스템에 적용 할 수 있을 것으로 예상되며, 실제 응용에서도 성능 향상을 보일 수 있을 것이다.

PPFP(Push and Pop Frequent Pattern Mining): 빅데이터 패턴 분석을 위한 새로운 빈발 패턴 마이닝 방법 (PPFP(Push and Pop Frequent Pattern Mining): A Novel Frequent Pattern Mining Method for Bigdata Frequent Pattern Mining)

  • 이정훈;민연아
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권12호
    • /
    • pp.623-634
    • /
    • 2016
  • 현존하는 빈발 패턴 마이닝 방법은 대부분 시간 효율성을 목표로 하고, 물리적 메모리 사용에 매우 의존적이다. 하지만 빅데이터 시대가 도래함에 따라 실제 세상의 데이터베이스는 급속도로 증가하고 있으며, 그에 따라 기존의 방법으로 현실적인 거대한 양의 데이터를 마이닝하기에 물리적 메모리 공간이 부족한 실정이다. 이러한 문제를 해결하기 위해, 빈발 패턴 마이닝의 메모리 의존성을 줄이기 위한 보조저장장치 기반의 연구들이 진행되었으나, 메모리 기반의 방법들에 비해 처리 시간이 너무 많이 소비된다는 한계가 있었다. 따라서 확장성을 가지며, 기존의 디스크 기반의 방법들에 비해 시간효율성을 높인 새로운 빈발 패턴 마이닝이 필요하게 되었다. 본 논문에서는 빅데이터로부터 빈도 아이템 집합들을 마이닝하기 위해 메모리와 디스크를 함께 사용하는 스택 기반의 새로운 접근법인 PPFP 알고리즘을 제안하였다. PPFP는 빈발 패턴 마이닝 접근법 중 가장 인기 있고 효율적인 접근법 중 하나인 FP-growth를 기반으로 하고 있다. PPFP 마이닝 방법은 다음과 같이 두 단계로 진행된다. (1) IFP-tree 구축: FP-tree를 생성한 후, 새로운 인덱스 번호 부여 방법으로 FP-tree의 각 노드에 인덱스 번호를 부여하고, 이 인덱스 번호가 부여된 FP-tree(IFP-tree)를 테이블로 변환하여(IFP-table) 디스크에 저장한다. (2) PPFP 알고리즘을 이용한 빈발 패턴 마이닝: 스택 기반의 PUSH-POP 방식으로 패턴을 확장시켜 나가며 빈발 패턴을 마이닝한다. 이러한 방식을 통해 메모리 기반의 방법에 비해 반복적으로 많은 시간이 소모되는 연산에 매우 적은 양의 메모리를 활용하여 확장성과 함께 시간효율성 또한 향상시킬 수 있었다. 그리고 기존의 연구 방법들과 비교 실험을 통해 새로운 알고리즘의 성능을 증명하였다.

IoT 센서 데이터를 이용한 단위실의 재실추정을 위한 Decision Tree 알고리즘 성능분석 (A Study on Occupancy Estimation Method of a Private Room Using IoT Sensor Data Based Decision Tree Algorithm)

  • 김석호;서동현
    • 한국태양에너지학회 논문집
    • /
    • 제37권2호
    • /
    • pp.23-33
    • /
    • 2017
  • Accurate prediction of stochastic behavior of occupants is a well known problem for improving prediction performance of building energy use. Many researchers have been tried various sensors that have information on the status of occupant such as $CO_2$ sensor, infrared motion detector, RFID etc. to predict occupants, while others have been developed some algorithm to find occupancy probability with those sensors or some indirect monitoring data such as energy consumption in spaces. In this research, various sensor data and energy consumption data are utilized for decision tree algorithms (C4.5 & CART) for estimation of sub-hourly occupancy status. Although the experiment is limited by space (private room) and period (cooling season), the prediction result shows good agreement of above 95% accuracy when energy consumption data are used instead of measured $CO_2$ value. This result indicates potential of IoT data for awareness of indoor environmental status.

A Study on the Classification of Variables Affecting Smartphone Addiction in Decision Tree Environment Using Python Program

  • Kim, Seung-Jae
    • International journal of advanced smart convergence
    • /
    • 제11권4호
    • /
    • pp.68-80
    • /
    • 2022
  • Since the launch of AI, technology development to implement complete and sophisticated AI functions has continued. In efforts to develop technologies for complete automation, Machine Learning techniques and deep learning techniques are mainly used. These techniques deal with supervised learning, unsupervised learning, and reinforcement learning as internal technical elements, and use the Big-data Analysis method again to set the cornerstone for decision-making. In addition, established decision-making is being improved through subsequent repetition and renewal of decision-making standards. In other words, big data analysis, which enables data classification and recognition/recognition, is important enough to be called a key technical element of AI function. Therefore, big data analysis itself is important and requires sophisticated analysis. In this study, among various tools that can analyze big data, we will use a Python program to find out what variables can affect addiction according to smartphone use in a decision tree environment. We the Python program checks whether data classification by decision tree shows the same performance as other tools, and sees if it can give reliability to decision-making about the addictiveness of smartphone use. Through the results of this study, it can be seen that there is no problem in performing big data analysis using any of the various statistical tools such as Python and R when analyzing big data.

Industrial Waste Database Analysis Using Data Mining Techniques

  • Cho, Kwang-Hyun;Park, Hee-Chang
    • Journal of the Korean Data and Information Science Society
    • /
    • 제17권2호
    • /
    • pp.455-465
    • /
    • 2006
  • Data mining is the method to find useful information for large amounts of data in database. It is used to find hidden knowledge by massive data, unexpectedly pattern, and relation to new rule. The methods of data mining are decision tree, association rules, clustering, neural network and so on. We analyze industrial waste database using data mining technique. We use k-means algorithm for clustering and C5.0 algorithm for decision tree and Apriori algorithm for association rule. We can use these outputs for environmental preservation and environmental improvement.

  • PDF

센서 네트워크에서 다수의 이동 싱크로의 에너지 효율적인 데이터 전파에 관한 연구 (Proactive Data Dissemination Protocol on Distributed Dynamic Sink Mobility Management in Sensor Networks)

  • 황광일;엄두섭;허경
    • 한국통신학회논문지
    • /
    • 제31권9B호
    • /
    • pp.792-802
    • /
    • 2006
  • In this paper, we propose an energy-efficient proactive data dissemination protocol with relatively low delay to cope well with highly mobile sink environments in sensor networks. In order for a dissemination tree to continuously pursue a dynamic sink, we exploit two novel algorithms: forward sink advertisement and distributed fast recovery. In our protocol, the tree is shared with the other slave sinks so that we call it Dynamic Shared Tree (DST) protocol. DST can conserve considerable amount of energy despite maintaining robust connection from all sources to sinks, since tree maintenance of DST is accomplished by just distributed local exchanges. In addition, since the DST is a kindof sink-oriented tree, each source on the DST disseminates data with lower delay along the tree and it also facilitates in-network processing. Through simulations, it is shown that the presented DST is considerably energy-efficient, robust protocol with low delay compared to Directed Diffusion, TTDD, and SEAD, in highly mobile sink environment.

유비쿼터스 센서 네트워크를 위한 트리 라우팅 구조의 임베디드 시스템 구현 (Embedded System Implementation of Tree Routing Structure for Ubiquitous Sensor Network)

  • 박형근;이철희
    • 한국산학기술학회논문지
    • /
    • 제12권10호
    • /
    • pp.4531-4535
    • /
    • 2011
  • 본 논문에서는 USN(Ubiquitous Sensor Network)에서 사용되는 트리 라우팅(tree routing)의 구조를 임베디드 시스템으로 구현하였다. 트리 라우팅은 USN에서 센서 데이터를 싱크노드로 전송하는 기법 중 하나이며, 라우팅시 홉수에 따라 미리 정의된 ID를 기반으로 센서 데이터가 전송된다. 현재 무선구간의 상태와 센서 노드의 정보를 이용하여 최적의 라우팅 경로를 갖도록 하였으며, 수신된 센서 데이터와 트리라우팅의 결과를 임베디드 시스템을 이용하여 구현함으로써 휴대용 센서 정보 수집장치에 응용이 가능하도록 하였다.

신뢰성 보장을 위한 멀티캐스트에서의 효율적인 라우터 지원 (An Efficient Router Assistance Mechanism for Reliable Multicast)

  • 최종원;최인영
    • 한국정보과학회논문지:정보통신
    • /
    • 제31권2호
    • /
    • pp.224-232
    • /
    • 2004
  • 최선의 전송(best-effort) 방식을 택하는 멀티캐스트 전송에서 신뢰성을 제공하기 위한 연구 중 데이타 채널과는 독립적인 계층적 제어 트리를 통하여 신뢰성을 제공하는 연구는 높은 확장성을 보장하는 것으로 알려져 있다. 그러나 하위 네트워크 계층의 트리에서 토폴로지 형성에 관한 명시적 정보를 제공하지 않는 상태에서 형성된 전송계층의 논리적 제어트리는 네트워크 계층의 트리 토폴로지와 일치하지 않아서 링크를 비효율적으로 사용할 가능성이 있다. 본 논문에서 제안한 라우터의 지원을 받아 제어트리를 구성하는 기법은 중복되는 데이타를 없애고 링크의 효율성을 향상시키는데 그 목적이 있으며, 제어트리에 사용되는 메시지 타입을 검사하는 기능 확장만을 요구함으로써 사용의 용이성을 증가시켰다.