• 제목/요약/키워드: Partitioned Data Sets

검색결과 21건 처리시간 0.019초

분할된 역 인덱스 테이블에서 부모노드의 정보를 이용한 질의 처리 (Query Processing using Information of Parent Nodes in Partitioned Inverted Index Tables)

  • 김명수;황병연
    • 한국멀티미디어학회논문지
    • /
    • 제11권7호
    • /
    • pp.905-913
    • /
    • 2008
  • 최근 XML(Extensible Markup Language) 사용의 증가와 함께 다량의 이질적 구조를 가진 XML문서들이 이용되고 있으며, 이러한 XML문서들의 효율적인 관리를 위해 데이터 저장 구조에 대한 연구의 필요성이 증가하고 있다. 이에 따라 본 논문에서는 이들 XML 문서들의 효율적인 관리를 위하여 분할된 역 인덱스 테이블에서 부모노드의 정보를 이용하여 질의를 처리하는 방법을 제안한다. 이질적 구조를 가진 대규모의 문서들에 대한 질의 처리 횟수와 처리 데이터 량은 검색 성능에 큰 영향을 주기 때문에 데이터 구조를 설계할 때에 이 두 가지 요소들을 신중히 고려해야 한다. 제안된 방법은 부모 노드의 정보를 이용하여 선형 경로 질의를 위한 질의 처리 횟수를 반감시키고, 역 인덱스 테이블을 XML 트리의 깊이에 따라 적절히 분할하여 탐색 대상이 되는 데이터의 양을 줄이기 때문에 XML 문서에 대한 검색 성능을 향상시킨다. 제안하는 방법의 효율성을 입증하기 위해 인터넷에서 수집한 XML 문서들에 대한 XPath 질의 처리 성능이 기존의 역 색인 기법들에 비해 우수함을 보인다.

  • PDF

Interior Partitioned Layout and Daylighting Energy Performance in Office Buildings

  • Kim, Gon
    • Architectural research
    • /
    • 제1권1호
    • /
    • pp.31-40
    • /
    • 1999
  • In this age of "Information", many people consider it a deterrent to information flow to provide a hierarchy with private rooms in a modern office layout. There are others, however, who insist that visual and acoustical privacy are more important than any other design factor in achieving higher productivity. The debate may never end, but the partitioned open plan, which is a new form of the vast open plan, has merits of each concept - open and closed layout. Consequently, office design has dramatically shifted to partitioned open planning, with shorter, temporary walls or partitions, originally intended for increasing privacy and diminishing hierarchy, yet still keeping flexibility in spatial organization. The introduction of low-level partitioned spaces in an office layout, however, produces a complicated lighting design problem. Obviously, accurately predicted daylighting performance data are needed not only for daylighting design but for artificial lighting system design. Scale models of 12 sets of unit partitioned spaces are constructed and extensive scale model measurements of both daylight and reflected sunlight have been performed within an artificial sky simulator. The prototype-building interior is modeled with different partition configurations, each of which is modeled using the different envelope geometry and exterior configurations, and then the variations in interior light levels are estimated. The result indicates that partitioned spaces employed in an open plan of modern offices still offer a large potential for daylighting and energy saving as well. Much of the savings may derive from the cumulative effect of reflected sunlight. Optimal design for building envelope geometry and exterior configuration promises additional savings.

  • PDF

Validity Study of Kohonen Self-Organizing Maps

  • Huh, Myung-Hoe
    • Communications for Statistical Applications and Methods
    • /
    • 제10권2호
    • /
    • pp.507-517
    • /
    • 2003
  • Self-organizing map (SOM) has been developed mainly by T. Kohonen and his colleagues as a unsupervised learning neural network. Because of its topological ordering property, SOM is known to be very useful in pattern recognition and text information retrieval areas. Recently, data miners use Kohonen´s mapping method frequently in exploratory analyses of large data sets. One problem facing SOM builder is that there exists no sensible criterion for evaluating goodness-of-fit of the map at hand. In this short communication, we propose valid evaluation procedures for the Kohonen SOM of any size. The methods can be used in selecting the best map among several candidates.

요약된 Partitioned-Layer Index: Partitioned-Layer Index의 임의 접근 횟수를 줄이는 Top-k 질의 처리 방법 (Abstracted Partitioned-Layer Index: A Top-k Query Processing Method Reducing the Number of Random Accesses of the Partitioned-Layer Index)

  • 허준석
    • 한국멀티미디어학회논문지
    • /
    • 제13권9호
    • /
    • pp.1299-1313
    • /
    • 2010
  • Top-k 질의는 데이터베이스에서 사용자가 가장 원하는 k개의 객체를 구하는 질의이다. Top-k 질의를 효율적으로 처리하는 대표적인 연구로 Partitioned-Layer Index (간단히, PL-index) 방법이 있다. PL-index는 데이터베이스를 여러 개의 더 작은 데이터베이스로 분할하고 각 분할된 데이터베이스에 대해 sublayer들의 list (간단히, sublayer list)를 구성한다. 이때, 분할된 데이터베이스에 대해서 top-i 결과가 될 수 있는 객체들을 그 분할된 데이터베이스에 대한 i번째 sublayer로 구성한다. 그리고 주어진 질의에 맞춰 그 sublayer list들을 병합함으로써 질의 결과를 구한다. PL-index는 질의 처리 시 데이터베이스로부터 읽어 들이는 객체의 개수가 매우 작다는 장점을 가지지만, sublayer list들을 병합할 때에 임의 접근(random access)이 많이 발생하기 때문에 디스크 기반의 데이터베이스 환경에서 질의 처리 성능이 저하된다. 이에 본 논문에서는 임의 접근 횟수를 줄임으로써 디스크 기반의 데이터베이스 환경에서 PL-index의 질의 처리 성능을 크게 향상시키는 요약된(Abstracted) Partitioned-Layer Index (간단히, APL一index)를 제안한다. 먼저, PL-index의 각 sublayer를 가상의 (점) 객체로 요약함으로써 sublayer list들을 이러한 점 객체들의 list들(즉, APL-index)로 변형한다. 그리고 APL-index에 대해 질의 처리를 가상으로 수행하여 실제 질의 처리 시 접근할 sublayer를 예측한다, 그리고 예측된 sublayer들을 sublayer list별로 한꺼번에 읽어 들임으로 PL-index에서 발생하는 임의 접근 횟수를 줄인다. 합성 데이터와 실제 데이터에 대한 실험을 통하여 제안한 APL-index가 PL-index의 임의 접근 횟수를 크게 줄일 수 있음을 보인다.

On a Novel Way of Processing Data that Uses Fuzzy Sets for Later Use in Rule-Based Regression and Pattern Classification

  • Mendel, Jerry M.
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제14권1호
    • /
    • pp.1-7
    • /
    • 2014
  • This paper presents a novel method for simultaneously and automatically choosing the nonlinear structures of regressors or discriminant functions, as well as the number of terms to include in a rule-based regression model or pattern classifier. Variables are first partitioned into subsets each of which has a linguistic term (called a causal condition) associated with it; fuzzy sets are used to model the terms. Candidate interconnections (causal combinations) of either a term or its complement are formed, where the connecting word is AND which is modeled using the minimum operation. The data establishes which of the candidate causal combinations survive. A novel theoretical result leads to an exponential speedup in establishing this.

퍼지균등화와 러프집합을 이용한 선박설계 지식기반 구축 (Knowledge Base Construction of Ship Design Using Fuzzy Equalization and Rough Sets)

  • 서규열
    • 한국해양공학회지
    • /
    • 제21권6호
    • /
    • pp.115-119
    • /
    • 2007
  • Inference rules of the knowledge base, generated by experts or optimization, may be often inconsistent and incomplete. This paper suggests a systematic and automatic method which extracts inference rules not from experts' subject but from data. First, input/output linguistic variables are partitioned into several properties by the fuzzy equalization algorithm and each combination of their properties comes to premise of inference rule. Then, the conclusion which is the mast suitable for the premise is selected by evaluating consistent measure. This method, automatically from data, derives inference rules from experience. It is shown through application that extracts new inference rules between hull dimensions and hull performance.

영상 분류를 위한 분류기 통합모델 (Classifier Integration Model for Image Classification)

  • 박동철
    • 전자공학회논문지CI
    • /
    • 제49권2호
    • /
    • pp.96-102
    • /
    • 2012
  • 영상 분류를 위한 다단계 특성벡터 기반의 분류기 모델(Partitioned Feature-based Classification Model with Expertise Table: PFC-ET)의 성능을 더욱 향상시킨 진보된 형태의 분류기 통합모델 (Classifier Integration Model: CIM)이 본 논문에서 제안되었다. CIM은 PFC-ET과 같이 주어진 데이터에서 추출된 전체의 특징벡터를 연결하여 이용하지 않고, 같은 성질의 특징 벡터들끼리 모아서, 각각의 국지적 학습기를 통하여 분류에 이용한다. PFC-ET에서 분류판단 확률행렬에 의한 오류를 최소화하기위해 국지적 분류기로 사용되는 군집화 알고리즘의 멤버 비율을 사용하여 최종적인 분류의 정확도를 높이는 방안을 제안한다. 제안된 CIM의 성능을 검증하기 위하여, Caltech 데이터에 대한 일반적인 영상 분류와 6 클래스 위성 영상 분류 문제에 대한 실험을 진행하였다. 제안된 CIM은 기존의 PFC 와 PFC-ET 모델과 비교한 실험에서 분류 정확도와 후처리 문제의 복잡성 면에서 향상된 성능을 보여주었다.

Three Color Algorithm for Two-Layer Printed Circuit Boards Layout with Minimum Via

  • Lee, Sang-Un
    • 한국컴퓨터정보학회논문지
    • /
    • 제21권3호
    • /
    • pp.1-8
    • /
    • 2016
  • The printed circuit board (PCB) can be used only 2 layers of front and back. Therefore, the wiring line segments are located in 2 layers without crossing each other. In this case, the line segment can be appear in both layers and this line segment is to resolve the crossing problem go through the via. The via minimization problem (VMP) has minimum number of via in layout design problem. The VMP is classified by NP-complete because of the polynomial time algorithm to solve the optimal solution has been unknown yet. This paper suggests polynomial time algorithm that can be solve the optimal solution of VMP. This algorithm transforms n-line segments into vertices, and p-crossing into edges of a graph. Then this graph is partitioned into 3-coloring sets of each vertex in each set independent each other. For 3-coloring sets $C_i$, (i=1,2,3), the $C_1$ is assigned to front F, $C_2$ is back B, and $C_3$ is B-F and connected with via. For the various experimental data, though this algorithm can be require O(np) polynomial time, we obtain the optimal solution for all of data.

평가와 선택기법에 기반한 대표패턴 생성 알고리즘 (A Representative Pattern Generation Algorithm Based on Evaluation And Selection)

  • 이형일
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권3호
    • /
    • pp.139-147
    • /
    • 2009
  • 메모리 기반 추론 기법은 단순히 학습패턴이나 대표패턴의 형태로 메모리에 저장하며 테스트 패턴과의 거리 계산을 통하여 분류한다. 이 기법의 가장 큰 문제점은 학습 패턴 전체를 메모리에 저장하거나 학습 패턴들을 대표 패턴으로 대체하는 방법을 사용함으로 다른 기계학습 방법에 비하여 많은 메모리 공간을 필요로 하며, 저장되는 학습패턴이 증가할수록 분류에 필요한 시간도 많이 소요된다는 단점을 갖는다. 본 논문은 효율적인 메모리 사용과 분류 성능의 향상을 위한 EAS 기법을 제안하였다. 즉, 학습패턴에 대해 분할공간을 생성한 후 생성된 각 분할공간을 MDL기법과 PM기법으로 평가하였다. 그리고 평가 결과 가장 우수한 분할공간만을 취하여 대표패턴으로 삼고 나머지는 다시 분할하여 평가를 반복하는 기법이다. UCI Machine Learning Repository에서 벤치마크 데이터를 발췌한 실험 자료를 사용하여 제안한 기법의 성능과 메모리 사용량에 있어 우수함을 입증하였다.

Spatio-Temporal Analysis of Trajectory for Pedestrian Activity Recognition

  • Kim, Young-Nam;Park, Jin-Hee;Kim, Moon-Hyun
    • Journal of Electrical Engineering and Technology
    • /
    • 제13권2호
    • /
    • pp.961-968
    • /
    • 2018
  • Recently, researches on automatic recognition of human activities have been actively carried out with the emergence of various intelligent systems. Since a large amount of visual data can be secured through Closed Circuit Television, it is required to recognize human behavior in a dynamic situation rather than a static situation. In this paper, we propose new intelligent human activity recognition model using the trajectory information extracted from the video sequence. The proposed model consists of three steps: segmentation and partitioning of trajectory step, feature extraction step, and behavioral learning step. First, the entire trajectory is fuzzy partitioned according to the motion characteristics, and then temporal features and spatial features are extracted. Using the extracted features, four pedestrian behaviors were modeled by decision tree learning algorithm and performance evaluation was performed. The experiments in this paper were conducted using Caviar data sets. Experimental results show that trajectory provides good activity recognition accuracy by extracting instantaneous property and distinctive regional property.