• Title/Summary/Keyword: 속성 클러스터링

Search Result 110, Processing Time 0.039 seconds

A Multidimensional Nested-Attribute Indexing for Queries on Nested Objects (중포된 객체에 대한 질의처리를 위한 다차원 중포 속성 색인기법)

  • 이종학;대구효
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.352-354
    • /
    • 1999
  • 본 논문에서는 객체지향 데이터베이스의 중포된 객체에 대한 질의처리를 효율적으로 지원하기 위한 다차원 중포 속성 색인기법을 제안한다. 중포된 객체에 대한 기존의 색인기법들은 일차원 색인구조를 이용함으로써 중포된 객체의 속성과 클래스 계층이 포함된 다양한 형태의 질의들에 대한 처리를 효율적으로 지원하지 못하는 문제점을 가지고 있다. 다차원 중포 속성 색인기법에서는 다차원 파일구조를 이용하여 중포 속성의 킷값 도메인과 함께 중포 속성을 표현하는 경로상의 모든 속성에 대해 각 속성이 정의된 클래스 계층마다 클래스 식별자 도메인을 할당함으로써, 다차원 도메인 공간상에서 색인 엔트리들의 클러스터링을 다른다. 따라서, 다차원 중포속성 색인기법에서는 기존의 색인기법에서 지원하기 어려운 질의의 대상 범위가 클래스 계층상의 임의의 클래스들로 제한되거나, 질의에 포함된 복합 속성들의 도메인이 클래스 계층상의 임의의 클래스들로 제한되는 경우에도 효율적으로 지원할 수 있다.

  • PDF

Mining of Multi-dimensional Association Rules over Interval Data using Clustering and Characterization (클러스터링과 특성분석을 이용한 구간 데이터에서 다차원 연관 규칙 마이닝)

  • Lim, Seung-Hwan;Kwon, Yong-Suk;Kim, Sang-Wook
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.16 no.1
    • /
    • pp.60-64
    • /
    • 2010
  • To discover association rules from nontransactional data, there have been many studies on discretization of attribute values. These studies do not reflect the change of discovered rules' confidence according to the change of the ranges of the discretized attributes, and perform the discretization stage and the rule discovery stage independently. This causes the ranges of attributes not properly discretized, thereby making the rules having high confidence excluded in the result set. To solve this problem, we propose a novel method that performs the discretization and rule discovery stages simultaneously in order to discretize ranges of attributes in such a way that the rules having high confidence are discovered well. To the end, we perform hierarchical clustering on the attributes in the right hand side of rules, then do characterization on every cluster thus obtained. The experimental result demonstrates that our method discovers the rules having high confidence better than existing methods.

Clustering with Adaptive weighting of Context-aware Linear regression (상황인식기반 선형회귀의 적응적 가중치를 적용한 클러스터링)

  • Lee, Kang-whan
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2021.05a
    • /
    • pp.271-273
    • /
    • 2021
  • 본 논문은 이동노드의 클러스터링내에서 보다 효율적인클러스터링을 제공하고 유지하기위한 딥러닝의 선형회귀적 적응적 보정가중치에 따른 군집적 알고리즘을 제안한다. 대부분의 클러스터링 군집데이터를 처리함에 있어 상호관계에 따른 분류체계가 제공된다. 이러한 경우 이웃한 이동노드중 목적노드와는 연결가능성이 가장높은 이동노드를 클러스터내에서 중계노드로 선택해야 한다. 본 연구에서는 이러한 상황정보를 이해하고 동적이동노드간 속도와 방향속성정보간의 상관관계의 친밀도를 고려한 자율학습기반의 회귀적 모델에서 적응적 가중치에 따른 분류를 제시한다. 본 논문에서는 이러한 상황정보를 이해하고 클러스터링을 유지할 수 있는 자율학습기반의 적응적 가중치에 따른 딥러닝 모델을 제시 한다.

  • PDF

Indexing Techniques or Nested Attributes of OODB Using a Multidimensional Index Structure (다차원 파일구조를 이용한 객체지향 데이터베이스의 중포속성 색인기법)

  • Lee, Jong-Hak
    • The Transactions of the Korea Information Processing Society
    • /
    • v.7 no.8
    • /
    • pp.2298-2309
    • /
    • 2000
  • This paper proposes the multidimensioa! nested attribute indexing techniques (MD- NAI) in object-oriented databases using a multidimensional index structure. Since most conventional indexing techniques for object oriented databases use a one-dimensional index stnlcture such as the B-tree, they do not often handle complex qUlTies involving both nested attributes and class hierarchies. We extend a tunable two dimensional class hierachy indexing technique(2D-CHI) for nested attributes. The 2D-CHI is an indexing scheme that deals with the problem of clustering ohjects in a two dimensional domain space that consists of a kev attribute dOI11'lin and a class idmtifier domain for a simple attribute in a class hierachy. In our extended scheme, we construct indexes using multidimensional file organizations that include one class identifier domain per class hierarchy on a path expression that defines the indexed nested attribute. This scheme efficiently suppoI1s queries that involve search conditions on the nested attribute represcnted by an extcnded path expression. An extended path expression is a one in which a class hierarchy can be substituted by an indivisual class or a subclass hierarchy in the class hierarchy.

  • PDF

Performance Comparison of Clustering Techniques for Spatio-Temporal Data (시공간 데이터를 위한 클러스터링 기법 성능 비교)

  • Kang Nayoung;Kang Juyoung;Yong Hwan-Seung
    • Journal of Intelligence and Information Systems
    • /
    • v.10 no.2
    • /
    • pp.15-37
    • /
    • 2004
  • With the growth in the size of datasets, data mining has recently become an important research topic. Especially, interests about spatio-temporal data mining has been increased which is a method for analyzing massive spatio-temporal data collected from a wide variety of applications like GPS data, trajectory data of surveillance system and earth geographic data. In the former approaches, conventional clustering algorithms are applied as spatio-temporal data mining techniques without any modification. In this paper, we focused to SOM that is the most common clustering algorithm applied to clustering analysis in data mining wet and develop the spatio-temporal data mining module based on it. In addition, we analyzed the clustering results of developed SOM module and compare them with those of K-means and Agglomerative Hierarchical algorithm in the aspects of homogeneity, separation, separation, silhouette width and accuracy. We also developed specialized visualization module fur more accurate interpretation of mining result.

  • PDF

Clustering Technique Using Relevance of Data and Applied Algorithms (데이터와 적용되는 알고리즘의 연관성을 이용한 클러스터링 기법)

  • Han Woo-Yeon;Nam Mi-Young;Rhee PhillKyu
    • The KIPS Transactions:PartB
    • /
    • v.12B no.5 s.101
    • /
    • pp.577-586
    • /
    • 2005
  • Many algorithms have been proposed for (ace recognition that is one of the most successful applications in image processing, pattern recognition and computer vision fields. Research for what kind of attribute of face that make harder or easier recognizing the target is going on recently. In flus paper, we propose method to improve recognition performance using relevance of face data and applied algorithms, because recognition performance of each algorithm according to facial attribute(illumination and expression) is change. In the experiment, we use n-tuple classifier, PCA and Gabor wavelet as recognition algorithm. And we propose three vectorization methods. First of all, we estimate the fitnesses of three recognition algorithms about each cluster after clustering the test data using k-means algorithm then we compose new clusters by integrating clusters that select same algorithm. We estimate similarity about a new cluster of test data and then we recognize the target using the nearest cluster. As a result, we can observe that the recognition performance has improved than the performance by a single algorithm without clustering.

Context-awareness User Analysis based on Clustering Algorithm (클러스터링 알고리즘기반의 상황인식 사용자 분석)

  • Lee, Kang-whan
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.24 no.7
    • /
    • pp.942-948
    • /
    • 2020
  • In this paper, we propose a clustered algorithm that possible more efficient user distinction within clustering using context-aware attribute information. In typically, the data provided to classify interrelationships within cluster information in the process of clustering data will be as a degrade factor if new or newly processing information is treated as contaminated information in comparative information. In this paper, we have developed a clustering algorithm that can extract user's recognition information to solve this problem in using K-means algorithm. The proposed algorithm analyzes the user's clustering attributed parameters from user clusters using accumulated information and clustering according to their attributes. The results of the simulation with the proposed algorithm showed that the user management system was more adaptable in terms of classifying and maintaining multiple users in clusters.

A Tunalbe Class Hierarchy Index for Object -Oriented Databases using a Mulidimensional Index Structure (다차원 색인구조를 이용한 객체지향 데이터베이스의 조율 가능한 클래스 계층 색인기법)

  • Lee, Jong-Hak;Hwang, Gyu-Yeong
    • Journal of KIISE:Software and Applications
    • /
    • v.26 no.3
    • /
    • pp.365-379
    • /
    • 1999
  • 본 논문에서는 객체지향 데이터베이스의 클래스 계층에 대한 색인기법으로 이차원 색인구조를 이용하여 조율 가능한 이차원 클래스 색인기법인 2D-CHI를 제안한다. 2D-CHI 에서는 색인된 속성의 키값 도메인과 클래스 식별자 도메인으로 구성된 이차원 도메인상의 색인엔트리들에 대한 클러스터링 문제를 다룬다. 클러스터링 특성이 하나의 속성에 의해서 독점되는 B+-Tree 와 같은 일차원 색인구조를 이용하는 기존의 클래스 색인기법들은 특정 형태의 질의에 대해서만 적합한 색인기법들로서 다양한 형태의 질의들로 구성된 질의 패턴에 대해서 적절하게 대응하지 못한다. 2D-CHI에서는 질의 피턴에 따라 키값 도메인과 클래스 식별자 도메인 사이에서 색이 엔트리들의 클러스터링 정도를 조정함으로써 질의처리의 성능을 향상시킨다. 2D-CHI 의 성능평가를 위하여, 먼저 데이터의 균일 분포를 가정으로 비용 모델을 정립하여 기존의 색인기법들과 색인의 성능을 비교한다. 그리고, 계층 그리드 파일을 이용하여 구현한 2D-CHI의 실험으로 비용 모델을 검증하며, 다양한 실험을 통하여 데이터의 분포와 주어진 질의 형태에 따라 최적의 이차원 클래스 계층 색인구조를 구성할 수 있음을 보인다.

SOM Clustering Method based on RFM Analysis for Predicting Customer Purchase Pattern in u-Commerce (RFM 분석 기반 고객 구매 패턴을 예측을 위한 SOM 클러스터링 방법)

  • Cho, Young Sung;Moon, Song Chul;Ryu, Keun Ho
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2013.07a
    • /
    • pp.185-187
    • /
    • 2013
  • 유비쿼터스 컴퓨팅이 생활의 일부가 되어가면서 정보의 양도 급속도로 늘어나고 있으며, 이로 인해 많은 데이터 속에서 정보를 찾아내는 기술이 부각되고 있다. 고객 기반의 협력적 필터링을 이용한 고객 선호도 예측 방법에서는 아이템에 대한 사용자의 선호도를 기반으로 이웃 선정 방법을 사용하므로 아이템에 대한 내용을 반영하지 못할 뿐만 아니라 희박성 문제를 해결하지 못하고 있다. 그리고 비슷한 선호도를 가진 일부 아이템의 정보를 바탕으로 하기 때문에 아이템의 속성은 무시하는 경향이 있다. 본 논문에서는 유비쿼터스 상거래에서 RFM(Recency, Frequency, Monetary) 분석 기반의 SOM을 이용한 군집방법을 제안한다. 제안 방법은 고객의 구매 데이터 기반의 유사한 속성의 데이터끼리의 클러스터링을 통해 보다 빠른 시간 내에 고객 성향에 맞는 추천이 가능한 구매 패턴 추출이 가능하다.

  • PDF

Enhanced File Management in Ubiquitous Environments (유비쿼터스 환경에서 향상된 파일 관리)

  • Woo-Seok Hyun
    • Annual Conference of KIPS
    • /
    • 2008.11a
    • /
    • pp.1107-1110
    • /
    • 2008
  • 유비쿼터스 컴퓨팅의 패러다임은 사용자 컨텍스트에 반응하는 컴퓨팅 환경을 구축하는데 있다. 유비쿼터스 환경에서 이상적인 파일 시스템은 현재 컨텍스트를 성공적으로 인식하여 파일관리를 자동화할 수 있는 시스템이다. 유비쿼터스 파일관리에서의 핵심은 휴리스틱(heuristics)에 기반한 클러스터링 방법을 시스템에 적용함에 의해서 수립될 수 있다. 적용된 휴리스틱은 전통적인 파일 시스템에서 파일을 손으로 다루기 위해 사용자에 의해서 파일 속성으로 사용되어졌던 것들이다. 파일 속성은 파일들을 가장 적절한 작업 컨텍스트로 관련짓기 위해서 사용될 수 있고 파일간 관계(inter-file relationship)를 이끌어 낼 수 있다. 본 논문에서는 파일 시스템으로부터 주어진 파일 정보를 연결하는 방법에 대해 논의한다. 이 방법은 개별적인 파일보다는 컨텍스트 관련 작업 집합으로서 파일 관리를 가능하게 해 준다. 조사는 규칙적인 컴퓨터 사용자를 대상으로 수행되었으며 집계된 결과는 본 논문에서 제안한 컨텍스트 기반 파일 클러스터링 방법을 지지해 준다. 수행된 실험 결과는 파일 휴리스틱에서 본 논문에서 제안하는 모델이 파일간 의미있는 관계를 찾아주는 효과적인 결과를 보여주게 되었다.