• Title/Summary/Keyword: 색인 클러스터링

Search Result 106, Processing Time 0.03 seconds

A Multidimensional Nested-Attribute Indexing for Queries on Nested Objects (중포된 객체에 대한 질의처리를 위한 다차원 중포 속성 색인기법)

  • 이종학;대구효
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.352-354
    • /
    • 1999
  • 본 논문에서는 객체지향 데이터베이스의 중포된 객체에 대한 질의처리를 효율적으로 지원하기 위한 다차원 중포 속성 색인기법을 제안한다. 중포된 객체에 대한 기존의 색인기법들은 일차원 색인구조를 이용함으로써 중포된 객체의 속성과 클래스 계층이 포함된 다양한 형태의 질의들에 대한 처리를 효율적으로 지원하지 못하는 문제점을 가지고 있다. 다차원 중포 속성 색인기법에서는 다차원 파일구조를 이용하여 중포 속성의 킷값 도메인과 함께 중포 속성을 표현하는 경로상의 모든 속성에 대해 각 속성이 정의된 클래스 계층마다 클래스 식별자 도메인을 할당함으로써, 다차원 도메인 공간상에서 색인 엔트리들의 클러스터링을 다른다. 따라서, 다차원 중포속성 색인기법에서는 기존의 색인기법에서 지원하기 어려운 질의의 대상 범위가 클래스 계층상의 임의의 클래스들로 제한되거나, 질의에 포함된 복합 속성들의 도메인이 클래스 계층상의 임의의 클래스들로 제한되는 경우에도 효율적으로 지원할 수 있다.

  • PDF

A Study on Intellectual Structure of Library and Information Science in Korea (문헌정보학의 지식 구조에 관한 연구)

  • Yoo, Yeong-Jun
    • Journal of the Korean Society for information Management
    • /
    • v.20 no.3
    • /
    • pp.277-297
    • /
    • 2003
  • This study was conducted upon the premise that index terms display the intellectual structure of a specific subject field. In this study, and attempt was made to grasp the intellectual structure of Library and Information. Science by clustering the index terms of the journals of the related academic societies at the Library of National Assembly - such as the Journal of the Korean Society for Information Management, the Journal of the Korean Library and Information Science Society, and the Journal of the Korean Society for Library and Information Science. Through the course of the study, index term clusters were generated based on the linkage of the index terms and the frequency of co-occurrence, and moreover, time periods analysis was conducted along with studies on first-appearing terms, in order to clarify the trend and development process of the Library and Information Science. This study also analysed the difference between two intellectual structure by comparing the structure generated by index term clusters with the existing structure of traditional classification systems.

An Approximate Approach for Density-Based Clustering Using Multidimensional Indexes (다차원 색인을 이용한 밀도 기반 클러스터링의 근사적 접근 방법)

  • Hwang Jae-Joon;Moon Yang-Sae;Whang Kyu-Young;Jang Joo-Hyun;Kim Jin-Ho
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.37-39
    • /
    • 2005
  • 본 논문에서는 기존의 밀도 기반 전지 클러스터링 알고리즘의 성능을 개선한 밀도 기반 클러스터링의 근사적 접근법을 제안한다. 기존의 밀도 기반 전지 알고리즘은 다차원 색인의 많은 검색 공간을 빠르게 전지하면서도 원하는 클러스터를 정확히 찾아내는 특징을 가지고 있다. 그러나 기존 알고리즘은 전지를 위한 한계 값 설정을 위하여 단말 영역들의 밀도 값을 사용함으로써, 내부 영역에 속한 단말 영역들 간의 밀도 편차가 큰 경우 전지 여부에 대한 판별이 빨리 이루어지지 않는다. 또한, 최악의 경우에는 모든 단말 페이지를 검색하여야 하고, 이에 따라 성능이 저하될 수 있다. 반면에 제안하는 근사적 접근법에서는 한계 값 설정을 위해 단말 영역이 아닌 내부 영역의 밀도 값을 사용한다. 일반적으로, 내부 영역들 간의 밀도 편차는 단말 영역들 간의 밀도 편차보다 크지 않으므로, 근사 밀도 기반 전지 알고리즘에서는 더욱 많은 검색 공간의 전지 여부의 빨리 판별할 수 있게 된다. 성능 평가 실험을 수행한 결과, 제안한 알고리즘은 기존의 알고리즘과 비교하여 정확성 측면에서는 큰 차이가 없는 반면 수행 시간 측면에서는 최대 $17\%$의 성능 향상 효과가 있는 것으로 나타났다.

  • PDF

Splitting policies based on clustering trajectories for indexing positions of moving objects (이동체의 위치 색인을 위한 궤적 클러스터링 기반의 분할 정책)

  • 김진곤;전봉기;홍봉희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04a
    • /
    • pp.773-775
    • /
    • 2003
  • 이동성을 갖는 장치들의 위치 정보를 관리하기 위하여 이동체 데이터베이스에 관한 연구가 필요하게 되었다. 이동체 색인의 검색에서 영역 질의와 궤적 질의는 공간 근접성과 궤적 연결성과 같이 상반된 특징으로 인하여 함께 고려되지 않았다. 이동체 색인에서 영역 질의의 성능개선을 위해서는 노드간의 심한 중복과 사장 공간(Dead space)을 줄여야 하고, 궤적 질의의 성능 개선을 위해서는 이동체의 궤적 보전이 이루어져야 한다. 이와 같은 요구 조건을 만족하기 위해, 이 논문에서는 R-tree를 기반의 색인 구조에서 새로운 분할 정책을 제안한다. 제시하는 색인 구조에서 단말 노드의 엔트리는 궤적이며, 비단말 노드의 엔트리는 자식 노드이다. 단말 노드 분할 정책에서 동일 궤적을 그룹화해서 분할 하는 공간 축 분할 정책과 공간 활용도를 높이는 시간 축 분할 정책을 제안한다. 시간 축 분할 후 사장영역이 클 경우에는 다중 분할을 수행하여 사장 공간을 줄이고 노드간의 중복을 최소화한다. 비 단말 노드 분할 정책에서는 같은 궤적을 저장하는 노드들을 연결 노드(Connected Node)라고 정의하고, 엔트리의 궤적 연결성을 기준으로 분할한다.

  • PDF

A Study on Weighted Hierarchical Color Clustering Using Color Distribution (컬러 분포를 가중치로 이용한 컬러 클러스터링에 관한 연구)

  • 윤위영;범수균;탁우현;이종환;김경석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10b
    • /
    • pp.250-252
    • /
    • 1998
  • 내용기반 이미지 검색(Content-based image retrieval)에서 컬러 특징을 표현하기 위해 컬러 히스토그램이 많이 이용되고 있다. 하지만 히스토그램의 고차원적인 성질 때문에 색인구조를 사용한 효율적인 검색이 어렵고, 유사도 계산 단계에서 비용이 많이 든다. 이점을 개선하기 위해서 이미지의 컬러 정보 손실을 최소화하면서 히스토그램의 차원을 낮추는 컬러 클러스터링 방법이 제안되었다. 이 논문은 이미지 검색의 응용 분야에 따른 이미지 데이터의 컬러 분포 특성을 이용한 컬러 클러스터링 방법을 제안한다. 컬러 분포를 가중치로 이용한 계층적 컬러 클러스터링 방법에 대해 알아보고, 두 단계 컬러 히스토그램을 이용한 이미지 검색에 적용하여 컬러 정보 유지 능력을 실험해 본다.

Color vision test using k-Means clustering (k-Means 클러스터링을 활용한 색각 검사 방안)

  • Lee, Hye-Jin;Park, Young-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.360-362
    • /
    • 2019
  • 본 논문에서는 k-Means 클러스터링을 활용한 컬러 기반 이미지 추출을 통한 색각 검사 방안 연구를 진행한다. 이를 위해, RGB 컬러스페이스 기반의 이미지를 특별한 컬러스페이스 이미지로 변환 후 컬러 패턴 분포에 따라 k-Means 클러스터링을 적용하여 다양한 형태의 이미지를 추출하는 실험을 수행한다. 위의 실험을 통해 하나의 이미지를 컬러 분포 패턴을 통해 클러스터링하여 이미지를 추출을 통하여 정상인과 색각 이상자를 판별할 수 있었다. 실험 결과, 다양한 형태와 색을 가진 이미지를 추출하여 정상인이 보는 이미지와 색각 이상자가 보는 이미지가 다른 것을 확인하였다.

Design and Performance Analysis of Signature-Based Hybrid Spill-Tree for Indexing High Dimensional Vector Data (고차원 벡터 데이터 색인을 위한 시그니쳐-기반 Hybrid Spill-Tree의 설계 및 성능평가)

  • Lee, Hyun-Jo;Hong, Seung-Tae;Na, So-Ra;Jang, You-Jin;Chang, Jae-Woo;Shim, Choon-Bo
    • Journal of Internet Computing and Services
    • /
    • v.10 no.6
    • /
    • pp.173-189
    • /
    • 2009
  • Recently, video data has attracted many interest. That is the reason why efficient indexing schemes are required to support the content-based retrieval of video data. But most indexing schemes are not suitable for indexing a high-dimensional data except Hybrid Spill-Tree. In this paper, we propose an efficient high-dimensional indexing scheme to support the content-based retrieval of video data. For this, we extend Hybrid Spill-Tree by using a newly designed clustering technique and by adopting a signature method. Finally, we show that proposed signature-based high dimensional indexing scheme achieves better retrieval performance than existing M-Tree and Hybrid Spill-Tree.

  • PDF

Clustering System of Restaurant Review in Blog based on Word Similarity (단어 유사도를 기반으로 한 맛집 블로그 포스트 클러스터링 시스템)

  • Jo, Kyungeun;Woo, Gyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.04a
    • /
    • pp.993-996
    • /
    • 2015
  • 인터넷 블로그를 이용한 맛집 마케팅은 외식 산업에서 상당한 영향력을 발휘하고 있다. 사람들은 블로그를 이용해 많은 맛집 리뷰를 작성 및 검색하고 있다. 그런데 사람들이 맛집 리뷰를 검색하면, 검색 엔진에서는 검색어에 대한 정확도 및 시간순으로 검색 결과를 정렬해 주기 때문에 같은 식당에 대한 포스트들이 분산되어 검색된다. 따라서 사람들은 수많은 맛집 리뷰가 섞여있는 검색 결과를 보고 그중 한 식당을 선택하는 것에 어려움을 느낄 수 있다. 이때, 같은 식당에 대한 리뷰를 모아서 보여준다면 어떤 식당에 대한 리뷰가 존재하는지 일목요연하게 볼 수 있으며, 한 식당에 대한 다양한 의견을 참고하여 가고자 하는 식당을 선택하는데 도움이 된다. 따라서 본 논문에서는 블로그의 맛집 포스트를 클러스터링 하는 시스템을 제안하였다. 시스템을 통해 생성된 클러스터의 평가 결과, 정확률, 난수 색인, 순수도는 90% 이상의 높은 값을 보였다.

Recognition of Color Harmony for Sensitivity Recognition (감성인식을 위한 색채 조화 인식)

  • Baek, Jeong-Uk;Shin, Seong-Yoon;Rhee, Yang-Won
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2009.10a
    • /
    • pp.173-174
    • /
    • 2009
  • Color harmony will look good formative elements of the basic lines, shapes and colors. In this paper, we present the implementation of Johannes Itten's color balance. Yellow, red, blue, on the basis of the first color mixing between the index and second color is placed. 12 color balance made by placing a third color between the first color and second color. we recognize this 12 color balance. Edge is detected using the Canny edge operator and labeling and clustering was expressed through the colors.

  • PDF

EPR : Enhanced Parallel R-tree Indexing Method for Geographic Information System (EPR : 지리 정보 시스템을 위한 향상된 병렬 R-tree 색인 기법)

  • Lee, Chun-Geun;Kim, Jeong-Won;Kim, Yeong-Ju;Jeong, Gi-Dong
    • The Transactions of the Korea Information Processing Society
    • /
    • v.6 no.9
    • /
    • pp.2294-2304
    • /
    • 1999
  • Our research purpose in this paper is to improve the performance of query processing in GIS(Geographic Information System) by enhancing the I/O performance exploiting parallel I/O and efficient disk access. By packing adjacent spatial data, which are very likely to be referenced concurrently, into one block or continuous disk blocks, the number of disk accesses and the disk access overhead for query processing can be decreased, and this eventually leads to the I/O time decrease. So, in this paper, we proposes EPR(Enhanced Parallel R-tree) indexing method which integrates the parallel I/O method of the previous Parallel R-tree method and a packing-based clustering method. The major characteristics of EPR method are as follows. First, EPR method arranges spatial data in the increasing order of proximity by using Hilbert space filling curve, and builds a packed R-tree by bottom-up manner. Second, with packing-based clustering in which arranged spatial data are clustered into continuous disk blocks, EPR method generates spatial data clusters. Third, EPR method distributes EPR index nodes and spatial data clusters on multiple disks through round-robin striping. Experimental results show that EPR method achieves up to 30% or more gains over PR method in query processing speed. In particular, the larger the size of disk blocks is and the smaller the size of spatial data objects is, the better the performance of query processing by EPR method is.

  • PDF