• Title/Summary/Keyword: 데이터 인덱스 정보

Search Result 383, Processing Time 0.05 seconds

Resource Scheduling Framework based on Resource Parameter Graph (자원인자 기반 스케줄링 프레임워크)

  • 배재환;권성호;김덕수;이강우
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.8 no.3
    • /
    • pp.19-31
    • /
    • 2003
  • For the implementation of large scale GRID systems, the performance scalability in resource scheduling is clearly to be addressed. In this research, we analyzed existing scheduling frameworks from the viewpoint of the performance and propose a novel resource scheduling framework called resource parameter based scheduling. Proposed scheduling framework consists of three components. The first is the resource parameter graph that expresses resource information via inter-resource relation and the composition base on the hierarchical structure. The second component is the resource parameter tree to be used for the implementation of the memory-based index of resource information. The third component is the resource information repository which mostly consists of static data to be used for the general resource information services. This paper presents the details of the framework.

  • PDF

An Efficient Indexing Method For XML Documents Using Pre-Order List (Pre-Order List를 이용한 XML문서의 효과적인 색인방법)

  • 김영;박상호;박선;이주홍;홍준식
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.154-156
    • /
    • 2004
  • 최근 XML은 인터넷상의 데이터의 표현 및 교환의 표준으로 인식되면서 XML에 대한 많은 연구가 이루어지고 있다 특히 XML문서의 정보량이 방대해짐에 따라 빠른 검색의 필요로 많은 인덱싱 기법들이 제안되었다. 최근의 연구 중, 패스를 기반으로 하는 인덱싱 기법들은 중간노드와 최하위노드의 검색, 조상-후손관계의 조인연산 등에서 성능이 떨어지는 경향이 있다. 이를 보완하기 위해 연구된 Numbering-Scheme 기반의 인덱싱 기법들은 대부분의 검색에서 우수한 성능을 보인다. 그러나 하위 노드가 늘어나는 경우엔 검색 오버헤드가 커질 수 있으며, 대량의 XML 문서나 구조가 다른 XML 문서가 추가되면 인덱스와 데이터 값의 재조정이 필요하게 된다. 이러한 문제를 해결하기 위하여 본 논문은 Numbering-Scheme을 기반으로 각 노드별 노드범위(Node-Range)와 Pre-Order List물 추가하여 검색성능을 높이고, 데이터의 삽입, 삭제에 효과적인 인덱싱 기법을 제안한다.

  • PDF

Retrieval of Large scaled XML Documents based on Path Query using Inverted indexes (역 색인을 이용한 경로 질의 기반 대용량 XML문서 검색)

  • Moon, Kyung-Won;Hwang, Byung-Yeon
    • Annual Conference of KIPS
    • /
    • 2005.05a
    • /
    • pp.35-38
    • /
    • 2005
  • 1998년 XML 문서 표준이 제안된 이래, 다양한 응용 분야에서 XML은 데이터를 표현하는 표준으로 자리잡아 가고 있다. 특히, 인터넷상의 많은 데이터들이 XML 형태로 작성되고 변환됨에 따라 다량의 XML 데이터가 생성되고 있다. 따라서 현재 XML 문서의 저장 및 질의 처리 기법의 연구가 활발하게 진행되고 있다. 하지만 기존의 연구는 대용량 XML 문서를 다루기에는 미흡한 점이 있다. 본 논문에서는 인터넷상의 널리 퍼져있는 방대하고, 다양한 구조의 XML문서들을 대상으로 패스 기반 질의를 빠르게 처리할 수 있는 검색 기법을 제안한다. 제안된 기법은 인터넷상에 산재해 있는 여러 XML 문서를 관계형 데이터베이스에 효율적으로 저장하고 질의를 통해 인터넷상 XML 문서의 엘리먼트를 빠르게 검색하는데 주안점을 둔다. 먼저, XML 문서를 관계형 데이터베이스에 효율적으로 저장하는 계층형 XML 저장 기법을 제안하고, 정보 검색 시스템에서 많이 사용하는 역 인덱스를 사용하여 저장된 XML 문서에 대한 검색 성능을 향상시킨다.

  • PDF

Design of The Environment for a Realtime Data Integration based on TMDR (TMDR 기반의 실시간 데이터 통합 환경 설계)

  • Jung, Kye-Dong;Hwang, Chi-Gon
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.13 no.9
    • /
    • pp.1865-1872
    • /
    • 2009
  • This study suggests a method for extending XMDR to integrate and search legacy system. This extension blends MSO(Meta Semantic Ontology) for the management of metadata, ML(Meta Location) for the management of location information, and Topic Map which is the standard language used to represent semantic web. This study refers to it as TMDR(Topic Map MetaData Registry). As an intelligent layer, Topic Map functions like an index. However, if the data frequently changes, the efficiency of Topic Map may drop. To solve this problem, the proposed system represents the relation among metadata, the relation among real data, and the relation between metadata and real data as Topic Map. The represented Topic Map proposes a method to reduce the changing relation among real data caused by the relation among metadata.

Storing and Querying XML Data using ORDBBM (ORDBMS를 이용한 XML문서의 저장 및 질의)

  • 박성희;박경현;김록원;남광우;류근호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.81-83
    • /
    • 2000
  • 현재 XML 문서를 저장하고 이에 대한 질의를 처리하는 백엔드 저장소로써는 파일시스템, 기존의 RDBMS와 OODBMS를 이용하는 접근 방법이 있다. 또한 독자적으로 semistrucured 데이터에 대한 저장 및 질의를 처리 할 수 있는 데이터베이스 시스템이 존재한다. 따라서, 이 논문에서는 기존의 응용프로그램에서 이용하는 데이터와 통합을 잘 할 수 있는 RDBMS의 장점과 객체지향 DOM모델을 지원할 수 있는 OODBMS의 특징을 모두 수용할 수 있는 ORDBMS에서 XML 문서를 저장하고 저장된 데이터에 대한 질의를 잘 할 수 있는 XML문서 처리시스템을 설계한다. 여기서, XML문서의 논리적 구조가 정해져 있지 않는 XML문서를 ORDBMS의 테이블 형태로 저장하는 여러 가지 방법을 제시하고, semistructured 데이터에 대한 질의의 특징인 패스표현을 효율적으로 지원하기 위해 패스 인덱스의 개념을 제시한다. 이렇게 함으로써 XML문서에 대한 질의를 ORDBMS에서 처리할 때 효율성을 높일 수 있다.

  • PDF

Study on the searching of images via clustering (이미지 데이타 클러스터링을 이용한 검색 연구)

  • Kim, Jin-Ok;Hwang, Dae-Joon
    • Annual Conference of KIPS
    • /
    • 2002.04a
    • /
    • pp.97-100
    • /
    • 2002
  • 이미지, 비디오, 오디오와 같은 멀티미디어 데이터들은 텍스트기반의 데이터에 비하여 대용량이고 비정형적인 특성을 가지기 때문에 검색이 어렵다. 또한 멀티미디어 데이터의 특징은 행렬이나 벡터의 형태로 표현되기 때문에 완전일치 검색이 아닌 유사 검색을 수행하여 사용자가 원하는 이미지와 유사한 이미지를 검색해야 한다. 본 연구에서는 멀티미디어 데이터 검색에 클러스터링와 인덱싱 기법을 같이 적용하여 유사한 이미지끼리는 인접 디스크에 클러스터하고 이 클러스터에 접근하는 인덱스를 구축하여 검색이 빠르게 이루어지는 유사 검색방법을 제안한다 제안 검색 방법은 클러스터링을 생성하는 알고리즘과 해싱기법의 인덱싱을 같이 적용함으로써 VQ(Vector Quantization)보다 높은 재현율과 정확도를 보인다.

  • PDF

Design and Implementation of a Web-Based Search Engine for Single Nucleotide Polymorphism Data (웹기반의 Single Nucleotide Polymorphism 데이터 검색 시스템의 설계 및 구현)

  • 양진옥;김상수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.160-162
    • /
    • 2002
  • SNP는 개인과 개인간의 DNA에 존재하는 한 염기 쌍의 차이(single base-pair variation)이다. SNP를 이용하면 사람마다 다른 유전병의 형태 등을 규명할 수 있다. 본 논문에서는 한국생명공학연구원의 유전체 사업단에서 개발해 오고 있는 웹기반 SNP데이터 검색 시스템의 설계와 구현에 대해서 설명한다. 본 시스템은 일반 속성(attribute)을 저장하고 검색하기 위해 PostgreSQL DBMS를 사용하고, DNA 시퀸스 검색을 위해 BLAST검색엔진을 사용한 약결합 아키텍쳐(loosely-coupled architecture)를 채택하고 있다. 즉, 일반 속성으로 저장될 수 있는 데이터들은 데이터베이스의 테이블들의 컬럼 값으로 저장하고 SQL 언어를 통해 검색할 수 있도록 하였으며, DNA 시퀸스 검색을 위해서는 BLAST에서 제공하는 인덱스를 구축하고 BLAST 명령어를 사용하여 검색할 수 있도록 하였다. 또한, 결과 분석 모듈을 구현하여 검색 결과들이 다른 웹 사이트의 데이터를 가리키도록 하였다.

  • PDF

Design and Implementation of the CIR-Tree Manager on MiDAS-III for Supporting Efficient Content-Based Image Retrieval (MiDAS-III에서 내용기반 이미지 검색을 위한 CIR-트리 관리기의 설계 및 구현)

  • 이희종;송석일;이석희;유재수;조기형;이훈순;이장선
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.302-304
    • /
    • 1999
  • 최근 이미지 데이터에 대한 요구가 폭발적으로 증가됨에 따라 대용량 이미지 데이터에 대한 저장과 검색에 관한 연구가 활발히 진행되고 있다. 그러나 이미지 데이터는 기존의 텍스트 데이터에 비해 대용량이라는 특성과 비정형적인 특성을 가지고 있어 신속하고 효율적인 검색에 많은 어려움이 있다. 본 논문에서는 기존에 이미지 검색을 위해 제안된 인덱스 구조중 고차원 특성을 효율적으로 수용하고 저장공간의 이용률과 검색성능이 뛰어난 CIR-트리를 국내에서 개발된 상용 데이터베이스 시스템인 바다의 하부 저장구조인 MiDAS 기반에서 구현한다. CIR-트리 관리기를 갖는 MiDAS-III에서 K-NN 질의 및 범위 질의가 처리될 때 순차검색에 비해 약 60~99%정도의 검색성능이 향상되었다.

  • PDF

Research on Real-time Stream Data Monitoring for BodyNet (BodyNet 에서의 스트림 데이터 실시간 모니터링 기법의 연구)

  • Lee, Seul-A;Choi, Ok-ju;Lee, Minsoo
    • Annual Conference of KIPS
    • /
    • 2010.11a
    • /
    • pp.126-129
    • /
    • 2010
  • WBAN(Wireless Body Area Network)기반의 의료 응용으로 실시간 모니터링 시스템을 구현하였다. 특히 산소포화도 생체 센서들로부터 연속적으로 전송되는 스트림 데이터에 대해 다양한 조건을 포함하는 질의들이 실행 되는데 이러한 실시간 모니터링 질의들을 효율적으로 식별하기 위한 질의 인덱스를 설계하였다. 매번 모든 질의들을 실행하기에는 시간이 많이 걸리기 때문에 Interval Skip List 를 이용하여 빠르고 효율적으로 식별하도록 설계하였다. 이로써 위급한 상황의 환자의 건강에 문제가 생겼을 때 신속하게 대처할 수 있는 환경을 제공한다. 본 논문에서는 방대한 양의 스트림 데이터와 이 데이터를 실시간으로 감시할 수 있도록 Interval Skip List 를 스마트 메디컬 스페이스(m-MediNet)에 적용한 방법을 기술하고 있다.

A Hash based R-Tree for Fast Search of Mass Spatial Data (대용량 공간 데이터의 빠른 검색을 위한 해시 기반 R-Tree)

  • Kang, Hong-Koo;Kim, Joung-Joon;Shin, In-Su;Han, Ki-Joon
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2008.10a
    • /
    • pp.82-89
    • /
    • 2008
  • 최근, GIS 분야에서 RFID와 GPS 센서 같은 위치 및 공간 데이타를 포함하는 다양한 GeoSensor의 활용으로 수집되는 공간 데이타가 크게 증가하면서, 대용량 공간 데이타의 빠른 처리를 위한 공간 인덱스의 중요성이 높아지고 있다. 특히, 대표적인 공간 인덱스인 R-Tree를 기반으로 검색 성능을 높이기 위한 연구가 활발히 진행되고 있다. 그러나, 기존 연구는 R-Tree에서 노드의 MBR 간의 겹침이나 트리 높이를 어느 정도 줄임으로써 다소 검색 성능을 향상시켰지만, 트리 검색에서 발생하는 불필요한 노드 접근 비용 문제를 효율적으로 해결하지 못하고 있다. 본 논문에서는 이러한 문제를 해결하고 R-Tree에서 대용량 공간 데이타의 빠른 검색을 제공하는 인덱스인 HR-Tree(Hash based R-Tree)를 제시한다. HR-Tree는 트리 검색 없이 R-Tree 리프 노드를 직접 접근할 수 있는 해시 테이블을 이용함으로써 R-Tree의 검색 성능을 높인다. 해시 테이블은 데이타 영역을 차원에 따라 반복적으로 분할한 Partition과 대응되는 R-Tree 리프 노드의 MBR과 포인터들로 구성된다. 각 Partition은 생성 과정에서 고유의 식별 코드를 갖기 때문에 Partition 코드가 주어지면 해시 테이블에서 해당 레코드를 쉽게 접근할 수 있다. 또한, HR-Tree는 R-Tree구조의 변경없이 다양한 R-Tree 변형 구조에 쉽게 적용할 수 있는 장점이 있다. 마지막으로 실험을 통하여 HR-Tree의 우수성을 입증하였다.

  • PDF