• 제목/요약/키워드: 인덱스 구조

검색결과 367건 처리시간 0.036초

중복제거 파일시스템에서 서머리 기반 인덱싱 기법 (A Method of Summary based Indexing in De-duplication File System)

  • 이중수;안창원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.312-313
    • /
    • 2012
  • 중복제거 파일 시스템은 가상머신 이미지와 같이 서로 중복되는 데이터가 많은 파일에서 용량을 줄이기 위하여 많이 사용된다. 중복제거를 위하여 많은 경우 서머리 벡터와 인덱스를 함께 사용하고 있는데, 이는 메모리를 많이 소모하고 인덱스 구조에 따라 여러 번의 하드 디스크 접근을 해야 하는 한계가 있었다. 본 논문에서는 서머리 벡터를 인덱스 내에서 활용하고 하드디스크를 접근하는 횟수를 감소할 수 있는 인덱싱 기법을 제안한다.

시맨틱 웹 데이터의 경로 기반 질의 처리 기법 (The Scheme for Path-based Query Processing on the Semantic Data)

  • 김연희;김지현
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권10호
    • /
    • pp.31-41
    • /
    • 2009
  • 시맨틱 웹에서는 메타데이터와 온톨로지를 이용해 정보 리소스의 개념을 정의하고 의미적 연관성을 표현함으로써 지능적인 정보 검색과 자동화된 웹 서비스의 제공이 가능하다. 이러한 시맨틱 웹의 핵심적인 기능을 구현하기 위해서는 온톨로지와 메타데이터와 같은 시맨틱 웹 데이터를 효율적으로 관리하는 것이 무엇보다 중요하다. 따라서 본 논문에서는 시맨틱 웹 데이터의 의미와 구조적인 특성을 고려하여 보다 정확한 질의 결과의 검색과 효율적인 질의 처리를 지원할 수 있는 인덱스 구조를 제안한다. 특히 시맨틱 웹 데이터의 의미와 구조적인 특성을 그대로 표현하기 위해 그래프 데이터 모델을 이용하고 다양한 질의 형태를 그래프 모델 기반의 경로식으로 처리한다. 본 논문에서 제안한 인덱스는 1차적으로 추출 가능한 구조적 경로 정보는 물론 온톨로지를 이용한 추론을 통해 2차적으로 추출 가능한 구조적 경로 정보에 대한 질의를 처리 대상으로 하여 기존연구들과 차별화하며 시맨틱 웹의 개념을 온전히 반영하는 것을 목표로 한다. 또한 실험적 평가를 통해 본 논문에서 제안한 인덱스 구조가 정확성과 효율성 측면에서 우수하며 시맨틱 웹의 다양한 애플리케이션 개발에 적용 가능함을 보인다.

XML DTD의 효율적인 검색을 위한 구조 정보 및 인덱스 메카니즘 (An Index Mechanism and Structure Information for Efficient Retrieval of XML DTD)

  • 김영란
    • 한국컴퓨터정보학회논문지
    • /
    • 제8권3호
    • /
    • pp.80-86
    • /
    • 2003
  • XML은 웹 상에서 정보를 전달하고 저장하는데 있어 가장 주목을 받고 있는 언어이다. XML로 표현된 정보는 의미가 부여됨으로서 보다 정확하고 빠른 검색을 제공한다. 반면에, XML 문서는 논리적으로는 유사하지만 구조적 측면에서 서로 다른 표현방식으로 작성됨으로 인해, 이 기종 시스템 및 장치를 갖는 문서처리 환경에서 문서를 교환하고 공유하는데 어려움이 있다. 이 논문에서는 객체 지향 클래스 다이어그램을 XML DTD로 변환하고, 동일 주제에 대해 서로 다른 구조로 작성된 XML DTD 문서를 효율적으로 관리하기 위한 구조 정보 표현과 인덱스 메카니즘을 설계하였다. 제안된 방법을 이용함으로써 특정 엘리먼트에 대한 효율적이고 빠른 검색을 지원할 수 있으며, 간단한 연산으로 엘리먼트에 접근을 용이하게 할 수 있는 효과가 기대된다.

  • PDF

An Improved Index Structure for the Flash Memory Based F2FS File System

  • Kim, Yong-Seok
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권12호
    • /
    • pp.1-8
    • /
    • 2022
  • F2FS는 SSD(Solid State Drive)를 위한 파일시스템 중의 하나로서 리눅스 운영체제의 커널에 채용되어 널리 사용되고 있다. F2FS는 플래시 메모리의 특성을 반영하여 성능을 높이기 위한 여러 가지 방안들을 적용하였는데, 그 중의 하나가 파일별 데이터 블록들의 주소 정보를 관리하는 인덱스 구조의 개선이다. 본 논문에서는 F2FS의 인덱스 구조를 더욱 개선하여 성능을 높이는 방안을 제시하였다. F2FS는 모든 인덱스 블록들에 대하여 논리적 번호로 기록하고 이것을 물리적 번호로 매핑하는 테이블을 사용한다. 본 논문에서는 인덱스 블록들 중에서 끝단의 블록만 논리적 번호를 적용하고 앞단의 블록들은 물리적 번호를 직접 적용함으로써, 데이터 블록 접근시에 매핑 테이블을 검색하는 회수를 기존의 1~4회에서 1~2회로 줄일 수 있음을 보여주었다.

XML 문서의 효율적인 저장을 위한 경로 통합 기법 (A Path Combining Strategy for Efficient Storing of XML Documents)

  • 이범석;황병연
    • 한국멀티미디어학회논문지
    • /
    • 제9권10호
    • /
    • pp.1257-1265
    • /
    • 2006
  • XML의 사용이 증가함에 따라서 XML과 관련된 다양한 분야에 대한 연구의 필요성도 증대되고 있는데, 특히 XML로 표현된 문서를 효과적으로 저장, 관리, 검색하기 위한 XML 문서 관리 시스템에 대한 많은 연구들이 활발하게 진행되어 왔다. 이러한 시스템들 중 BitCube는 검색에서 빠른 속도를 통해 뛰어난 성능을 입증한 3차원 비트맵 인덱스 시스템이다. 그러나 문서, 경로, 단어의 세 축으로 이루어진 3차원 메모리 구조를 사용하기 때문에 클러스터 내의 문서가 증가함에 따라 인덱스의 크기가 급격하게 증가하고, 이로 인해 연산 수행속도가 저하되는 문제점을 가지고 있다. 본 논문에서는 BitCube시스템의 문제점을 개선하기 위해 XML 문서의 경로 통합 기법을 제안한다. 이 기법은 XML문서를 시스템의 하부구조에 사용되는 관계형 DBMS에 저장할 때, 유사한 경로들을 통합하여 저장하고, 기존의 3차원 비트맵 인덱스에서 단어로 구성했던 한 축을 value 단위로 구성하여 인덱스 크기를 줄인다 제안한 방법은 3차원 비트맵 인덱스를 구성할 때 인덱스의 크기를 줄이고, 이로 인하여 검객 속도 향상과 디스크 저장 공간의 효율을 가진다.

  • PDF

관계형 모델에서 XML 변경과 전문 검색을 지원하기 위한 역 인덱스 구축 기법 (Inverted Indexes for XML Updates and Full-Text Retrievals in Relational Model)

  • 천윤우;홍동권
    • 정보처리학회논문지D
    • /
    • 제11D권3호
    • /
    • pp.509-518
    • /
    • 2004
  • 최근 산업체를 중심으로 XML 전문 검색과 XML 문서의 변성 기능에 대한 표준의 시도가 활발히 이루어지고 있다. XML 질의어에서의 전문 검색 기능은 매우 중요한 부분을 차지한다. XML 문서는 관계형 테이블과는 달리 문서의 구조가 복잡하며 때로는 매우 불규칙하다. 이런 상황에서의 검색은 부분적인 정보를 최대한 활용해야 하는 전문 검색이 일반적인 구조적 검색보다 매우 중요한 역할을 한다. 본 논문은 XML 데이터를 관리하기 위하여 관계형 모델을 사용하는 환경에서 XML 문서의 변경과 다양한 형태의 전문 검색을 동시에 지원하기 위한 방안으로 효율적인 역 인덱스 구축 기법을 제안한다. 본 논문에서 제안한 방법은 인덱스 크기의 큰 변화 없이 역 인덱스를 구축하며, 대용량의 XML 문서의 다양한 전문 검색 기능을 성능의 저하 없이 지원한다. 또 XML 문서의 부분적인 변화에 역 인덱스의 변경이 기존의 방법들에 비해서 급격히 줄어든 좋은 성능을 보인다.

압축된 써픽스 배열 구축의 실제적인 성능 비교 (Comparisons of Practical Performance for Constructing Compressed Suffix Arrays)

  • 박치성;김민환;이석환;권기룡;김동규
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제34권5_6호
    • /
    • pp.169-175
    • /
    • 2007
  • 써픽스 배열은 기본적인 전체 텍스트 인덱스 자료구조로서, 반복되는 패턴 질의 수행 시 효율적으로 사용될 수 있다. 유용한 전체 텍스트 인덱스 자료구조들이 많이 제안되어왔음에도 불구하고, O(nlogn)-비트 공간을 필요로 하는 공통적인 문제점으로 인하여 보다 효율적으로 공간을 사용할 수 있는 방법에 대한 필요성이 요구되었다. 하지만 기 개발된 압축된 써픽스 배열이나 FM-인덱스와 같은 것들 또한 이미 존재하는 써픽스 배열에서부터 구축되어야 하기 때문에 실제적인 사용 공간을 줄일 수는 없었다. 최근, 써픽스 배열을 구축할 필요 없이 텍스트로부터 직접 압축된 써픽스 배열을 구축할 수 있는 두 가지 알고리즘들이 제안되었다. 본 논문에서는 실험을 통해 자료구조 구축 시간과 구축 시 필요로 하는 최대 사용 공간, 구축이 끝난 후 최종 자료구조의 크기 등을 측정함으로써 이 두 가지 압축된 써픽스 배열 구축 알고리즘과 기존의 써픽스 배열들과의 실제적인 성능을 비교한다.

클러스터링 및 연속적 I/O를 이용한 이미지 데이터 검색 연구 (A study on the searching of images via clustering and sequential I/O)

  • 김진옥
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.106-108
    • /
    • 2002
  • 본 연구에서는 멀티미디어 데이터 검색에 클러스터링과 인덱싱 기법을 같이 적용하여 유사할 이미지끼리는 인접 디스크에 클러스터하고 이 클러스터에 접근하는 인덱스를 구축하여 검색이 빠르게 이루어지는 유사 검색방법을 제시한다. 이 연구에서는 트리 유사 구조의 인덱스 대신 해싱 방법을 이용하며 검색시 I/O시간을 줄이기 위해 오브젝트를 가진 클러스터 위치를 찾는데 한번의 I/O를 사용하고 이 클러스터를 읽기 위해 연속주인 파일 I/O를 사용하여 클러스터를 찾는 데용을 최소화한다 클러스터인덱싱 접근은 트리 유사 구조와 임의 I/O를 사용한 내용기반의 이미지 검색보다 효율적인 검색 적합성을 보이며 연속적 I/O를 통해 검색 미용을 낮춘다.

  • PDF

RDBMS를 이용한 DTD 엘리먼트 타입 기반의 문서 색인 기법 (A XML Indexing Technique based on DTD's Element Types in RDBMS)

  • 박관순;김택곤;김우생
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (C)
    • /
    • pp.55-57
    • /
    • 2006
  • 최근 XML 문서가 인터넷 기반의 애플리케이션 간의 자료 저장 및 교환을 위한 표준으로써 부상함에 따라 XML 문서의 저장 및 관리에 대한 연구가 활발히 이루어지고 있다. 하지만 XML 문서의 검색에 관련된 많은 연구들이 모든 XML 엘리먼트 경로에 대한 색인화로 인해 인덱스의 크기가 커지고 이에 비례하여 검색성능이 뜯어지는 문제를 보이고 있다. 본 논문에서는 이를 개선하기 위해 엘리먼트 타일을 기반으로 전통적인 역색인 방법을 XML 문서에 맞게 확장하고, RDBMS에 기반하여 계층구조를 갖는 XML 문서들의 자료를 구조적 넘버링(Numbering) 방법의 인덱스로 설계 하였다. 인덱스 테이블들은 엘리먼트 타입의 정보를 담고 있는 엘리먼트 타입 테이블, XML문서의 경로를 가지고 있는 경로 테이블, 역색인으로 구성된 Term테이블. Term 경로를 나타내는 Term경로 테이블을 생성한다. 이전의 XML 인덱싱 기법에 관련된 연구들에서 보이는 XML 문서상의 모든 경로에 대한 표현을 간소화 시키고, 이를 통해 보다 좋은 검색 성능을 보이고자 하였다.

  • PDF

가상현실에서 이동 객체를 위한 인덱스 설계 (An Index Structure for Moving Object in Virtual Reality)

  • 문형석;엄기현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.161-164
    • /
    • 2004
  • 가상현실 시스템은 프레임마다 객체를 식별하고 이벤트에 대한 빠른 응답시간을 요구한다. 대부분 개상현실 시스템들을 빠른 응답시간과 객체 식별을 빠르게 하기 위하여 인덱스를 사용한다. 이러한 인덱스들은 그리드 형태로 공간을 분할하여 트리형태의 구조를 가지기 때문에 영역질의에는 취약한 구조이며 이동 객체의 이동횟수에 따라 부가적인 연산비용이 생긴다. 따라서 3차원 영역질의에 우수한 성능을 보이는 R-트리를 가상현실 시스템에 적용하였을 때에 발생되는 문제점을 정의하였다. 또한 발생한 문제점을 해결하기 위해 가시성을 고려한 영역 질의, 초기 삽입 정책을 제안하였다.

  • PDF