• 제목/요약/키워드: 동적 색인

검색결과 145건 처리시간 0.026초

XML 문서의 다양한 구조 검색을 위한 효율적인 동적 색인 모델 (An Efficient Dynamic Indexing Model for Various Structure Retrievals of XML Documents)

  • 신승호;손충범;강형일;유재수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권1호
    • /
    • pp.48-60
    • /
    • 2004
  • 정보 표현의 기본 단위인 엘리먼트로 구성되는 XML 문서 내에서 동적으로 구조 변경이 이루어진다. 이때 XML 문서의 구조변경은 빠른 검색을 위해 기존의 색인 구조 정보의 변경 없이 효율적으로 처리되어야 한다. 이를 위해 본 논문에서는 XML 문서의 구조 변경 시 기존의 색인 구조에 효율적으로 수용될 수 있는 동적 색인 모델을 제안한다. 제안하는 동적 색인 모델은 다양한 구조 검색을 지원하기 위한 구조 정보 표현 방법과 효율적인 구조 검색을 지원하기 위한 동적 색인 구조로 구성된다. 제안하는 색인 기법이 기존의 동적 색인을 지원하는 기법보다 내용 색인, 구조 색인, 애트리뷰트 색인 측면에서 우수함을 성능 평가를 통해 보인다.

이동체 데이터베이스를 위한 색인 구조의 비용모델 (Cost Model of Index Structures for Moving Objects Databases)

  • 전봉기
    • 한국정보통신학회논문지
    • /
    • 제11권3호
    • /
    • pp.523-531
    • /
    • 2007
  • 본 논문에서는 이동체들을 관리하기에 적합한 새로운 색인 기법을 개발하고, 이 기법의 비용 모델을 제안한다. 또한 삽입/삭제 비용이 적은 동적 해싱 색인을 제안한다. 동적 해싱 색인 구조는 해쉬와 트리를 결합한 동적 해싱 기술을 공간 색인에 적용한 것이다. 본 논문에서는 이동체의 빈번한 위치 변경에 대한 비용 모델과 동적 색인 구조를 분석하였고, 성능 평가 실험을 통하여 검증하였다. 실험 결과에서 새로이 제안하는 색인 기법(동적 해싱 색인)은 R-tree와 고정 그리드 보다 성능이 우수하였다.

이동체의 현재 위치 색인을 위한 동적 해슁 구조의 설계 및 구현 (Design and Implementation of the dynamic hashing structure for indexing the current positions of moving objects)

  • 전봉기
    • 한국정보통신학회논문지
    • /
    • 제8권6호
    • /
    • pp.1266-1272
    • /
    • 2004
  • 위치 기반 서비스는 이동체의 위치에 종속적인 결과를 얻는 위치 기반 질의를 필요로 한다. 이동체의 위치는 연속적으로 변하기 때문에, 이동체의 색인은 변경된 위치 정보를 유지하기 위하여 빈번한 갱신 연산을 수행해야 한다. 기존의 공간 색인들(그리드 파일, R-트리, KDB-트리 등)은 정적 데이터를 검색하는데 효과적인 색인이다. 이들 색인은 연속적으로 위치 데이터가 변경되는 이동체 데이터베이스의 색인으로는 적합하지 않다. 본 논문에서는 삽입/삭제 비용이 적은 동적 해슁 색인을 제안한다. 동적 해슁 색인 구조는 해쉬와 트리를 결합한 동적 해슁 기술을 공간 색인에 적용한 것이다. 실험 결과에서 동적 해슁 색인은 $R^*$-tree와 고정 그리드 보다 성능이 우수하였다.

동적 정보 저장을 위한 자동 하이퍼텍스트 색인 기법의 개발 (Development of an Automatic Hypertext Indexer for Dynamic Information Storage)

  • 이동애;장덕성
    • 한국정보처리학회논문지
    • /
    • 제4권9호
    • /
    • pp.2333-2341
    • /
    • 1997
  • 하이퍼텍스트 정보를 저장할 때 정보가 삽입, 삭제, 변경되면, 인접한 정보들에 대한 하이퍼텍스트 링크도 변화되어야 한다. 하이터텍스트 링크는 하이터텍스트 색인어를 기준으로 관련있는 다른 정보를 찾는 수단을 제공한다. 따라서 하이퍼텍스트 색인어를 관리하는 것이 동적 정보 저장의 핵심이 된다. 본 논문에서는 새로운 정보가 삽입, 삭제, 변경될지라도 시스템이 안정성을 유지하며, 변경된 부분에 대한 하이퍼텍스트 색인어와 하이퍼텍스트 링크가 동적으로 결정될 수 있는 방법을 제시한다. 이를 위해 동적 색인기를 만들고, 동적 색인기의 동작을 돕기 위해 색인어 사전, 불용어 사전, 조사 사전, 역색인 파일, 시소러스 등을 구성한다.

  • PDF

동적 주기억 데이터베이스를 위한 색인 구조의 성능 평가 (Performance Evaluation of an Index Structure for Dynamic Main Memory Database)

  • 박정규;전흥석;노삼혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.213-215
    • /
    • 2000
  • 주기억 데이터베이스에서 효율적인 성능을 위해서 제안된 색인 구조 중 T-트리가 있다. 이 색인 구조는 삽입 삭제가 많은 동적 주기억 데이터베이스에서 빈번한 노드 생성 및 삭제에 따르는 오버헤드(overhead)로 효율적이지 못한다. 이 문제를 극복하기 위해서 T2-트리가 제안되었다. T2-트리는 T-트리의 단점인 범위 질의의 비효율성의 해결과 삽입 삭제가 빈번한 동적 주기억 데이터베이스 시스템으 위해 억제된 노드 생성 및 삭제 기법과 스레드 이진 트리의 특징을 가지고 있다. 이 논문에서는 리눅스에서 주기억 데이터베이스 프로그램인 FastDB에 사용된 T-트리 인덱싱 구조를 새롭게 제안된 T2-트리로 수정하여 두 가지 인덱싱 구조를 비교 실험한 결과를 보여주고 있다. 실험결과에 의하면 T-트리에 비해서 T2-트리가 동적인 주기억 데이터베이스 시스템에서 효율적인 구조임을 알 수 있다.

  • PDF

동적 색인 스토리지 및 통합 검색 서비스 개발 (Dynamic index storage and integrated searching service development)

  • 이왕우;이석형;최호섭;윤화묵;김종환;허윤영
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
    • /
    • pp.346-349
    • /
    • 2007
  • 본 논문은 웹뉴스 및 리뷰 검색 서비스를 위해 만든 통합 검색 시스템을 소개한다. 검색 서비스를 위한 데이터 수집을 위해서 특정 사이트에서 수집한 뉴스와 리뷰 문서로부터 제목, 날짜, 저자, 본문처럼 특정한 영역의 데이터만 추출하는 XSLTRobot을 만들었다. XSLTRobot은 원하는 부분의 데이터만 추출하기 위해 XSLT 기술을 이용한다. 여러가지 검색 데이터 형식에 적합한 통합 검색엔진과 통합 검색엔진의 스토리지 모듈중 하나인 동적 색인 저장소(Dynamic Index Storage)를 소개한다. 동적 색인 저장소는 뉴스 데이터처럼 색인의 업데이트가 빨라야 하는 환경에 이용된다. 본 논문에서 제시하는 동적 색인 저장소는 대량의 실시간 업데이트 문서를 처리하지 않기 때문에 검색성능에 초점을 맞춰서 설계하였다.

  • PDF

동적 웹 페이지 변조 점검 시스템 (Dynamic Web Page Defacement Validation System)

  • 김우년;김도환;주미리;박응기;김상욱
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.475-477
    • /
    • 2004
  • 일반적으로 웹 페이지 변조 점검 시스템은 해시 코드를 이용한다. 해시 코드 방법은 웹 페이지의 민감한 변화를 즉시 찾아 낼 수 있는 장점이 있지만, 인터넷 포털이나 뉴스 사이트 등의 동적인 웹 페이지의 경우에 적용하기 어려운 단점이 있다. 본 논문에서는 인터넷 포털이나 뉴스 사이트 등과 같은 웹 페이지의 내용이 계속해서 변화하는 경우에도 적용할 수 있는 N-Gram 색인 기반의 웹 페이지 변조 점검 시스템인 웹 레이더 시스템을 제시한다. 웹 레이더 시스템은 정상적인 웹 페이지의 N-Gram 색인과 점검 시에 생성한 N-Gram 색인을 비교하여 두 인덱스의 동일 N-Gram의 발생 비율 차이를 합한 값을 N-Gram 색인 거리로 정의하고 이 값을 이용하여 웹 페이지 변조를 확인한다 본 논문에서 제시하는 웹 레이더 시스템은 구조화되지 않은 동적 웹 페이지의 변조를 원격에서 점검할 수 있다.

  • PDF

$T^2$-트리: 동적 주기억 데이터베이스를 위한 효율적 색인 구조 ($T^2$-Tree: An Efficient Index Structure for Dynamic Main Memory Database)

  • 김태진;전홍석;이재호;노삼혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.258-260
    • /
    • 1999
  • 주기억 데이터베이스를 위한 색인 구조는 기존의 디스크 기반 데이터베이스의 색인 구조와는 고려되어야 할 사항이 다르다. 최근까지 연구된 색인 구조 중 대표적인 것은 T-트리와 T*-트리이다. 비록 T*-트리가 T-트리의 단점인 범위 질의의 비효율성을 해결하고 있지만 데이터의 삽입과 삭제가 많은 시스템에서 트리 균형을 맞추기 위한 오버헤드, 회전 연산의 수행과 후위 포인터(successor pointer)의 추가적인 오버헤드가 있다. 따라서 본 논문에서는 삽입과 삭제가 빈번한 동적 주기억 데이터베이스를 위해서 억제된 노드 생성 및 삭제 기법과 스레드 이진 트리의 특성을 이용한 보다 효율적인 색인 구조인 T2-트리를 제안한다.

  • PDF

SSD에 적합한 동적 색인 저장 구조 : SPM (Efficient Dynamic Index Structure for SSD (SPM))

  • 진두석;김진숙;류범종;정회경
    • 한국콘텐츠학회논문지
    • /
    • 제10권2호
    • /
    • pp.54-62
    • /
    • 2010
  • 역파일 인덱스 구조는 대용량 텍스트 데이터의 색인저장 기법을 위한 효율적인 데이터 구조로 널리 활용 되고 있다. 특히, 최근 이슈가 되고 있는 온라인 색인관리 측면에서는 동적 검색 환경에 적합한 In-Place 방식과 Merge-based 색인 방식이 주로 사용 되고 있다. 위 방법들의 핵심은 검색 처리시간을 줄이기 위해서 포스팅 정보의 저장 연속성(Contiguity)을 보장하면서 동시에 색인정보 관리(Index Maintenance) 시간을 최소화 하기위한 색인저장 구조에 중점을 두고 연구가 진행 되었다. 그러나 최근 기존 저장장치(HDD)와 근본적으로 구조가 다른 새로운 저장장치(SSD, SCRAM)가 데이터 저장소로 이용되면서 이러한 장치들의 특성을 효과적으로 활용할 수 있는 새로운 형태의 색인저장 기법 또한 필요하게 되었다. 따라서 본 논문에서는 새로운 저장장치의 빠른 접근 속도(Low access latency) 특성을 최대한 활용할 수 있는 분할(Segmentation) 포스팅 구조를 기반으로 새로운 저장장치에 적합하도록 변형된 In-Place 방식(Pulsing)과 수정된 Merge-based 방식(Merging)을 혼합하여 검색 처리시간 및 색인정보관리시간을 크게 향상시킬 수 있는 새로운 색인저장 구조(SPM)를 제안한다.

XML 문서를 위한 효율적인 색인 기법 (An Efficient Index Method for XML Documents)

  • 강형일;송석일
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 추계학술발표대회(상)
    • /
    • pp.363-366
    • /
    • 2003
  • 이 논문에서는 XML 문서에 대한 경로질의를 효과적으로 처리할 수 있는 색인기법을 제안한다. 제안하는 색인 기법은 문서의 변경에 동적으로 대처하며 단순경로 질의뿐 아니라, 경로의 길이가 주어지지 않는 질의에도 효과적으로 동작한다. 이 논문에서는 제안하는 색인기법을 구현하고 실험을 통해서 경로질의를 처리하는 시간을 측정하여 제안하는 방법의 타당성을 보인다.

  • PDF