• 제목/요약/키워드: Index기법

검색결과 2,246건 처리시간 0.032초

XML을 이용한 구조적 문서 생성 및 탐색을 위한 깊이중심분할 색인기법에 관한 연구 (A Study on the Depth-Oriented Decomposition Indexing Method for Creating and Searching Structured Documents Based-on XML)

  • 양옥렬;이용주
    • 정보처리학회논문지D
    • /
    • 제9D권6호
    • /
    • pp.1025-1042
    • /
    • 2002
  • 본 논문은 정보검색을 위한 용어들 간에 존재하는 관련정보인 시소러스를 이용하여 정보 검색 시스템의 검색 성능을 향상시키기 위한 구조적 문서를 생성하고 이를 검색하는 검색 기법에 대하여 연구하였다. 이를 위해 시소러스를 이용한 구조적 문서의 탐색을 위한 깊이중심분할 색인(DODI : Depth-Oriented Decomposition Index) 기법을 제안하였으며, 또한 시소러를 이용한 색인 기법으로서 효과적인 정보 검색이 가능하도록 검색 알고리즘을 통해 연관관계의 정보들에 대한 검색이 가능하도록 하였다. 또한 색인기법에 의해 생성된 구조적 문서는 OpenXML을 통해 데이터베이스 내에 저장되고, ForXML 메소드를 이용하여 재구성된 XML문서를 생성하도록 구조적 문서 저장 시스템을 구현하였다.

B+-트리 기반의 이동객체 색인 기법 ([ B+ ]-Tree based Indexing Method for Moving Object)

  • 서동민;유재수;송석일
    • 한국콘텐츠학회논문지
    • /
    • 제7권7호
    • /
    • pp.11-23
    • /
    • 2007
  • 이동객체 응용은 빈번하게 변경되는 이동객체의 위치정보를 효과적으로 처리할 수 있는 색인구조를 필요로 한다. 이동객체의 위치를 색인하기 위해 제안된 색인기법들은 대부분 R-트리를 기반으로 하고 있다. R-트리는 변경보다는 검색 연산의 성능에 초점이 맞추어진 색인구조이어서 잦은 변경을 다뤄야 하는 이동객체의 응용에 적합하지 않은 측면이 있다. 일부 연구에서는 R-트리의 변경 연산 성능을 향상시키기 위한 연구를 진행한 바 있다. 하지만, 변경 연산의 성능이 개선되었다 하더라도 R-트리가 기본적으로 내재하고 있는 동시성 제어기법 문제(동시성 제어 기법의 비효율성과 안정성) 때문에 R-트리 기반의 색인기법을 실제 응용에서 쓰는 데는 여전히 문제가 있다. 이 논문에서는 B+-트리와 힐버트 곡선 (Hilbert Curve)를 기반으로 하는 새로운 이동객체 색인 기법을 제안한다. 기존에 제안된 B+-트리 기반의 색인기법과는 다르게 이 논문에서는 힐버트 커브의 해상도(또는 차수, order)를 객체의 분포도와 개수에 따라서 가변적으로 적용하는 방법을 제안한다. 실험을 통해서 제안하는 색인 기법이 응답시간과 처리율 측면에서 기존 색인기법에 비해 우수함을 보인다.

문자열 부분검색을 위한 색인기법의 설계 및 성능평가 (Design and Performance Evaluation of an Indexing Method for Partial String Searches)

  • 강승헌;유재수
    • 한국정보처리학회논문지
    • /
    • 제6권6호
    • /
    • pp.1458-1467
    • /
    • 1999
  • 신장해슁이나 B+-트리와 같은 기존의 색인구조들은 문자열의 부분검색을 지원하지 못하거나 부분검색에 제약점을 가지고 있다. 최근 웹 환경에서 동작하는 정보검색 엔진들이 사용하는 역파일의 빠른 검색성능을 가지면서 문자열 부분검색을 효율적으로 지원하는 색인기법을 제안한다. 제안된 색인기법은 기본적으로 역파일 구조이며, 2음절 단위의 패턴으로 색인을 구성함으로써 문자열 부분검색을 지원한다. 제안된 색인기법의 특성을 분석하기 위해 제안된 방법의 성능을 다양한 환경에서 실험을 통하여 비교하고 분석한다. 또한 성능평가를 위해 기존의 역파일 기법, 요약 파일 기법들과 제안하는 색인기법의 분석적 모델을 검색시간과 저장공간 측면에서 세시하고, 그 모델을 기반으로 그들의 성능을 비교한다. 분석적 비교모델을 통한 성능비교 결과, 제안된 부분검색을 위한 색인기법은 저장공간의 오버헤드는 크지만 기존 요약 파일 기법에 비해 검색성능을 상당히 향상시킨다.

  • PDF

고차원 (유전자 발현) 자료에 대한 군집 타당성분석 기법의 성능 비교 (Comparison of the Cluster Validation Methods for High-dimensional (Gene Expression) Data)

  • 정윤경;백장선
    • 응용통계연구
    • /
    • 제20권1호
    • /
    • pp.167-181
    • /
    • 2007
  • 유전자 발현 자료(gene expression data)는 전형적인 고차원 자료이며, 이를 분석하기 위한 여러 가지 군집 알고리즘(clustering algorithm)과 군집 결과들을 검증하는 군집타당성분석 기법(cluster validation technique)이 제안되고 있지만, 이들 군집 타당성을 분석하는 기법의 성능에 대한 비교, 평가는 매우 드물다. 본 논문에서는 저차원의 모의실험 자료와 실제 유전자 발현 자료에 대하여 군집 타당성분석 기법들의 성능을 비교하였으며, 그 결과 내적 측도에서는 Dunn 지수, Silhouette 지수 순으로 뛰어났고 외적 측도에서는 Jaccard 지수가 성능이 가장 우수한 것으로 평가되었다.

거리 제한을 이용한 색인 시스템 (An Index System using Restrictive Distance)

  • 박찬이;김상복
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권1호
    • /
    • pp.273-282
    • /
    • 2006
  • 한본 논문에서는 단어 가중기법에 거리 개념을 도입한 색인 기법을 제안한다. 본 색인 기법은 질의어와 문서를 대표하는 색인의 대부분은 복합명사 혹은 인접한 두개 이상의 명사 또는 명사구가 많으며 이들 명사간의 거리가 멀면 멀수록 색인으로 선택되는 비율이 줄어드는 점을 착안하여, 이를 기존의 가중치 부여 기법으로 색인어 후보를 선정하고, 후보들 간의 거리가 3어절 이내의 후보를 최종 색인으로 선정하였다. 이 방법을 이용하여 신문기사, 학술논문, 웹문서 등 100여종의 문서를 대상으로 실험한 결과 신문기사 92.03%, 학술논문 95%, 웹문서는 73..33%의 정확율을 보였다.

  • PDF

DOT 색인을 이용한 효율적인 공간 조인 기법 (An Efficient Spatial Join Method Using DOT Index)

  • 백현;윤지희;원정임;박상현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권5호
    • /
    • pp.420-436
    • /
    • 2007
  • 지리정보시스템에서 빈번히 사용되는 공간 조인 연산자의 성능을 보장하기 위해서는 효율적인 색인 기법의 선택이 중요하며, 대표적인 색인 기법으로는 $R^*$-tree를 이용한 방법이 알려져 있다. 본 논문에서는 DOT(Double Transformation) 공간 색인을 이용한 효율적인 공간 조인 처리 기법을 제시하고 이를 $R^*$-tree를 이용한 공간 조인 처리 기법과 비교한다. DOT 공간 색인 기법은 공간 객체의 MBR 정보를 공간 순서화 곡선을 사용하여 하나의 1차원 값으로 변환한 후 그 값을 검색 키로 갖는 $B^+$-tree 색인 구조를 구성하는 방법으로서, 이를 이용하면 전통적인 데이타베이스의 주 색인을 적용할 수 있다는 중요한 특징을 가진다. 본 논문에서는 공간 객체의 MBR 정보를 하나의 1차원 값으로 변환하기 위해 사용되는 공간 순서화 곡선의 규칙성을 분석함으로써 공간 변환 연산의 횟수를 대폭 감소시킨 효율적인 DOT 색인기반의 공간 조인 알고리즘을 제안한다. 제안된 알고리즘에서는 반복적으로 수행되는 공간 변환 연산의 횟수를 줄이기 위하여 질의 영역을 공간 순서화 곡선이 연속 운행하는 가능한 최대 크기의 면적으로 분할하는 쿼터 분할 기법을 사용한다. 다양한 분포와 크기를 갖는 데이타 집합을 대상으로 $R^*$-tree를 이용한 공간 조인 처리 기법과의 비교 실험을 수행한 결과 최대 약 3배의 성능 이익을 얻을 수 있음을 확인할 수 있었다.

잡음이 존재하는 채널에서 이용되는 분류 벡터 양자화 코드북의 인덱스할당기법 (Optimization of CVQ codebook index for noisy channels)

  • 한종기;김진욱
    • 한국통신학회논문지
    • /
    • 제28권3C호
    • /
    • pp.315-326
    • /
    • 2003
  • 본 논문은 분류 벡터 양자화(CVQ)기법을 이용한 통신 시스템에서 채널 오류를 감소시키기 위한 인덱스벡터할당 방식을 다루고 있다. 제안된 시스템은 크게 내부 인덱스 할당방식(IIA inner index assignment)과 교차인덱스 할당방식(CIA : cross index assignment)으로 구성된다. IIA는 부(Sub)코드북 내에서 유사한 코드벡터들에 Hamming거리가 가까운 인덱스들을 할당함으로써 채널에러에 의해 발생된 화질저하를 감소시킨다. CIA는 인덱스 벡터의 클래스 정보를 나타내는 클래스 비트에 발생하는 채널 오류의 영향을 최소화할 수 있는 방법으로서 IIA에 의해 할당된 인덱스 벡터들을 수정한다. 본 논문에서 실시된 컴퓨터 모의실험은 제안된 시스템이 채널 부호화기법을 사용하지 않고도 채널 잡음을 극복할 수 있음을 보여준다.

다차원 색인구조를 위한 동시성제어 기법 및 회복기법 (Concurrency Control and Recovery Methods for Multi-Dimensional Index Structures)

  • 송석일;유재수
    • 정보처리학회논문지D
    • /
    • 제10D권2호
    • /
    • pp.195-210
    • /
    • 2003
  • 이 논문에서는 다차원 색인구조의 동시성을 최대화하는 동시성제어 알고리즘과 이를 위한 회복기법을 제안한다. 다차원 색인구조에서 동시성을 저하는 가장 큰 요인은 MBR 변경연산과 분할 연산이다. 제안하는 알고리즘은 먼저 MBR 변경연산으로 인한 동시성 저하를 최소화하기 위해서 PLC(Partial Lock Coupling) 기법을 제안한다. 이 기법은 기존 방법에 비해 잠금결합을 사용하는 회수를 크게 줄여 동시성을 높인다. 또한, MBR 변경의 수행 중에도 탐색자들이 해당 노드를 접근할 수 있도록 하는 MBR 변경 방법을 제안한다. 분할로 인한 동시성 저하를 해결하기 위해서 노드 분할로 인한 탐색자의 지연 시간을 최소화 할 수 있는 새로운 분할방법을 제안한다. 제안하는 알고리즘을 BADA-4 DBMS의 저장시스템인 MiDAS-3에서 구현하여 성능평가를 수행한다. 다양한 실험을 통해 제안하는 방법이 기존 방법보다 우수함을 보인다. 마지막으로, 이 논문에서는 제안하는 동시성제어 방법에 적절한 회복기법을 제안한다. 회복기법은 동시성을 최대한 보장할 수 있도록 설계되었으며 빠른 회복시간을 보장한다.

RFID 스트리밍 데이터 처리를 위한 연속 질의의 변환 기법 (A Transformation Scheme for Continuous Queries on RFID Streaming Data)

  • 박재관;홍봉희;반재훈
    • 정보처리학회논문지D
    • /
    • 제14D권3호
    • /
    • pp.273-284
    • /
    • 2007
  • RFID 미들웨어 시스템은 애플리케이션의 질의를 처리하기 위해서 다수의 RFID 판독기에 의해 지속적으로 인식되는 RFID 스트리밍 데이터를 수집 및 정제한다. 이러한 질의들은 미들웨어에서 일정기간 동안 수행되기 때문에 연속 질의라고 불린다. 미들웨어의 성능을 개선하기 위해서는, 이러한 연속 질의를 효과적으로 처리하기 위한 색인이 필수적이다. 최근, 데이터가 아닌 질의를 기반으로 색인을 구축하는 질의 색인 기법들이 제안되었으며 이러한 기법들은 이동체 위치 스트리밍 데이터 혹은 센서 스트리밍 데이터에 대하여 연속 질의를 처리하는 환경에서 향상된 성능을 보여준다. EPCglobal은 RFID 애플리케이션을 위한 표준 질의 인터페이스인 Event Cycle Specification (ECSpec)을 제안하였다. ECSpec 기반의 연속 질의는 질의의 조건을 대상 도메인 공간에 표현하면 다수의 세그먼트로 표현되는 특징이 있다. 이러한 RFID 질의 색인의 데이터에 대하여 기존의 질의 색인을 사용하면 다수의 데이터를 삽입해야 하기 때문에 색인을 구축 및 유지하기 위한 비용이 커지게 된다. 이러한 문제를 해결하기 위해서, 이 논문에서는 다수의 세그먼트를 새로운 변환공간으로 표현하고 이것을 결집하여 단일 데이터로써 표현하는 결집 변환(Aggregate Transformation) 기법을 제안한다. 또한, 기존 질의 색인과 변환 기법을 적용한 색인의 성능을 비교한다.

XML 문서의 상향식 질의처리를 지원하는 효율적인 색인구조 (An Efficient Index Structure for Bottom-Up Query Processing of XML Documents)

  • 서동민;김은재;성동욱;유재수;조기형
    • 인터넷정보학회논문지
    • /
    • 제7권4호
    • /
    • pp.101-113
    • /
    • 2006
  • XML에서의 질의는 경로 질의를 사용하고, 경로 질의를 효과적으로 처리하기 위한 여러 가지 색인 기법들이 연구되었다. 최근에는 구조 조인 기법과 더불어 접미사(suffix) 트리를 이용한 기법이 제안되고 있다. 그 중에서 가장 대표적인 기법이 ViST(Virtual Suffix Tree) 이다. ViST는 질의 처리 시간을 줄이기 위해서 접미사 트리와 B+ 트리를 이용하여 질의 처리에 참여하는 엘리먼트만을 비교한다. 그러나 실제 문서에서 조상-후손 관계가 아닌 엘리먼트도 후손으로 보고 처리하는 문제점으로 인해 디스크 접근이 많아지는 비효율성을 지닌다. 따라서 본 논문에서는 ViST의 문제점을 해결하는 색인구조를 제안하고 이 색인구조에 알맞은 질의 처리기법을 제안한다. 그리고 다양한 질의 처리 실험을 통해 기존에 제안된 색인구조에 비해 향상된 질의 처리 성능을 나타냄을 보인다.

  • PDF