• 제목/요약/키워드: 데이터베이스 인덱싱

검색결과 93건 처리시간 0.051초

이동 객체 데이터베이스를 위한 거리기반 인덱싱 전략 (Distance-based Indexing Strategy for Moving Objects Database)

  • 김승현;송문배;남성헌;황종선;손진곤
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (A)
    • /
    • pp.196-198
    • /
    • 2002
  • 이동 기술의 발전으로 위치와 이동 패턴이 연속적으로 변화하는 객체가 증가하였다. 시간에 따라 객체가 이동하면서 그 위치와 모양이 연속적으로 변화하는 것을 이동 객체라 한다. 과거의 DBMS는 연속적으로 이동 정보가 변화한다. 이러한 정보를 저장하는 매체인 이동 객체 데이터베이스의 갱신 횟수는 매우 중요하다. 본 논문에서 객체는 일반적으로 일정한 패턴으로 이동한다고 가정한다. 이러한 객체의 일정한 이동 패턴을 이용하여, 이동 객체 데이터베이스의 갱신 횟수를 최소화하면서, 효과적으로 인덱싱 하는 전략을 제시한다. 또한 질의에 대한 객체 위치의 오차를 최소화하여 반환해 주는 질의 처리 기법을 제안한다.

  • PDF

유전체 데이터베이스를 위한 효율적인 접미어 트라이 인덱스 구조 (An Efficient Suffix Trie Index Structure for Genomic Databases)

  • 박진만;원정임;윤지희;박상현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (하)
    • /
    • pp.1583-1586
    • /
    • 2003
  • DNA 시퀀스는 A, C, G, T 네 개의 문자로 구성된 매우 긴 시퀀스로 볼 수 있다. 고속으로 유사 DNA 시퀀스를 검색하기 위하여 인덱싱 기술을 이용하는 것이 일반적이다. 그러나 검색 대상의 유전체 데이터베이스는 그 크기가 매우 크며, 또한 지수 함수적으로 크기가 급속히 증가하고 있으므로, 기존의 인덱싱 기법을 그대로 적용할 경우, 실용성에 한계가 있다. 본 논문에서는 이와 같은 문제점을 해결할 수 있는 대규모 유전체 데이터베이스를 위한 효율적인 인덱싱 기법과 질의처리 기법을 제안한다. 기본 구조로서 접미어 트라이를 사용하며, 접미어 트리 인덱스 구조의 최대 단점인 인덱스 크기를 줄일 수 있는 데이터 압축 표현 방식을 제안한다. 또한 제안된 데이터 압축 표현 방식의 디스크 기반 인덱스 구성 알고리즘과 이를 활용한 부분 시퀀스 검색 알고리즘을 보이고, 그 저장 성능의 비교 평가결과를 보인다.

  • PDF

Nested Interval 을 이용한 XML 문서의 저장 및 질의 기법 (Nested Interval Encoding with Continued Fractions for XML Storage & Retrieval)

  • 송용호;나갑주;이상원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.27-30
    • /
    • 2005
  • XML(Extensible Markup Language)이 데이터 표현(data representation)과 문서 교환(data exchange)의 표준으로 지정됨에 따라 데이터베이스(database, DB)에 XML 문서를 저장하고 질의하기 위한 연구가 활발히 진행되고 있다. 특히, 현재 주류를 이루고 있는 관계형 DB 에 저장하기 위한 XML 인덱싱(indexing) 기법에 대한 연구도 다양하게 진행되고 있다. 본 논문에서는 XML 문서를 관계형 DB 에 효율적으로 저장하고 질의하기 위한 방법으로서 기존의 트리(tree) 구조의 데이터를 관계형 DB 에 Nested Interval 인덱싱 기법을 적용하여 XML 문서를 저장하는 방법에 대해 연구한다. 기존의 저장 기법들의 경우 XML 문서를 효율적으로 질의하기 위한 인덱싱을 수행하기 때문에 입력 후 추가되는 노드(node), 혹은 노드 집합의 입력 시에는 전체 혹은 일부분의 XML 문서를 재-인덱싱 해야 하는 비효율이 있다. 그러나, Nested Interval 의 경우에는 재-인덱싱이 불필요하다. 본 논문에서는 기존의 트리 구조 데이터의 인덱싱 기법들에 대한 비교와 함께 Nested Interval 을 이용한 XML 문서의 인덱싱 기법에 대해 기술한다.

  • PDF

동적 주기억 데이터베이스를 위한 색인 구조의 성능 평가 (Performance Evaluation of an Index Structure for Dynamic Main Memory Database)

  • 박정규;전흥석;노삼혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.213-215
    • /
    • 2000
  • 주기억 데이터베이스에서 효율적인 성능을 위해서 제안된 색인 구조 중 T-트리가 있다. 이 색인 구조는 삽입 삭제가 많은 동적 주기억 데이터베이스에서 빈번한 노드 생성 및 삭제에 따르는 오버헤드(overhead)로 효율적이지 못한다. 이 문제를 극복하기 위해서 T2-트리가 제안되었다. T2-트리는 T-트리의 단점인 범위 질의의 비효율성의 해결과 삽입 삭제가 빈번한 동적 주기억 데이터베이스 시스템으 위해 억제된 노드 생성 및 삭제 기법과 스레드 이진 트리의 특징을 가지고 있다. 이 논문에서는 리눅스에서 주기억 데이터베이스 프로그램인 FastDB에 사용된 T-트리 인덱싱 구조를 새롭게 제안된 T2-트리로 수정하여 두 가지 인덱싱 구조를 비교 실험한 결과를 보여주고 있다. 실험결과에 의하면 T-트리에 비해서 T2-트리가 동적인 주기억 데이터베이스 시스템에서 효율적인 구조임을 알 수 있다.

  • PDF

도로 네트워크를 위한 k-최근접 이웃 질의의 처리 방안

  • 이상철;김상욱
    • 정보와 통신
    • /
    • 제25권7호
    • /
    • pp.16-23
    • /
    • 2008
  • 텔레매틱스에서 위치 정보 서비스를 효과적으로 제공하기 위해 이동 객체와 더불어 시설물과 같은 정적 객체에 대한 위치 정보를 효과적으로 관리하는 데이터베이스 기술들이 요구된다 본 논문에서는 도로 네트워크 데이터베이스를 위한 인덱싱 및 질의 처리 기술 현황에 대하여 고찰한다. 텔레매틱스에서는 영역 질의, k-최근접 이웃 질의, 연속 k-최근접 이웃 질의, 공간 조인 질의 등이 발생하며, 이 중 k-최근접 이웃 질의가 빈발하게 발생한다. k-최근접 이웃 질의를 처리하기 위한 효과적인 방안으로 IER, INE, $VN^3$, 근사 인덱싱 기법 등이 있다. 본 논문에서는 각 기법의 개념, 알고리즘, 장단점에 대하여 고찰한다.

특정 사이트내의 검색 프로그램 구현에 관한 연구 (A Study on Implementation for Web Search Program in Specific Web Site)

  • 장덕성;구세완
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (하)
    • /
    • pp.1243-1246
    • /
    • 2002
  • 본 논문은 검색엔진을 이용하여 대상 웹사이트의 링크 사이트 전체를 수집하고, 각 링크 사이트의 페이지를 인덱싱하여 데이터베이스화하는데, 특히 가장 최신의 페이지를 분류하여 시간에 의해 검색단어의 정확도가 가려지는 경우, 이를 이용할 수 있도록 하였다. 본 논문은 검색엔진에 의해 검색 서비스를 제공하는 기본적인 웹 로봇의 구현에 대한 연구이며, 웹 로봇의 역할은 크게 링크 사이트를 수집하는 것 이외에 제목, 메타태그, 멀티미디어 다운로드등의 역할들을 수행하며 이를 인덱싱 하여 데이터베이스화한다.

  • PDF

새로운 데이터 탐색 기술과 기법의 활용

  • 한국데이터베이스진흥센터
    • 디지털콘텐츠
    • /
    • 1호통권56호
    • /
    • pp.84-91
    • /
    • 1998
  • 데이터베이스에 저장되는 데이터의 양은 급격히 증가되어 왔고, 사용자들은 필요한 데이터를 찾기 위해 서말이 넘는 땀방울을 흘려야 했다. 그러나 새로운 탐색 기술들이 이러한 문제에 대한 해답을 제시하고 있다. 자연언어 질의, 역-인덱싱, 인터넷 탐색 엔진, 데이터베이스 텍스트 탐색 같은 기술들은 사용자의 오랜 숙원을 해결해줄 기대주로 관심을 모으고 있다. 자유 형식 정보 소스들로부터 정보의 특별한 탐색과 추출을 수행하기 위해 사용 가능한 보다 새로운 탐색 기술들과 기법들을 소개한다.

  • PDF

외형 기반 이미지 검색을 위한 해시 기반 검색 기법 (A hash-based matching scheme for shape-based image retrieval)

  • 탁윤식;황인준;최홍근
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.328-331
    • /
    • 2008
  • 많은 양의 이미지를 포함하고 있는 대용량 데이터베이스에 대한 이미지 검색에서 보다 짧은 시간에 적은 양의 검색공간을 사용하면서 원하는 결과를 얻을 수 있는 이미지 인덱싱 기법에 대한 다양한 연구가 진행되어 왔다. 본 논문에서는 외형 기반의 이미지 검색에서 기존의 인덱싱 기법보다 빠른 검색을 지원할 수 있는 해시 기반의 새로운 인덱싱 기법을 제안한다. 기존의 해시 기반 인덱싱 기법에서는 해시 주소 계산을 위해 인덱스 값의 범위가 미리 정해져야 하기 때문에 색상 정보 등 소수의 특징 정보를 제외하고는 인덱싱에 널리 사용되지 못하고 있다. 한편, 제안된 해시 구조는 값의 범위가 정해지지 않은 정수형의 인덱스 값을 기반으로 효과적으로 이미지 인덱스를 구축할 수 있다. 효과적인 이미지 검색을 위해 제안된 인덱스를 기반한 범위검색(Range Search) 기법을 제안하였으며, 실험을 통해 제안된 인덱스 구조에서의 범위 검색이 기존의 인덱스 구조에 비해 보다 효과적임을 보인다.

시퀸스 데이터베이스를 위한 타임 워핑을 지원하는 효과적인 서브시퀸스 매칭 (Effective Subsequence Matching Supporting Time Warping in Sequence Databases)

  • 박상현;김상옥;조준서
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.181-183
    • /
    • 2001
  • 본 논문에서는 대용량 시퀸스 데이터베이스에서 타임 워핑을 지원하는 인텍스 기반 서브시퀸스 매칭에 관하여 논의한다. 타임 워핑은 시퀸스의 길이가 서로 다른 경우에도 유사한 패턴을 갖는 시퀸스들을 찾을 수 있도록 해 준다. 최근의 연구에서 타임 워핑을 지원하는 효과적인 전체 매칭 기법이 제안된 바 있다. 본 연구에서는 이 기존의 연구에 슬라이딩 윈도우 개념을 결합하는 새로운 기법을 제안한다. 인덱싱을 위하여, 각 슬라이딩 윈도우와 대응되는 서브시퀸스로부터 특징 벡터를 추출하고, 이 특징 벡터를 인덱싱 애트리뷰트로 사용하는 다차원 인덱스를 구성한다. 질의 처리를 위하여, 조건을 만족하는 질의 접두어들에 대한 특징 벡터들을 이용하여 인덱스 검색을 수행한다. 제안된 기법은 대용량의 데이터베이스에서도 효과적인 서브시퀸스 매칭을 지원한다. 본 연구에서는 제안된 기법이 착오 기각을 유발시키지 않음을 증명하고, 실험을 통하여 제안된 기법의 우수성을 규명한다.

  • PDF

분석 CRM 실무자의 자연어 질의 처리를 위한 기업 데이터베이스 구성요소 인덱싱 방법론 (A PageRank based Data Indexing Method for Designing Natural Language Interface to CRM Databases)

  • 박성혁;황경서;이동원
    • CRM연구
    • /
    • 제2권2호
    • /
    • pp.53-70
    • /
    • 2009
  • 분석 CRM 영역에서는 고객 데이터 분석을 통하여 고객 행동과 관련된 통찰력을 얻는 것이 중요하다. 이러한 분석 과정에서, 사용자 스스로 기업 데이터베이스에서 대용량 고객 이력 데이터를 조회하고 추출하기 위해서는 SQL 을 사용하여 자유롭게 질의구문을 작성할 수 있어야 한다. 그런데 일반 사용자들이 이러한 업무를 수행하고자 할 때, 기업 데이터베이스 구성 요소에 대한 전문적인 지식이 부족하기 때문에 정보 탐색에 있어서 어려움을 겪는다. 이를 해결하기 위한 방안으로 본 연구에서는 사용자가 제공하는 자연어 수준의 질의를 분석하고, 데이터베이스를 구성하는 값을 중심으로 올바른 질의 결과를 제공하기 위한 데이터베이스 구성요소 인덱싱 방법론을 제안한다. 구체적으로 기업 데이터베이스를 구성하는 세 가지 요소인 관계, 속성, 값에 대한 정보를 읽어 들여 요약 정보에 대한 인덱스를 구성한 다음 사용자의 자연어 질의에서 분석된 의미 단위 별로 데이터베이스 요약 정보와 연결해주는 TableRank 기법을 소개한다. 실험용 데이터베이스를 대상으로 테스트를 수행한 결과, 사용자의 자연어 질의 결과가 데이터베이스를 구성하는 값 정보와 연결되는 것이 관찰되었다. 논문의 후반부에서는 자연어 질의를 자동적으로 처리하기 위한 선행 모듈 개발의 시사점을 정리하고, 향후 기업 데이터베이스 자동 검색 시스템으로 발전하기 위한 방안에 대해서도 설명한다.

  • PDF