• 제목/요약/키워드: 인덱스 테이블

검색결과 104건 처리시간 0.027초

XML을 RDBMS에 저장하기 위한 Analyzer 설계 및 구현 (Design and Implementation of XML Analyzer on RDBMS)

  • 정민경;홍동권;남재열
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.148-150
    • /
    • 2005
  • 오늘날 XML이 디지털 정보교환의 표준으로 자리잡은 후 XML문서를 데이터베이스에 저장하고 원하는 정보를 효율적으로 질의하기 위한 연구가 활발히 진행되고 있다. 특히 XML질의어를 RDBMS 상에서 처리하기 위해 그리고 XML문서정보를 정확하게 추출하여 효율적으로 관리하기 위해 다양한 기법을 동원한 XML 인덱스 Table의 연구가 계속 되고 있다. 하지만 아무리 설계가 잘 된 XML인덱스 table이라 할지라도 이에 저장될 정보들을 XML문서로부터 빠른 시간에 파싱하여 관계형 테이블에 로드하기가 쉽지 않다. 이에 본 논문에서는 RDMS환경에서 XML문서를 관리하고 질의를 처리할 수 있도록 XML 인덱스 table을 디자인하였으며 이에 정확한 값이 좋은 성능을 가지면서 저장되도록 XML문서의 데이터 정보를 추출하는 XML Analyzer를 설계 및 구현하였다. 우선 Analyzer를 구현하기 위해서는 XML Parser를 사용해야 되는데 본 장에서는 이벤트 기반 방식인 SAX를 통해 XML문서를 파싱하여 데이터를 추출하고 그 결과값을 RDMS상의 XML 인덱스 Table에 저장한다. 마지막으로 이를 실제 구현하고 Test한 내용을 근거로 하여 본 장에서 소개하는 XML Analyzer가 다른 방식보다 성능면에서 훨씬 우수하다라는 사실을 입증한다.

  • PDF

수강신청 시스템에서의 SQL 분석을 통한 데이터베이스 성능 향상 방안 (Methods for improving Database Performance through SQL Analysis in the Course Registration System)

  • 김희완
    • 문화기술의 융합
    • /
    • 제6권4호
    • /
    • pp.693-701
    • /
    • 2020
  • 본 논문에서는 현재 운영되는 수강신청 시스템에서의 데이터베이스 성능을 향상시키기 위하여 SQL문 분석을 하였다. 수강신청 업무와 관련된 트랜잭션들에서 사용 중인 SQL문장들을 실행계획을 통하여 현행 데이터베이스 성능을 측정하였으며, SQL 분석을 통하여 보완한 SQL문장들이 성능이 향상된 결과를 확인하였다. 전반적으로 실행계획 분석을 통하여 수강신청 데이터베이스 시스템의 성능을 향상시켰으며, 수강신청 SQL 의 일부 개선방법을 시험결과로 보였다. 개선된 방법은 데이터베이스 튜닝 작업을 통하여 수강신청과 관련된 테이블들과 인덱스 테이블들을 재조정하고, SQL의 기능을 활용함으로서 성능이 향상된 수강신청 데이터베이스 시스템으로 진화한 최적화된 시스템을 구현할 수 있게 되었다. 제안된 방법으로 재조정된 수강신청 시스템은 이전에 운영하던 수강신청시스템에 비하여 성능적 측면에서 우수한 결과를 나타내었으며, 통합 성능 시험 결과 1.8배 ~ 18배의 응답시간 단축을 가져왔다.

관계형 모델에서 XML 변경과 전문 검색을 지원하기 위한 역 인덱스 구축 기법 (Inverted Indexes for XML Updates and Full-Text Retrievals in Relational Model)

  • 천윤우;홍동권
    • 정보처리학회논문지D
    • /
    • 제11D권3호
    • /
    • pp.509-518
    • /
    • 2004
  • 최근 산업체를 중심으로 XML 전문 검색과 XML 문서의 변성 기능에 대한 표준의 시도가 활발히 이루어지고 있다. XML 질의어에서의 전문 검색 기능은 매우 중요한 부분을 차지한다. XML 문서는 관계형 테이블과는 달리 문서의 구조가 복잡하며 때로는 매우 불규칙하다. 이런 상황에서의 검색은 부분적인 정보를 최대한 활용해야 하는 전문 검색이 일반적인 구조적 검색보다 매우 중요한 역할을 한다. 본 논문은 XML 데이터를 관리하기 위하여 관계형 모델을 사용하는 환경에서 XML 문서의 변경과 다양한 형태의 전문 검색을 동시에 지원하기 위한 방안으로 효율적인 역 인덱스 구축 기법을 제안한다. 본 논문에서 제안한 방법은 인덱스 크기의 큰 변화 없이 역 인덱스를 구축하며, 대용량의 XML 문서의 다양한 전문 검색 기능을 성능의 저하 없이 지원한다. 또 XML 문서의 부분적인 변화에 역 인덱스의 변경이 기존의 방법들에 비해서 급격히 줄어든 좋은 성능을 보인다.

MapReduce와 시공간 데이터를 이용한 빅 데이터 크기의 이동객체 갱신 횟수 감소 기법 (Update Frequency Reducing Method of Spatio-Temporal Big Data based on MapReduce)

  • 최용권;백성하;김경배;배해영
    • Spatial Information Research
    • /
    • 제20권2호
    • /
    • pp.137-153
    • /
    • 2012
  • 지금까지 대규모의 이동객체 관리를 위해 갱신 비용을 감소시킬 수 있는 인덱스 기법들이 제안되었다. 이동객체 인덱스는 빈번하게 위치정보가 변화하는 이동객체를 관리하기 위해 주기적으로 갱신 되어야 하기 때문이다. 그러나 이러한 기법들은 이동객체의 수가 현저히 증가하는 경우 인덱스의 갱신 가능범위를 초과하는 부하가 발생한다. 본 논문에서는 이처럼 기존의 처리 가용량을 초과하는 빅 데이터 크기의 이동객체에서 발생하는 갱신요청들을 MapReduce와 기존 인덱스기법을 조합하여 감소시키는 기법을 제안한다. 이 기법에서는 수많은 이동객체에서 발생하는 갱신요청들을 MapReduce를 이용하여 각각의 이동객체 별로 그룹화하는 방법을 사용한다. 각 이동객체 별로 그룹화 데이터들의 최신의 데이터와 가장 오래된 데이터를 비교하여 갱신여부를 판단하고 최신의 요청만 갱신하도록 하여 전체 갱신 횟수를 크게 감소시킨다. 갱신이 지연된 경우 기존의 갱신요청들을 가지고 있는 해시 테이블에 일정기간 보관하여 지연된 갱신요청이 분실되지 않고 지속적으로 갱신되도록 한다. 실험을 통해 제안한 기법을 적용한 경우와 적용하지 않은 경우를 비교해 전체 갱신 횟수 및 갱신 비용이 감소되는 것을 알 수 있다.

시공간 집계정보를 위한 Aggregation R-tree 기반의 하이브리드 인덱스 (A Hybrid Index based on Aggregation R-tree for Spatio-Temporal Aggregation)

  • 유병섭;배해영
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권5호
    • /
    • pp.463-475
    • /
    • 2006
  • 교통 관리 시스템과 같은 응용에서는 공간 데이타 웨어하우스의 공간 계층을 이용한 분석을 수행하는데, 이러한 분석에서는 주로 단순한 집계정보만을 요구한다. 공간 계층 기반의 집계정보 제공을 위하여 기존의 연구들은 공간 인덱스를 사용한 해결방법을 제시하였는데, 대부분의 연구들은 공간 인덱스 중 가장 널리 이용되는 R-tree를 확장한 방법을 이용하였다. 그러나 단순히 현재 집계 정보만을 제공하여 수년에 걸친 분석을 요구하는 교통 정책에 대하여 의사결정을 지원할 수 없었다. 본 논문에서는 과거의 집계정보까지 관리할 수 있는 aR-tree(Aggregation R-tree)기반의 하이브리드 인덱스를 제안한다. 제안 기법은 aR-tree를 이용하여 공간 계층과 현재시점의 집계정보를 제공하며, 시간 구조체를 이용한 정렬 해쉬 테이블로 시간 계층과 과거의 집계정보를 제공한다. 따라서 제안기법은 시공간 분석을 통한 효율적인 의사결정을 지원하며, 이는 현재의 교통 분석 및 과거를 통한 교통 정책 결정을 가능하게 한다.

서비스로의 데이터베이스에서 빈도수 기반의 추론공격 방지를 위한 인덱싱 기법 (An Indexing Method to Prevent Attacks based on Frequency in Database as a Service)

  • 정강수;박석
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권8호
    • /
    • pp.878-882
    • /
    • 2010
  • 데이터의 소유권이 외부 업체로 이양되는 DaaS 모델은 신뢰할 수 없는 서비스 제공자에 의한 데이터 누출의 위험이 존재한다. 본 논문은 복수 개의 칼럼으로 이루어진 암호화 된 테이블의 인덱스를 통해 발생할 수 있는 추론 공격을 분석하여 b-anonymity라는 개념을 도입함으로써 이에 대한 해결책을 제시한다. 또한 데이터의 인덱싱에 R+-Tree 기법을 사용함으로써 인덱스를 사용할 때 발생할 수 있는 오탐률 (False-positive)을 최소화하여 데이터 처리의 효율성을 보장하였다.

트라이 인덱스를 이용한 DNA 시퀀스 검색 (DNA Sequence Searching Using a Trie Index)

  • 원정임;박용일;윤지희;박상현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.4-6
    • /
    • 2003
  • 본 논문에서는 대규모 DNA 시퀀스를 위한 트라이 인덱싱 기법을 기반으로 하는 효율적인 부분 시퀀스 검색 기법을 제시한다. 제안된 인덱싱 방안에서는 저장 공간 감소를 위하여 시퀀스의 각 문자를 최소 비트 정보로 표현하며, 저장 구조로서 포인터를 사용하지 않는 디스크 기반의 이진 접미어 트라이 구조를 사용한다. 질의 처리 방안에서는 포인터가 없는 이진 트라이 구조 상에서 질의 시퀀스를 검색하기 위하여 이진 정보 기반의 연산과정을 필요로 하며, 또한 단말 정보를 효율적으로 검색하기 위하여 별도의 단말정보 테이블과 인덱스 구조를 사용한다. 실험 결과에 의하면 제안된 방식은 기존의 접미어 트리 인덱싱 방식에 비하여 약 30~50%의 저장 공간 감소 효과를 가질 뿐 아니라, 평균 질의 처리 시간에 있어 약 20배까지의 성능 개선 효과를 갖는 것으로 나타났다.

  • PDF

칼라맵 인텍스와 Hue 정보를 이용한 칼라 영상 분할 (Color Image Segmentation Using Color-map Index and Hue)

  • 유창연;곽내정;김영길;안재형
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.472-475
    • /
    • 2003
  • 본 논문에서는 칼라맵 인덱스와 Hue 정보를 이용하여 반복적 병합을 통해 분할하는 칼라 영상 분할 방법을 제안하였다. 먼저 영상을 벡터 양자화 한 후 양자화 칼라맵 인덱스를 이용해 초기 영역을 설정한다. 초기 영역으로 선택된 영역들은 Hue 정보를 이용하여 영역을 병합하였고 그 후 미소영역을 병합하였다. 이때 반복처리로 인해 수행시간이 많이 소요되는 것을 개선하기 위해 Hue 정보를 이용한 영역 병합 처리에서 두 개의 테이블을 이용하여 속도를 개선하였다. 후처리에서는 과분할된 영역을 제거하기 위해 RGB 칼라 성분의 유클리디언 거리를 이용하여 주변유사 영역에 병합하였다. 제안 방법은 다수의 칼라 영상에 적용하여 좋은 분할 결과와 빠른 처리속도를 보여주었다.

  • PDF

효율적인 Nested Loops Join을 위한 조인순서 선정 및 인덱스 구성에 관한 연구 (The Study of the Method that to Choice Efficient Nested Loops Join Order and the Index Design)

  • ;여정모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 춘계학술발표대회
    • /
    • pp.877-880
    • /
    • 2013
  • 정보시스템의 기반이 되는 관계형 데이터베이스에서는 데이터의 양에 따라 성능 차이가 발생한다. 데이터베이스에 관한 여러 가지 기능에 대한 이해가 부족하여 많은 성능 저하 문제를 유발하는데, 그중에 조인 성능문제가 큰 비중을 차지하고 있다. 아주 드문 경우가 아니라면 대부분의 데이터 처리는 하나 이상의 테이블이 필요하기 때문이다. 조인을 정확하게 사용하면 성능 개선에 큰 이점을 가져 올 수 있다. 본 연구는 관계형 데이터베이스 기반의 가장 기본적인 조인방식인 Nested Loops Join 방식을 효율적으로 수행하기 위한 조인순서 선정 및 인덱스 구성에 관한 연구를 하였다. 연구 결과를 평가하기 위해서 SQL Trace을 추출한 후 성능을 비교함으로써 선정된 조인순서가 효율적인 것을 입증하였다. 또한 기존의 응답시간을 기준으로 성능평가방법보다 액세스한 데이터 블록 수를 기준으로 한 성능 평가방법이 더 근본적으로 조인 성능을 개선할 수 있음을 증명하였다. 차후에는 더 복잡한 조인 형태 및 다른 조인방식의 성능개선 방법에 관한 연구를 진행할 것이다.

성능 향상을 위한 데이터 모델링 방법 (Data Modeling Methods for Performance Enhancement)

  • 김수연;이상호;서의호
    • 지능정보연구
    • /
    • 제4권2호
    • /
    • pp.85-102
    • /
    • 1998
  • 현재의 시스템 개발 프로젝트에서 대부분의 기업은 관계형 데이터베이스를 목표 환경으로 채택하고 있지만 설계자들은 기존의 파일 시스템이나 계층형 데이터베이스의 설계 방식을 관계형 데이터베이스 설계 시에도 그대로 적용하려는 경향이 있다. 또한 모델링 시 시스템 특성과는 무관한 업무 중심의 엔티티 관계도를 작성함으로써 구현 시에 모델을 상당 부분 변경하거나 추가해야 하는 오버헤드가 발생하기도 한다. 관계형 데이터베이스의 경우 구조를 어떻게 설계하느냐에 따라 효율의 차이가 크게 나타나므로 성능 향상을 위한 데이터 모델링 기법이 중요한 이슈로 등장하게 되었다. 본 논문에서는 관계형 데이터베이스 성능과 관련하여 이미 연구되고 실험된 내용을 여러 문헌과 자료를 참고하여 조사하였다. 성능 항상을 위한 모델링 기법들을 테이블, 릴레이션쉽, 인덱스 등의 객체별로 분류하여 정리하였고, 조사된 내용 중에서 몇 가지를 선택하여 Oracle DBMS 환경에서 실제로 실험을 실시하였다. 대용량 테이블에 대한 질의를 수행하여 소요되는 시간을 측정하고 그 결과를 분석하였다. 실험을 통해 검증된 결과를 토대로 제안되는 모델링 방법을 제시한다.

  • PDF