• 제목/요약/키워드: succinct data structure

검색결과 3건 처리시간 0.017초

문자의 빈도수를 고려한 Rank/Select 자료구조 구현 (Implementation of Rank/Select Data Structure using Alphabet Frequency)

  • 권유진;이선호;박근수
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제36권4호
    • /
    • pp.283-290
    • /
    • 2009
  • Rank/select 자료구조는 트리, 그래프, 문자열 인덱스 등의 다양한 자료구조를 간결하게 표현하는 기본 도구이다. Rank/select 자료구조는 주어진 문자열에 어느 위치까지 나타난 문자 개수를 세는 연산을 처리한다. 효율적인 rank/select 자료구조를 위해 이론적인 압축 방식들이 제안되었으나, 실제 구현에 있어 연산 시간 및 저장 공간의 효율을 보장할 수 없었다. 본 논문은 간단한 방법으로 이론적인 압축 크기를 보장하면서 연산 시간도 효율적인 rank/select 자료구조 구현 방법을 제시한다. 본 논문의 실험을 통해, 복잡한 인코딩 방법 없이도 이론적인 nH$_0$ + O(n) 비트 크기에 근접하면서 기존의 HSS 자료구조보다 빠른 rank/select 연산을 지원하는 구현 방법임을 보인다.

임의 접근을 지원하는 간단한 정수 배열 코드 시스템 (A Simple Integer Sequence Code System Supporting Random Access)

  • 이준희;스리니바사 라오 사티
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권10호
    • /
    • pp.594-598
    • /
    • 2017
  • 정수 형태의 배열로 이루어진 데이터가 주식 시장과 같은 원본으로부터 셀 수 없을 정도로 매일 생성되고 있다. 정수 배열을 저장하는 데에 감마 코드, 델타 코드, 피보나치 코드 등을 포함한 범용 코드가 일반적으로 사용된다. 이 배열을 적은 공간을 차지하게 하면서 빠른 시간에 특정 원소에 접근하는 연산을 수행할 수 있게 하려는 시도가 진행되었다. 본 논문에서는 간결한 자료구조의 특성을 활용하여 부호화된 정수 배열에서의 임의 접근을 가능하도록 한 코드 시스템을 제시한다. 이는 코드 시스템에 사용되는 구획 문자 비트열을 압축하면서 질의 수행 시간을 상수 시간에 지원하는 자료구조를 통해 구현되었다. 실험 결과를 통해 범용 코드 시스템보다 더 적은 공간과 시간을 사용해 정수 배열을 표현할 수 있다는 것을 보인다.

시퀀스 데이터베이스에서 유연 규칙의 탐사 (Elastic Rule Discovering in Sequence Databases)

  • 박상현;김상욱;김만순
    • 산업기술연구
    • /
    • 제21권A호
    • /
    • pp.147-153
    • /
    • 2001
  • This paper presents techniques for discovering rules with elastic patterns. Elastic patterns are useful for discovering rules from data sequences with different sampling rates. For fast discovery of rules whose heads and bodies are elastic patterns, we construct a suffix tree from succinct forms of data sequences. The suffix tree is a compact representation of rules, and is also used as an index structure for finding rules matched to a target head sequence. When matched rules cannot be found, the concept of rule relaxation is introduced. Using a cluster hierarchy and a relaxation error, we find the least relaxed rules that provide the most specific information on a target head sequence. Performance evaluation through extensive experiments reseals the effectiveness of the proposed approach.

  • PDF