• 제목/요약/키워드: 데이터 인덱스 정보

검색결과 383건 처리시간 0.034초

다차원 데이터 분석을 위한 비트맵 인덱스 (A Bitmap Index for Multi-Dimensional Data Analysis)

  • 임윤선;박영선;김명
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.298-300
    • /
    • 2002
  • 다차원 데이터를 배열에 저장하는 Multidimensional OLAP (MOLAP) 시스템은 배열내의 위치 정보를 통해 데이터를 신속하게 엑세스할 수 있는 장점을 갖는다. 그러나 실생활의 다차원 데이터는 대체로 희박하여 저장될 때 압축되고, 데이터가 검색될 때는 원래의 위치 정보를 찾기 위해 인덱스를 필요로 하게 된다. 다양한 종류의 다차원 인덱스가 테이블 형태의 데이터를 대상으로 개발되어 있으나, 이들은 데이터의 삽입과 삭제에 유연하게 대처할 수 있도록 하기 위해서 인덱스 공간과 데이터 검색 시간에 약간의 낭비를 초래한다. 본 연구에서는 OLAP 데이터가 주기적으로 갱신되며, 분석에 필요한 집계 데이터도 점진적으로 갱신되기보다 실제로는 새로 생성되고 있다는 점을 고려하여, 읽기 전용 MOLAP 데이터를 위한 인덱스 구조를 제안한다. 데이터는 청크들로 나뉜 후 압축 저장되며, 각 청크는 위치 정보를 유지하면서 비트로 표현되어 인덱스에 저장되도록 하였다. 제안한 비트맵 인덱스는 높은 압축률을 보이며, 범위 질의(range query)를 포함한 OLAP 주요 연산들 처리에 특히 효율적이다.

  • PDF

디렉토리 인덱스에 데이터 숨기기 방법을 적용하기 위한 필요한 요소들 (Analysis of Required Elements of a Directory Index Data Hiding Method)

  • 조규상
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제58차 하계학술대회논문집 26권2호
    • /
    • pp.478-479
    • /
    • 2018
  • 본 논문에서는 NTFS 파일시스템에서 디렉토리 인덱스의 구조내에 데이터를 숨기기 방법을 적용하는데 있어서 필요한 요소들에 대한 설명과 그것의 필요성에 대하여 논하기로 한다. 기존에 발표된 이 방법은 NTFS의 디렉토리 인덱스를 유지하기 위하여 B-tree방식으로 인덱스에 대한 데이터 구조를 운영하고 있는 점을 이용하여 인덱스의 정보를 담고 있는 인덱스 레코드 안에 저장되는 파일명을 이용하여 데이터 감추기를 수행하는 방법이다. 이것을 하기 위하여 필요한 몇가지 요소가 있는데 그 중에서 파일시스템, 작업 디렉토리, 위장 파일, 숨기려는 데이터, 사용할 수 없는 문자들, 앵커파일, 분석도구 등에 대한 것들을 나열하고 해당하는 요소들이 필요성과 그에 대한 의미를 기술하고자 한다.

  • PDF

멀티 디스크 방송 환경을 위한 인덱스 기술 (An Indexing Technique for Multi-Disks Broadcast Environments)

  • 박기영;정성원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.215-218
    • /
    • 2007
  • 모바일 환경에서는 상향링크와 하향링크의 대역폭이 비대칭적이며 전력이 한정되어 있기 때문에 효율적인 데이터 전송기술로 브로드캐스팅 방법이 연구되어 왔다. 브로드캐스트에서 인덱스를 사용하면 원하는 데이터가 언제 방송되는지를 알 수 있어 튜닝 시간을 줄이고, 전력의 소비를 줄이는 효과가 있다. 지금까지 연구된 싱글 채널 인덱스 기법들은 모든 데이터 아이템이 동일한 확률로 접근되는 flat 브로드캐스트 방송에 적합한 인덱스 기법들이다. 데이터 아이템에 대한 접근 확률이 편향되는 경우에는 멀티디스크 방송 기법을 사용해야 효과적이지만, 기존의 인덱스 기법들은 인덱스가 한 방송 주기 내에서 반복되어 방송되는 데이터 아이템을 가리킬 수 없기 때문에 멀티디스크 방송 기법에는 효과적이지 않다. 본 논문에서는 싱글 채널 인덱스 기법으로서 멀티디스크 방송에 적용되는 인덱스 기법인 MDEI (Multi-disk Exponential Index) 기법을 제안한다. 제안 하는 MDEI 기법은 각 디스크 별로 인덱스를 구성하기 때문에 데이터에 대한 접근확률이 편향되는 경우에 멀티디스크 방송을 기반으로 이 인덱스 기법을 사용하면 flat 브로드캐스트를 사용하는 다른 인덱스 기법을 사용했을 때보다 평균 접근지연시간 시간을 크게 줄일 수 있다. 실험 결과는 데이터에 대한 접근 확률이 편향된 환경에서 MDEI가 평균 접근지연시간에 있어서 매우 좋은 성능을 갖는 것을 보여준다.

LUR-tree에서 이동체의 지연 다량 삽입 기법 (Lazy Bulk Insertion Method of Moving objects on LUR-tree)

  • 김정현;장용일;배해영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.70-72
    • /
    • 2005
  • 지금까지의 이동체 인덱스에 대한 연구는 주로 인덱스 구성 후에 발생하는 질의 처리 효율성에 두고 있다. 다수의 이동체 인덱스에서 이동체 데이터의 갱신 연산에 의한 인덱스 재구성에 대한 디스크 접근 오버헤드를 고려하지 않았다. 이동체 데이터 처리를 위한 대표적 인덱스 구조인 R-tree는 이동체에 대한 갱신 연산 비용이 많이 든다. 이런 R-tree의 단점을 보완하기 위해 이동체가 가지는 MBR값이 동적으로 변화하는 환경에 맞추어 R트리의 갱신 비용을 절감하여 처리하는 LUR-tree가 제안되었다. 본 논문에서는 마른 데이터 생성 속도에 적합하도록 디스크 접근 오버헤드를 고려해서 LUR-tree를 관리할 수 있는 현재 인덱스에 대한 다량 삽입 기법을 제안한다. 이 기법에서는 다차원 인덱스 구조에서의 다량 삽입 기법을 위한 간단한 버퍼링 기법을 사용한다. LUR-tree의 단말 노드 정보를 관리하는 보조 인덱스를 추가하여 갱신 연산에 따른 노드의 분할과 합병을 예측한다. 예측된 결과를 바탕으로 노드의 변화를 최소화하는 방향으로 데이터의 갱신 순서를 정하여 데이터 갱신에 따른 노드의 분할과 합병을 최소화한다. 실험을 통해 제안한 기법을 이용한 다량 삽입이 기존의 다량 삽입 기법들과 비교해 인덱스의 갱신 비용을 감소시키는 것을 알 수 있다.

  • PDF

모바일 환경에서 다중 속성 검색을 위한 시그너쳐 기반의 인덱싱 기법 (Signature-based Indexing Scheme for Multi-attribute Retrieval in Mobile Environments)

  • 박성근;정성원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.52-54
    • /
    • 2004
  • 모바일 환경에서 효과적인 데이터 전송 방법인 브로드 캐스트 기법에서 중요한 문제 중의 하나가 데이터에 대한 인덱스 생성이다. 데이터에 대한 인덱스가 제공되면 클라이언트는 튜닝 타임과 엑세스 타임을 줄일 수 있고, 그와 함께 배터리 소모도 줄일 수 있다 기존에 제시된 인덱스 생성 기법온 대부분 트리 구조를 기반으로 하고 있다. 트리 기반 인덱싱 기법은 튜닝 타임을 최소화하지만, 반면 멀티-어트리뷰트(multi-attribute)에 대한 엑세스나 다양한 종류의 멀티미디어 데이터들 혹은 클러스터링 된 데이터에 대한 인덱스 생성이 어렵다. 이러한 문제를 해결하기 위해 시그너쳐 기반의 인덱싱 기법이 제시되었다. 그러나 기존의 시그너쳐 기반 인덱싱 기법에서는 엑세스 타임이 전체 브로드 캐스트 타임으로 고정되는 문제가 있었다. 본 논문비서는 앞으로 브로드 캐스팅 될 데이터들에 대한 포괄적인 정보를 가지는 시그너쳐 집합을 인덱스로 제공해서 클라이언트의 엑세스 타임을 최소화시키는 시그너쳐 스킴을 제시한다.

  • PDF

MMDB의 인덱스 선택 기준에 관한 연구 (A Study on the Index Selection Criteria of MMDB)

  • 유경산;유신;여정모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.664-667
    • /
    • 2015
  • 데이터 처리 성능에서 메인 메모리 데이터베이스(MMDB)가 디스크 기반 데이터베이스(DRDB)보다 월등하여 국내외의 데이터베이스 영역에서 이슈가 되고 있다. MMDB 성능에 영향을 미치는 요소에는 CPU의 성능과 메모리의 크기 및 인덱스의 선택 등이 있다. 이 중에서 MMDB 성능에 비교적 큰 영향을 미치는 요소는 인덱스의 선택 문제이다. 옵티마이저의 실행계획을 수립할 때, 인덱스는 최적의 경로를 찾도록 하는 전략적인 요소로서 그 구성에 문제가 있으면 최적화된 실행계획을 얻을 수 없다. 하지만 이러한 인덱스 선택 기준에 관련한 연구는 미미한 실정이다. 따라서 우리는 MMDB에서의 인덱스 선택 기준에 대하여 실험하고 연구하였다. 실험에 사용된 MMDB는 인기 있는 TimesTen MMDB이다. 실험 대상 테이블에 대하여 인덱스가 없는 경우, T-Tree 인덱스를 생성한 경우, Bitmap 인덱스를 생성한 경우 등에서 데이터 량과 분포도를 각각 변화시켜, 어떤 분포도에서 어떤 인덱스가 유리한지 실험하고 인덱스의 선택 기준 결과를 얻었다. 본 연구의 결과는 실무에서 MMDB의 인덱스를 선택하는 기준으로 사용될 수 있을 것으로 기대한다.

최적의 군집을 찾기 위한 상대적 군집 평가 방법 (Clustering Validity Assessment Using Relative Criteria for finding Optimal Clusters)

  • 김영옥;이수원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.334-336
    • /
    • 2002
  • 군집 분석은 데이터의 속성을 분석하여 서로 유사한 패턴을 가진 데이터를 묶는 방법이다. 군집 분석은 많은 응용 분야에서 쓰이고 있으나, 수행된 군집 분석 결과가 과연 정확한 결과이고 의미 있는 결과인지를 평가하는데 어려움이 있다. 본 논문에서는 군집이 형성된 데이터를 분석하여 군집 분석 결과를 평가하는 상대적 군집 평가 방법을 제안한다. 본 논문에서는 상대적 군집 평가 방법의 인덱스를 정의하고 형성된 군집 분석 결과에 적용해 최적의 군집, 의미 있는 군집을 찾을 수 있음을 보인다. 또한 실험을 통해 제안한 인덱스의 적합성을 보이며, 제안한 인덱스가 기존의 인덱스에 비해 최적의 군집, 의미 있는 군집을더 잘 찾을 수 있음을 보인다.

  • PDF

다차원 인덱스를 지원하는 4D데이터 제공자 (4D Data Provider Supporting a Multidimensional Index)

  • 이선준;김상호;류근호;이성호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.34-36
    • /
    • 2002
  • 사용자에게 제공되고 있는 대부분의 시간 지리 정보 시스템은 소프트웨어 형태로 패키지화하여 제공되므로 과다한 구축비용과 재사용성의 문제점을 가지고 있다. 그리고 시간 지리 정보 시스템은 복잡하며 대용량인 특성을 가진 시공간 데이터를 처리해야만 한다. 따라서 시공간 데이터의 효율적인 관리 및 재사용성을 위해서 소프트웨어 부품화물 제공하는 컴포넌트 개발 방법론을 사용해야하며 시공간 데이터에 빠르게 접근하기 위한 인덱스 구조가 필요하다. 이 논문에서는 시공간 데이터를 효율적으로 관리하기 위하여 4차원 시공간 객체에 대한 인덱스를 컴포넌트 개발 방법론을 적용하여 설계하였다. 그리고 다차원 인덱스를 이용하는 4D 데이터 제공자를 COM 기반의 OLE DB 인터페이스를 이용하여 구현하고 성능을 평가하였다.

  • PDF

다양한 분포의 데이터를 이용한 시계열 패턴 인덱스의 성능 비교

  • 김영인
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 1998년도 공동추계학술대회 경제위기 극복을 위한 정보기술의 효율적 활용
    • /
    • pp.791-805
    • /
    • 1998
  • 음성데이타베이스 이미지 데이터베이스 등과 같은 응용에서 다차원 구조의 시계열 패턴을 효율적으로 처리하기 위한 인덱스 구조가 필요하다. 이러한 인덱스구조로 시계열 패턴 인덱스(9)가 제안되었다. 본 논문에서는 시계열 패턴 인덱스가 실제 응용에 적용가능한가를 판단하기 위하여 , 다양한 분포의 대량 데이터를 이용한 실험을 통한 성능을 비교한다. 성능 실험결과 저장시의 성능은 균일 분포에서 좋은 성능을 나타냈다. 질의 처리시의 성능은 모든 분포에서 좋은 후보 선택의 결과를 나타냈다.

대용량 그래프에서 k-차수 인덱스 테이블을 이용한 RDBMS 기반의 효율적인 최단 경로 탐색 기법 (RDBMS based Efficient Method for Shortest Path Searching over Large Graphs using K-degree Index Table)

  • 홍지혜;한용구;이영구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1186-1188
    • /
    • 2013
  • 최근 소셜 네트워크의 등장과 기술의 발달로 인해 빅 데이터가 등장하였다. 특히, 소셜 네트워크나 웹 데이터 등과 같은 빅 데이터를 이용하는 애플리케이션이 많아지고 있다. 이러한 그래프 데이터는 크기가 매우 방대하여 인-메모리 기법을 통해 연산하기 어렵다. 최근 대용량 그래프 상에서 효율적인 최단 경로 탐색을 위해 부분 최단 경로를 저장하는 인덱스 테이블을 활용한 기법이 제안되었으나, 인덱스 참조율을 고려하지 않아 비효율적이다. 본 논문에서는 인덱스 참조율이 높은 노드의 차수를 이용한 k-차수 인덱스 테이블을 이용한 효율적인 최단 경로 탐색 기법을 제안한다. 실험을 통하여 제안하는 기법이 거리 기반 인덱스를 이용한 기존의 기법에 비해 약 12% 정도 성능이 향상됨을 보였다.