• 제목/요약/키워드: 데이터 인덱싱

검색결과 208건 처리시간 0.026초

대용량 이종 XML 데이터 검색을 위한 RDBMS기반 인덱싱 기법 (Technology for Searching Massive XML Data with Different Schema)

  • 이성진;박영순
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.202-204
    • /
    • 2004
  • 최근 XML은 기업간 데이터 교환의 표준으로 자리잡았다. 기업간 데이터 교환은 필연적으로 대량의 XML형태의 데이터가 로그 형태로 보전되게 된다. W3C에서는 XML자료의 검색을 위하여 XQueryl.0을 발표하고 XML 검색문의 표준화를 제시하였다. 검색운과는 별도로 XML데이터의 저장 모델에 대한 연구 또한 활발히 진행되고 있다. 본 논문에서는 대용량 XML데이터를 RDBMS를 이용하여 저장하고 빠른 검색을 지원 할 수 있는 역 인덱싱 방안을 기초로 검색 성능을 향상시킬 수 있는 방안에 대하여 연구하고 기존 방법과의 비교 실험을 통해 그 효과를 검증하였다.

  • PDF

오디오 데이터 인덱싱의 검색 효율 분석 (Retrieval Efficiency Analysis For Audio Data Indexing)

  • 조용춘;이배호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (하)
    • /
    • pp.1297-1300
    • /
    • 2000
  • 본 논문에서는 멀티미디어 데이터 중에서 오디오 데이터의 검색을 위해 Wavelet 변환을 이용한 인덱싱 방법에 대해 서술한다. 오디오 데이터는 그 자신이 가지고 있는 특징 때문에 좋은 검색효율을 위한 인덱스를 구성하기가 까다롭다. 여기서 Wavelet을 이용한 인덱스는 데이터를 블록으로 나누지 않고 인덱싱 하고, 이 방법을 이용한 검색효율에 대해 서술한다. 즉 Wavelet의 마지막 단계의 고주파 부분과 저주파 부분에서 고주파 부분은 String Matching 기법으로 블록을 결정하고, 저주파 부분은 결정된 블록에 대해서 세부적인 비교를 한다. 실험은 적절한 비교 계수를 결정하기 위한 실험과, 질의 길이의 변화에 따른 검색율의 변화를 보여준다. 마지막 결론에서는 본 논문에서 제안한 방법을 이용한 발전방향과 응용에 대해서 서술한다.

  • PDF

TIP-인덱싱 기법과 오디오 화일의 특징계수에 의한 내용기반 음악 검색 (Content-based Music Retrieval by TIP-indexing Techniques and Features of Audio files)

  • 김영인
    • 한국산업정보학회논문지
    • /
    • 제11권3호
    • /
    • pp.10-14
    • /
    • 2006
  • 방대한 양의 음악 데이터를 효율적으로 검색하기 위해서는 오디오 특징에 의해 인덱싱하고 검색하는 인덱싱 기법이 요구된다. 그러나 이와 관련한 인덱싱 기법에 대한 연구는 미진한 실정이다. 본 논문에서는 TIP-인덱싱 화일을 이용하여 오디오 특징 계수를 인텍싱하고 검색할 수 있는 내용기반 음악 정보 검색 기법을 제안한다. 또한 다양한 블록킹 인수를 이용한 성능 비교 실험을 위하여 TIP-인덱싱 화일을 만들고 실험한다. 실험 결과는 제안한 방법의 유효성을 보여준다.

  • PDF

경험적인 가중치를 고려한 증권시장용 계정 원장 DB의 인덱싱 방안 연구 (A Study on Indexing Strategy for Stock Ledger DB based on Heuristic Factor)

  • 강석희;최진영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.329-332
    • /
    • 2006
  • DBMS상의 인덱싱 기법은 대부분 B-트리 또는 B-트리의 변형인 T-트리 등을 주로 사용하여 왔다. 이는 트리 구성에서 최적의 균형을 유지하여 자료검색 및 저장 공간에 효율적인 방안으로 인식되어 왔으며 대부분의 범용 DBMS에서 탁월한 성능을 보여 왔다. 그러나 고성능의 효율을 요구하는 OLTP 분야 중 특히 증권시장에서는 이런 일반적인 인덱싱 방법보다는 그 분야 특성에 맞는 새로운 인덱싱 방안의 적용이 성능 향상과 더불어 시스템의 최적의 효율을 얻어낼 수 있다. 본 논문에서는 증권시장용 원장(ledger) DB의 새로운 인덱싱 방안으로서, 먼저 원장 DB의 접근 형태를 이해하고 경험적인 데이터를 기준으로 산출한 가중치를 이용, 새로운 인덱싱 방안을 제시하고 기존 인덱싱 방법과의 비교를 통한 성능향상의 효율성을 보여준다.

  • PDF

DWT를 이용한 오디오 데이터 인덱싱 및 검색 (Audio Data Indexing and Retrieval Using DWT)

  • 조용춘;이배호
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.761-764
    • /
    • 2001
  • 본 논문은 오디오 데이터의 인덱싱과 검색을 위해 DWT를 이용한 방법을 제안하였다. 오디오 데이터는 그 자신이 가지고 있는 다양한 특성 때문에 좋은 검색 효율을 위한 인덱스를 구성하기가 쉽지 않다. 신호 및 영상처리에서 각광받고 있는 DWT를 이용한 인덱스는 웨이블렛 변환이 가지고 있는 여러 특징들로 인해 데이터를 블록으로 나누지 않은 상태에서의 인덱싱과 검색을 가능케 한다. 즉 웨이블렛의 마지막 단계의 고주파 부분과 저주과 부문에서 고주파 부분은 String Watching 기법으로 블록을 결정하고, 저주파 부분은 결정된 블록에 대해서 세부적인 비교를 한다. 실험은 적절한 비교 계수를 결정하기 위한 실험과, 질의 길이의 변화에 따른 검색율의 변화를 보여준다. 마지막 결론에서는 본 논문에서 제안한 방법을 이용한 발전방향과 응용에 대해서 서술한다.

  • PDF

레벨별로 상세화된 공간 데이터를 위한 새로운 공간 인덱싱 기법 (A New Spatial Indexing Method for Level-Of-Detailed Data)

  • 권준희;윤용익
    • 한국멀티미디어학회논문지
    • /
    • 제5권4호
    • /
    • pp.361-371
    • /
    • 2002
  • GIS에 있어 효율적인 액세스 기법은 가장 중요한 요구사항 중 하나이다. 레벨별로 상세화된 공간 데이터를 사용하게 되면 한번에 모든 데이터를 검색할 필요가 없어 효율적인 공간 데이터 검색이 가능해진다 데이터 검색을 위한 기존의 공간 인덱싱 기법은 이러한 레벨별로 상세화된 공간 데이터를 효율적으로 다루지 못한다. 이를 위해 레벨별로 상세화된 공간 데이터를 위한 공간 인덱싱 기법이 알려졌다. 그러나 이 기법들은 단순화와 선택 연산자를 거친 몇 가지 종류의 레벨별로 상세화된 데이터만을 지원한다는 문제점을 가진다 이러한 문제점들을 해결하고자 본 논문에서는 모든 종류의 레벨별로 상세화된 공간 데이터를 지원하면서 검객이 효율적으로 이루어지는 새로운 공간 인덱싱 기법을 제안한다. 제안된 기법은 레벨별로 각각의 인덱스 구조가 한 개의 인덱스 구조로 통합된다. 실험 결과는 제안된 기법이 데이터 중복이 발생하지 않으면서도 검색 성능이 우수함을 보인다.

  • PDF

루씬을 이용한 빅데이터 인덱싱 및 검색시스템의 설계 및 구현 (A Design and Development of Big Data Indexing and Search System using Lucene)

  • 김동민;최진우;우종우
    • 인터넷정보학회논문지
    • /
    • 제15권6호
    • /
    • pp.107-115
    • /
    • 2014
  • 최근 소셜 미디어 사용의 증가, 산업간 융합의 확대, 다양한 스마트 기기의 보급을 통한 인터넷의 이용이 증가하면서 수많은 데이터를 발생시키고 있다. 이들 데이터들은 크기가 매우 크고, 형식이 다양하며, 순환속도가 매우 빨라 기존의 데이터 처리기술만으로는 관리와 분석이 어려운 실정이다. 즉, 수십 테라에 이르는 데이터의 폭증 및 데이터의 다양화에 따라 빠르게 분석하는 기술이 미흡하며, 이러한 문제점들을 해결하기 위한 새로운 기술적 방안이 절실히 요구되고 있다. 이러한 빅데이터의 처리기술에 대한 많은 연구가 최근 활성화 되고 있으며, 본 연구에서는 이러한 관점에서 빅데이터 플랫폼의 효과적인 인덱싱 엔진의 설계 및 구현에 관하여 기술한다. 즉, 기존의 데이터 처리기술의 범위를 초과하는 대규모의 데이터 집합을 효율적으로 관리하고, 인덱싱을 통한 검색속도의 향상으로 데이터 분석 시 소요되는 시간 단축을 연구목표로 한다. 본 연구의 실험을 위해서는 대규모 SNMP(Simple Network Management Prtocool) 로그 데이터를 사용하였으며, 효율적 데이터의 인덱싱을 통한 빠른 검색으로 데이터 분석시의 시간을 최대한 단축하고자 하였다. 또한 분석된 데이터의 표현의 가시화를 통하여 사용자의 데이터 분석에도 도움이 될 것으로 기대한다.

효율적인 웨이블렛 기반 오디오 데이터 검색 시스템 구현 (Implementation of an Efficient Wavelet Based Audio Data Retrieval System)

  • 이배호;조용춘;김광희
    • 한국음향학회지
    • /
    • 제21권1호
    • /
    • pp.82-88
    • /
    • 2002
  • 본 논문은 오디오 데이터의 검색을 위해 웨이블렛 (wavelet) 변환을 이용한 효율적인 인덱싱 방법을 제안하였다. 오디오 데이터는 그 자신이 가지고 있는 많은 저장공간의 필요, 전송에 있어서의 실시간 필요성, 큰 대역폭등의 다양한 특성 때문에 좋은 검색효율을 위한 인덱스를 구성하기가 쉽지 않다. 신호 및 영상처리에서 각광받고 있는 웨이블렛을 이용한 인덱스는 웨이블렛 변환이 가지고 있는 여러 특징들로 인해 데이터를 블록으로 나누지 않은 상태에서의 인덱싱과 검색을 가능케 한다. 오디오 데이터의 인덱싱은 웨이블렛의 마지막 단계의 고주파 부분과 저주파 부분의 계수를 이용하여 고주파부분은 스트링 매칭 알고리즘에 의해 스트링의 연속으로 변환하고, 저주파 부분은 영점 교차 히스토그램으로 변환한다. 구축된 인덱스를 이용한 오디오 데이터 검색은 질의 데이터와 데이터 베이스안의 인덱스 각 부분, 즉 고주파 부분과 저주파 부분의 스트링을 비교하여 가장 적은 편차를 갖는 결과를 검색 결과로 한다. 본 논문은 적절한 비교 계수 결정, 질의 길이의 변화에 따른 검색율의 변화, 데이터 각 분류별 유사도 검색 효율에 대한 실험을 하였으며, 본 논문에서 제안한 방법이 기존의 방법보다 우수한 성능 향상을 보였다.

비교사 토론 인덱싱을 위한 시청각 콘텐츠 분석 기반 클러스터링 (Audio-Visual Content Analysis Based Clustering for Unsupervised Debate Indexing)

  • 금지수;이현수
    • 한국음향학회지
    • /
    • 제27권5호
    • /
    • pp.244-251
    • /
    • 2008
  • 본 연구에서는 시청각 정보를 이용한 비교사 토론 인덱싱 방법을 제안한다. 제안하는 방법은 BIC (Bayesian Information Criterion)에 의한 음성 클러스터링 결과와 거리기반 함수에 의한 영상 클러스터링 결과를 결합한다. 시청각 정보의 결합은 음성 또는 영상 정보를 개별적으로 사용하여 클러스터링할 때 나타나는 문제점을 줄일 수 있고, 토론 데이터의 효과적인 내용 기반의 분석이 가능하다. 제안하는 방법의 성능 평가를 위해 서로 다른 5종류의 토론 데이터에 대해 음성, 영상 정보를 개별적으로 사용할 때와 두 가지 정보를 동시에 사용할 때의 성능 평가를 수행하였다. 실험 결과 음성과 영상 정보를 결합한 방법이 음성, 영상 정보를 개별적으로 사용할 때 보다 토론 인덱싱에 효과적임을 확인하였다.

Voronoi 다이어그램을 이용한 고속 최근접 검색 기법

  • 권동섭;최원익;박명선;이석호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.3-5
    • /
    • 1999
  • 최근접 검색(nearest neighbor search)을 위해서 대부분의 기존 기법들은 데이터를 특정한 공간 인덱스 구조를 이용하여 인덱싱하고 이 인덱스를 이용하여 질의를 수행하는 방법을 사용하였다. 본 연구에서는 이러한 데이터 자체를 인덱싱하는 방법과는 달리 미리 최근접 질의의 결과가 되는 Vorononi 다이어그램을 생성해두고, 이를 통하여 최근접 검색을 수행하는 VGrid(Voronoi diagram-Grid) 기법을 제안한다. 이 방법은 미리 모든 데이터에 대한 Voronoi 다이어그램을 계산하고 그 결과를 격자(grid)를 이용하여 인덱싱한 다음 최근접 검색 질의가 주어지면 이 격자 인덱스를 이용하여 빠르게 결과를 찾아낸다. 이 방법을 이용하면 처음 인덱스를 생성할 때는 많은 계산 시간이 소모되지만, 일단 인덱스가 구성되고 나면 최근접 검색 질의 처리 시 디스크 접근 회수가 줄기 때문에 기존의 기법에 비해 빠르게 최근접 검색 질의를 수행할 수 있다.

  • PDF