• 제목/요약/키워드: 색인기법

검색결과 654건 처리시간 0.021초

Wavelet을 이용한 내용기반 검색에 관한 연구 (A Study on Contents-based Retrieval using Wavelet)

  • 강진석;박재필;나인호;최연성;김장형
    • 한국정보통신학회논문지
    • /
    • 제4권5호
    • /
    • pp.1051-1066
    • /
    • 2000
  • 디지털 압축기술의 발달과 컴퓨팅 능력이 발전함에 따라서 많은 양의 이미지, 그래픽, 오디오, 비디오 정보가 인터넷을 통한 멀티미디어 시스템에서 활발히 이용되고 있다. 이에 따라 사용자가 원하는 멀티미디어 컨텐츠를 탐색하기 위한 다양한 검색기법이 요구되고 있으며, 특히 단순한 텍스트형 키워드에 의한 검색보다는 내용에 의한 검색 기법이 절실히 요구되고 있다. 본 논문에서는 여러 가지 전처리 과정을 통해 영상을 분류하고, 여기에 색상의 공간적, 질감적 특징을 선별적으로 적용함으로서 처리 효율을 높이면서 검색 성능을 증가시킬 수 있는 내용기반 색인 및 검색 알고리즘을 제안하였다. 또한, 특정 상표에 대한 내용기반 데이터 검색요청 및 수행 결과 분석을 통해 제안된 기법의 성능을 평가하였고, 그 결과를 기술하였다.

  • PDF

센서 네트워크 환경에서 질의 처리를 위한 노드 선정 기법의 설계 (Design of the Node Decision Scheme for Processing Queries on Sensor Network Environments)

  • 김동현
    • 한국정보통신학회논문지
    • /
    • 제16권10호
    • /
    • pp.2224-2229
    • /
    • 2012
  • 센서 데이터는 지속적으로 데이터 집합에 데이터가 삽입되기 때문에 데이터 검색을 위하여 연속 질의를 사용해야 한다. 연속 질의를 처리하기 위하여 각 센서 노드에서 질의 색인을 구축하고 질의 조건에 맞는 데이터를 전송하는 것이 필요하다. 그러나 모든 노드에 질의 조건을 전송하면 대량의 메시지가 발생하는 문제가 있다. 이 논문에서는 질의 조건 전송을 위한 메시지 횟수를 줄이기 위하여 센서노드선정 트리를 이용한 노드 선정 기법을 제안한다. 단말노드 엔트리는 각 센서 노드를 나타내며 센서 노드에서 발생하는 데이터의 영역을 정의한다. 질의가 발생하면 질의 조건과 겹치는 노드들이 선정되며 해당 노드로 질의 조건을 전송한다. 그리고 센서노드선정 트리를 구현하고 효율성을 실험하였다.

멀티미디어 데이터베이스 전송 알고리즘에 관한 연구 (A Study on Multimedia Database Transmission Algorithm)

  • 최진탁
    • 한국컴퓨터산업학회논문지
    • /
    • 제3권7호
    • /
    • pp.921-926
    • /
    • 2002
  • B+-Tree는 데이터베이스 관리 시스템에서 대용량의 데이터를 효율적으로 관리하기 위해서 가장 널리 사용되는 인덱스이다. 하지만 기존의 B+-Tree는 데이터베이스를 처음 구성할 때나, 인덱스를 새로 구성할 시, 많은 DISK/IO가 발생하고, 삭제 연산이 빈번할 시에는 색인 구조 변경연산이 많이 발생하여 동시성이 떨어진다는 단점이 있다. 이러한 문제점을 해결하기 위해서 대부분의 데이터베이스 시스템에서는 일괄구성과 지연삭제를 이용한다. 하지만 일괄구성 및 지연(Lazy) 삭제 방법을 적용한 B+-Tree를 데이터 베이스 관리 시스템에 적용 하려면 동시성 제어 및 회복 기법이 필수적으로 요구되지만, 이에 대한 연구가 미흡하여 실제 시스템에 적용하기에는 문제가 있다. 본 연구에서는 일괄구성과 지연삭제 방법을 적용한 B+-Tree를 실제 데이터베이스 시스템에 적용할 수 있도록 동시성 및 회복기법을 제안했다. 제안기법은 트랜잭션 Pending 리스트를 사용하여 연속적인 철회(Cascade Rollback)가 발생하지 않고, 재구성시 베이스 테이블에 대한 삽입, 삭제를 가능하게 하여 동시성을 높였으며, 시스템 Queue를 사용하여 일괄구성 연산을 사용자의 트랜잭션에서 수행하지 않고 따로 시스템 트랜잭션으로 처리하여 사용자의 트랜잭션의 응답시간을 줄였다.

  • PDF

XML 문서의 효율적인 저장을 위한 경로 통합 기법 (A Path Combining Strategy for Efficient Storing of XML Documents)

  • 이범석;황병연
    • 한국멀티미디어학회논문지
    • /
    • 제9권10호
    • /
    • pp.1257-1265
    • /
    • 2006
  • XML의 사용이 증가함에 따라서 XML과 관련된 다양한 분야에 대한 연구의 필요성도 증대되고 있는데, 특히 XML로 표현된 문서를 효과적으로 저장, 관리, 검색하기 위한 XML 문서 관리 시스템에 대한 많은 연구들이 활발하게 진행되어 왔다. 이러한 시스템들 중 BitCube는 검색에서 빠른 속도를 통해 뛰어난 성능을 입증한 3차원 비트맵 인덱스 시스템이다. 그러나 문서, 경로, 단어의 세 축으로 이루어진 3차원 메모리 구조를 사용하기 때문에 클러스터 내의 문서가 증가함에 따라 인덱스의 크기가 급격하게 증가하고, 이로 인해 연산 수행속도가 저하되는 문제점을 가지고 있다. 본 논문에서는 BitCube시스템의 문제점을 개선하기 위해 XML 문서의 경로 통합 기법을 제안한다. 이 기법은 XML문서를 시스템의 하부구조에 사용되는 관계형 DBMS에 저장할 때, 유사한 경로들을 통합하여 저장하고, 기존의 3차원 비트맵 인덱스에서 단어로 구성했던 한 축을 value 단위로 구성하여 인덱스 크기를 줄인다 제안한 방법은 3차원 비트맵 인덱스를 구성할 때 인덱스의 크기를 줄이고, 이로 인하여 검객 속도 향상과 디스크 저장 공간의 효율을 가진다.

  • PDF

영역 기반의 영상 질의를 이용한 내용 기반 영상 검색 (Content-based image retrieval using region-based image querying)

  • 김낙우;송호영;김봉태
    • 한국통신학회논문지
    • /
    • 제32권10C호
    • /
    • pp.990-999
    • /
    • 2007
  • 본 논문에서는 효과적인 영상 검색을 위한 방법으로서 JSEG 영상 분할 기법을 통한 영역 기반의 영상 인덱싱 및 검색 기법을 제안한다. JSEG은 영상을 색상 분류에 따라 양자화하고 이에 영역 윈도우를 적용시켜 J-image를 만든 다음, 세부 분할된 영역의 성장과 병합을 통하여 영상을 효과적으로 분할하는 방법이다. 제안하는 영상 검색 시스템은 JSEG에 의해 분할된 영상을 사용자에게 질의 영상으로 주고, 사용자로 하여금 분할 영상에서 관심 영역군(群)을 선택하게 한다. 그리고 나서, 사용자 질의에 의해 선택된 영역의 MBR을 구하고 이 영역의 중심을 기준으로 다중 윈도우 마스크를 생성하여 적용시킴으로써 특정 관심 영역을 중심으로 한 영상의 전역적인 특징을 추출한다. 최종적으로 추출된 특징의 성능 비교를 위한 기술자로는 누적 히스토그램을 이용하였다. 제안된 방법은 특정 영역에서의 특징과 전역 특징을 동시에 추출하여 검색에 이용함으로써 보다 빠르고 정확하게 사용자가 원하는 영상을 제공할 수 있다. 실험 결과는 영상 색인 및 검색에 있어서 제안된 방법이 영상 기반의 검색 기법과 비교하여 더 효과적임을 보여준다.

플래시 메모리 기반 인덱스 구조에서 대리블록 이용한 가비지 컬렉션 기법 (Garbage Collection Method using Proxy Block considering Index Data Structure based on Flash Memory)

  • 김선환;곽종욱
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권6호
    • /
    • pp.1-11
    • /
    • 2015
  • 낸드 플래시 메모리는 빠른 접근 시간과 저전력의 특성을 가지고 있어 저장장치로 많이 사용되고 있는 추세이다. 하지만 저사양의 임베디드 장치에서는 메모리 요구사항과 구현상의 복잡성으로 FTL을 적용하기에는 비용이 많이 든다. 이러한 이유로 FTL을 구현하기 힘든 임베디드 장치에 적용할 수 있는 B+ 트리 연구들이 다수 제안되었다. 이런 연구들은 낸드 플래시 메모리에서 제자리 업데이트가 불가하다는 단점을 고려하여 삽입과 갱신의 성능을 최적화 하였다. 하지만 B+ 트리에 기존의 가비지 컬렉션 기법들을 적용하면 낸드 플래시 메모리의 페이지 위치를 변경하게 되고 B+ 트리의 재구성을 발생시켜 전체적인 성능을 저하시킨다. 이러한 문제를 해결하고자 본 논문에서는 낸드 플래시 메모리를 기반으로 하는 B+ 트리와 이와 유사한 인덱스 트리 구조에 적용할 수 있는 가비지 컬렉션 기법을 제안한다. 제안하는 가비지 컬렉션 기법은 블록 정보 테이블과 대리 블록을 이용하여 B+ 트리의 재구성을 발생시키지 않는다. 제안된 기법의 성능평가를 위해, 낸드 플래시 메모리가 장착된 실험 장치에 B+ 트리와 ${\mu}$-Tree를 구현하고 제안된 기법을 적용하였다. 구현 결과 B+ 트리에서 제안된 기법이 GAGC(Greedy Algorithm Garbage Collection)보다 삽입된 키의 개수가 약 73% 많았으며, ${\mu}$-Tree에서 제안된 기법이 GAGC보다 시간 오버헤드가 약39% 적었다.

비공유 공간 클러스터 환경에서 효율적인 병렬 공간 조인 처리 기법 (Efficient Parallel Spatial Join Processing Method in a Shared-Nothing Database Cluster System)

  • 정원일;이충호;배해영
    • 정보처리학회논문지D
    • /
    • 제10D권4호
    • /
    • pp.591-602
    • /
    • 2003
  • 기존의 단일 대용량 데이터베이스 서버에 인터넷 서비스 사용자들이 과도하게 몰릴 경우 서버에 발생하는 네트워크 통신량의 증가와 자원 사용량의 급격한 증가로 인해 서비스 처리 시간의 지연 및 서비스의 중단 현상이 발생할 수 있다. 이러한 문제들을 해결하기 위해 저비용의 여러 단일 노드를 고속의 네트워크로 연결하여 고성능을 제공하는 공간 데이터베이스 클러스터가 대두되었으나, 단일 노드에서 처리할 경우 전체 시스템의 성능을 저하시킬 수 있는 고비용의 공간 조인 연산에 대한 연구가 필요하다. 본 논문에서는 공간 데이터의 특성을 고려한 데이터의 분할과 부분 중복 기법을 사용하는 비공유 공간 데이터베이스 클러스터 환경에서 고비용의 공간 조인 연산을 효율적으로 수행하기 위한 논리적 분할 영역 및 병렬 공간 조인 기법을 제안한다. 제안 기법은 기존의 병렬 광간 조인 기법에서 나타나는 노드간 작업 생성 및 할당 단계가 필요하지 않으며 추가적인 메시지 전송이 발생하지 않으므로 고비용의 공간 조인 질의에 대해 기존의 비공유 구조를 위한 병렬 R-tree 공간 조인 기법보다 23%의 성능향상을 보인다. 또한, 각 클러스터 노드에서의 중복 정제(Refinement) 연산을 제거하므로 사용자에게 빠른 응답을 제공한다.

블로그 검색 성능 향상을 위한 주제-랭크 기법 (The Topic-Rank Technique for Enhancing the Performance of Blog Retrieval)

  • 신현일;윤은일;류근호
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권1호
    • /
    • pp.19-29
    • /
    • 2011
  • 1인 미디어인 블로그에 대한 관심이 증가함에 따라, 블로그 검색과 관련된 다양한 랭킹 알고리즘들이 제안되었다. 이러한 알고리즘들은 블로그가 웹 페이지와 다르게 갖는 구조적 특징에 맞게 변형되었으며, 각 블로그간의 연결이나, 댓글, 트랙백들을 통해 이루어진 상호소통 속에서 나타난 결과들을 바탕으로 블로그의 평판이나 인기도를 수치화하여 검색 시스템에 반영한다. 하지만 실제 블로그 검색에서는 블로그 자체의 랭크뿐만 아니라 검색어와 블로그 글과의 적합성과시간등의요소를복합적으로사용하게된다. 그런데기존에알려진요소만으로는검색결과의품질이낮을수 있다. 본 논문에서는 블로그의 주제와 관련도가 가장 높은 블로그를 찾아 낼 수 있는 주제-랭크 기법을 제안한다. 이 기법은 블로그와 블로그 글의 색인어뿐만 아니라, 블로그 글을 대표하는 주제와의 관계까지 랭킹을 매기는 방법이다. 제안된 기법을 통해 블로그 검색에서 검색어와 블로그의 연관성에 따라 랭킹을 효과적으로 부여할 수 있다. 본 논문 제안하는 주제-랭크 기법을 적용한 블로그 검색 시스템의 정확률과 적용률을 국내의 다른 블로그 검색 시스템들과 비교해 본 결과, 주제-랭크 기법을 사용한 블로그 검색 시스템의 성능이 타 시스템에 비해 더 우수함을 알 수 있었다.

문헌빈도와 장서빈도를 이용한 kNN 분류기의 자질선정에 관한 연구 (A Study on Feature Selection for kNN Classifier using Document Frequency and Collection Frequency)

  • 이용구
    • 한국도서관정보학회지
    • /
    • 제44권1호
    • /
    • pp.27-47
    • /
    • 2013
  • 이 연구에서는 자동 색인을 통해 쉽게 얻을 수 있는 자질의 문헌빈도와 장서빈도를 이용하여 자동분류에서 자질 선정 기법을 kNN 분류기에 적용하였을 때, 어떠한 분류성능을 보이는지 알아보고자 하였다. 실험집단으로 한국일보-20000(HKIB-20000)의 일부를 이용하였다. 실험 결과 첫째, 장서빈도를 이용하여 고빈도 자질을 선정하고 저빈도 자질을 제거한 자질선정 방법이 문헌빈도보다 더 좋은 성능을 가져오는 것으로 나타났다. 둘째, 문헌빈도와 장서빈도 모두 저빈도 자질을 우선으로 선정하는 방법은 좋은 분류성능을 가져오지 못했다. 셋째, 장서빈도와 같은 단순빈도에서 자질 선정 구간을 조정하는 것이 문헌빈도와 장서빈도의 조합보다 더 좋은 성능을 가져오는 것으로 나타났다.

주제분석기법으로서의 자동색인 (Automatic indexing as a subject analysis technique)

  • 이영자
    • 한국도서관정보학회지
    • /
    • 제12권
    • /
    • pp.61-96
    • /
    • 1985
  • The human subject analysis of a document has some critical problems. The method results in the inconsistency in analysis process and the contradiction of two objects of the subject analysis (one is the identification of the content for the retrieval of specific items and the other is to identify the content for the grouping of related materials). Since the subject analysis by mechanized has been recognized to be the possible way to aggregate the problems of manual analysis, various a n.0, pproaches of automatic indexing have been studied and experimented. This study is to examine the automatic indexing as one of the promising subject analysis techniques by statistical, syntactical and semantic a n.0, pproaches. In conclusion, the reasonable a n.0, pplication time of the automatic indexing should be made a decision based on the through investigation on the cost verse effectiveness, and automatic indexing system should be developed in the close relationship with the on-line search which is a good retrieval system for information explosion society. From now on, since the machine-readable document-text will be envisaged to be more and more available due to the rapid development of computer technology, the more substantial research on the automatic indexing will be also possible, which can bring about the increasing of practical automatic indexing systems.

  • PDF