• 제목/요약/키워드: 검색 색인

검색결과 1,079건 처리시간 0.026초

고차원 멀티미디어 데이터에 대한 내용기반 검색을 위한 인덱싱 방법들의 성능 평가 (A Performance Evaluation of Indexing Methods for Content-based Retrieval of High Dimensional Multimedia Data)

  • 문주선;최정훈;낭종호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (A)
    • /
    • pp.345-346
    • /
    • 2008
  • 멀티미디어 데이터베이스의 효과적인 내용 기반 검색을 위한 많은 색인 방법들이 연구되어왔지만 정작 동일한 데이터 집합과 동일한 평가 기준으로 서로 다른 검색 방법들의 성능을 분석한 실험은 이뤄지지 않았다. 본 논문에서는 기존의 대표적인 색인 방법들을 구현하고 공통의 데이터 집합에 대한 색인 검색을 여러 성능 측정 기준에 따라 분석함으로써 각 색인 방법들의 특징 및 성능을 객관적으로 평가하였다. 향후 본 논문에서 실험한 결과들을 이용하면 특정 데이터 집합에 효과적인 색인 방법을 선택할 수 있을 것이다.

  • PDF

국내 문자정보 데이터베이스의 색인에 관한 연구 (Development of an Indexing Model for Korean Textual Databases)

  • 정영미
    • 정보관리학회지
    • /
    • 제13권1호
    • /
    • pp.19-43
    • /
    • 1996
  • 본 연구에서는 국내 텍스트 데이터베이스의 색인언어 및 색인기법에 관한 현황을 분석하고, 3개의 텍스트 데이터베이스를 대상으로 하여 자연언어 색인과 통제언어 색인의 검색 성능을 평가하는 실험을 수행하였다. 조사결과 국내 텍스트 데이터베이스의 대부분이 자연언어 색인 방식을 사용하고 있었으며 검색 실험에서는 적절한 탐색전략을 사용하는 경우 자연언어가 통제언어보다 검색성능이 우수한 것으로 평가되었다. 색인현황에 관한 조사와 검색 성능의 실험 결과에 근거하여 국내 텍스트 데이터베이스를 위한 효율적인 색인 모형을 제시하였다.

  • PDF

효율적인 구조 정보 검색을 위한 색인 모델 (An Indexing Model for Efficient Structure Information Retrieval)

  • 고혜경;조윤기;조정길;이병렬;구연설
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (A)
    • /
    • pp.649-651
    • /
    • 2001
  • 본 논문에서는 XML 문서의 효율적인 관리와 구조검색을 위한 구조적 색인 방법을 제안한다. 기존의 방법은 특정 엘리먼트의 부모, 자식, 형제애 대한 다양한 구조검색을 효율적으로 지원하지 못하므로, XML 문서의 구조정보를 LETID(Labeled Element Type ID)로 표현하며 엘리먼트를 식별하고, 부모와 자식 엘리먼트간의 계층 정보와 동일한 부모 엘리먼트를 갖는 자식 엘리먼트들의 순서정보를 나타낸다. LETID는 고정된 크기로 하며, 엘리먼트에 고유 ID를 부여하는 방식을 통해서 DTD의 논리적 구조를 분석할 때 부모 형제 노드를 직접적으로 찾을 수 있고 ID 값에 깊이정보가 포함되어 있기 때문에 고유번호만 보고 깊이를 알 수가 있다. 이 구조정보를 이용하여 빠른 검색을 위한 내용 색인 구조 색인 애트리뷰트 색인을 설계하고 설계된 색인을 통하여 질의를 처리하여 다양한 구조적 질의를 효율적으로 처리할 수 있다.

  • PDF

이동 객체의 유사 부분궤적 검색을 위한 시그니쳐-기반 색인 기법 (Signature-based Indexing Scheme for Similar Sub-Trajectory Retrieval of Moving Objects)

  • 심춘보;장재우
    • 정보처리학회논문지D
    • /
    • 제11D권2호
    • /
    • pp.247-258
    • /
    • 2004
  • 최근 비디오 데이타베이스, 시공간 데이타베이스, 모바일 데이타베이스와 같은 데이타베이스 응용 분야에서 이동 객체를 기반으로 하는 검색 기법에 관한 연구가 활발히 이루어지고 있다. 본 논문에서는 이동 객체의 궤적에 대한 효율적인 유사 부분궤적 검색을 지원하는 새로운 시그니쳐-기반 색인 기법을 제안한다. 제안하는 시그니쳐-기반 색인 기법은 궤적 데이타를 토대로 궤적 시그니쳐를 생성하는 방법에 따라 중첩 시그니쳐-기반 색인 기법(Superimposed signature-based Indexing scheme for similar Sub-trajectory Retrieval : SISR)과 합성 시그니쳐-기반색인 기법(Concatenated signature-based Indexing scheme for similar Sub-trajectory Retrieval : CISR)으로 나뉜다. 생성된 궤적 시그니쳐 정보는 시그니쳐 파일에 저장되고, 검색시 주어진 사용자 질의 궤적 정보를 기반으로 데이타 파일을 직접 접근하기 전에 전체 궤적 시그니쳐들을 탐색하여 필터링을 수행한다. 이를 통해 데이타 파일의 검색 범위를 현저히 줄임으로써 검색 성능을 향상시킨다. 또한 검색된 궤적 데이터와의 유사성을 측정하기 위해 k-워핑 알고리즘을 적용시켜 검색의 효율성을 높인다. 마지막으로, 순차 색인 기법, SISR기법, 그리고 CISR 기법을 삽입시간, 검색 시간 그리고 부가 저장 공간측면에서 성능 평가를 수행한다. 성능 평가 결과, 제안하는 두 가지 기법이 검색 성능 측면에서 순차 색인 기법에 비해 성능이 우수함을 나타내고, 아울러 SISR 기법이 CISR 기법에 비해 보다 우수한 성능을 보인다.

웹 기반 멀티미디어 검색 엔진 구현 (Web based Multimedia Search Engine)

  • 이상열;정성호;황병곤
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 추계학술발표논문집
    • /
    • pp.437-441
    • /
    • 2002
  • 멀티미디어 검색 시스템들은 아직까지 내용 기반에 의한 검색 기술이 실용적으로 쓰일 만큼 높은 성능을 보이고 있지 않기 때문에 텍스트에 의한 검색만을 지원하고 있는 실정이다. HTML문서에 나타나는 텍스트 중 이미지 아래에 붙은 표제나 이미지 링크에 붙어 있는 텍스트를 골라내어 이미지의 색인 정보로 이용하여 텍스트를 추출하는 기법을 제안하였다. 텍스트를 추출하기 위해 n-gram 색인 방법을 사용하였으며 한편 검색 효율을 높이기 위해서 질의 의도가 큰 단어에 가중치를 부여하였다.

  • PDF

동적 색인과 한국어 내용 기반 검색을 이용한 개인용 검색 시스템 (Personal Information Searching System using Dynamic Indexing and Korean Contents Based Search)

  • 김윤태;김지원;손수정;이현아
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.639-641
    • /
    • 2018
  • 고전적으로 이용되던 디렉터리 분류로는 원하는 정보를 빠르게 찾기 어려워지면서, 키워드 기반 검색 시스템이 정보 처리의 중심이 되고 있다. 본 논문에서는 개인용 컴퓨터에서의 빠른 자료 검색을 위한 키워드 기반 정보검색 시스템을 제안한다. 시스템에서는 동적 색인을 통하여 기존 시스템들보다 빠른 시간 내에 검색 결과를 제공한다. 내용 기반 검색과 다양한 포맷에 대한 문서 검색 기능을 포함하여 사용자에게 편리한 환경을 제공할 뿐만 아니라, 한글 문장이 포함된 문서에 대해서 원활한 검색을 제공하고자 한다. 성능 비교 검증을 수행한 결과 기존 시스템에 비해 보다 빠른 시간 내에 많은 문서를 탐지할 수 있음을 확인하였다.

  • PDF

P2P 시스템에서의 다중 노드 전역 디렉토리 기반 색인 순차 검색 기법 (Indexed-Sequential Search Approach on Multi-Node Global Directory in Peer-to-Peer Systems)

  • 강인성;최성진;이화민;백맹순;황종선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (3)
    • /
    • pp.193-195
    • /
    • 2004
  • 저렴한 비용으로 기존의 클라이언트 서버 시스템을 대체할 수 있는 P2P 시스템에서 서로 공유하고자 하는 파일의 리스트를 얼마나 빠르고 효과적으로 검색하느냐는 시스템 성능을 좌우하는 중요한 항목 중 하나이다. 그러나 기존의 P2P 시스템에서의 검색 기법들은 목적 파일들에 대한 검색 시간의 단축과 키워드 검색이라는 두 가지 설계 목표 중 어느 한 쪽에만 치중하여 설계됨으로써 종합적인 검색 기능이 요구되는 실제 시스템에 적용되기에는 매우 불완전하다. 본 논문에서는 P2P 시스템에 참여하여 파일을 공유하고자 하는 노드들의 모든 공유파일 목록을 하나의 전역 디렉토리로 구성하고 이를 이진 값의 순서대로 저장함으로써 높은 검색 속도로 키워드 검색 기능을 제공하는 다중 노드 전역 디렉토리 기반 색인 순차 검색 기법을 제안한다. 제안된 기법은 높은 겅색 속도와 키워드 검색을 지원함으로써 P2P 시스템의 검색 속도 성능 개선과 사용자 편의성을 제공한다.

  • PDF

내용 기반 이미지 검색을 위한 효율적인 분산 고차원 색인 기법 (An Efficient Distributed High-Dimensional Index Structure for Contents-Based Image Retrieval)

  • 김민수;김기훈;송희섭;한진수;유승훈;안지환;박주영;복경수;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2017년도 춘계 종합학술대회 논문집
    • /
    • pp.43-44
    • /
    • 2017
  • 다양한 디지털 기기 활용의 증가로 인해 멀티미디어 데이터가 증가됨에 따라 내용 기반으로 검색하는 기술이 연구되고 있다. 내용 기반 검색을 위해 멀티미디어에서 추출된 고차원 특징 벡터가 대용량이 되면서 고차원 데이터를 분산해서 관리하는 색인 기법이 필요하다. 본 논문에서는 대용량 멀티미디어 데이터에서 유사한 이미지를 검출하기 위한 분산 고차원 색인 기법을 제안한다. 제안하는 기법은 마스터/슬레이브 구조로 되어 있다. 마스터 서버의 색인 구조는 그리드 방식을 사용하여 검색 요청 시 탐색하는 노드를 감소시킨다. 슬레이브 서버의 색인 구조는 구 형태로 색인하여 범위 질의와 최근접 질의를 효율적으로 검색한다.

  • PDF

역파일에 기반한 웹 검색 엔진의 랭킹 시스템 구현 (Implementation of a Ranking System for the Web Search Engine based on Inverted Files)

  • 임성채;안준선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.35-40
    • /
    • 2007
  • 역파일을 사용한 색인 기법은 정보 검색 분야에서 널리 사용되었으며, 최근 대용량 검색 시스템으로 사용되고 있는 웹 검색 엔진에서도 적응되고 있다. 본 논문에서는 웹 검색 엔진의 특성에 완친 구현된 역파일 기법 기반의 웹 문서 색인 파일의 구조와 디스크에 저장된 대용량의 역파일 색인을 기반으로 웹 페이지의 검색 적합도를 계산하는 랭킹 시스템을 설명한다. 이를 통하여 상용 웹 검색 엔진의 랭킹 시스템과 디스크 자원 사용의 최소화 기법을 제시한다.

  • PDF

디지털 미디어 검색 시스템 및 응용

  • 유성준
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1998년도 국제 컨퍼런스: 국가경쟁력 향상을 위한 디지틀도서관 구축방안
    • /
    • pp.115-138
    • /
    • 1998
  • $\square$ 입력 및 색인 방법의 용이성 및 효율성 $\square$ 대상 미디어 타입 $\square$ 웹 데이터의 색인 및 검색 기능 $\square$ DBMS와의 결합성 $\square$ Total Solution에의 근접성 $\square$ 검색 방법의 종류 $\square$ 현재 시장 점유율 $\square$ 가격(중략)

  • PDF