• 제목/요약/키워드: content- based retrieval

검색결과 717건 처리시간 0.023초

Automatic In-Text Keyword Tagging based on Information Retrieval

  • Kim, Jin-Suk;Jin, Du-Seok;Kim, Kwang-Young;Choe, Ho-Seop
    • Journal of Information Processing Systems
    • /
    • 제5권3호
    • /
    • pp.159-166
    • /
    • 2009
  • As shown in Wikipedia, tagging or cross-linking through major keywords in a document collection improves not only the readability of documents but also responsive and adaptive navigation among related documents. In recent years, the Semantic Web has increased the importance of social tagging as a key feature of the Web 2.0 and, as its crucial phenotype, Tag Cloud has emerged to the public. In this paper we provide an efficient method of automated in-text keyword tagging based on large-scale controlled term collection or keyword dictionary, where the computational complexity of O(mN) - if a pattern matching algorithm is used - can be reduced to O(mlogN) - if an Information Retrieval technique is adopted - while m is the length of target document and N is the total number of candidate terms to be tagged. The result shows that automatic in-text tagging with keywords filtered by Information Retrieval speeds up to about 6 $\sim$ 40 times compared with the fastest pattern matching algorithm.

효율적 구조 질의를 지원하는 바다-IV/XML 질의처리기의 설계 및 구현 (Design and Implementation of BADA-IV/XML Query Processor Supporting Efficient Structure Querying)

  • 이명철;김상균;손덕주;김명준;이규철
    • 정보기술과데이타베이스저널
    • /
    • 제7권2호
    • /
    • pp.17-32
    • /
    • 2000
  • As XML emerging as the Internet electronic document language standard of the next generation, the number of XML documents which contain vast amount of Information is increasing substantially through the transformation of existing documents to XML documents or the appearance of new XML documents. Consequently, XML document retrieval system becomes extremely essential for searching through a large quantity of XML documents that are storied in and managed by DBMS. In this paper we describe the design and implementation of BADA-IV/XML query processor that supports content-based, structure-based and attribute-based retrieval. We design XML query language based upon XQL (XML Query Language) of W3C and tightly-coupled with OQL (a query language for object-oriented database). XML document is stored and maintained in BADA-IV, which is an object-oriented database management system developed by ETRI (Electronics and Telecommunications Research Institute) The storage data model is based on DOM (Document Object Model), therefore the retrieval of XML documents is executed basically using DOM tree traversal. We improve the search performance using Node ID which represents node's hierarchy information in an XML document. Assuming that DOW tree is a complete k-ary tree, we show that Node ID technique is superior to DOM tree traversal from the viewpoint of node fetch counts.

  • PDF

물체 분할 기법을 이용한 내용기반 영상 검색 (A Content-Based Image Retrieval using Object Segmentation Method)

  • 송석진;차봉현;김명호;남기곤;이상욱;주재흠
    • 융합신호처리학회논문지
    • /
    • 제4권1호
    • /
    • pp.1-8
    • /
    • 2003
  • 현재 사회전반에 걸쳐 급격히 증가하고 있는 멀티미디어 정보를 효율적으로 관리, 활용할 수 있는 방법이 다양하게 연구되고 있다. 본 논문에서는 정지영상 검색을 위해 사용자가 질의(query)를 요구하면 질의 물체를 배경으로부터 분할한 후 유사물체를 영상 데이터베이스 내에서 검색할 수 있는 내용기반 영상검색 시스템을 구현하였다. 질의영상이 들어오면 우선 메디안 필터링 처리를 하여 잡음 제거한 후 캐니 에지 탐지법으로 물체의 에지를 구한다. 그리고 볼록 다각형 기법을 이용하여 배경으로부터 질의물체를 분할한다. 분할된 영상으로부터 컬러 히스토그램을 구한 후 데이터 베이스내의 영상과 히스토그램 인터섹션을 하여 유사치를 구한다 또한 공간적 그레이 분포와 질감특성을 추출하기 위해 분할된 영상을 그레이 영상으로도 변환시켜 웨블릿 변환한 후 밴디드 오토코릴로그램과 에너지를 구해 유사치를 구한다. 이렇게 구한 유사치을 더해 최종 유사영상을 검색하는데 물체 분할기법을 사용함으로써 배경에 강인할 뿐 아니라 보다 정확한 물체 검색이 가능하였다.

  • PDF

내용기반 회전불변 상표검색 (Content-based Rotation Invariant Retrieval of Trademarks)

  • 박진근;조상현;최흥문
    • 전자공학회논문지CI
    • /
    • 제39권1호
    • /
    • pp.60-66
    • /
    • 2002
  • 본 논문에서는 불변 모멘트와 주대칭축 기준 에지 방향 히스토그램을 이용한 내용 기반 회전 불변 상표검색 방법을 제안하였다. 기존의 상표 검색 시스템에서는 사용 영상이 회전되면 그 특징 벡터값이 변화하기 때문에 회전 불변 검색이 어려웠다. 제안한 방법에서는 회전 불변 특징 벡터를 얻기 위해서 기존의 불변 모멘트에 회전으로 인한 히스토그램의 이동문제를 해결하기 위한 주대칭축 기준 에지 방향 히스토그램을 추가하였다. 기존에 회전으로 인한 검색이 어려웠던 20종류의 상표를 포함하여 300가지의 상표를 갖는 데이터베이스에 대하여 실험한 결과 회전된 상표를 포함해도 기존의 방법보다 더 효과적으로 검색할 수 있음을 확인하였다.

내용기반 영상 검색을 위한 특징 추출 및 영상 데이터베이스 검색 시스템 구현 (Feature Extraction for Content-based Image Retrievaland Implementation of Image Database Retrieval System)

  • 김진아;이승훈;우용태;정성환
    • 한국정보처리학회논문지
    • /
    • 제5권8호
    • /
    • pp.1951-1959
    • /
    • 1998
  • 본 논문에서는 내용기반 접근 방법에 의한 보다 효율적인 특징 추출 및 이를 이용한 영상 검색 시스템을 Oracle 데이터베이스상에서 구현하였다. 먼저, 다양한 입력 영상에 대하여 기존 Stricker 방법을 수정하여 영상의 칼라 특징을 추출하고, 추출된 칼라 특징과 ART2 신경만을 이용하여 영상들을 개략 분류한다. 다음, wavelet 변환을 이용하여 변환 영역상에서 영상의 질감 특징을 추출하고, 이를 이용하여 전 단계에서 칼라 특징으로 개략 분류된 영상들의 최종적인 상세 분류를 수행한다. 연구된 특징 추출 방법들을 기반으로 하여, 관계형 데이터베이스상에서 확장된 SQL문을 사용하여 영상 검색 시스템을 구현하였다. 제안된 영상 검색 시스템은 Oracle DBMS상에서 구현되었고, 200개의 시험 영상으로 실험한 결과, Recall과 Precision에서 90%, 81%의 만족한 검색 효율을 보였다.

  • PDF

이기종 CBIR 시스템을 위한 FEMAL (FEMAL for Heterogeneous CBIR System)

  • 김현종;박영배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권9호
    • /
    • pp.853-867
    • /
    • 2005
  • 지금까지 많은 내용 기반 이미지 검색 방법들이 제안되고 있다. 이 시스템들은 각 시스템마다 다른 이미지 데이타를 이용하고, 다른 특징 추출방법에 따라 다른 특징 추출 데이타를 생성하므로, 각 시스템의 검색 성능을 비교 평가할 수가 없다 특히 웹상에서, 동일한 이미지 데이타를 서로 다른 사이트에 있는 내용 기반 이미지 검색 시스템에 적용하여 검색 성능을 비교 평가할 수 없는 문제점이 있다. 이와 같은 문제점을 해결하기 위해서, 각각의 특정한 검색시스템에서 생성된 특징 추출 데이타를 웹상의 다른 검색 시스템에서 인식할 수 있도록, XML 기반의 FEMAL을 제안한다. FEMAL을 이용한 실험에서, 특징 추출 데이타를 서로 통신하고 통합이 가능함을 보이고, 검색 성능의 비교 평가가 가능함을 보인다.

내용기반으로한 이미지 검색에서 이미지 객체들의 외형특징추출 (Feature Extraction of Shape of Image Objects in Content-based Image Retrieval)

  • 조준서
    • 정보처리학회논문지B
    • /
    • 제10B권7호
    • /
    • pp.823-828
    • /
    • 2003
  • 이 논문의 주요 목적은 내용을 기반으로 하는 이미지 검색에서 이미지 객체의 외형특징을 추출하는 방법을 제시하는 것이다. 대부분의 실질적인 객체들의 외형은 불규칙적이고, 이러한 객체를 수치화하기위한 일반적인 방법은 없다. 특히 전자 카타로그들은 상품들을 나타내는 많은 이미지를 포함하고 있다. 이 논문에서는 이미지 전체가 아닌 이미지내의 개별 객체들을 기반으로 특징을 추출하는 방법을 제시한다. 왜냐하면 제시된 방법은 한 이미지내에서 RLC lines을 사용하여 각 객체들의 외형을 기반으로하는 방법을 사용하기 때문이다. 실험결과는 일반적으로 가장 많이 사용하는 특징인 Texture와 비교를 했고 제시된 외형을 나타내는 변수들이 전자카타로그의 이미지 객체들을 뚜렷하게 나타냈고, 보다 정확하게 객체들을 분류하고 구별하였다.

3차원 그래픽 데이타베이스를 위한 시점기반의 방향관계 표현 기법 (Representation Method of Viewpoint-based Directional Relationship for 3-Dimensional Graphic Databases)

  • 황종하;백중환;황수찬
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권2호
    • /
    • pp.157-167
    • /
    • 2003
  • 객체 사이에 존재하는 공간관계는 3차원 그래픽 이미지에 대한 내용기반 검색시 가장 자주 사용되는 조건 중의 하나이다. 그러나 기존 대부분의 공간관계에 대한 연구는 2차원 이미지에서 시점이 고정된 절대적인 방향관계에 패한 연구가 주를 이루고 있다. 따라서 본 논문에서는 3차원 공간에서 관측자의 시점을 기준으로 객체 사이의 방향관계를 검색할 수 있는 시점기반 방향관계 표현 기법을 제시하고 이를 이용한 검색 기법에 대해서 기술한다. 본 논문에서는 3차원 방향관계의 표현을 위해 절대시점 기반의 2차원 공간관계 표현 기법인 2D 스트링을 확장한 3D 스트링 기법을 정의하였다. 또한 관측자를 기준으로 한 객체들 간의 상대적인 방향관계를 효율적으로 추출하기 위한 기법을 제시한다. 본 논문에서 제시한 기법은 3D 스트링으로 표현된 3차원 객체의 공간관계를 2차원+1차원으로 분리하여 처리하도록 함으로서 차원의 감소를 통한 시점기반 방향관계 검색 과정을 단순화할 수 있다는 장점을 갖는다.

내용 기반의 멀티미디어 데이터 연관규칙 마이닝에 대한 연구 (A Study on Data Association-Rules Mining of Content-Based Multimedia)

  • 김진옥;황대준
    • 정보처리학회논문지D
    • /
    • 제9D권1호
    • /
    • pp.57-64
    • /
    • 2002
  • 컴퓨터 처리기술과 저장기술 그리고 인터넷 등의 영향으로 멀티미디어 데이터의 양은 급속하게 증가하지만 체계적인 멀티미디어 데이터간의 연관규칙을 마이닝하는 연구는 초기 단계이다. 본 논문은 이미지 프로세싱 분야 및 내용기반 이미지 검색에 대한 기존 연구를 바탕으로 대형 영상 데이터 저장소에 저장된 이미지 데이터에서 재생성되는 항목간의 연관규칙을 찾으며 공간적 관계로 내용기반의 연관규칙을 마이닝하는 알고리즘을 제안한다. 제안된 연관규칙 탐색 알고리즘은 이미지의 색상, 질감, 모양 등 내용기반의 영상속성을 오브젝트 항목으로 하고 오브젝트가 이미지에서 재생성될 때를 이용하여 이미지간의 연관규칙을 찾고 오브젝트들이 이미지에서 차지하고 있는 공간적 위치관계를 통해 드러나지 않는 이미지간의 연관규칙을 마이닝한다. 본 논문의 재생성 항목을 고려한 연관규칙 알고리즘은 Apriori 알고리즘보다 빈번한 항목 집합을 찾아내는데 더 높은 성능을 갖는다는 것을 실험을 통하여 보여준다. 제안된 알고리즘은 동일한 정보원으로부터 받은 멀티미디어 데이터간의 연관성을 탐색하는데 특히 효과적이며 다양한 관련 응용분야에 적용할 수 있다.

Application of Speech Recognition with Closed Caption for Content-Based Video Segmentations

  • Son, Jong-Mok;Bae, Keun-Sung
    • 음성과학
    • /
    • 제12권1호
    • /
    • pp.135-142
    • /
    • 2005
  • An important aspect of video indexing is the ability to segment video into meaningful segments, i.e., content-based video segmentation. Since the audio signal in the sound track is synchronized with image sequences in the video program, a speech signal in the sound track can be used to segment video into meaningful segments. In this paper, we propose a new approach to content-based video segmentation. This approach uses closed caption to construct a recognition network for speech recognition. Accurate time information for video segmentation is then obtained from the speech recognition process. For the video segmentation experiment for TV news programs, we made 56 video summaries successfully from 57 TV news stories. It demonstrates that the proposed scheme is very promising for content-based video segmentation.

  • PDF