• 제목/요약/키워드: Text Image Retrieval

검색결과 80건 처리시간 0.024초

지능형 화상 검색 시스템에서의 사용자 모델을 이용한 사용자 적응 (User Adaptation Using User Model in Intelligent Image Retrieval System)

  • 김용환;이필규
    • 한국정보처리학회논문지
    • /
    • 제6권12호
    • /
    • pp.3559-3568
    • /
    • 1999
  • 수많은 정보의 홍수 속에 정보 과다는 현대인의 피할 수 없는 문제로 대두되었다. 특히, 인터넷과 컴퓨팅 기술의 발전으로 정보 자원이 급속도로 증가하고 있다. 따라서, 사용자가 원하는 정보를 찾아내는 것은 더욱 어려워졌다. 이러한 정보 검색 문제들을 해결하기 위하여 많은 정보 검색 시스템이 나타나게 되었다. 현재의 정보 검색 시스템들은 문서 검색에서는 사용자의 요구에 맞는 결과를 찾아 주고 있다. 그러나. 화상에 대한 검색 시스템의 연구는 초보 단계이기 때문에 사용자의 요구에 맞는 결과를 출력하지 못하고 있다. 이러한 문제를 해결하기 위해서 본 논문에서는 화상 검색 시스템이 사용자 모델을 이용하여 사용자에게 적응할 수 있는 기능을 부여하기 위하여 지능 사용자 인터페이스에 관한 고찰을 통한 인간-컴퓨터의 상호 작용 모델인 HCOS(Human-Computer Symmetry) 모델을 적용하고 이를 기반으로 화상 검색 시스템에서의 사용자 적응 능력을 갖는 지능 사용자 인터페이스를 제안하였다. 지능 사용자 인터페이스는 정보 검색의 복잡성과 사용자와 시스템간의 의미상의 차이를 감소시켜야 하며 사용자의 질의 성향과 관심을 반영할 수 있도록 학습 기능과 적응 기능을 포함하고 있어야 한다. 이를 위해 본 논문에서는 화상 검색을 위한 사용자 모델에 기계 학습(Machine Learning) 알고리듬인 결정 트리(Decision Tree)와 역전파 신경망(Backpropagation Neural Network)을 사용하였다. 지능 사용자 인터페이스의 화상 검색 실험을 통하여 시스템이 사용자에 적응하여 검색 효율이 좋아짐을 알 수 있었다.

  • PDF

위성영상 검색에서 사용자 관심영역을 이용한 적합성 피드백 (Relevance Feedback using Region-of-interest in Retrieval of Satellite Images)

  • 김성진;정진완;이석룡;김덕환
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권6호
    • /
    • pp.434-445
    • /
    • 2009
  • 내용 기반 영상 검색(content based image retrieval)은 영상 자체의 정보를 이용하여 유사 영상을 검색하는 기법이다. 하지만 멀티미디어 데이터는 텍스트 데이터와 달리 얻을 수 있는 데이터가 정확하지 않고 또한 시스템에서 표현되는 데이터의 저차원(low-level)의 표현법과 사용자가 인식하는 고차원(high-level)의 개념(concept)은 상당한 차이를 나타내게 된다. 즉 시스템 상에서 벡터들로 표현된 영상 데이터들이 벡터스페이스 상에서는 가깝지만 실제 사용자는 유사하지 않다고 인식하는 문제점이 발생한다. 이를 의미적 간극(semantic-gap) 문제라고 부른다. 이런 의미적 간극 문제로 인해 영상검색 결과는 좋지 않은 성능을 보이게 된다. 이를 해결하기 위해 사용자의 피드백 정보를 이용하여 질의를 수정하는 적합성 피드백 기법이 널리 사용되고 있다. 하지만 기존의 적합성 피드백은 사용자의 관심영역(region-of-interest, 이하 ROI)를 고려하지 않아 적합한(relevant) 영역의 모든 영역들이 새로운 질의 점을 계산하는 과정에서 사용된다. 시스템은 그 스스로 사용자 관심영역을 알지 못하기 때문에 적합성 피드백을 영상수준(image-level)으로 진행하기 때문이다. 이 논문에서는 복잡한 위성영상 영역 검색에서 관심영역을 사용자가 직접 선택하도록 유도하여 더욱 정확한 질의 점을 계산하여 정확도를 높이는 사용자 관심영역 적합성 피드백 방법을 제시한다. 또한 사용자가 선택하지 않은 부정확한 영상 정보를 이용하여 정확도를 향상시키는 프루닝 기법도 함께 제시한다. 실험을 통하여 사용자 관심영역 적합성 피드백의 우수성과 함께 제안한 프루닝 기법의 효율성도 함께 보여준다.

효과적인 도서목록 검색을 위한 개선된 OCR알고리즘에 관한 연구 (Improvement OCR Algorithm for Efficient Book Catalog RetrievalTechnology)

  • 하문;백영현;문성룡
    • 전자공학회논문지CI
    • /
    • 제47권1호
    • /
    • pp.152-159
    • /
    • 2010
  • 본 논문에서는 기울어진 문자, 다양한 크기, 글씨체, 흐린 문자를 포함한 입력영상의 문자 복원과 인식, 효율적인 도서 검색을 위한 광학문자인식 알고리즘을 제안한다. 본 논문에서 제안한 광학문자 인식알고리즘은 검출부와 인식부로 구성되며, 검출부에서는 복잡한 배경에서 정확한 도서 영역 검출을 위하여 로버츠 에지 연산자와 허도로프 거리 알고리즘을 적용하여 필요한 영역을 검출하였다. 또한 인식부에서는 문자의 크기와 경사도, 부분 손실 등의 영상에 강인성을 갖는 바이큐빅 보간법을 적용하여 데이터 손실 복원과, 반자동 기울기를 갖는 입력 영상의 보정을 하였다. 모의실험 결과 기존 알고리즘 보다 인식률에서는 6%, 검색시간에서는 1.077초 더 우수함을 확인하였다.

키워드탐색과 비주얼 브라우징 기법을 이용한 이미지 개발 시스템 (An Image Retrieval System with Multiple Access Modes)

  • 이지연
    • 정보관리학회지
    • /
    • 제18권4호
    • /
    • pp.183-200
    • /
    • 2001
  • 기존의 전통적인 이미지 데이터로의 접근방식은 각 이미지를 기술하는 색인어 및 키워드들에 의하여 이루어졌다. 이러한 키워드에 의한 전통적인 방식은 색인의 객관성 및 이용자들의 적절한 탐색어 선택에 따르는 부담을 수반하는 것이어서 이미지 검색의 문제점으로 제시되어 왔다. 이 연구는 객관성 있는 이미지 기술의 어려움과 키워드 탐색의 한계성을 인식하고 색인어와 매칭되는 탐색어 선택에 따르는 이용자의 부담을 덜 수 있는 방법의 하나로 비주얼 브라우징 기법을 제시하였다. 키워드 탐색 방법과 비주얼 브라우징 방법, 그리고 이 두 가지를 혼합 사용하는 방법을 비교하는 실험을 통하여 각 방법의 효율성을 측정하고 장점 및 단점을 살펴보았다. 실험 결과 키워드 탐색 방식은 탐색의 효율적인 측면을 고려할 때에 적합한 것으로 나타났으며 비주얼 브라우징 방식은 탐색 결과의 포괄적인 측면을 기대할 때에 이용될 수 있는 것으로 드러났다. 이러한 결과는 한 방식이 다른 방식보다 절대 우위의 효율성을 가진다기보다는 이용자가 요구하는 정보의 양과 정확성에 따라 각 방식의 효율성이 달라진다는 것을 제시하고 있다. 이 연구는 비주얼 브라우징 방식을 통하여 현재의 키워드 중심의 이미지 탐색 방식의 문제점을 완화시키고 이용자 중심의 탐색 방식과 이미지 검색 시스템의 디자인을 위한 방향을 제시하고 있다.

  • PDF

예제 이미지와 사용자 스케치 질의에 의한 웹 기반 이미지 검색 시스템 (Web based Image Retrieval system using User Sketch and Example Image Queries)

  • 황병곤
    • 한국산업정보학회논문지
    • /
    • 제9권4호
    • /
    • pp.26-31
    • /
    • 2004
  • 최근에 웹의 폭발적 사용의 증가에 따라, WWW에서 많은 정보를 좀 더 손쉽게 획득할 수 있다. 본 논문에서 H에서 웹 에이전트를 사용하여 이미지를 검색하는 일반적인 내용기반 이미지 검색 시스템을 제안한다. 웹 에이전트는 웹 상에서 HTML문서에 나타나는 텍스트 중 이미지 이름이나 링크에 붙어 있는 이미지를 의미하는 텍스트를 추출한다. 제안된 시스템은 웹 브라우저에서 사용자의 스케치와 예제 이미지 질의를 이용하여 데이터베이스에 있는 이미지를 검색하는 방법을 제시하여 실험결과를 통해서 질의 효율성을 나타내었다.

  • PDF

이미지 화일과 텍스트 화일의 검색효율성 비교 (A Comparison of Retrieval Effectiveness between Image File and Text File)

  • 임영선;이두영
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1996년도 제3회 학술대회 논문집
    • /
    • pp.15-18
    • /
    • 1996
  • 본 논문은 본문 전체가 기계가독형 화일로 구성된 텍스트 전문데이터베이스와 이미지화일로 구성된 이미지 전문데이터베이스와의 검색효율성을 비교함으로써 도서관과 최종이용자의 입장에서 바람직한 전문데이터베이스가 어떤 것인지를 제안하고자 한다.

  • PDF

삼성 전자의 Smart DLS 국내구축 사례

  • 고홍승
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1998년도 국제 컨퍼런스: 국가경쟁력 향상을 위한 디지틀도서관 구축방안
    • /
    • pp.279-292
    • /
    • 1998
  • 4. 특징 및 도입효과 4-1. 구축시스템 특징 $.$다양한 입력자료에 대한 원문 검색 - Image, Video, 탁본, WP 등 ㆍ국내 최초로 개발된 OTRS(OCR-generated Text Retrieval System)시스템 -자료 속의 핵심어 위치를 이미지 상에서 확인 ㆍVR 시스템을 통한 WEB Service $.$ IR 시스템을 통한 색인어 검색 및 조건에 의한 검색(중략)

  • PDF

탐색과 브라우징을 지원하는 하이퍼미디어 시스템의 설계 (Design of a hypermedia system for effective searching and browsing)

  • 고영곤;최윤철
    • 정보관리학회지
    • /
    • 제10권1호
    • /
    • pp.15-30
    • /
    • 1993
  • 하이퍼미디어 시스템은 멀티미디어 정보간의 연상적 관게를 링크, 노드개념에 입각하여 지원함으로써 기존의 데이타베이스 시스템이나 텍스트 검색 시스템의 한계성을 극복해 준다. 본 연구는 텍스트, 그래픽, 영상, 목소리/사운드 등의 멀티미디어 정보를 지원해 주는 하이퍼미디어 시스템을 설계, 구현하였고 시스템의 기능을 보여주기 위하여 성경과 성경 관련 정보에 적용하여 응용시스템을 구축하였다. 특히 본 시스템에서는 탐색과 브라우징 기능을 효율적으로 통합함으로써 하이퍼미디어 시스템의 정보검색 기능과 사용자 인터페이스를 높이도록 설계하였다. 국립중앙도서관에 제안한 고서용 MARC 포멧과 기술규칙을 기초로 그 특징적인 것을 요약 정리한 것이다.

  • PDF

내용기반의 인쇄체 영문 문서 영상 검색을 위한 특징 기반 단어 검색 (A Feature -Based Word Spotting for Content-Based Retrieval of Machine-Printed English Document Images)

  • 정규식;권희웅
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권10호
    • /
    • pp.1204-1218
    • /
    • 1999
  • 문서영상 검색을 위한 디지털도서관의 대부분은 논문제목과/또는 논문요약으로부터 만들어진 색인에 근거한 제한적인 검색기능을 제공하고 있다. 본 논문에서는 영문 문서영상전체에 대한 검색을 위한 단어 영상 형태 특징기반의 단어검색시스템을 제안한다. 본 논문에서는 검색의 효율성과 정확도를 높이기 위해 1) 기존의 단어검색시스템에서 사용된 특징들을 조합하여 사용하며, 2) 특징의 개수 및 위치뿐만 아니라 특징들의 순서를 포함하여 매칭하는 방법을 사용하며, 3) 특징비교에 의해 검색결과를 얻은 후에 여과목적으로 문자인식을 부분적으로 적용하는 2단계의 검색방법을 사용한다. 제안된 시스템의 동작은 다음과 같다. 문서 영상이 주어지면, 문서 영상 구조가 분석되고 단어 영역들의 조합으로 분할된다. 단어 영상의 특징들이 추출되어 저장된다. 사용자의 텍스트 질의가 주어지면 이에 대응되는 단어 영상이 만들어지며 이로부터 영상특징이 추출된다. 이 참조 특징과 저장된 특징들과 비교하여 유사한 단어를 검색하게 된다. 제안된 시스템은 IBM-PC를 이용한 웹 환경에서 구축되었으며, 영문 문서영상을 이용하여 실험이 수행되었다. 실험결과는 본 논문에서 제안하는 방법들의 유효성을 보여주고 있다. Abstract Most existing digital libraries for document image retrieval provide a limited retrieval service due to their indexing from document titles and/or the content of document abstracts. This paper proposes a word spotting system for full English document image retrieval based on word image shape features. In order to improve not only the efficiency but also the precision of a retrieval system, we develop the system by 1) using a combination of the holistic features which have been used in the existing word spotting systems, 2) performing image matching by comparing the order of features in a word in addition to the number of features and their positions, and 3) adopting 2 stage retrieval strategies by obtaining retrieval results by image feature matching and applying OCR(Optical Charater Recognition) partly to the results for filtering purpose. The proposed system operates as follows: given a document image, its structure is analyzed and is segmented into a set of word regions. Then, word shape features are extracted and stored. Given a user's query with text, features are extracted after its corresponding word image is generated. This reference model is compared with the stored features to find out similar words. The proposed system is implemented with IBM-PC in a web environment and its experiments are performed with English document images. Experimental results show the effectiveness of the proposed methods.

An Image Retrieving Scheme Using Salient Features and Annotation Watermarking

  • Wang, Jenq-Haur;Liu, Chuan-Ming;Syu, Jhih-Siang;Chen, Yen-Lin
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제8권1호
    • /
    • pp.213-231
    • /
    • 2014
  • Existing image search systems allow users to search images by keywords, or by example images through content-based image retrieval (CBIR). On the other hand, users might learn more relevant textual information about an image from its text captions or surrounding contexts within documents or Web pages. Without such contexts, it's difficult to extract semantic description directly from the image content. In this paper, we propose an annotation watermarking system for users to embed text descriptions, and retrieve more relevant textual information from similar images. First, tags associated with an image are converted by two-dimensional code and embedded into the image by discrete wavelet transform (DWT). Next, for images without annotations, similar images can be obtained by CBIR techniques and embedded annotations can be extracted. Specifically, we use global features such as color ratios and dominant sub-image colors for preliminary filtering. Then, local features such as Scale-Invariant Feature Transform (SIFT) descriptors are extracted for similarity matching. This design can achieve good effectiveness with reasonable processing time in practical systems. Our experimental results showed good accuracy in retrieving similar images and extracting relevant tags from similar images.