• 제목/요약/키워드: Image Retrieval Query

검색결과 211건 처리시간 0.029초

위성영상 검색에서 사용자 관심영역을 이용한 적합성 피드백 (Relevance Feedback using Region-of-interest in Retrieval of Satellite Images)

  • 김성진;정진완;이석룡;김덕환
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권6호
    • /
    • pp.434-445
    • /
    • 2009
  • 내용 기반 영상 검색(content based image retrieval)은 영상 자체의 정보를 이용하여 유사 영상을 검색하는 기법이다. 하지만 멀티미디어 데이터는 텍스트 데이터와 달리 얻을 수 있는 데이터가 정확하지 않고 또한 시스템에서 표현되는 데이터의 저차원(low-level)의 표현법과 사용자가 인식하는 고차원(high-level)의 개념(concept)은 상당한 차이를 나타내게 된다. 즉 시스템 상에서 벡터들로 표현된 영상 데이터들이 벡터스페이스 상에서는 가깝지만 실제 사용자는 유사하지 않다고 인식하는 문제점이 발생한다. 이를 의미적 간극(semantic-gap) 문제라고 부른다. 이런 의미적 간극 문제로 인해 영상검색 결과는 좋지 않은 성능을 보이게 된다. 이를 해결하기 위해 사용자의 피드백 정보를 이용하여 질의를 수정하는 적합성 피드백 기법이 널리 사용되고 있다. 하지만 기존의 적합성 피드백은 사용자의 관심영역(region-of-interest, 이하 ROI)를 고려하지 않아 적합한(relevant) 영역의 모든 영역들이 새로운 질의 점을 계산하는 과정에서 사용된다. 시스템은 그 스스로 사용자 관심영역을 알지 못하기 때문에 적합성 피드백을 영상수준(image-level)으로 진행하기 때문이다. 이 논문에서는 복잡한 위성영상 영역 검색에서 관심영역을 사용자가 직접 선택하도록 유도하여 더욱 정확한 질의 점을 계산하여 정확도를 높이는 사용자 관심영역 적합성 피드백 방법을 제시한다. 또한 사용자가 선택하지 않은 부정확한 영상 정보를 이용하여 정확도를 향상시키는 프루닝 기법도 함께 제시한다. 실험을 통하여 사용자 관심영역 적합성 피드백의 우수성과 함께 제안한 프루닝 기법의 효율성도 함께 보여준다.

Content-Based Image Retrieval of Chest CT with Convolutional Neural Network for Diffuse Interstitial Lung Disease: Performance Assessment in Three Major Idiopathic Interstitial Pneumonias

  • Hye Jeon Hwang;Joon Beom Seo;Sang Min Lee;Eun Young Kim;Beomhee Park;Hyun-Jin Bae;Namkug Kim
    • Korean Journal of Radiology
    • /
    • 제22권2호
    • /
    • pp.281-290
    • /
    • 2021
  • Objective: To assess the performance of content-based image retrieval (CBIR) of chest CT for diffuse interstitial lung disease (DILD). Materials and Methods: The database was comprised by 246 pairs of chest CTs (initial and follow-up CTs within two years) from 246 patients with usual interstitial pneumonia (UIP, n = 100), nonspecific interstitial pneumonia (NSIP, n = 101), and cryptogenic organic pneumonia (COP, n = 45). Sixty cases (30-UIP, 20-NSIP, and 10-COP) were selected as the queries. The CBIR retrieved five similar CTs as a query from the database by comparing six image patterns (honeycombing, reticular opacity, emphysema, ground-glass opacity, consolidation and normal lung) of DILD, which were automatically quantified and classified by a convolutional neural network. We assessed the rates of retrieving the same pairs of query CTs, and the number of CTs with the same disease class as query CTs in top 1-5 retrievals. Chest radiologists evaluated the similarity between retrieved CTs and queries using a 5-scale grading system (5-almost identical; 4-same disease; 3-likelihood of same disease is half; 2-likely different; and 1-different disease). Results: The rate of retrieving the same pairs of query CTs in top 1 retrieval was 61.7% (37/60) and in top 1-5 retrievals was 81.7% (49/60). The CBIR retrieved the same pairs of query CTs more in UIP compared to NSIP and COP (p = 0.008 and 0.002). On average, it retrieved 4.17 of five similar CTs from the same disease class. Radiologists rated 71.3% to 73.0% of the retrieved CTs with a similarity score of 4 or 5. Conclusion: The proposed CBIR system showed good performance for retrieving chest CTs showing similar patterns for DILD.

새로운 이미지 거리를 통한 이미지 검색 방안 연구 (Study of the New Distance for Image Retrieval)

  • 이성임;임요한;조영민
    • 대한산업공학회지
    • /
    • 제40권4호
    • /
    • pp.382-387
    • /
    • 2014
  • Image retrieval is a procedure to find images based on the resemblance between query image and all images. In retrieving images, the crucial step that arises is how to define the similarity between images. In this paper, we propose a new similarity measure which is based on distribution of color. We apply the new measure to retrieving two different types of images, wallpaper images and the logo of automobiles, and compare its performance to other existing similarity measures.

시계열 스트리트뷰 데이터베이스를 이용한 시각적 위치 인식 알고리즘 (Visual Location Recognition Using Time-Series Streetview Database)

  • 박천수;최준연
    • 반도체디스플레이기술학회지
    • /
    • 제18권4호
    • /
    • pp.57-61
    • /
    • 2019
  • Nowadays, portable digital cameras such as smart phone cameras are being popularly used for entertainment and visual information recording. Given a database of geo-tagged images, a visual location recognition system can determine the place depicted in a query photo. One of the most common visual location recognition approaches is the bag-of-words method where local image features are clustered into visual words. In this paper, we propose a new bag-of-words-based visual location recognition algorithm using time-series streetview database. The proposed algorithm selects only a small subset of image features which will be used in image retrieval process. By reducing the number of features to be used, the proposed algorithm can reduce the memory requirement of the image database and accelerate the retrieval process.

A New Three-dimensional Integrated Multi-index Method for CBIR System

  • Zhang, Mingzhu
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권3호
    • /
    • pp.993-1014
    • /
    • 2021
  • This paper proposes a new image retrieval method called the 3D integrated multi-index to fuse SIFT (Scale Invariant Feature Transform) visual words with other features at the indexing level. The advantage of the 3D integrated multi-index is that it can produce finer subdivisions in the search space. Compared with the inverted indices of medium-sized codebook, the proposed method increases time slightly in preprocessing and querying. Particularly, the SIFT, contour and colour features are fused into the integrated multi-index, and the joint cooperation of complementary features significantly reduces the impact of false positive matches, so that effective image retrieval can be achieved. Extensive experiments on five benchmark datasets show that the 3D integrated multi-index significantly improves the retrieval accuracy. While compared with other methods, it requires an acceptable memory usage and query time. Importantly, we show that the 3D integrated multi-index is well complementary to many prior techniques, which make our method compared favorably with the state-of-the-arts.

문맥을 고려한 예제 기반 동영상 검색 알고리즘 (Content Based Video Retrieval by Example Considering Context)

  • 박주현;낭종호;김경수;하명환;정병희
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제30권12호
    • /
    • pp.756-771
    • /
    • 2003
  • 효율적인 동영상 검색 방법은 많은 양의 동영상 데이터를 관리하는 디지털 비디오 라이브러리 시스템에서 필수적으로 요구되는 기능이다. 본 논문에서는 샷 단위 동영상을 문맥, 전경, 배경, 오디오로 나누어 비교하여 질의 동영상과 비슷한 동영상을 찾아내는 예제 기반 동영상 검색 알고리즘을 제안하였고, 제안한 알고리즘에 따라서 저작 및 검색도구를 구현하였다. 샷간의 관계 정보 즉, 문맥을 고려한다는 것은 인접한 샷들 간의 오디오, 움직임 정보들과 같은 저급 수준 내용 정보 간에 변화 패턴을 비교한다는 것이다. 두 번째 비교 요소인 전경은 움직이는 객체들의 집합을 의미하고, 세 번째 비교 요소인 배경은 전경을 제외한 나머지 비디오 정보를 의미한다. 이러한 비교 방법은 동영상 제작 과정에 근거한 것으로써 사용자로 하여금 직관적인 비교를 할 수 있게 한다. 또한 질의 신을 직접 구성할 수 있게 하였고, 각각의 비교요소에 가중치를 부여할 수 있도록 하여서 사용자의 검색의도를 자유롭게 반영할 수 있도록 하였다. 본 논문에서는 동영상이 가지고 있는 의미 정보를 검색에 완전히 반영하지는 못하지만, 문맥을 통해서 부분적인 의미 정보를 사용할 수 있도록 하였으며, 질의 신 구성과 직관적인 비교 요소를 사용함으로써 사용자의 검색 의도를 최대한 반영하고자 하였다.

고유영상 투영거리를 이용한 얼굴영상 검색 (Face Image Retrieval by Using Eigenface Projection Distance)

  • 임길택
    • 한국산업정보학회논문지
    • /
    • 제14권5호
    • /
    • pp.43-51
    • /
    • 2009
  • 본 논문에서는 PCA(principal component analysis)기반의 특징을 이용한 효율적인 얼굴검색 방법을 제안한다. coarse-to-fine 전략을 사용하여 저차원 고유얼굴 공간에서 검색 결과들을 1차 정렬한 후 상위 후보들을 확장된 차원의 고유얼굴 공간에서 재정렬하는 방식으로 검색 순위를 재조정한다. 질의 영상과 클래스간의 유사도의 측정을 위해 PD(projection distance), MQDF(modified quadratic distance function), MED(minimum Euclidean distance)를 사용한다. 실험 결과 $32{\times}32$ 크기의 질의 영상에 PD를 활용하여 점진적으로 검색 결과를 조정하는 제안하는 방법이 얼굴검색에 효율적임을 알 수 있었다.

Content-based Video Information Retrieval and Streaming System using Viewpoint Invariant Regions

  • 박종안
    • 한국정보전자통신기술학회논문지
    • /
    • 제2권1호
    • /
    • pp.43-50
    • /
    • 2009
  • This paper caters the need of acquiring the principal objects, characters, and scenes from a video in order to entertain the image based query. The movie frames are divided into frames with 2D representative images called "key frames". Various regions in a key frame are marked as key objects according to their textures and shapes. These key objects serve as a catalogue of regions to be searched and matched from rest of the movie, using viewpoint invariant regions calculation, providing the location, size, and orientation of all the objects occurring in the movie in the form of a set of structures collaborating as video profile. The profile provides information about occurrences of every single key object from every frame of the movie it exists in. This information can further ease streaming of objects over various network-based viewing qualities. Hence, the method provides an effective reduced profiling approach of automatic logging and viewing information through query by example (QBE) procedure, and deals with video streaming issues at the same time.

  • PDF

PCA를 이용한 데이터베이스 검색에 있어서의 최적 MPEG-7 디스크립터 조합에 관한 연구 (A study of optimal MPEG-7 descriptor composite in database searching using PCA)

  • 김현민;최윤식
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 신호처리소사이어티 추계학술대회 논문집
    • /
    • pp.437-440
    • /
    • 2003
  • When we search database with a query image, the retrieval efficiency will vary from each kind of descriptor. Even the best representative descriptor, it results a few useless images that don't match with query image. This type of error can be reduced by adopting another descriptor which extracts features in different way. At present, the choice of descriptors is base on intuitive and experimental method. By theoretic accessing to the problem of descriptor choice, we can solve the given problem in the objective and rational way. In this study, we intend to make a composite of descriptors that can reduce retrieval error by adopting principal component analysis.

  • PDF

효과적인 3차원 객체 인식 및 자세 추정을 위한 외형 및 SIFT 특징 정보 결합 기법 (Combining Shape and SIFT Features for 3-D Object Detection and Pose Estimation)

  • 탁윤식;황인준
    • 전기학회논문지
    • /
    • 제59권2호
    • /
    • pp.429-435
    • /
    • 2010
  • Three dimensional (3-D) object detection and pose estimation from a single view query image has been an important issue in various fields such as medical applications, robot vision, and manufacturing automation. However, most of the existing methods are not appropriate in a real time environment since object detection and pose estimation requires extensive information and computation. In this paper, we present a fast 3-D object detection and pose estimation scheme based on surrounding camera view-changed images of objects. Our scheme has two parts. First, we detect images similar to the query image from the database based on the shape feature, and calculate candidate poses. Second, we perform accurate pose estimation for the candidate poses using the scale invariant feature transform (SIFT) method. We earned out extensive experiments on our prototype system and achieved excellent performance, and we report some of the results.