• 제목/요약/키워드: rotation-invariant

검색결과 256건 처리시간 0.021초

Shape Description and Retrieval Using Included-Angular Ternary Pattern

  • Xu, Guoqing;Xiao, Ke;Li, Chen
    • Journal of Information Processing Systems
    • /
    • 제15권4호
    • /
    • pp.737-747
    • /
    • 2019
  • Shape description is an important and fundamental issue in content-based image retrieval (CBIR), and a number of shape description methods have been reported in the literature. For shape description, both global information and local contour variations play important roles. In this paper a new included-angular ternary pattern (IATP) based shape descriptor is proposed for shape image retrieval. For each point on the shape contour, IATP is derived from its neighbor points, and IATP has good properties for shape description. IATP is intrinsically invariant to rotation, translation and scaling. To enhance the description capability, multiscale IATP histogram is presented to describe both local and global information of shape. Then multiscale IATP histogram is combined with included-angular histogram for efficient shape retrieval. In the matching stage, cosine distance is used to measure shape features' similarity. Image retrieval experiments are conducted on the standard MPEG-7 shape database and Swedish leaf database. And the shape image retrieval performance of the proposed method is compared with other shape descriptors using the standard evaluation method. The experimental results of shape retrieval indicate that the proposed method reaches higher precision at the same recall value compared with other description method.

3차 칼라 객체 관계에 의한 내용 기반 영상 검색 (Content-Based Image Retrieval using Third Order Color Object Relation)

  • 권희용;최재우;이인행;조동섭;황희융
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권1호
    • /
    • pp.62-73
    • /
    • 2000
  • 본 논문에서는 기존의 칼라 특성을 이용한 내용 기반 영상 검색 방법을 적용 영역별로 분류 할 수 있는 기준을 제시하고, 그 기준에 의해 영상 내 공간 정보를 충분하게 표현할 수 있어 이동 및 회전 확대/축소 변형에 강한 영상 검색 방법을 제안한다. 일반적으로 칼라 특성을 이용한 내용 기반 영상 검색은 영상 내 공간정보를 충분하게 표현하지 못하여 이동 및 회전, 확대/축소 변형에 약한 단점을 지니고 있다. 이에 기존 연구에서는 인위적으로 영상을 여러 개로 분할하는 방법 등으로 공간 정보를 표현하고자 하였지만 특징 벡터의 수가 급격히 늘어남에 따라 검색 효율이 저하된다는 단점을 가지고있다. 본 논문에서는 기존의 방법을 사용된 칼라 객체의 상호 관계에 따라 1차와 2차 관계에 의한 방법으로 분류하고, 이동, 회전 특히 크기 변화(축소,확대)에 탁월한 성능을 보이는 칼라 객체의 3차 관계를 이용한 방법을 제안한다. 제안된 방법은 주어진 영상으로부터 양자화된 24개의 버킷을 생성해서 각 버킷의 히스토그램의 크기 순서로 세 개 버킷을 선정하고 그들의 평균 칼라 위치를 계산해서 그들 간의 상호 각도를 추출하여 영상의 특징 벡터로 사용하였다. 실험 결과 기존 방법보다 특히 영상의 크기 변화에 대해 좋은 결과를 얻을수 있었으며, 계산량도 적어 효율적임을 보여 주었다.

  • PDF

SIFT 알고리즘을 이용한 혼합형 모바일 교육 시스템 (Mixed Mobile Education System using SIFT Algorithm)

  • 홍광진;정기철;한은정;양종열
    • 한국산업정보학회논문지
    • /
    • 제13권2호
    • /
    • pp.69-79
    • /
    • 2008
  • 무선 인터넷과 모바일 기기의 보급으로 언제 어디서나 원하는 정보를 얻을 수 있는 유비쿼터스 환경을 위한 인프라가 구축되면서 교육을 포함한 다양한 분야에서 오프라인과 온라인 컨텐츠를 동시에 이용함으로써 정보 전달의 효율성을 높일 수 있는 방법에 대한 연구가 활발하게 이루어지고 있다. 본 논문은 사용자에게 모바일 기기를 이용하여 오프라인과 온라인 컨텐츠를 함께 제공하여 교육의 효과를 높일 수 있는 혼합형 모바일 교육 시스템(Mixed Mobile Education System: MME)을 제안한다. 제안된 시스템은 기존의 연구와 달리 사용자에게 자연스러운 환경을 제공하기 위해서 부가적인 태그를 사용하지 않는다. 태그를 사용하는 시스템의 경우 새로운 데이터의 등록이 어렵고 유사한 내용의 오프라인 컨텐츠 사용이 불가능하기 때문이다. 본 논문에서 우리는 저화질의 카메라를 통해 입력받은 영상에서 잡음 색상 왜곡, 크기 및 기울기 변화에 영향을 적게 받는 특징점을 추출하고 오프라인 컨텐츠를 인식하기 위해 Scale Invariant Feature Transform(SIFT) 알고리즘을 사용하였다. 또한 클라이언트-서버 구조를 사용함으로써 모바일 장치의 제한적인 저장 능력 문제를 해결하고 데이터의 등록 및 수정이 용이하도록 하였다. 실험을 통해 기존의 흔합형 교육 시스템과의 성능을 비교하고 제안된 시스템의 장단점을 확인하였으며, 시스템을 실생활에 적용하였을 경우 다양한 상황에서도 사용자에게 만족할만한 성능을 제공함을 확인하였다.

  • PDF

기하학적 해석을 이용한 비전 기반의 장애물 검출 (Vision-based Obstacle Detection using Geometric Analysis)

  • 이종실;이응혁;김인영;김선일
    • 전자공학회논문지SC
    • /
    • 제43권3호
    • /
    • pp.8-15
    • /
    • 2006
  • 이동 로봇의 많은 응용분야에서 장애물을 검출하는 것은 중요한 요소이다. 스테레오 비전과 광류를 이용하여 장애물을 검출하는 방법은 복잡한 연산을 요구하므로 본 논문에서는 단지 두 장면의 영상만을 이용하여 비전 기반 장애물 검출 방법을 제시하고 단일 카메라와 주행거리계를 사용하여 실시간 처리가 가능하도록 하였다. 제안한 방법은 두 장면으로부터 3차원 복원을 수행함으로서 장애물을 검출하는 방법으로 먼저 두 장면의 입력영상 각각에 대하여 Lowe의 SIFT를 사용하여 특징점을 추출하고 이들 간의 대응점을 구한다. 그리고 주행거리계로부터 주어지는 회전과 병진행렬 값들과 삼각법을 이용하여 대응점들에 대한 3차원 위치를 구한다. 이렇게 삼각법에 의해 얻어진 결과는 장애물들에 대한 부분적인 3차원 복원을 의미한다. 제안한 방법은 실내에서 주행하는 이동 로봇에 적용하였을 때 좋은 결과를 얻을 수 있었으며, 75msec의 속도로 장애물을 검출할 수 있었다.

영상표현을 위한 비전 중심점 이동에 따른 영역기반 형태 기술자 (Region-based Shape Descriptor with Moving a Vision Center for Image Representation)

  • 김선종;김영인
    • 지능정보연구
    • /
    • 제12권1호
    • /
    • pp.95-105
    • /
    • 2006
  • 본 논문에서는 영상을 비전 중심점 이동에 따라 정밀하게 표현할 수 있는 형태 기술자를 제안하고, 이를 이용하여 영상이 표현되는 방법을 조사하였다. 제안된 기술자는 영역의 중심점에 모든 영역의 크기가 집중되어 있도록 표현하는 방법이며, 이 비전의 중심점을 다른 관심영역으로 이동시킴으로써 좀 더 정밀한 영상표현도 가능하게 되었다. 이는 또한 영역의 크기 정보를 포함하고 있어서 더욱 효과적이다. 영상의 윤곽선이 제안된 기술자에 의해 정밀하게 표현될수록 영상 내용 검색 등에는 더욱 효과적으로 이용될 수 있다. 제안된 형태 기술자는 정규화가 가능하여 크기, 위치, 회전에 무관하게 표현될 수 있으며, 일정한 영상 패턴으로 구성된 데이터베이스 시스템을 만들 수 있다. 제안된 형태 기술자를 이용하여 실루엣 영상 검색에 적용하여 실험하였으며, 실험 결과, 영상 표현에 효과적으로 사용될 수 있음을 보였다.

  • PDF

회전에 견고한 DCT 기반 영상 검색 (DCT-Based Images Retrieval for Rotated Images)

  • 김남이;송주환;유강수
    • 한국콘텐츠학회논문지
    • /
    • 제11권4호
    • /
    • pp.67-73
    • /
    • 2011
  • 일반적인 영상 검색의 경우 질의 영상과 같은 영상 또는 최대한 유사한 영상을 결과로써 보여주게 되는데 회전 영상의 경우에는 일반적인 영상 검색 방법들의 성능이 현저하게 떨어지는 경향이 있다. 이에 따라 본 논문에서는 회전 영상에 대해서도 검색 성능이 우수하도록 하기 위해 질의 영상과 DB 영상에 대해 Harris Corner Detector 알고리즘을 통해 특징점을 구하고, 그 특징점을 토대로 Principal Components Analysis 알고리즘을 이용해 물체의 주축을 구하여 회전 불변 상태의 영상으로 전환한다. 제안한 기법은 Wang의 원본 1000장의 영상과 $30^{\circ}$, $45^{\circ}$, $90^{\circ}$, $135^{\circ}$, $180^{\circ}$로 회전된 총 6000 장의 지름이 256 크기인 자연 영상을 가지고 실험한 결과, 기존의 기법과 비교하였을 때 회전 영상에 대해서도 우수한 검색 성능을 보였다.

건물 데이터베이스 구축을 위한 그래프 토폴로지 설계 및 패턴매칭 구현 (Graph Topology Design for Generating Building Database and Implementation of Pattern Matching)

  • 최효석;염재홍;이동천
    • 한국측량학회지
    • /
    • 제31권5호
    • /
    • pp.411-419
    • /
    • 2013
  • 3차원 건물을 모델링하기 위해 항공영상 또는 라이다 데이터를 이용하여 건물 외곽선 추출이나 지붕을 구성하는 패치를 추출하는 단계를 거친다. 이러한 3차원 정보를 자동으로 획득하는 알고리즘 개발과 같은 효과적인 정보의 획득에 대한 연구가 활발히 진행되고 있으나, 추후 추출된 정보의 활용이나 유지관리에 대한 연구는 미흡한 상태이다. 본 연구는 3차원 정보를 얻었다는 가정 하에 건물의 형태에 따른 검색을 위한 연구이다. 이를 위하여 벽면, 분할 지붕면, 바닥과 같은 건물의 구성체를 노드(node)로 표현하고 이들의 인접성 관계를 그래프 구조로 객체의 형태를 정의하는 토폴로지 설계 방법을 제안하였다. 제안된 방법에 의해 생성된 토폴로지를 건물 그래프 데이터베이스에 저장하고, 토폴로지 정보를 이용한 패턴매칭을 수행하여 건물을 검색한 결과의 분석을 통해 제안된 객체 토폴로지 설계방법의 효용성을 입증하였다. 그래프 구조의 토폴로지를 기반으로 건물을 검색할 수 있었으며, 검색 조건을 부여하여 건물의 유사 정도를 조절하며 검색할 수 있었다. 또한 축척 및 회전에 불변한 객체의 형태묘사 방법으로 사용될 수 있다고 사료된다.

색상과 모양 정보를 이용한 2단계 영상 검색 기법 (The 2-Phase Image Retrieval Technique using The Color and Shape Information)

  • 김봉기;오해석
    • 한국멀티미디어학회논문지
    • /
    • 제1권2호
    • /
    • pp.173-182
    • /
    • 1998
  • 최근 멀티미디어 기술의 발전으로 인해 영상을 효율적으로 검색할 수 있는 영상 데이터베이스 시스템이 정보화 사회의 중요한 핵심 기술로 대두되고 있다. 본 논문에서는 내용기반 영상 데이터 검색올 위한 영상 특정 추출 방법으로 색상 정보와 모양 정보를 고려하는 2 단계 영상 검색 시스템을 제안하였다 1 단계에서는 색상 정보를 위해서 Striker 등이 제시한 색상 분포 특성올 이용한 색인 방법의 문제점을 보완하고 확장하여 지역 색상 분포 특성을 고려한 색인 방법을 사용하여 1차로 영상을 개략 분류한다. 2 단계에서는 1 단계에서 분류된 집단 영상들에 대하여 2차로 모양 정보를 이용하여 사용자가 질의한 영상과 유사한 영상을 최종적으로 검색한다 모양 정보를 위해서는 기존 불변 모멘트의 문제점인 많은 연산량과, Jain 퉁이 제시한 방향 히스토그램 인터섹션 방법에서 제기된 회전에 민감하다는 문제점을 해결하기 위해 물체의 윤곽선에 해당하는 화소들만을 대상으로 연산을 수행하는 향상된 불변 모멘트(Improved Moment Invariants : IMI)를 이용한다. 실험 영상으 로 300개의 자동차 영상을 사용하여 기존 방법들과의 비교 실험을 통해 향상된 검색 결과를 얻을 수 있었다

  • PDF

SURF 알고리즘 기반 특징점 추출기의 FPGA 설계 (FPGA Design of a SURF-based Feature Extractor)

  • 류재경;이수현;정용진
    • 한국멀티미디어학회논문지
    • /
    • 제14권3호
    • /
    • pp.368-377
    • /
    • 2011
  • 본 논문에서는 특징점 정합을 통한 객체인식, 파노라마 이미지 생성, 3차원 영상 복원 등에 사용될 수 있는 알고리즘 중 대표적인 SURF 알고리즘 기반 특징점 추출기의 하드웨어 구조 설계 및 FPGA 검증 결과에 대해 기술한다. SURF 알고리즘은 크기와 회전변화에 강한 특징점과 서술자를 생성함으로써 객체인식, 파노라마 이미지 생성, 3차원 영상 복원 등에 활용될 수 있다. 하지만 ARMl1(667Mhz) 프로세서와 128Mbytes의 DDR 메모리를 사용하는 임베디드 환경에서 실험결과 VGA($640{\times}480$) 해상도 C영상의 특정점 추출 처리 시약 7,200msec의 시간이 걸려 실시간 동작이 불가능한 것으로 파악되었다. 본 논문에서는 SURF 알고리즘의 핵심 요소인 적분 이미지 메모리 접근 패턴을 분석하여 메모리 접근 횟수와 메모리 사용량을 줄이는 방법을 이용해 실시간 동작이 가능하도록 하드웨어로 설계하였다. 설계된 하드웨어를 Xilinx(社)의 Vertex-5 FPGA 를 이용하여 검증한 결과 l00Mhz 클록에서 VGA 영상의 특징점 추출시 약 60frame/sec로 동작하여 실시간 응용으로 충분함을 알 수 있다.

스펙트럼 분석기와 퍼지 ARTMAP 신경회로망을 이용한 Robust Planar Shape 인식 (Robust Planar Shape Recognition Using Spectrum Analyzer and Fuzzy ARTMAP)

  • 한수환
    • 한국지능시스템학회논문지
    • /
    • 제7권2호
    • /
    • pp.34-42
    • /
    • 1997
  • 본 논문은 산업분야의 군사적으로 많이 사용되고 있는 planar shape의 인식을 스펙트럼 분석기를 이용하여 FFT 스펙트럼으로부터 추출된 3차원 특징 벡터와 신경회로망인 fuzzy ARTMAP을 이용하여 시도되었다. 외곽선 정보를 추출하여 이를 원점으로 이동시키고 각 경계점들과 원점들과의 유클리드 거리를 구하여 이를 다시 FFT스펙트럼과 스펙트럼 분석기를 통하여 3차원 특징 벡터를 추출하였다. 이 3차원 데이터는 이동, 회전, 크기에 무관한 값으로 fuzzy ARTMAP에 입력값으로 사용하였다. Fuzzy ARTMAP은 두개의 fuzzy ART 모듈을 가지고 있으며 위에서 구한 특징 벡터들에 의해 학습되고 실험되어 진다.본 논문에 포함된 실험은 4개의 비행기와 4개의 산업부품을 이용하여 잡음이 섞인 shape의 인식에 있엇 제시된 방법이 좋은 인식률을 기록함을 보여주고 있다.

  • PDF