• 제목/요약/키워드: 회전 불변

검색결과 142건 처리시간 0.025초

컬러와 모양 정보를 이용한 캐릭터 이미지 검색 (Charactor Image Retrieval Using Color and Shape Information)

  • 이동호;유광석;김회율
    • 방송공학회논문지
    • /
    • 제5권1호
    • /
    • pp.50-60
    • /
    • 2000
  • 본 논문에서는 캐릭터 이미지 검색에 가장 적합한 컬러와 모양 정보를 표현하는 새로운 복합 특징량을 제안한다. 제안된 방법은 YCbCr 컬러 모델에서 얻어진 Y이미지에 대해서는 회전, 이동, 크기 변화에 불변한 Zernike 모멘트를 사용하여 모양 정보를 추출하고, Cb 및 Cr 이미지로부터 DCT계수를 사용하여 색상 정보를 추출하여 캐릭터 이미지를 검색한다. 이 방법은 인간의 시각적인 특성을 잘 표현하는 방법으로서 36개의 적은 특징량으로 높은 검색효율을 나타내기 때문에 대용량 데이터베이스와 같은 웹 검색과 애니메이션 검색에 적합한 방법이다. 캐릭터 이미지 3,834개를 대상으로 실험하였으며 MPEG-7 컬러/질감, 기술자들의 성능 평가에 사용된 ANMRR(Average of Normalized Modified Retrieval Rank)과 모션/모양 기술자들의 성능 평가에 사용된 BEP(Bull's Eye Performance)를 사용하여 캐릭터 이미지 검색에서 우수한 성능을 타나냄을 실험으로 확인하였다.

  • PDF

기하학 정보를 이용한 3차원 모델 검색 (3D Model Retrieval Using Geometric Information)

  • 이기호;김낙우;김태용;최종수
    • 한국통신학회논문지
    • /
    • 제30권10C호
    • /
    • pp.1007-1016
    • /
    • 2005
  • 본 논문은 3차원 모델의 모양 기반 검색을 하기 위한 모델의 특징을 추출하는 방법을 제시한다. 3차원 모델의 특징 기술자는 모델에 대한 위치, 회전, 크기 변환에서 그 특징이 불변해야 하기 때문에, 모델을 정규 좌표계로 표시하기 위한 선(先)처리 작업이 필요하다. 우리는 선처리 작업을 위해서 주성분 분석 방법을 사용하였으며, 이 방법은 최소 경계 상자와 외접구의 생성을 위해서도 이용되었다. 제안한 알고리즘은 다음과 같다. 반지름 1인 외접구를 만들고, 구의 중심에 3차원 모델을 위치시킨 후, 반지름이 다른 동심구($r_i=i/n,\;i=1,2,{\ldots},n$)를 생성하고, 이 동심구들과 모델이 접하는 면을 구한 다음 그 면에 대한 곡률을 계산한다. 여기서 구한 곡률을 3차원 모델의 특징 기술자로 사용하게 된다. 실험 결과는 타 알고리즘에 비해 제안하는 방법이 상대적으로 적은 빈(bin) 수를 가졌음에도 불구하고 ANMRR 평가 함수에 의해 최소 0.1에서 0.6 이상의 성능 개선 효과가 나타나고 있음을 보여 준다. 본 논문은 색인 기법으로 $R{^*}-tree$를 사용하였다.

광학적 상관관계를 기반으로 하는 지문인식 방법에 관한 연구 (A study on correlation-based fingerprint recognition method)

  • 김상백;주성현;정만호
    • 한국광학회지
    • /
    • 제13권6호
    • /
    • pp.493-500
    • /
    • 2002
  • 지문 인식은 보통 지문 영상의 획득과 획득된 지문 영상을 비교하는 단계로 구분해서 생각할 수 있다. 본 논문에서는 지문 영상을 획득하는 단계에서 지문 입력 센서를 사용하여 연구의 초점을 지문의 비교 방법에 맞추었다. 지문 입력 센서에서 는 지문 영상이 영상처리되어 출력되기 때문에 지문을 획득할 때 발생할 수 있는 잡음들에 대해서는 고려하지 않았고 사용자가 임의적으로 여러 번 지문을 입력하게 하여 회전과 이동이 복합적으로 존재하는 영상 왜곡을 고려하였다. 사용자의 지문 인식을 위한 방법으로 광학적 상관관계(Optical Correlation)를 출력하는 Non-linear Joint Transform Correlator(NRC)를 컴퓨터 상에서 구현하였고, 지문 입력 시에 발생할 수 있는 왜곡에 불변적인 특징을 갖도록 지문의 중심점을 찾는 알고리즘을 추가하여 지문 인식의 정확도를 보완하였다. 또한, 찾아진 지문 영상의 중심점을 가지고 100$\times$100픽셀 크기의 중심 영역만을 추출하여 지문 인식에 필요한 시간과 입력 영상의 정보를 줄이면서 높은 정확도를 갖는 매칭 기법을 제시하였다

다중 스케일 영상을 이용한 GAN 기반 영상 간 변환 기법 (GAN-based Image-to-image Translation using Multi-scale Images)

  • 정소영;정민교
    • 문화기술의 융합
    • /
    • 제6권4호
    • /
    • pp.767-776
    • /
    • 2020
  • GcGAN은 기하학적 일관성을 유지하며 영상 간 스타일을 변환하는 딥러닝 모델이다. 그러나 GcGAN은 회전이나 반전(flip) 등의 한정적인 기하 변환으로 영상의 형태를 보존하기 때문에 영상의 세밀한 형태 정보를 제대로 유지하지 못하는 단점을 가지고 있다. 그래서 본 연구에서는 이런 단점을 개선한 새로운 영상 간 변환 기법인 MSGcGAN(Multi-Scale GcGAN)을 제안한다. MSGcGAN은 GcGAN을 확장한 모델로서, 다중 스케일의 영상을 동시에 학습하여 스케일 불변 특징을 추출함으로써, 영상의 의미적 왜곡을 줄이고 세밀한 정보를 유지하는 방향으로 영상 간 스타일 변환을 수행한다. 실험 결과에 의하면 MSGcGAN은 GcGAN보다 정량적 정성적 측면에서 모두 우수하였고, 영상의 전체적인 형태 정보를 잘 유지하면서 스타일을 자연스럽게 변환함을 확인할 수 있었다.

단백질 구조 비교를 위한 전처리 기법으로서의 주성분 분석 (Principal Component Analysis as a Preprocessing Method for Protein Structure Comparison)

  • 박성희;박찬용;김대희;박수준;박선희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.805-808
    • /
    • 2004
  • 본 논문에서는 두 단백질의 구조적 유사성을 기반으로 한 단백질 비교를 위해서 전처리 기법으로서의 주성분분석기법을 소개한다. 기존의 백본 및 알파탄소 간의 거리행렬(distance matrix), 2차 구조 비교기법, 구역(segment)단위의 비교 기법과 같은 단백질 비교 기법들은 위치이동(translation)와 회전(rotation)에 불변한(invariant) 차이를 구하기 위하여 거리행렬을 이용하였다. 그리고, 난 다음 이들의 최적화 과정을 거쳤다. 그러나, 본 논문에서 제시하는 전처리 기법으로서의 주성분분석기법은 단백질 구조를 전체적인 구조 관점에서 위치를 정렬시킨 후에 단백질 간의 구조를 비교하는 방식이다. 단백질의 구조의 방향성(Orientation)을 맞춘 다음에는 다양한 단백질 표현으로 구를 비교할 수 있다. 본 논문에서는 두 단백질의 구조의 유사성을 측정하기 위한 간결한 단백질 표현(representation)으로 3 차원 에지 히스토그램을 사용하였다. 이 기법은 방향성을 정렬하기 위하여 기존의 방법에서 사용되었던 반복적인 거리계산을 통한 최적화하는 과정을 없앰으로써 단백질 구조 비교 시간을 단축할 수 있는 새로운 단백질 구조 비교 패러다임을 가능하게 한다. 따라서, 이 패러다임을 통하여 적절한 단백질 구조 방향성 정렬과 단백질 구조 표현을 이용한 단백질 구조 비교 검색 시스템은 많은 양의 단백질 구조 정보로부터 원하는 형태의 단백질 구조를 빠른 시간에 검색할 수 있는 장점을 가질 수 있다.

  • PDF

2 포인트 극좌표계 변환을 이용한 중심으로부터의 목표물 영상 위치 측정 (The Image Position Measurement for the Selected Object out of the Center using the 2 Points Polar Coordinate Transform)

  • 서춘원
    • 전자공학회논문지
    • /
    • 제52권11호
    • /
    • pp.147-155
    • /
    • 2015
  • 시각적인 시스템에서 다양한 형태로 입력되는 목표물 영상을 효과적으로 처리하기 위하여 목표물의 위치 등을 추출할 수 있는 과정이 요구된다. 이러한 목표물의 위치 정보에 따라 다양한 영상의 변화에 대하여 영상 처리 기술이 응용되어지고 있으며, 이에 따라 목표물에 대한 처리 시스템 등 다각도로 많은 연구가 진행되고 있으며, 특히 회전 및 크기에 불변 특성을 동시에 얻을 수 있는 log-polar 변환을 이용한 방법 등이 영상 인식에 많이 이용되고 있다. 따라서, 본 논문에서는 극좌표계 변환 방법에 의한 입력 영상 내의 목표물의 위치를 측정할 수 있는 2 포인트 극좌표계 변환 방법에 의한 위치 측정 방법을 제시하고자 하였으며, 입력 영상에 대하여 측정하고자 하는 목표물을 극좌표계로 변환한 후에 얻어진 좌 우 극좌표계 영상에 대하여 Centroid 방법에 따른 극좌표 목표물의 무게 중심을 구하였으며, 획득된 무게 중심 좌표를 역변환하여 직각 좌표계의 좌표로 계산함으로서 목표물의 위치를 측정할 수 있었다. 또한, 2 포인트 극좌표계 변환전에 목표물의 중심 좌표법을 산출하고 이를 극좌표계에서 얻어진 중심 좌표의 역변환 값과 비교하여 좌표의 유사도를 얻었으며, 약 99%~104%의 유사도 값을 얻음으로서 오차 범위가 약 4%내의 좋은 결과를 갖는 좌표 위치를 얻을 수 있었다. 따라서 본 논문에서 제시하는 2 포인트 극좌표계 변환에 따른 목표물 위치 측정 방법은 다양한 영상 분야에 적용될 수 있는 가능성을 제시하였다.

해저단에서의 장파의 비선형 변형 (Nonlinear Transformation of Long Waves at a Bottom Step)

  • Mrichina, Nina R.;Pelinovsky, Efim N.
    • 한국해안해양공학회지
    • /
    • 제4권3호
    • /
    • pp.161-167
    • /
    • 1992
  • 서로 다른 유한수심을 갖는 두 영역을 연결하는 해저단위로 전파하는 비분산 유한진폭장파를 고려한다. 2차원 운동을 가정하고, 파봉선이 단과 평행하며, 비점성류체에서의 비회전운동으로 본다. 유한진폭파의 변형을 기술하기 위하여 유한진폭 천해정식과, 단위의 연결부에서 Riemann 변수로 나타낸 질양보존 및 압력연속조건들을 사용한다. 식들에 의하면 Riemann 불변양이 일정한 네 조의 특성유선과 입사, 반사 및 전달파의 진폭을 관련지어 주는 2개의 비선형방정식이 정의된다. 얻어진 방정식계는 통상의 형태로는 해석하기가 어려워 지진 해일파에 실용적으로 사용할 수 있는 특수한 경우만 고려한다. 얻어진 결과들을 장파이론과 비교하였고 아주 작은 진폭의 파인 경우에도 뚜렷한 비선형 효과가 제시되었다.

  • PDF

의류 검색용 회전 및 스케일 불변 이미지 분류 및 검색 기술 (Invariant Classification and Detection for Cloth Searching)

  • 황인성;조법근;전승우;최윤식
    • 방송공학회논문지
    • /
    • 제19권3호
    • /
    • pp.396-404
    • /
    • 2014
  • 의류 검색 분야는 의류의 비정형 특성으로 인해 매우 어려운 분야로 인식 오류 및 연산량을 줄이기 위한 노력이 많이 진행되어 왔으나 이를 위한 학습 및 인식 과정 전체에 대한 구체적인 사례가 없고 일부 관련 기술들은 아직 많은 한계를 보이고 있다. 이에 본 논문에서는 입력된 영상에서 사람 객체를 파악하여 착용한 의상으로부터 색상, 무늬, 질감 등 의상이 가질 수 있는 특성 정보를 분석하여, 이를 분류하고 검색하는 방법에 대한 전 과정을 구체적으로 보였다. 특히, 의류의 패턴 및 무늬 등을 구분하기 위한 비정형 의류 검색을 위한 LBPROT_35 디스크립터를 제안하였다. 이 제안 방식은 영상의 통계적 특징을 분석하는 기존의 LBP_ROT(Local Binary Pattern with ROTation-invariant) 방식에 추가로 원 영상에 크기 변화가 생겨도 검색해 낼 수 있도록 하는 특성이 추가된 것이며, 이를 통해 비정형 의류 검색 시 옷이 회전되어 있거나 스케일에 변화가 있어도 높은 검색율을 얻을 수 있게 되었다. 또한 색 공간을 11개의 구간으로 양자화 하는 방식을 이용하여 컬러 분류를 구현하여, 의류 검색에 있어서 중요한 컬러 유사성을 상실하지 않도록 하였다. 한편, 인터넷 상의 의류 사진들로부터 추출한 총 810장의 트레이닝 이미지로 데이터베이스를 구축하고 이들 중 36장을 질의영상으로 테스트 한 결과, 94.4%의 인식률을 보이는 등 Dense-SIFT 대비 높은 인식률을 보였다.

특징의 효과적 병합에 의한 광고영상정보의 분류 기법 (A Grouping Method of Photographic Advertisement Information Based on the Efficient Combination of Features)

  • 정재경;전병우
    • 전자공학회논문지CI
    • /
    • 제48권2호
    • /
    • pp.66-77
    • /
    • 2011
  • 본 논문은 특징을 효과적으로 병합하여 계층적 색인구조를 적용하는 광고영상의 분류기법에 대한 체계적 방법을 제안한다. 본 방법은 온라인 및 오프라인 상의 광고 영상 정보 관리를 위한 효과적인 응용으로써, 특별히 광고 영상정보의 추적을 위한 전처리 과정을 제공한다. 이를 위하여 전체 영상에 대한 일반적 정보를 포함하는 전역특징과 영상의 지역적 특성에 기반하는 지역특징을 고려한다. 고안된 지역특징은 영상 회전, 스케일링, 잡음추가, 빛의 변화에 불변하여 아핀(Affine) 변환에 의한 화면 차 영상에 대하여도 신뢰성 높은 매칭 도를 얻을 수 있고 동질의 영상 쌍을 검색하는데 있어서도 높은 정확도를 보여준다. 제안 방법은 우선 전역특징으로 전체영상자료에서 다수의 영상 쌍들로 개략적인 영상 군을 구성한 후에, 영상군안에서 지역특징에 의한 동질 영상 쌍들 즉 정밀한 영상 군들로 분리하는 정밀 매칭을 실행한다. 실행시간을 단축하기 위해 전형적인 클러스터링으로 전역특성이 유사한 영상들끼리 그룹화 함으로서 지역특징에 의한 동질 영상 쌍 간 과도한 매칭 시간의 문제점을 극복한다.

SIFT와 신경망을 이용한 학습 기반 차량 번호판 검출 (Learning-based Detection of License Plate using SIFT and Neural Network)

  • 홍원주;김민우;오일석
    • 전자공학회논문지
    • /
    • 제50권8호
    • /
    • pp.187-195
    • /
    • 2013
  • 차량 번호판 검출의 기존 연구들은 대부분 높은 성능을 얻기 위해 영상 획득 환경을 제한한다. 본 논문은 제약사항이 적은 환경에서 다양한 종류의 차량 번호판을 검출하기 위해 SIFT와 신경망을 이용한 새로운 방법을 제안한다. SIFT는 영상의 크기, 회전 변화에 불변하는 지역특징으로서 처리해야 할 환경이 고정되지 않은 경우에도 분별력이 뛰어나다. 영상에서 추출한 SIFT를 번호판 내부의 것(내부 부류)과 외부의 것(외부 부류)으로 나누어 2부류 분류기를 학습한다. 분류기는 신경망을 사용하며, 찾고자 하는 번호판의 종류를 학습 집합에 포함하는 것으로 다양한 종류의 번호판을 동일한 알고리즘으로 검출할 수 있다. 제안하는 방법은 입력 영상에서 지역특징을 추출하고 미리 학습한 분류기로 번호판 내부 부류를 가려낸다. 분류기의 성능이 높지 않더라도 분류 결과 내부 부류는 번호판 내부에 밀집하여 나타나고 번호판 외부에서는 흩어져 나타난다. 이러한 특성을 이용해 지역특징 맵을 만들고, 이 맵에서 임계값 이상인 전역 최댓값을 번호판 영역으로 검출한다. 다양한 환경에서 데이터 베이스를 수집하고 지역특징 분류와 번호판 검출 알고리즘을 실험한다. 지역특징을 분류기로 분류한 결과 정인식률은 97.1%, 정확률은 62.0%, 재현율은 50.2%를 보였다. 정인식률에 비해 정확률과 재현율은 낮았지만, 번호판 검출 결과 98.6%의 높은 검출 성능을 보였다.