• 제목/요약/키워드: Invariant Recognition

검색결과 291건 처리시간 0.027초

영상 크기변화에 강인한 실시간 속도표지판 인식 (Real time speed-limit sign recognition invariant to image scale)

  • 황민철;고병철;남재열
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1358-1360
    • /
    • 2015
  • 본 논문에서는 MB-LBP(Multi-scale Block Local Binary Patterns)와 공간피라미드를 이용하여 생성된 특징을 랜덤 포레스트(Random Forest) 분류기에 적용하여 영상내의 표지판 속도를 인식하는 알고리즘을 제안한다. 입력 영상에서 표지판 영역은 다양한 위치와 크기를 가지며 주위 배경이 후보 영역에 포함되므로 먼저 입력 영상에 원형 Hough Transform을 적용하여 원형의 표지판 후보 영역만을 검출한다. 그 후 영상의 화질을 향상시키기 위해 히스토그램 평활화와 모폴로지 연산을 적용하여 표지판의 숫자 영역과 배경 영역의 대비를 높이도록 한다. 표지판의 크기 변화에 강건한 시스템의 구현을 위해 후보 영역에서 LBP(Local Binary Patterns)보다 우수한 성능을 보이는 MB-LBP를 적용하고, 다양한 크기의 속도 표지판을 인식하기 위해 공간 피라미드를 사용하여 지역적 특징과 전역적 특징 모두를 추출하였다. 추출된 특징은 랜덤 포레스트(Random Forest)를 이용하여 각 9개의 속도 표지판으로 분류, 각 속도별 클래스에 대한 인식 성능을 측정하였다.

Change Detection of Land-cover from Multi-temporal KOMPSAT-1 EOC Imageries

  • Ha, Sung-Ryong;Ahn, Byung-Woon;Park, Sang-Young
    • 대한원격탐사학회지
    • /
    • 제18권1호
    • /
    • pp.13-23
    • /
    • 2002
  • A radiometric correction method is developed to apply multi-temporal KOMPSAT-1 EOC satellite images for the detection of land-cover changes b\ulcorner recognizing changes in reflection pattern. Radiometric correction was carried out to eliminate the atmospheric effects that could interfere with the image properly of the satellite data acquired at different multi-times. Four invariant features of water, sand, paved road, and roofs of building are selected and a linear regression relationship among the control set images is used as a correction scheme. It is found that the utilization of panchromatic multi-temporal imagery requires the radiometric scene standardization process to correct radiometric errors that include atmospheric effects and digital image processing errors. Land-cover with specific change pattern such as paddy field is extracted by seasonal change recognition process.

특징점 Appearance Model을 이용한 3차원 물체 인식 (3D Object Recognition Using Appearance Model of Feature Point)

  • 주성문;박재완;이칠우
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1536-1539
    • /
    • 2013
  • 3차원 물체는 카메라의 시선 방향에 따라 다른 영상을 생성하므로 2차원 영상만으로 3차원 물체를 인식하는 것은 쉬운 일이 아니다. 특히 영상생성 시 강한 perspective transformation 이 발생할 경우 2차원 국소 특징을 이용하는 SIFT(Scale-Invariant Feature Transform) 알고리즘은 매칭에 활용하기 어렵다. 본 논문에서는 3차원 물체를 하나의 특정 축 중심으로 회전시키면서 얻은 복수의 영상을 학습 데이터로 활용하여 SIFT 알고리즘을 개선한 물체인식 방법을 제안한다. 이 방법은 복수 영상의 특징점들을 하나의 특징 공간으로 합성하고 그 특징점들 간의 기하학적인 제약조건을 확인하여 3차원 물체를 인식하는 방법이다. 실험에서는 알고리즘의 유용성을 먼저 확인하기 위해 조명조건과 카메라의 위치를 일정하게 유지하였다. 이 방법에 의해 SIFT 알고리즘만으로 인식이 힘들었던 3차원 물체의 다양한 외관(appearance) 인식이 가능하게 되었다.

Multiple Properties-Based Moving Object Detection Algorithm

  • Zhou, Changjian;Xing, Jinge;Liu, Haibo
    • Journal of Information Processing Systems
    • /
    • 제17권1호
    • /
    • pp.124-135
    • /
    • 2021
  • Object detection is a fundamental yet challenging task in computer vision that plays an important role in object recognition, tracking, scene analysis and understanding. This paper aims to propose a multiproperty fusion algorithm for moving object detection. First, we build a scale-invariant feature transform (SIFT) vector field and analyze vectors in the SIFT vector field to divide vectors in the SIFT vector field into different classes. Second, the distance of each class is calculated by dispersion analysis. Next, the target and contour can be extracted, and then we segment the different images, reversal process and carry on morphological processing, the moving objects can be detected. The experimental results have good stability, accuracy and efficiency.

Zero Deep Curve 추정방식을 이용한 저조도에 강인한 비디오 개선 방법 (Low-Light Invariant Video Enhancement Scheme Using Zero Reference Deep Curve Estimation)

  • 최형석;양윤기
    • 한국멀티미디어학회논문지
    • /
    • 제25권8호
    • /
    • pp.991-998
    • /
    • 2022
  • Recently, object recognition using image/video signals is rapidly spreading on autonomous driving and mobile phones. However, the actual input image/video signals are easily exposed to a poor illuminance environment. A recent researches for improving illumination enable to estimate and compensate the illumination parameters. In this study, we propose VE-DCE (video enhancement zero-reference deep curve estimation) to improve the illumination of low-light images. The proposed VE-DCE uses unsupervised learning-based zero-reference deep curve, which is one of the latest among learning based estimation techniques. Experimental results show that the proposed method can achieve the quality of low-light video as well as images compared to the previous method. In addition, it can reduce the computational complexity with respect to the existing method.

감시 카메라 영상의 객체 인식을 위한 회전 변화에 강인한 질감 분류 (Rotation Transformation Invariant Texture Classification for Object Recognition of Surveillance Camera Image)

  • 김원희;박성모;김종남
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.171-172
    • /
    • 2009
  • 질감 분류 기술은 패턴인식과 컴퓨터 비전 분야에서 널리 사용되는 기술로서, 최근 들어서는 감시 카메라 시스템에서의 정확한 객체 인식을 위한 회전 변화에 강인한 질감 분류 연구가 진행되고 있다. 본 논문에서는 순환 가보 웨이블렛 필터를 이용한 회전 변환에 강인한 질감 분류 방법을 제안한다. 제안하는 방법은 순환 가보 웨이블렛 필터링된 영상에서 전역 및 지역 특징 벡터를 계산하고 특징 벡터의 차이를 이용한 유사도 측정 판별식으로 질감 분류를 수행한다. Brodatz 질감 앨범을 이용한 실험에서 기존의 방법들보다 2~6% 향상된 질감 분류 비율을 확인할 수 있었다. 제안하는 방법은 질감 기반 객체 인식에 관련된 응용 분야에서 유용하게 사용될 수 있다.

객체 인식 설명성 향상을 위한 FPN-Attention Layered 모델의 성능 평가 (Performance Evaluation of FPN-Attention Layered Model for Improving Visual Explainability of Object Recognition)

  • 윤석준;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.1311-1314
    • /
    • 2022
  • DNN을 사용하여 객체 인식 과정에서 객체를 잘 분류하기 위해서는 시각적 설명성이 요구된다. 시각적 설명성은 object class에 대한 예측을 pixel-wise attribution으로 표현해 예측 근거를 해석하기 위해 제안되었다, Scale-invariant한 특징을 제공하도록 설계된 pyramidal features 기반 backbone 구조는 object detection 및 classification 등에서 널리 쓰이고 있으며, 이러한 특징을 갖는 feature pyramid를 trainable attention mechanism에 적용하고자 할 때 계산량 및 메모리의 복잡도가 증가하는 문제가 있다. 본 논문에서는 일반적인 FPN에서 객체 인식 성능과 설명성을 높이기 위한 피라미드-주의집중 계층네트워크 (FPN-Attention Layered Network) 방식을 제안하고, 실험적으로 그 특성을 평가하고자 한다. 기존의 FPN만을 사용하였을 때 객체 인식 과정에서 설명성을 향상시키는 방식이 객체 인식에 미치는 정도를 정량적으로 평가하였다. 제안된 모델의 적용을 통해 낮은 computing 오버헤드 수준에서 multi-level feature를 고려한 시각적 설명성을 개선시켜, 결괴적으로 객체 인식 성능을 향상 시킬 수 있음을 실험적으로 확인할 수 있었다.

  • PDF

밝기, 명암도, 크기, 회전, 위치 변화에 강인한 얼굴 인식 (Face Recognition Robust to Brightness, Contrast, Scale, Rotation and Translation)

  • 이형지;정재호
    • 대한전자공학회논문지SP
    • /
    • 제40권6호
    • /
    • pp.149-156
    • /
    • 2003
  • 본 논문에서는 변형 Otsu 이진화 방법, Hu 모멘트 및 선형 판별 분석(linear discriminant analysis, LDA)를 기반으로 밝기, 명암도, 크기, 회전 위치 변화에 강인한 얼굴 인식 방법을 제안하고자 한다. 제안한 변형 Otsu 이진화를 사용하여 밝기 및 명암도에 불변한 이진 영상들을 만든다. 그런 후 생성된 얼굴 영상의 경계 영상 및 다단계 이진영상으로부터 총 17개의 Hu 모멘트를 계산한 다음 LDA 방법을 적용하여 최종 특징 벡터를 추출한다. 특히 제안하는 얼굴 인식 방법은 Hu 모멘트를 이용함으로써 크기, 회전 및 위치 변화에도 강인한 특성을 갖고 있다. Olivetti research laboratory (ORL) 데이터베이스와 AR 데이터베이스의 총 100명의 얼굴 영상에 대해 기존의 주요 성문 분석(Principal component analysis, PCA) 방법 및 PCA와 LDA를 결합한 얼굴 인식 방법과 비교 실험한 결과, 제안한 얼굴 인식 방법은 대체적으로 기존 방법보다 뛰어난 인식 성능을 보였다.

가상 복사조도 반구와 반사계수에 근거한 얼굴 재조명 (Face Relighting Based on Virtual Irradiance Sphere and Reflection Coefficients)

  • 한희철;손광훈
    • 방송공학회논문지
    • /
    • 제13권3호
    • /
    • pp.339-349
    • /
    • 2008
  • 본 논문에서는 임의의 알려지지 않은 조명 상황 하에서 3차원 객체의 텍스처 영상 한 장을 이용하여 광원의 위치를 추정하고 이를 이용해 조명에 의해 왜곡되어 있는 얼굴 영상을 재조명하는 기법을 제안한다. 우선 주어진 텍스처 영상으로부터 광원의 위치를 추정하기 위해 법선 벡터와 가중 양선형 보간을 이용하여 가상 복사조도 반구를 만들었다. 이를 이용해 추정된 주변광과 확산광 계수로 재조명 방정식을 도출하였다. 얼굴 텍스처 영상에서의 그림자와 음영을 원색으로 복원하는 알고리즘의 효율성과 정확성을 보이기 위해 광원의 위치 추정, 재조명, 얼굴 인식 등의 다양한 실험 결과를 보였다. 실험결과에 의하여 제안한 알고리즘은 조명에 강인한 얼굴 인식시스템뿐만 아니라 3차원 디스플레이에서의 작업 시 시각적 피로감을 줄이고 작업 효율을 높일 수 있음을 확인하였다.

주파수 영역에서 에너지 확률을 이용한 얼굴 특징 추출 (Facial Feature Extraction Using Energy Probability in Frequency Domain)

  • 최진;정윤수;김기현;유장희
    • 대한전자공학회논문지SP
    • /
    • 제43권4호
    • /
    • pp.87-95
    • /
    • 2006
  • 본 논문에서는 얼굴 영상의 에너지 분포 특성을 이용한 새로운 특정추출 방법을 제안한다. 제안된 방법은 얼굴 영상의 에너지 확률과 에너지 랩을 이용해서 데이터 차원이 축소된 유효정보의 추출 및 유효정보의 LDA 해석에 기반을 둔다. 일반적으로, 얼굴 영상은 고유한 에너지 분포 특성을 가지고 있다. 그러나 기존의 많은 DCT 기반 방법들은 이러한 얼굴 영상의 특성을 효과적으로 이용하지 못하는 단점이 있다. 제안된 방법은 이러한 기존 방법의 단점을 개선하기 위해 다음의 3단계 방법을 사용한다. 먼저, DCT 도메인에서 얼굴의 에너지 확률 개념을 정의하고, 이러한 에너지 확률로부터 얼굴의 에너지 맵을 생성한다. 마지막으로, 에너지 확률 지도에 위치한 주파수 계수들에 대한 LDA 적용 및 해석을 통하여 특정 벡터 추출 및 인식을 수행한다. 제안된 방법은 ETRI 데이터베이스에서 96.8%, ORL 데이터베이스에서 100%의 인식률을 보인다. 실험을 통하여 인식 성능의 개선뿐만 아니라, 특정 벡터의 차원 축소에도 효과가 있음을 알 수 있다.