• 제목/요약/키워드: Gabor filters

검색결과 42건 처리시간 0.023초

가버 필터에 기반한 관심 객체 검출 (Object of Interest Extraction Using Gabor Filters)

  • 김성영
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권2호
    • /
    • pp.87-94
    • /
    • 2008
  • 본 논문에서는 칼라 영상으로부터 관심 객체를 효과적으로 추출할 수 있는 방법을 제안한다. 본 논문에서 제안한 방법은 추출할 객체에 대한사전 지식이 필요 없으며 단순한 배경뿐만 아니라 복잡한 배경에서도 영상에 포함된 관심 객체를 추출하는 것이 가능하도록 한다. 이를 위해 가버 필터 사전을 사용하여 객체의 대략적인 형상을 포함하는 가버 영상을 생성한다. 이를 기반으로 객체 추출에 필요한 특징 정보의 추출 기준이 되는 관심 창(attention window)의 초기 위치를 설정한다. 객체 추출 단계는 기존 연구에서 제안한 방법을 일부 수정하여 적용한다. 제안된 방법의 추출 성능을 평가하기 위해 제안된 방법으로 추출된 결과를 수작업으로 추출된 객체와 비교하여 Precision, Recall 및 F-measure를 계산한다. 이를 통해 제안된 방법의 성능을 확인하였다. 또한 기존 방법과의 추출 결과 비교를 통해 제안된 방법의 우수성을 검증하였다.

  • PDF

가버 웨이블릿 신경망 기반 적응 표정인식 시스템 (Adaptive Facial Expression Recognition System based on Gabor Wavelet Neural Network)

  • 이상완;김대진;김용수;변증남
    • 한국지능시스템학회논문지
    • /
    • 제16권1호
    • /
    • pp.1-7
    • /
    • 2006
  • 본 논문에서는 6개의 특징점을 이용하는 가버 웨이블릿 신경망 기반 적응 표정인식 시스템을 제안한다. 특징 추출부를 포함하는 초기 네트워크의 구성은 Levenberg-Marquardt 기반의 학습방법이 사용되며, 따라서 특징 추출부 결정에 있어서 경험적 요소를 배재시킬 수 있다. 또한 새로운 사용자에 대한 적응 네트워크를 구성하기 위해서 개선된 보상함수를 가지는 Q-학습과, 비지도 퍼지 신경망 모델을 사용하였다. Q-학습을 통해서는 개인 사용자에 대해 분리도가 좋은 특징벡터를 얻을 수 있는 가버필터 세트를 얻을 수 있으며, 퍼지 신경망을 통해서는 사용자의 얼굴변화에 맞게 인식기를 변화시킬 수 있다. 따라서 제안된 시스템은 사용자의 얼굴변화를 따라갈 수 있는 좋은 적응 성능을 보이고 있다.

Adaptive V1-MT model for motion perception

  • Li, Shuai;Fan, Xiaoguang;Xu, Yuelei;Huang, Jinke
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권1호
    • /
    • pp.371-384
    • /
    • 2019
  • Motion perception has been tremendously improved in neuroscience and computer vision. The baseline motion perception model is mediated by the dorsal visual pathway involving the cortex areas the primary visual cortex (V1) and the middle temporal (V5 or MT) visual area. However, few works have been done on the extension of neural models to improve the efficacy and robustness of motion perception of real sequences. To overcome shortcomings in situations, such as varying illumination and large displacement, an adaptive V1-MT motion perception (Ad-V1MTMP) algorithm enriched to deal with real sequences is proposed and analyzed. First, the total variation semi-norm model based on Gabor functions (TV-Gabor) for structure-texture decomposition is performed to manage the illumination and color changes. And then, we study the impact of image local context, which is processed in extra-striate visual areas II (V2), on spatial motion integration by MT neurons, and propose a V1-V2 method to extract the image contrast information at a given location. Furthermore, we take feedback inputs from V2 into account during the polling stage. To use the algorithm on natural scenes, finally, multi-scale approach has been used to handle the frequency range, and adaptive pyramidal decomposition and decomposed spatio-temporal filters have been used to diminish computational cost. Theoretical analysis and experimental results suggest the new Ad-V1MTMP algorithm which mimics human primary motion pathway has universal, effective and robust performance.

인간시각필터의 수학적 모델링 해석 (Mathematical Modeling Analysis of the Human Visual Filters)

  • 이적식
    • 대한전자공학회논문지SP
    • /
    • 제38권6호
    • /
    • pp.617-629
    • /
    • 2001
  • 인간시각체계에서 단순세포의 수용영역에 대한 수학적인 모델 연구가 정신물리학, 생리학, 신경과학 측면에서 발전되어 왔다. 여러 분야에서 사용되는 모델은 Gabor 복소함수, Gaussian 미분, Hermite 함수를 포함하며, 영상처리와 컴퓨터 시각 분야에 많이 응용되고 있다. 본 논문에서는 불확실성원리에 기초하여 고려된 함수들의 결합유효폭을 계산하고, 인간시각필터와 일치되는 중심주파수와 각 함수의 변수들을 결정하고, 결과적인 대역폭을 분석한다. 더욱이 함수들의 위치와 주파수 영역의 특성을 파악하여 정신물리학적으로 획득한 실험적인 데이터와의 관련성을 검토한다.

  • PDF

얼굴 특징점의 지각적 위계구조에 기초한 표정인식 신경망 모형 (A neural network model for recognizing facial expressions based on perceptual hierarchy of facial feature points)

  • 반세범;정찬섭
    • 인지과학
    • /
    • 제12권1_2호
    • /
    • pp.77-89
    • /
    • 2001
  • 얼굴 특징점의 지각적 위계구조를 반영한 표정인식 신경망 모형을 설계하였다. 입력자료는 MPEG-4 SNHC(Synthetic/Natural Hybrid Coding)의 얼굴 정의 파라미터(FDP) 중 39개 특징점 각각에 대해 150장의 표정연기 사진을 5개의 크기와 8개의 바위를 갖는 Gabor 필터로분석한 값이었다. 표정영상에 대한 감정상태 평정 값과 39개 특징점의 필터 반응 값을 중가 회귀분석한 결과, 감정상태의 쾌-불쾌 차원은 주로 입과 눈썹 주변의 특징점과 밀접한 과련이 있었고, 각성-수면차원은 주로 눈 주변의 특징점과 밀접한 관련이 있었다. 필터의 크기는 주로 저역 공간 주파수 필터와 감정상태가 관련이 있었고, 필터의 방위는 주로 비스듬한 사선방위와 감정상태가 관련이 있었다. 이를 기초로 표정인식 신경망을 최적화한 결과 원래 1560개(39x5x8) 입력요소를 400개(25x2x8)입력요소로 줄일 수 있었다. 표정인식 신경망의 최적화 결과를 사람의 감정상태 평정과 비교하여 볼 때, 쾌-불쾌 차원에서는 0.886의 상관관계가 있었고, 각성-수면 차원에서는 0.631의 상관관계가 있었다. 표정인식 신경망의 최적화 모형을 기쁨, 슬픔, 놀람, 공포, 분노, 혐오 등의 6가지 기본 정서 범주에 대응한 결과 74%의 인식률을 얻었다. 이러한 결과는 사람의 표정인식 원리를 이용하면 작은 양의 정보로도 최적화된 표정인식 시스템을 구현할수 있다는 점을 시시한다.

  • PDF

복합형 필터와 CNN 모델을 이용한 효과적인 얼굴 검출 기법 (Robust Face Detection Using Hybrid Filters and Convolutional Neural Networks)

  • 조일국;박현정;김호준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.451-454
    • /
    • 2005
  • 본 논문에서는 수정된 CNN(Convolutional Neural Network) 모델과 다중 필터가 상호 결합된 형태의 얼굴 패턴 검출 기법을 소개 한다. 이는 로봇 시각의 응용문제에서 실내영상의 실시간 인식문제를 대상으로 한다. 검출 과정의 효율성 향상을 위하여 도입된 다중 필터는 후보 영역의 개수와 범위를 줄일 수 있게 한다. 제안된 모델에서 CNN 신경망은 가보변환(Gabor Transform)계층을 두어 검출 과정의 첫 단계에서 영상 내의 기본 특징 지도를 생성 하도록 하였다. 보다 강인한 검출기능을 위하여 조명보정 기법이 시스템의 전처리 단계로 구현 된다. 실제 영상을 통한 실험 결과로부터 제안된 이론의 타당성을 고찰 한다.

  • PDF

텍스쳐 특징과 구조적인 정보를 이용한 문서 영상의 분할 및 분류 (Document Image Segmentation and Classification using Texture Features and Structural Information)

  • 박근혜;김보람;김욱현
    • 융합신호처리학회논문지
    • /
    • 제11권3호
    • /
    • pp.215-220
    • /
    • 2010
  • 본 논문은 문서 영상을 대상으로 표, 그림, 글자 등의 각 구성요소들을 자동으로 분류하기 위한 새로운 텍스쳐 기반의 영상 분할 및 분류 방법을 제안한다. 제안한 방법은 문서 영상 분할 단계와 문서 영상 내 구성요소 분류 단계로 이루어진다. 먼저 영상 분할을 수행한 후, 분할된 영역을 대상으로 문서 영상의 구성 요소들을 분류하는데, 이때 각 구성 요소는 서로 다른 텍스쳐를 가지고 있는 영역이라는 특징을 이용한다. 분할된 영역들을 분류하기 위한 텍스쳐 특징을 추출하기 위해 다양한 텍스쳐 분석에 광범위하게 사용되는 2차원 가보필터를 이용한다. 제안한 방법은 구성 요소와 사용 언어에 대한 사전 지식을 이용하지 않으면서 문서 영상의 분할 및 구성요소 분류에서 좋은 성능을 보인다. 제안한 방법은 멀티미디어 데이터 검색, 실시간 영상 처리 등과 같은 다양한 분야에 적용 될 수 있다.

통계적 특성에 의한 객체 영상 검출방안 (The Object Image Detection Method using statistical properties)

  • 김지홍
    • 한국정보통신학회논문지
    • /
    • 제22권7호
    • /
    • pp.956-962
    • /
    • 2018
  • 본 논문은 영상에 포함된 객체 특징을 추출하기 위한 연구로서, 말레이시아 산림에서 드론으로 항공 촬영된 산림 영상사진을 이용하여 실제로 산림 속에 존재하는 나무를 파악하기 위한 방법을 기술한다. 일반적으로 회색조 영상특징 추출방법으로는 LBP 방식과 GLCM 방식, Gabor 필터 방식 등이 많이 사용되고 있다. 본 연구에서는 드론으로 촬영된 영상이므로 나뭇잎 질감이 매우 유사하기 때문에, 질감 자체보다는 표본으로 채취한 샘플들에 대한 통계적 특성을 이용한 객체 추출 방식을 제안한다. 이를 위하여 먼저 샘플 영상을 생성하고, 생성된 샘플영상과 원 영상간의 상호상관관계를 이용하여 객체를 검출한다. 각 샘플영상들에 대한 평균치 및 표준편차는 객체 샘플을 분간하고, 판단하기 위한 중요한 자료로 사용될 수 있으며, 또한 RGB 모델과 HSV 모델의 각 신호성분들을 분석하여 객체판단에 유용한 샘플 영상에 대한 통계값을 이용함으로서 객체 추출 확률을 높일 수 있다.

필터 및 특징 선택 기반의 적응형 얼굴 인식 방법 (An Adaptive Method For Face Recognition Based Filters and Selection of Features)

  • 조병모;김기한;이필규
    • 한국콘텐츠학회논문지
    • /
    • 제9권6호
    • /
    • pp.1-8
    • /
    • 2009
  • 2D 영상 이미지를 인식하는데 있어서, 테스트 이미지를 입력 받는 카메라의 설치 공간 및 설정 상황에 따라 밝기, 명암, 빛의 방향 등과 같은 인식의 성능에 영향을 끼칠 수 있는 요소들이 매우 많이 존재한다. 본 논문은 카메라가 위치한 환경 상의 최소의 샘플 이미지를 가지고, 그 환경에서 입력되는 영상의 인식 성공률을 높일 수 있는 적응형 얼굴 인식 방법을 제안하고 있다. 제안한 적응형 얼굴 인식은 두 개의 부분으로 구성되어 있는데, 하나는 환경 적응을 하기 위한 부분이고, 다른 하나는 얼굴 인식을 수행하는 부분이다. 전자인 환경 적응 모듈에서는 안정 상태 유전 알고리즘을 사용하여 인식기가 최적의 성능을 낼 수 있는 필터 조합과 필터 파라메터와 특징 벡터 집합 차원을 결정하고, 후자인 얼굴 인식 모듈에서는 그 결과를 사용하여 얼굴 인식 결과를 확인한다. 얼굴 인식 과정에서 이미지 사이의 유사도를 측정하기 위해서 가보 웨이블릿을 사용하였고, 인식의 결과를 도출하는 과정에서는 k-Nearest Neighbor을 사용하였다. 적응형 얼굴 인식 방법을 테스트 하기위해, 사인 함수의 가중치를 사용한 명암 노이즈, 임펄스 노이즈, 복합 노이즈에 관하여 각각 실험을 하였고, 진화 후에는 일반적으로 발생할 수 있는 노이즈에 대한 급격한 인식률 저하를 방지할 수 있음을 확인하였다.

Three-Dimensional Shape Recognition and Classification Using Local Features of Model Views and Sparse Representation of Shape Descriptors

  • Kanaan, Hussein;Behrad, Alireza
    • Journal of Information Processing Systems
    • /
    • 제16권2호
    • /
    • pp.343-359
    • /
    • 2020
  • In this paper, a new algorithm is proposed for three-dimensional (3D) shape recognition using local features of model views and its sparse representation. The algorithm starts with the normalization of 3D models and the extraction of 2D views from uniformly distributed viewpoints. Consequently, the 2D views are stacked over each other to from view cubes. The algorithm employs the descriptors of 3D local features in the view cubes after applying Gabor filters in various directions as the initial features for 3D shape recognition. In the training stage, we store some 3D local features to build the prototype dictionary of local features. To extract an intermediate feature vector, we measure the similarity between the local descriptors of a shape model and the local features of the prototype dictionary. We represent the intermediate feature vectors of 3D models in the sparse domain to obtain the final descriptors of the models. Finally, support vector machine classifiers are used to recognize the 3D models. Experimental results using the Princeton Shape Benchmark database showed the average recognition rate of 89.7% using 20 views. We compared the proposed approach with state-of-the-art approaches and the results showed the effectiveness of the proposed algorithm.