• 제목/요약/키워드: Local feature

검색결과 932건 처리시간 0.024초

실시간 다중 객체 인식 및 추적 기법 (Real-time Multi-Objects Recognition and Tracking Scheme)

  • 김대훈;노승민;황인준
    • 한국항행학회논문지
    • /
    • 제16권2호
    • /
    • pp.386-393
    • /
    • 2012
  • 본 논문에서는 객체의 관심점(interest points)에 대한 지역 특징 기술자를 이용하여 이미지나 동영상에서 다수의 관심 객체를 효과적으로 인식하고 추적하기 위한 기법을 제안한다. 이를 위해 먼저 대상이 되는 객체를 포함하는 다양한 이미지를 수집하고 SURF 알고리즘을 적용하여 객체의 관심점과 그들에 대한 지역 특징 기술자를 생성한다. 지역 특징에 대한 통계적인 분석을 통하여 관심점들 중에서 해당 객체의 특성을 가장 잘 표현하는 대표점(representative points)을 선택하고 이를 바탕으로 이미지에 존재하는 객체를 인식한다. 또한, 지역 특징 기술자의 정합을 응용하여 각 SURF 지점들의 움직임 벡터를 생성하고 이를 기반으로 실시간으로 객체를 추적한다. 제안하는 기법은 모든 객체를 독립적으로 다루기 때문에, 여러 개의 객체를 동시에 인식하고 추적할 수 있다. 다양한 실험을 통해, 동영상에서 객체의 존재 여부 및 종류를 신속하게 판별하고 관심 객체의 추적을 효과적으로 수행할 수 있음을 보인다.

방향 회전에 불변한 얼굴 영역 분할과 LBP를 이용한 얼굴 검출 (Face Detection using Orientation(In-Plane Rotation) Invariant Facial Region Segmentation and Local Binary Patterns(LBP))

  • 이희재;김하영;이다빛;이상국
    • 정보과학회 논문지
    • /
    • 제44권7호
    • /
    • pp.692-702
    • /
    • 2017
  • LBP기반 특징점 기술자를 이용한 얼굴검출은 얼굴의 형태정보 및 눈, 코, 입과 같은 얼굴 요소들 간 공간정보를 표현할 수 없는 문제가 있다. 이러한 문제를 해결하기 위해 선행 연구들은 얼굴 영상을 다수개의 사각형 부분영역들로 분할하였다. 하지만, 연구마다 서로 다른 개수와 크기로 부분 영역을 분할하였기 때문에 실험에 사용하는 데이터베이스에 적합한 부분 영역의 분할 기준이 모호하며, 부분 영역의 수에 비례하여 LBP 히스토그램 차원이 증가되고, 부분 영역의 개수가 증가함에 따라 얼굴의 방향 회전에 대한 민감도가 크게 증가한다. 본 논문은 LBP기반 특징점 기술자의 방향 회전 문제와 특징점 차원의 수 문제를 해결할 수 있는 새로운 부분 영역 분할 방법을 제안한다. 실험 결과, 제안하는 방법은 방향 회전된 단일 얼굴 영상에서 99.0278%의 검출 정확도를 보였다.

A Hybrid Proposed Framework for Object Detection and Classification

  • Aamir, Muhammad;Pu, Yi-Fei;Rahman, Ziaur;Abro, Waheed Ahmed;Naeem, Hamad;Ullah, Farhan;Badr, Aymen Mudheher
    • Journal of Information Processing Systems
    • /
    • 제14권5호
    • /
    • pp.1176-1194
    • /
    • 2018
  • The object classification using the images' contents is a big challenge in computer vision. The superpixels' information can be used to detect and classify objects in an image based on locations. In this paper, we proposed a methodology to detect and classify the image's pixels' locations using enhanced bag of words (BOW). It calculates the initial positions of each segment of an image using superpixels and then ranks it according to the region score. Further, this information is used to extract local and global features using a hybrid approach of Scale Invariant Feature Transform (SIFT) and GIST, respectively. To enhance the classification accuracy, the feature fusion technique is applied to combine local and global features vectors through weight parameter. The support vector machine classifier is a supervised algorithm is used for classification in order to analyze the proposed methodology. The Pascal Visual Object Classes Challenge 2007 (VOC2007) dataset is used in the experiment to test the results. The proposed approach gave the results in high-quality class for independent objects' locations with a mean average best overlap (MABO) of 0.833 at 1,500 locations resulting in a better detection rate. The results are compared with previous approaches and it is proved that it gave the better classification results for the non-rigid classes.

지역적 매칭쌍 특성에 기반한 고해상도영상의 자동기하보정 (Automatic Registration of High Resolution Satellite Images using Local Properties of Tie Points)

  • 한유경;번영기;최재완;한동엽;김용일
    • 한국측량학회지
    • /
    • 제28권3호
    • /
    • pp.353-359
    • /
    • 2010
  • 본 논문은 Scale Invariant Feature Transform(SIFT) 기술자를 이용한 매칭 방법을 개선하여 고해상도영상에서 보다 많은 매칭쌍(tie points)을 추출함으로써 고해상도영상 자동기하보정의 결과향상을 목적으로 한다. 이를 위해 기준(reference)영상과 대상(sensed)영상의 특징점(interest points)간의 위치관계를 추가적으로 이용하여 매칭쌍을 추출하였다. SIFT 기술자를 이용하여 어핀(affine)변환계수를 추정한 후, 이를 통해 대상영상의 특징점 좌표를 기준영상 좌표체계로 변환하였다. 변환된 대상영상의 특징점과 기준영상의 특징점간의 공간거리(spatial distance)정보를 이용하여 최종적으로 매칭쌍을 추출하였다. 추출된 매칭쌍으로 piecewise linear function을 구성하여 고해상도 영상간 자동기하보정을 수행하였다. 제안한 기법을 통하여, 기존 SIFT 기법에 의해 추출한 결과에 비해 영상 전역에 걸쳐 고르게 분포된 다수의 매칭쌍을 추출할 수 있었다.

얼굴인식을 위한 어파인 불변 지역 서술자 (Affine Invariant Local Descriptors for Face Recognition)

  • 고용빈;이효종
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권9호
    • /
    • pp.375-380
    • /
    • 2014
  • 오늘날 촬영 상황을 조절할 수 있는 환경, 즉 고정된 촬영각이나 일관된 조도 조건에서는 얼굴인식 기술 수준은 신뢰할 수 있을 정도로 높다. 그러나 복잡한 현실에서의 얼굴 인식은 여전히 어려운 과제이다. SIFT 알고리즘은 촬영각의 변화가 미미할 때에 한하여, 크기와 회전 변화에 무관하게 우수한 성능을 보여주고 있다. 본 논문에서는 다양하게 촬영각이 변하는 환경에서도 얼굴 인식을 할 수 있는 어파인 불변 지역 서술자를 탐지하는 ASIFT(Affine SIFT)라는 알고리즘을 적용하였다. SIFT 알고리즘을 확장하여 만든 ASIFT 알고리즘은 촬영각 변화에 취약한 단점을 극복하였다. 제안하는 방법에서 ASIFT 알고리즘은 표본 이미지에, SIFT 알고리즘은 검증 이미지에 적용하였다. ASIFT 방법은 어파인 변환을 사용하여 다양한 시각에 따른 영상을 생성할 수 있기 때문에 ASIFT 알고리즘은 저장 영상과 실험 영상의 시각 차이에 따른 문제를 해결할 수 있었다. 실험결과 FERET 데이터를 사용했을 때 제안한 방법은 촬영각의 변화가 큰 경우에 기존의 시프트 알고리즘보다도 높은 인식률을 보여주었다.

기울기하강과 동적터널링에 기반을 둔 학습알고리즘의 신경망을 이용한 영상데이터의 주요특징추출 (Principal Feature Extraction on Image Data Using Neural Networks of Learning Algorithm Based on Steepest Descent and Dynamic tunneling)

  • 조용현
    • 한국정보처리학회논문지
    • /
    • 제6권5호
    • /
    • pp.1393-1402
    • /
    • 1999
  • 본 논문에서는 새로운 학습알고리즘의 3층 전향 신경망을 이용한 입력데이터의 주요 특징추출에 대해서 제안하였다. 제안된 학습알고리즘에서에서는 빠른 수렴속도의 최적화가 가능하도록 하기 위하여 기울기하강의 역전파 알고리즘을 이용하고, 국소최적해를 만났을 때 이를 벗어난 새로운 연결가중치의 설정을 위하여 동적터널링의 역전파 알고리즘을 이용함으로써 빠른 수렴속도로 전역최적해로에 수렴되도록 학습시킬 수 있다. 제안된 학습 알고리즘을 이용한 다층신경망을 $12{\times}12$ 픽셀의 영상 데이터들과 $128{\times}128$ 픽셀의 Lenna 영상데이터를 대상으로 시뮬레이션한 결과, 단층신경망을 이용하는 Sanger 방법이나 측면연결을 가지는 단충신경망을 이용하는 Foldiak 방법 및 기울기하강에 기초를 둔 기존의 역전파 알고리즘을 이용한 다층신경망에 의한 결과와 비교할 때 더욱 우수한 수렴성능과 추출성능이 있음을 확인할 수 있었다.

  • PDF

Gabor, MDLC, Co-Occurrence 특징의 융합에 의한 언어 인식 (Language Identification by Fusion of Gabor, MDLC, and Co-Occurrence Features)

  • 장익훈;김지홍
    • 한국멀티미디어학회논문지
    • /
    • 제17권3호
    • /
    • pp.277-286
    • /
    • 2014
  • 본 논문에서는 Gabor 특징과 MDLC 특징, 그리고 co-occurrence 특징의 융합에 의한 질감 특징 기반언어 인식 방법을 제안한다. 제안된 방법에서는 먼저 시험 영상에 Gabor 변환에 이은 크기 연산자를 적용하여 Gabor 크기 영상을 얻고 그 통계치를 계산하여 결과를 벡터화한다. 이어서 MDLC 연산자를 이용하여 MDLC 영상을 얻고 역시 그 통계치를 계산하여 벡터화한다. 다음으로 시험 영상으로부터 GLCM을 계산하고 이를 이용하여 co-occurrence 특징을 계산한 다음 벡터화한다. 이들 Gabor, MDLC, co-occurrence 특징에 의한 벡터들은 벡터 융합에 의하여 특징 벡터로 사용된다. 분류 단계에서는 얼굴 인식에 주로 사용되는 WPCA를 분류기로 하여 시험 특징 벡터와 가장 유사한 학습 특징 벡터를 찾는다. 제안된 방법의 성능은 15개국 언어의 문서를 스캔하여 얻은 시험 문서 영상 DB에 대한 평균 인식률을 조사하여 알아본다. 실험 결과 제안된 방법은 시험 DB에 대하여 비교적 낮은 특징 벡터 차원으로 매우 우수한 언어 인식 성능을 보여준다.

토착지명, 지리적 실체, 그리고 인식의 문제 -동해/일본해 표기 사례- (Endonym, Geographical Feature and Perception: The Case of the Name East Sea/Sea of Japan)

  • 주성재
    • 대한지리학회지
    • /
    • 제44권5호
    • /
    • pp.661-674
    • /
    • 2009
  • 최근 유엔지명전문가회의에서는 두 개 이상의 국가에 걸치거나 국경을 초월하여 존재하는 지리적 실체가 갖는 이름이 어떤 지위를 가질 것인가에 대하여 활발한 토론이 진행되었다. 두 개의 상반된 견해가 제시되었는데, 하나는 어떤 실체가 위치한 곳에서 사용되는 언어로 표기된 지명은 그 경계 내에서만 토착지명이라는 관점이며, 다른 하나는 어떤 언어로 표기된 지명은 전체에 대하여 토착지명이라는 관점이다. 전자는 지리적 실체가 나뉠 수 있음을 전제로 한다는 점에서 부분적 관점, 후자는 지리적 실체를 나뉘지 않는 전체로 인식한다는 점에서 전체적 관점이라고 부를 수 있다. 부분적 관점에서는 적어도 한국의 영해에서는 '동해'라고 불러야 한다는 점, 전체적 관점에서는 바다 전체에 대해 '동해'는 토착지명이 된다는 점 등에서 볼 때, 어떤 관점에서도 '동해'지명은 존중되어야 한다. 이 논문은 지리적 실체를 나눌 수 있고 각 부분은 다른 형태의 지명을 가질 수 있다는 부분적 관점을 지지한다. 지리적 실체의 분리에 대해서는 지역 주민들이 자신의 것으로 인식하는 바다의 경계를 사용해야 한다. 영어로 표기된 East Sea는 토착지명 '동해'의 번역된 형태로 분류하는 방안이 제안된다.

잡음환경에서 Teager 에너지와 음성부재확률 기반의 음성향상 알고리즘 (Speech Enhancement Algorithm Based on Teager Energy and Speech Absence Probability in Noisy Environments)

  • 박윤식;안홍섭;이상민
    • 대한전자공학회논문지SP
    • /
    • 제49권3호
    • /
    • pp.81-88
    • /
    • 2012
  • 본 논문에서는 다양한 잡음환경에서 효과적인 잡음 제거 (NS, noise suppression)를 위한 새로운 음성향상 (speech enhancement) 알고리즘을 제안한다. 제안된 방법에서는 음성향상 알고리즘에서 잡음전력 갱신을 위한 음성검출 (VAD, voice activity detection)의 피쳐 (feature) 파라미터로서 오염된 음성신호를 기반으로 주파수 밴드 별로 도출되는 기존의 지역 음성부재확률 (LSAP, local speech absecne probability) 대신 오염된 음성신호의 Teager energy (TE)를 적용한 LSAP를 적용한다. 또한 적용된 TE operator의 성능을 개선하기 위하여 프레임 단위로 도출되는 전역 음성부재확률 (GSAP, global SAP)을 TE의 가중치 파라미터로서 적용한다. 제안된 알고리즘은 기존의 방법과 객관적인 실험을 통해 비교 평가한 결과 다양한 배경잡음 환경에서 향상된 성능을 보였다.

Relation Based Bayesian Network for NBNN

  • Sun, Mingyang;Lee, YoonSeok;Yoon, Sung-eui
    • Journal of Computing Science and Engineering
    • /
    • 제9권4호
    • /
    • pp.204-213
    • /
    • 2015
  • Under the conditional independence assumption among local features, the Naive Bayes Nearest Neighbor (NBNN) classifier has been recently proposed and performs classification without any training or quantization phases. While the original NBNN shows high classification accuracy without adopting an explicit training phase, the conditional independence among local features is against the compositionality of objects indicating that different, but related parts of an object appear together. As a result, the assumption of the conditional independence weakens the accuracy of classification techniques based on NBNN. In this work, we look into this issue, and propose a novel Bayesian network for an NBNN based classification to consider the conditional dependence among features. To achieve our goal, we extract a high-level feature and its corresponding, multiple low-level features for each image patch. We then represent them based on a simple, two-level layered Bayesian network, and design its classification function considering our Bayesian network. To achieve low memory requirement and fast query-time performance, we further optimize our representation and classification function, named relation-based Bayesian network, by considering and representing the relationship between a high-level feature and its low-level features into a compact relation vector, whose dimensionality is the same as the number of low-level features, e.g., four elements in our tests. We have demonstrated the benefits of our method over the original NBNN and its recent improvement, and local NBNN in two different benchmarks. Our method shows improved accuracy, up to 27% against the tested methods. This high accuracy is mainly due to consideration of the conditional dependences between high-level and its corresponding low-level features.