• 제목/요약/키워드: Local Descriptors

검색결과 63건 처리시간 0.024초

Improvement of Accuracy for Human Action Recognition by Histogram of Changing Points and Average Speed Descriptors

  • Vu, Thi Ly;Do, Trung Dung;Jin, Cheng-Bin;Li, Shengzhe;Nguyen, Van Huan;Kim, Hakil;Lee, Chongho
    • Journal of Computing Science and Engineering
    • /
    • 제9권1호
    • /
    • pp.29-38
    • /
    • 2015
  • Human action recognition has become an important research topic in computer vision area recently due to many applications in the real world, such as video surveillance, video retrieval, video analysis, and human-computer interaction. The goal of this paper is to evaluate descriptors which have recently been used in action recognition, namely Histogram of Oriented Gradient (HOG) and Histogram of Optical Flow (HOF). This paper also proposes new descriptors to represent the change of points within each part of a human body, caused by actions named as Histogram of Changing Points (HCP) and so-called Average Speed (AS) which measures the average speed of actions. The descriptors are combined to build a strong descriptor to represent human actions by modeling the information about appearance, local motion, and changes on each part of the body, as well as motion speed. The effectiveness of these new descriptors is evaluated in the experiments on KTH and Hollywood datasets.

Viewpoint Unconstrained Face Recognition Based on Affine Local Descriptors and Probabilistic Similarity

  • Gao, Yongbin;Lee, Hyo Jong
    • Journal of Information Processing Systems
    • /
    • 제11권4호
    • /
    • pp.643-654
    • /
    • 2015
  • Face recognition under controlled settings, such as limited viewpoint and illumination change, can achieve good performance nowadays. However, real world application for face recognition is still challenging. In this paper, we propose using the combination of Affine Scale Invariant Feature Transform (SIFT) and Probabilistic Similarity for face recognition under a large viewpoint change. Affine SIFT is an extension of SIFT algorithm to detect affine invariant local descriptors. Affine SIFT generates a series of different viewpoints using affine transformation. In this way, it allows for a viewpoint difference between the gallery face and probe face. However, the human face is not planar as it contains significant 3D depth. Affine SIFT does not work well for significant change in pose. To complement this, we combined it with probabilistic similarity, which gets the log likelihood between the probe and gallery face based on sum of squared difference (SSD) distribution in an offline learning process. Our experiment results show that our framework achieves impressive better recognition accuracy than other algorithms compared on the FERET database.

Affine Local Descriptors for Viewpoint Invariant Face Recognition

  • Gao, Yongbin;Lee, Hyo Jong
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.781-784
    • /
    • 2014
  • Face recognition under controlled settings, such as limited viewpoint and illumination change, can achieve good performance nowadays. However, real world application for face recognition is still challenging. In this paper, we use Affine SIFT to detect affine invariant local descriptors for face recognition under large viewpoint change. Affine SIFT is an extension of SIFT algorithm. SIFT algorithm is scale and rotation invariant, which is powerful for small viewpoint changes in face recognition, but it fails when large viewpoint change exists. In our scheme, Affine SIFT is used for both gallery face and probe face, which generates a series of different viewpoints using affine transformation. Therefore, Affine SIFT allows viewpoint difference between gallery face and probe face. Experiment results show our framework achieves better recognition accuracy than SIFT algorithm on FERET database.

Digital Video Steganalysis Based on a Spatial Temporal Detector

  • Su, Yuting;Yu, Fan;Zhang, Chengqian
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권1호
    • /
    • pp.360-373
    • /
    • 2017
  • This paper presents a novel digital video steganalysis scheme against the spatial domain video steganography technology based on a spatial temporal detector (ST_D) that considers both spatial and temporal redundancies of the video sequences simultaneously. Three descriptors are constructed on XY, XT and YT planes respectively to depict the spatial and temporal relationship between the current pixel and its adjacent pixels. Considering the impact of local motion intensity and texture complexity on the histogram distribution of three descriptors, each frame is segmented into non-overlapped blocks that are $8{\times}8$ in size for motion and texture analysis. Subsequently, texture and motion factors are introduced to provide reasonable weights for histograms of the three descriptors of each block. After further weighted modulation, the statistics of the histograms of the three descriptors are concatenated into a single value to build the global description of ST_D. The experimental results demonstrate the great advantage of our features relative to those of the rich model (RM), the subtractive pixel adjacency model (SPAM) and subtractive prediction error adjacency matrix (SPEAM), especially for compressed videos, which constitute most Internet videos.

사용자 피드백 기반의 적응적 가중치를 이용한 정지영상 검색 (Image Retrieval using Adaptable Weighting Scheme on Relevance Feedback)

  • 이진수;김현준;윤경로;이희연
    • 방송공학회논문지
    • /
    • 제5권1호
    • /
    • pp.61-67
    • /
    • 2000
  • 사용자 피드백은 일반적으로 사용자가 의도하는 정지영상 검색 조건을 기술하는 데만 주로 사용되어 왔다. 그러나, 본 논문에서는 사용자 피드백을 정지영상의 특징을 기술하는데 사용함으로써 사용자에 의존적이지 않은 정지영상 검색에 적용하였다. 그리고 본 논문에서는 사용자 피드백을 사용하여 각 정지영상마다 고유한 특징을 반영하도록 특징 정보와 관련된 가중치를 전문가에 비중을 두어 학습시킴으로써, 일반적인 검색 성능을 향상시킬 수 있다. 이러한 시스템을 구축하기 위해 본 논문에서는 칼라 기술자와 텍스쳐 기술자를 기반으로 한 전역 특징 정보와 지역 특징 정보, 그리고 각 기술자들간의 가중치와 기술자 내의 요소 가중치로 구성된 정지영상 기술 구조를 제안하고, 또한 잘못된 학습을 방지하기 위해 신뢰도에 기반한 가중치 학습 방법을 소개한다.

  • PDF

Person-Independent Facial Expression Recognition with Histograms of Prominent Edge Directions

  • Makhmudkhujaev, Farkhod;Iqbal, Md Tauhid Bin;Arefin, Md Rifat;Ryu, Byungyong;Chae, Oksam
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권12호
    • /
    • pp.6000-6017
    • /
    • 2018
  • This paper presents a new descriptor, named Histograms of Prominent Edge Directions (HPED), for the recognition of facial expressions in a person-independent environment. In this paper, we raise the issue of sampling error in generating the code-histogram from spatial regions of the face image, as observed in the existing descriptors. HPED describes facial appearance changes based on the statistical distribution of the top two prominent edge directions (i.e., primary and secondary direction) captured over small spatial regions of the face. Compared to existing descriptors, HPED uses a smaller number of code-bins to describe the spatial regions, which helps avoid sampling error despite having fewer samples while preserving the valuable spatial information. In contrast to the existing Histogram of Oriented Gradients (HOG) that uses the histogram of the primary edge direction (i.e., gradient orientation) only, we additionally consider the histogram of the secondary edge direction, which provides more meaningful shape information related to the local texture. Experiments on popular facial expression datasets demonstrate the superior performance of the proposed HPED against existing descriptors in a person-independent environment.

실시간 다중 객체 인식 및 추적 기법 (Real-time Multi-Objects Recognition and Tracking Scheme)

  • 김대훈;노승민;황인준
    • 한국항행학회논문지
    • /
    • 제16권2호
    • /
    • pp.386-393
    • /
    • 2012
  • 본 논문에서는 객체의 관심점(interest points)에 대한 지역 특징 기술자를 이용하여 이미지나 동영상에서 다수의 관심 객체를 효과적으로 인식하고 추적하기 위한 기법을 제안한다. 이를 위해 먼저 대상이 되는 객체를 포함하는 다양한 이미지를 수집하고 SURF 알고리즘을 적용하여 객체의 관심점과 그들에 대한 지역 특징 기술자를 생성한다. 지역 특징에 대한 통계적인 분석을 통하여 관심점들 중에서 해당 객체의 특성을 가장 잘 표현하는 대표점(representative points)을 선택하고 이를 바탕으로 이미지에 존재하는 객체를 인식한다. 또한, 지역 특징 기술자의 정합을 응용하여 각 SURF 지점들의 움직임 벡터를 생성하고 이를 기반으로 실시간으로 객체를 추적한다. 제안하는 기법은 모든 객체를 독립적으로 다루기 때문에, 여러 개의 객체를 동시에 인식하고 추적할 수 있다. 다양한 실험을 통해, 동영상에서 객체의 존재 여부 및 종류를 신속하게 판별하고 관심 객체의 추적을 효과적으로 수행할 수 있음을 보인다.

영상 검색을 위한 점진적 블록 크기 기반의 효율적인 손실 좌표 압축 기술 (Gradual Block-based Efficient Lossy Location Coding for Image Retrieval)

  • 최경민;정현일;김해광
    • 방송공학회논문지
    • /
    • 제18권2호
    • /
    • pp.319-322
    • /
    • 2013
  • MPEG-7 CDVS (Compact Descriptor for Visual Search)분야에서 표준화하고 있는 현대의 모바일 디바이스 및 서버에서 사용되는 영상검색과 매칭 알고리즘들은 SIFT(scale invariant feature transform)와 SURF(speeded up robust features) 같은 강인한 디스크립터를 기반으로 하는 특징 점에 의한 알고리즘으로 이루어진다. 이러한 특징 점들은 크게 좌표와 디스크립터로 나누어져 있다. 빠르고 정확한 검색을 위해서 특징 점들은 디바이스에서 서버, 또는 서버에서 디바이스로 자유롭게 전송이 되어야 하므로 과거에 여러 압축 알고리즘들이 제안 되었다. 이 논문에서는 특징 점들의 분포 및 연관성 등을 관찰하고 연구하여 좌표의 정보를 효율적으로 압축하면서 정확도를 보존할 수 있는 점진적 블록 크기 기반의 손실 좌표 압축 알고리즘을 제안한다. 실험 결과로부터 현재 가장 효율이 좋은 알고리즘 보다 특징 점당 비트가 평균적으로 0.3~0.4bit(5%~6%) 감소하고 정확도(TP,FP,TN)가 데이터 종류에 따라 유지되거나 미약하게 상승하는 결과를 얻었다.

Visual Semantic Based 3D Video Retrieval System Using HDFS

  • Ranjith Kumar, C.;Suguna, S.
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권8호
    • /
    • pp.3806-3825
    • /
    • 2016
  • This paper brings out a neoteric frame of reference for visual semantic based 3d video search and retrieval applications. Newfangled 3D retrieval application spotlight on shape analysis like object matching, classification and retrieval not only sticking up entirely with video retrieval. In this ambit, we delve into 3D-CBVR (Content Based Video Retrieval) concept for the first time. For this purpose we intent to hitch on BOVW and Mapreduce in 3D framework. Here, we tried to coalesce shape, color and texture for feature extraction. For this purpose, we have used combination of geometric & topological features for shape and 3D co-occurrence matrix for color and texture. After thriving extraction of local descriptors, TB-PCT (Threshold Based- Predictive Clustering Tree) algorithm is used to generate visual codebook. Further, matching is performed using soft weighting scheme with L2 distance function. As a final step, retrieved results are ranked according to the Index value and produce results .In order to handle prodigious amount of data and Efficacious retrieval, we have incorporated HDFS in our Intellection. Using 3D video dataset, we fiture the performance of our proposed system which can pan out that the proposed work gives meticulous result and also reduce the time intricacy.

텍스처 기술자들을 이용한 이질적 얼굴 인식 시스템 (Heterogeneous Face Recognition Using Texture feature descriptors)

  • 배한별;이상윤
    • 한국정보전자통신기술학회논문지
    • /
    • 제14권3호
    • /
    • pp.208-214
    • /
    • 2021
  • 최근 많은 지능형 보안 시나리오 및 범죄수사에서는 사진이 아닌 얼굴 영상과 다수의 정면 사진과의 매칭을 요구한다. 기존의 얼굴 인식 시스템은 이러한 요구를 충분히 충족시킬 수 없다. 본 논문에서는 동일 인물의 스케치와 사진 간의 양식 차이를 줄임으로써, 이질적 얼굴 인식 시스템의 성능을 향상시키는 알고리즘을 제안한다. 제안하는 알고리즘은 텍스처 기술자들(그레이 레벨 동시 발생 행렬, 멀티스케일 지역 이진 패턴)을 통하여 영상의 텍스처 특징들을 각각 추출하고, 이를 바탕으로 고유특징 정규화 및 추출기법을 통해 변환 행렬을 생성하게 된다. 이렇게 생성된 벡터들 간 계산된 스코어 값은 스코어 정규화 방식들을 통하여 최종적으로 스케치 영상의 신원을 인식하게 된다.