• 제목/요약/키워드: Distance Feature

검색결과 822건 처리시간 0.029초

3D Face Recognition using Local Depth Information

  • 이영학;심재창;이태홍
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권11호
    • /
    • pp.818-825
    • /
    • 2002
  • 얼굴의 깊이 정보는 얼굴 인식에서 가장 중요한 요소이다. 3차원 얼굴 영상은 깊이 정보를 잘 나타내므로 얼굴의 깊이 값을 비교하는데 아주 유용하다. 얼굴 전체에 대한 처리는 많은 계산량과 데이터 량을 포함해야 하는 문제점이 있다. 따라서 본 논문에서는 얼굴의 국부적인 영역들에 대한 3차원 깊이 값을 이용하여 인식하였다. 3D 레이저 스캐너로 입력된 3차원 얼굴 영상으로부터 어떤 깊이에 있는 등고선 영역을 추출한 후, 이를 영역별로 취하면 국부적인 얼굴 깊이에 대한 특징을 잘 반영하게 된다. 얼굴의 가장 중심인 코를 기준점으로 깊이 영역에 대한 등고선 영역을 추출하며, 얼굴의 깊이를 고려한 국부적 깊이 정보를 다중 특징 벡터를 이용하여 얼굴을 인식한다. 다중 특징 벡터는 벡터 수가 적으면서 얼굴의 지역적 깊이 특성을 잘 나타내므로 간단한 방법으로 높은 인식률을 얻을 수 있었다.

Filtering of Filter-Bank Energies for Robust Speech Recognition

  • Jung, Ho-Young
    • ETRI Journal
    • /
    • 제26권3호
    • /
    • pp.273-276
    • /
    • 2004
  • We propose a novel feature processing technique which can provide a cepstral liftering effect in the log-spectral domain. Cepstral liftering aims at the equalization of variance of cepstral coefficients for the distance-based speech recognizer, and as a result, provides the robustness for additive noise and speaker variability. However, in the popular hidden Markov model based framework, cepstral liftering has no effect in recognition performance. We derive a filtering method in log-spectral domain corresponding to the cepstral liftering. The proposed method performs a high-pass filtering based on the decorrelation of filter-bank energies. We show that in noisy speech recognition, the proposed method reduces the error rate by 52.7% to conventional feature.

  • PDF

Audio Fingerprint Retrieval Method Based on Feature Dimension Reduction and Feature Combination

  • Zhang, Qiu-yu;Xu, Fu-jiu;Bai, Jian
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권2호
    • /
    • pp.522-539
    • /
    • 2021
  • In order to solve the problems of the existing audio fingerprint method when extracting audio fingerprints from long speech segments, such as too large fingerprint dimension, poor robustness, and low retrieval accuracy and efficiency, a robust audio fingerprint retrieval method based on feature dimension reduction and feature combination is proposed. Firstly, the Mel-frequency cepstral coefficient (MFCC) and linear prediction cepstrum coefficient (LPCC) of the original speech are extracted respectively, and the MFCC feature matrix and LPCC feature matrix are combined. Secondly, the feature dimension reduction method based on information entropy is used for column dimension reduction, and the feature matrix after dimension reduction is used for row dimension reduction based on energy feature dimension reduction method. Finally, the audio fingerprint is constructed by using the feature combination matrix after dimension reduction. When speech's user retrieval, the normalized Hamming distance algorithm is used for matching retrieval. Experiment results show that the proposed method has smaller audio fingerprint dimension and better robustness for long speech segments, and has higher retrieval efficiency while maintaining a higher recall rate and precision rate.

실시간 학습 방법을 이용한 베어링 고장진단 성능 개선 (Performance Improvement of Bearing Fault Diagnosis Using a Real-Time Training Method)

  • 조윤정;김재영;김종면
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제7권4호
    • /
    • pp.551-559
    • /
    • 2017
  • 본 논문에서는 베어링 고장진단 성능을 개선하기 위해 실시간 학습 방법을 제안한다. 기존 베어링 고장진단의 문제점은 학습되지 않은 상태에 대해 올바른 분류를 할 수 없다는 점이다. 제안한 4단계 실시간 학습 방법은 새로운 상태를 실시간으로 인지 및 학습하여 새로운 상태의 데이터를 올바르게 분류할 수 있다. 1단계에서는 학습 정보에서 각 클래스의 무게중심과 그 클래스 내 각 특징벡터 사이의 유클리디안 거리를 계산하여 각 클래스별로 거리의 최대값을 계산한다. 2단계에서는 새로 취득된 데이터의 특징벡터와 각 클래스의 무게중심 사이의 유클리디안 거리를 계산하고 각 클래스별 최대 허용 거리와 비교한다. 3단계에서는 새로 취득된 데이터들과 각 클래스 내 무게중심 사이의 거리가 각 클래스의 최대 허용 거리보다 모두 클 경우 새로운 상태의 데이터로 인지하고 새로운 상태 인지 횟수를 증가시킨다. 마지막 4단계에서는 새로운 상태 인지 회수가 10보다 클 경우 새로운 상태의 클래스를 생성하기 위해 새로운 상태로 인지된 10개의 데이터를 새로운 상태의 클래스로 지정하고 분류기를 재학습시킨다. 제안한 방법의 성능을 검증하기 위해 실제 베어링 결함 데이터를 사용하여 제안한 실시간 학습 방법의 효율성을 검증하였다.

구조물의 품질 결함 변별력 증대를 위한 수직 에너지 기반의 웨이블릿 Feature 생성 (Structural Quality Defect Discrimination Enhancement using Vertical Energy-based Wavelet Feature Generation)

  • 김준석;정욱
    • 품질경영학회지
    • /
    • 제36권2호
    • /
    • pp.36-44
    • /
    • 2008
  • In this paper a novel feature extraction and selection is carried out in order to improve the discriminating capability between healthy and damaged structure using vibration signals. Although many feature extraction and selection algorithms have been proposed for vibration signals, most proposed approaches don't consider the discriminating ability of features since they are usually in unsupervised manner. We proposed a novel feature extraction and selection algorithm selecting few wavelet coefficients with higher class discriminating capability for damage detection and class visualization. We applied three class separability measures to evaluate the features, i.e. T test statistics, divergence, and Bhattacharyya distance. Experiments with vibration signals from truss structure demonstrate that class separabilities are significantly enhanced using our proposed algorithm compared to other two algorithms with original time-based features and Fourier-based ones.

2D Shape Recognition System Using Fuzzy Weighted Mean by Statistical Information

  • Woo, Young-Woon;Han, Soo-Whan
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2008년도 제39차 동계학술발표논문집 16권2호
    • /
    • pp.49-54
    • /
    • 2009
  • A fuzzy weighted mean method on a 2D shape recognition system is introduced in this paper. The bispectrum based on third order cumulant is applied to the contour sequence of each image for the extraction of a feature vector. This bispectral feature vector, which is invariant to shape translation, rotation and scale, represents a 2D planar image. However, to obtain the best performance, it should be considered certain criterion on the calculation of weights for the fuzzy weighted mean method. Therefore, a new method to calculate weights using means by differences of feature values and their variances with the maximum distance from differences of feature values. is developed. In the experiments, the recognition results with fifteen dimensional bispectral feature vectors, which are extracted from 11.808 aircraft images based on eight different styles of reference images, are compared and analyzed.

  • PDF

DMS 모델을 이용한 한국어 음성 인식 (Korean Speech Recognition using Dynamic Multisection Model)

  • 안태옥;변용규;김순협
    • 대한전자공학회논문지
    • /
    • 제27권12호
    • /
    • pp.1933-1939
    • /
    • 1990
  • In this paper, we proposed an algorithm which used backtracking method to get time information, and it be modelled DMS (Dynamic Multisection) by feature vectors and time information whic are represented to similiar feature in word patterns spoken during continuous time domain, for Korean Speech recognition by independent speaker using DMS. Each state of model is represented time sequence, and have time information and feature vector. Typical feature vector is determined as the feature vector of each state to minimize the distance between word patterns. DDD Area names are selected as recognition wcabulary and 12th LPC cepstrum coefficients are used as the feature parameter. State of model is made 8 multisection and is used 0.2 as weight for time information. Through the experiment result, recognition rate by DMS model is 94.8%, and it is shown that this is better than recognition rate (89.3%) by MSVQ(Multisection Vector Quantization) method.

  • PDF

형태분석에 의한 특징 추출과 BP알고리즘을 이용한 정면 얼굴 인식 (Full face recognition using the feature extracted gy shape analyzing and the back-propagation algorithm)

  • 최동선;이주신
    • 전자공학회논문지B
    • /
    • 제33B권10호
    • /
    • pp.63-71
    • /
    • 1996
  • This paper proposes a method which analyzes facial shape and extracts positions of eyes regardless of the tilt and the size of input iamge. With the extracted feature parameters of facial element by the method, full human faces are recognized by a neural network which BP algorithm is applied on. Input image is changed into binary codes, and then labelled. Area, circumference, and circular degree of the labelled binary image are obtained by using chain code and defined as feature parameters of face image. We first extract two eyes from the similarity and distance of feature parameter of each facial element, and then input face image is corrected by standardizing on two extracted eyes. After a mask is genrated line historgram is applied to finding the feature points of facial elements. Distances and angles between the feature points are used as parameters to recognize full face. To show the validity learning algorithm. We confirmed that the proposed algorithm shows 100% recognition rate on both learned and non-learned data for 20 persons.

  • PDF

얼굴의 다중특징을 이용한 인증 시스템 구현 (A study on the implementation of identification system using facial multi-feature)

  • 정택준;문용선;박병석
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2002년도 춘계종합학술대회
    • /
    • pp.448-451
    • /
    • 2002
  • 본 연구는 인식의 정확성을 향상시키기 위하여 단일 특징을 이용한 인식 대신에 다중 특징을 이용하는 인식방법을 제안한다. 각각의 특징은 다음과 같은 방법으로 구하여진다. 얼굴 전체의 특징은 웨이블렛 다해상도 분해와 주성분 분석방법으로 계산하였고, 입술의 경우는 입술의 경계를 구한 후 최소 자승법을 이용한 방정식의 계수를 구하였으며, 또 하나의 특징은 얼굴요소의 거리 비율에 의해 구하였다. 위 값들을 입력으로 한 역전파 학습 알고리즘으로 분류하여 실험하여 제안된 방범의 유효성을 확인하였다.

  • PDF

Housdorff Distance 와 Hough Transform을 적용한 얼굴인식시스템의 분석 (An Analysis on Face Recognition system of Housdorff Distance and Hough Transform)

  • 조민환
    • 한국컴퓨터산업학회논문지
    • /
    • 제8권3호
    • /
    • pp.155-166
    • /
    • 2007
  • 본 연구에서는 얼굴 영상을 캡쳐하여 전 처리한 후 얼굴영역을 분리하고, 분리된 얼굴 영역에서 미분 연산자와 최소 형태를 세선화하여 특징을 추출하였다. Hough Transform은 $r-\theta$ 평면에서 직선의 기울기와 절편으로 변환되며, 반면 Housdorff distance는 세선화된 영상에서 선분을 추출하여 길이, 회전, 천이 특징을 추출하였다. 사람마다 다른 특징들을 추출하여 Housdorff distance과 Hough Transform에 관하여 비교분석 결과 Hough변환의 복잡도가 더 적은 것으로 판단되었다. 인식율은 Housdorff Distance를 이용한 인식율이 Hough Transformation에 비해 조금 높게 나타났다.

  • PDF