• 제목/요약/키워드: reference feature

검색결과 426건 처리시간 0.027초

MPEG-7 오디오 하위 서술자를 이용한 음악 검색 방법에 관한 연구 (A Study on the Music Retrieval System using MPEG-7 Audio Low-Level Descriptors)

  • 박만수;박철의;김회린;강경옥
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2003년도 정기총회 및 학술대회
    • /
    • pp.215-218
    • /
    • 2003
  • 본 논문에서는 MPEG-7에 정의된 오디오 서술자를 이용한 오디오 특징을 기반으로 한 음악 검색 알고리즘을 제안한다. 특히 timbral 특징들은 음색 구분을 용이하게 할 수 있어 음악 검색뿐만 아니라 음악 장르 분류 또는 Query by humming에 이용 될 수 있다. 이러한 연구를 통하여 오디오 신호의 대표적인 특성을 표현 할 수 있는 특징벡터를 구성 할 수 있다면 추후에 멀티모달 시스템을 이용한 검색 알고리즘에도 오디오 특징으로 이용 될 수 있을 것이다 본 논문에서는 방송 시스템에 적용 할 수 있도록 검색 범위를 특정 컨텐츠의 O.S.T 앨범으로 제한하였다. 즉, 사용자가 임의로 선택한 부분적인 오디오 클립만을 이용하여 그 컨텐츠 전체의 O.S.T 앨범 내에서 음악을 검색할 수 있도록 하였다. 오디오 특징벡터를 구성하기 위한 MPEG-7 오디오 서술자의 조합 방법을 제안하고 distance 또는 ratio 계산 방식을 통해 성능 향상을 추구하였다. 또한 reference 음악의 템플릿 구성 방식의 변화를 통해 성능 향상을 추구하였다. Classifier로 k-NN 방식을 사용하여 성능 평가를 수행한 결과 timbral spectral feature들의 비율을 이용한 IFCR(Intra-Feature Component Ratio) 방식이 Euclidean distance 방식보다 우수한 성능을 보였다.

  • PDF

SOM기반 특징 신호 추출 기법을 이용한 불균형 주기 신호의 이상 탐지 (Fault Detection of Unbalanced Cycle Signal Data Using SOM-based Feature Signal Extraction Method)

  • 김송이;강지훈;박종혁;김성식;백준걸
    • 한국시뮬레이션학회논문지
    • /
    • 제21권2호
    • /
    • pp.79-90
    • /
    • 2012
  • 본 연구는 공정신호가 불균형 데이터인 경우 이상 탐지 알고리즘의 성능 개선을 위한 특징 신호 추출 기법을 제안한다. 불균형 데이터란 범주 구분 문제에서 하나의 범주의 속하는 데이터의 비율이 다른 범주의 데이터에 비해 크게 차이나 이상 탐지성능이 크게 저하되는 경우를 의미한다. 공정이 운영되는 경우 얻을 수 있는 이상 신호의 수는 정상 신호에 비해 매우 적기에 이러한 문제를 해결하여 이상 탐지 기법을 적용하는 것은 매우 중요하다. 불균형 문제 해결을 위해 SOM(Self-Organizing Map) 알고리즘을 이용하여 각 노드에 대응되는 가중치를 특징 신호로 간주하여 정상 데이터와 이상 데이터의 비율을 맞춘다. 특징 신호 데이터 집단의 이상 탐지를 위해 클래스 분류 기법인 kNN(k-Nearest Neighbor)과 SVM(Support Vector Machine)을 적용하여 이를 공정 신호 이상탐지를 위해 주로 사용하는 Hotelling's $T^2$ 관리도와 성능을 비교한다. 반도체 공정에서 발생한다고 알려진 공정 신호를 모사하여 신호 알고리즘 성능의 우수성을 검증한다.

Reliability improvement of nonlinear ultrasonic modulation based fatigue crack detection using feature-level data fusion

  • Lim, Hyung Jin;Kim, Yongtak;Sohn, Hoon;Jeon, Ikgeun;Liu, Peipei
    • Smart Structures and Systems
    • /
    • 제20권6호
    • /
    • pp.683-696
    • /
    • 2017
  • In this study, the reliability of nonlinear ultrasonic modulation based fatigue crack detection is improved using a feature-level data fusion approach. When two ultrasonic inputs at two distinct frequencies are applied to a specimen with a fatigue crack, modulation components at the summation and difference of these two input frequencies appear. First, the spectral amplitudes of the modulation components and their spectral correlations are defined as individual features. Then, a 2D feature space is constructed by combining these two features, and the presence of a fatigue crack is identified in the feature space. The effectiveness of the proposed fatigue crack detection technique is experimentally validated through cyclic loading tests of aluminum plates, full-scale steel girders and a rotating shaft component. Subsequently, the improved reliability of the proposed technique is quantitatively investigated using receiver operating characteristic analysis. The uniqueness of this study lies in (1) improvement of nonlinear ultrasonic modulation based fatigue crack detection reliability using feature-level data fusion, (2) reference-free fatigue crack diagnosis without using the baseline data obtained from the intact condition of the structure, (3) application to full-scale steel girders and shaft component, and (4) quantitative investigation of the improved reliability using receiver operating characteristic analysis.

무게중심과 정점 간의 거리 특성을 이용한 삼각형 메쉬의 정렬 (The Alignment of Triangular Meshes Based on the Distance Feature Between the Centroid and Vertices)

  • 구민정;정상훈;김구진
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권12호
    • /
    • pp.525-530
    • /
    • 2022
  • 두 개의 점군(point cloud)을 정렬(alignment)하기 위해 현재까지 ICP(iterative closest point) 알고리즘이 널리 사용되고 있지만, ICP는 두 점군의 초기 방향이 크게 다를 경우 정렬에 실패하는 경우가 많다. 본 논문에서는 두 개의 삼각형 메쉬 A, B가 서로 크게 다른 초기 방향을 가질 때, 이들을 정렬하는 알고리즘을 제안한다. 메쉬 A, B에 대해 각각 가중치 무게중심(weighted centroid)을 구한 뒤, 무게중심으로부터 정점까지의 거리를 이용하여 메쉬 간에 서로 대응될 가능성이 있는 정점들을 특징점으로 설정한다. 설정된 특징점들이 대응될 수 있도록 메쉬 B를 회전한 뒤, A와 B의 정점들에 대해 RMSD(root mean square deviation)를 측정한다. RMSD가 기준치보다 작은 값을 가질 때까지 특징점을 변경하며 같은 과정을 되풀이하여 정렬된 결과를 얻는다. 실험을 통해 ICP 및 Go-ICP 알고리즘으로 정렬이 실패할 경우에도 제안된 알고리즘으로 정렬이 가능함을 보인다.

Development of Virtual Makeup Tool based on Mobile Augmented Reality

  • Song, Mi-Young;Kim, Young-Sun
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권1호
    • /
    • pp.127-133
    • /
    • 2021
  • 본 연구에서는 얼굴형 기준 모델 데이터를 기반으로 사용자의 얼굴형을 분석하고 얼굴 형 메이크업을 제공하여 가상 메이크업을 제공하기 위해 증강 현실 기반 메이크업 도구를 구축하였다. 얼굴형을 분석하려면 먼저 카메라로 촬영 한 이미지에서 얼굴을 인식 한 다음 얼굴 윤곽 영역의 특징을 추출하여 분석 속성으로 사용한다. 다음으로 각 얼굴형 기준 모델 데이터의 윤곽 영역 특징과 비교하기 위해 추출된 얼굴 윤곽 영역의 특징점을 정규화한다. 얼굴 모양은 정규화된 윤곽 영역의 특징점과 각 얼굴형 기준 모델 데이터의 특징점 사이의 거리 차이를 이용하여 예측 분석한다. 증강형실기반 가상메이크업에서는 카메라로부터 영상 입력에서는 영상에서 얼굴을 실시간으로 인식하여 얼굴 부위별 영역의 특징점을 추출하고, 얼굴형 분석처리과정을 통해 분석된 얼굴형에 따라 어울리는 메이크업을 제공하여 가상의 메이크업의 결과를 확인 할 수 있다. 우리는 제안된 시스템을 통해 화장품 소비자로 하여금 자신에게 어울리는 메이크업 디자인을 확인하여 화장품 구매 결정에 대한 편의 및 영향을 미칠 것으로 기대한다. 또한 가상의 자아에 얼굴 메이크업을 적용함으로써 매력적인 자신의 이미지를 만들어내는데 도움을 줄 것이다.

Universal SSR Small Signal Stability Analysis Program of Power Systems and its Applications to IEEE Benchmark Systems

  • Kim, Dong-Joon;Nam, Hae-Kon;Moon, Young-Hwan
    • KIEE International Transactions on Power Engineering
    • /
    • 제3A권3호
    • /
    • pp.139-147
    • /
    • 2003
  • The paper presents a novel approach of constructing the state matrix of the multi-machine power system for SSR (subsynchronous resonance) analysis using the linearized equations of individual devices including electrical transmission network dynamics. The machine models in the local d-q reference frame are integrated with the network models in the common R-I reference frame by simply transforming their output equations into the R-I frame where the transformed output is used as the input to the network dynamics or vice versa. The salient feature of the formulation is that it allows for modular construction of various component models without rearranging the overall state space formulation. This universal SSR small signal stability program provides a flexible tool for systematic analyses of SSR small-signal stability impacts of both conventional devices such as generation systems and novel devices such as power electronic apparatus and their controllers. The paper also presents its application results to IEEE benchmark models.

회전불변 패턴인식을 위한 WCHF-FSJTC (Wavelet circular harmonic function frequency selective joint transform correlator for rotation invariant pattern recognition)

  • 방준학;이하운;노덕수;김수중
    • 전자공학회논문지S
    • /
    • 제34S권2호
    • /
    • pp.94-103
    • /
    • 1997
  • The WCHF-FSJTC (wavelet circular harmonic function frequency selective joint transform correlator) using th wavelet transformed CHF as the reference image in FSJTC is proposed for rotation invariant pattern recognition. Since the wavelet transform has the property of feature extraction, the proposed system can have the better DC (discrimination cpability) and the higher SNR(signal to noise ratio) compared with the conventional CHF-CJTC(circular harmonic function conventional joint transform correlator). And since the structure of the proposed system is FSJTC which can eliminate auto-correlation and cross-correlation between input images, it can eliminate false alarm caused by the overlapping among correlation peaks. The used wavelet functio is the morlet function, which is proper for the reference image used in this paper. the optimal dialation parameter and oscillation frequency of the wavelet function are also achieved with varying the parameters of the wavelet function. The computer simulation shows that the proposed system has the best performance when the dilation parameter is 0.8 and the oscillation frequency is 0.48.

  • PDF

Class-Based Histogram Equalization for Robust Speech Recognition

  • Suh, Young-Joo;Kim, Hoi-Rin
    • ETRI Journal
    • /
    • 제28권4호
    • /
    • pp.502-505
    • /
    • 2006
  • A new class-based histogram equalization method is proposed for robust speech recognition. The proposed method aims at not only compensating the acoustic mismatch between training and test environments, but also at reducing the discrepancy between the phonetic distributions of training and test speech data. The algorithm utilizes multiple class-specific reference and test cumulative distribution functions, classifies the noisy test features into their corresponding classes, and equalizes the features by using their corresponding class-specific reference and test distributions. Experiments on the Aurora 2 database proved the effectiveness of the proposed method by reducing relative errors by 18.74%, 17.52%, and 23.45% over the conventional histogram equalization method and by 59.43%, 66.00%, and 50.50% over mel-cepstral-based features for test sets A, B, and C, respectively.

  • PDF

자동차 소음 환경에서 음성 인식 (Speech Recognition in the Car Noise Environment)

  • 김완구;차일환;윤대희
    • 전자공학회논문지B
    • /
    • 제30B권2호
    • /
    • pp.51-58
    • /
    • 1993
  • This paper describes the development of a speaker-dependent isolated word recognizer as applied to voice dialing in a car noise environment. for this purpose, several methods to improve performance under such condition are evaluated using database collected in a small car moving at 100km/h The main features of the recognizer are as follow: The endpoint detection error can be reduced by using the magnitude of the signal which is inverse filtered by the AR model of the background noise, and it can be compensated by using variants of the DTW algorithm. To remove the noise, an autocorrelation subtraction method is used with the constraint that residual energy obtainable by linear predictive analysis should be positive. By using the noise rubust distance measure, distortion of the feature vector is minimized. The speech recognizer is implemented using the Motorola DSP56001(24-bit general purpose digital signal processor). The recognition database is composed of 50 Korean names spoken by 3 male speakers. The recognition error rate of the system is reduced to 4.3% using a single reference pattern for each word and 1.5% using 2 reference patterns for each word.

  • PDF

서명검증에서 특징값을 고려한 판단 경계 설정에 관한 연구 (Determination of Decision Boundary Using Feature Values in the Signature Verification)

  • 이흥열;김재희
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1999년도 추계종합학술대회 논문집
    • /
    • pp.464-467
    • /
    • 1999
  • Usually, more reference signatures result in better performance in signature verification. However, registering .many signatures may be a tedious work for users, so algorithms that use less signatures for the registration without increasing error rate is needed. In this paper, we find the features such as pen-down duration, the number of locally minimum velocity points, and the number of locally maximum curvature points. Then we find the relationship between these features and the optimal decision boundary. We apply this relationship in deciding threshold for signature verification. Experimental results show that the method using three reference signatures has almost same error rate as algorithms with many references.

  • PDF