DOI QR코드

DOI QR Code

컴뮤트 타임 기반의 다양체 임베딩을 이용한 파형 신호 인식에 관한 연구

A Study on Classification of Waveforms Using Manifold Embedding Based on Commute Time

  • 한희일 (한국외국어대학교 정보통신공학과)
  • Hahn, Hee-Il (Department of Information and Communications Engineering, Hankuk University of Foreign Studies)
  • 투고 : 2013.11.18
  • 발행 : 2014.02.25

초록

본 논문에서는 파형 신호에서 패치를 추출하고 이를 패치 그래프로 구성한 다음, 이로부터 대표적인 다양체 임베딩 방식인 컴뮤트 타임 임베딩 기법을 구현하고, 이의 특성을 분석한다. 특히 음성 신호나 악기 음 등, 시간에 따라 스펙트럼이 가변적인 신호를 임베딩하면 스펙트럼의 변화에도 불구하고 그 신호 고유의 기하 구조를 생섬함을 실험으로 확인한다. 다양체 임베딩은 비선형 공간에 놓여 있는 고차원 데이터를 저차원 공간으로의 효율적인 맵을 가능하게 하지만 그래프 구성에 이용된 데이터에 대한 정보만 알 수 있고 그렇지 않은 데이터(out-of-sample data)에 대해서는 정보를 얻기 어렵다. 따라서 다양체 임베딩은 데이터 클러스터링에 적절히 적용 가능하지만, 훈련 과정을 통해 얻은 정보를 기초로 유추 기능이 요구되는 인식 등에는 응용하기 어려운 제약이 따른다. 이를 해결하기 위하여 본 논문에서는 다양체 임베딩이 인식 분야에도 적용 가능하도록 새로운 알고리즘을 제안하고 악기 음 분류 실험을 통하여 그 특성을 분석한다.

In this paper a commute time embedding is implemented by organizing patches according to the graph-based metric, and its properties are investigated via changing the number of nodes on the graph.. It is shown that manifold embedding methods generate the intrinsic geometric structures when waveforms such as speech or music instrumental sound signals are embedded on the low dimensional Euclidean space. Basically manifold embedding algorithms only project the training samples on the graph into an embedding subspace but can not generalize the learning results to test samples. They are very effective for data clustering but are not appropriate for classification or recognition. In this paper a commute time guided transform is adopted to enhance the generalization ability and its performance is analyzed by applying it to the classification of 6 kinds of music instrumental sounds.

키워드

참고문헌

  1. M. Belkin and P. Niyogi, "Laplacian eigenmaps for dimensionality reduction and data representation," Neural Computation15(6), pp.1373-1396, 2003. https://doi.org/10.1162/089976603321780317
  2. M. Brito, E. Chavez, A. Quiroz, and J. Yukich, "Connectivity of the mutual k-nearest-neighbor graph in clustering and outlier detection," Statistics and Probability Letter, 1997.
  3. F. Chung, Spectral graph theory, American Mathematical Society, 1997.
  4. R.R. Coifman and S. Lafon, "Diffusion maps," Applied and Computational Harmonic Analysis, pp.5-30, 2006.
  5. Y. Deng, Q. Dai, R. Wang, Z. Zhang, "Commute time guided transformation for feature extraction," Computer Vision and Image Understanding 116(2012) pp. 473-483. https://doi.org/10.1016/j.cviu.2011.11.002
  6. D.L. Donoho and C. Grimes,"Hessian eigenmaps: new locally linear embedding techniques for high dimensional data," Proceedings of the National Academy of Sciences, pp.5591-5596, 2003.
  7. M. Cho, Y. Lee, and E. Kim, "Dimensionality reduction by manifold learning," IEEK Fall Conference 2008.
  8. H. Qiu and E.R. Hancock, "Clustering and embedding using commute times," IEEE Trans. PAMI, Vol. 29, No. 11, Nov., 2007.
  9. S.T. Roweis and L.K. Saul, "Nonlinear dimensionality reduction by locally linear embedding," Science Vol.290, 2000.
  10. M. Saerens, F. Fouss, L. Yen, and P. Dupont, "The principal component analysis of a graph, and its relationships to spectral clustering," Machine Learning: ECML 2004, pp. 371-383.
  11. K.M. Taylor, "The geometry of signal and image patch-sets," PhD Thesis, University of Colorado, Boulder, Dept. of Applied Mathematics, June 2011.
  12. J.B. Tenenbaum, V. deSilva, and J.C. Langford, "A global geometric framework for nonlinear dimensionality reduction," Science, Vol. 290, pp.2319-2323, 2000. https://doi.org/10.1126/science.290.5500.2319
  13. U. von Luxburg, A. Radl, and M. Hein, "Getting lost in space: Large sample analysis of the commute distance," Neural Information Processing Systems (NIPS), 2010.