행렬기반의 정합 알고리듬에 의한 음악 기호의 인식

A Matrix-Based Graph Matching Algorithm with Application to a Musical Symbol Recognition

  • 허경용 (연세대학교 기계전자공학부) ;
  • 장경식 (부산 동의대학교 멀티미디어학과) ;
  • 장문익 (연세대학교 기계전자공학부) ;
  • 김재희 (연세대학교 기계전자공학부)
  • 발행 : 1998.08.01

초록

패턴 인식의 분야에서 그래프는 복잡한 대상체의 표현 및 인식의 도구로서 많이 사용되지만, 그래프간의 유사성 비교에는 많은 시간이 소요될 뿐아니라 실제 입력되는 영상은 왜곡으로 인해 저장되어 있는 이상적인 영상과 동일함을 기대할 수 없으므로 유사한 정도를 판별하는 기준이 마련되어야만 한다. 이 논문에서는 행렬을 그래프의 표현 수단으로 사용하였다. 행렬은 표현이 간단하며, 정의되어 있는 연산을 통해 순서 배열 및 매칭 과정을 간단히 수행하루 수 있다. 이 때 그래프를 구성하는 노드(node)들을 기하학적 위치에 따라 순서 배열함으로써 그래프를 구성하는 노드들 사이의 대응 관계를 효율적으로 찾을 수 있도록 하였으며, 또한 왜곡으로 인하여 기호를 표현하는 그래프의 노드가 제대로 추출되지 못한 경우는 기호의 구조를 고려하여 보정해 줄 수 있는 분할 과정을 도입하여 해결하였다. 제안한 방법은 악보의 비음표 기호 인식을 통해 실험하였으며, 실험 결과 95% 정도의 인식률을 얻을 수 있었다.

In pattern recognition and image analysis upplications, a graph is a useful tool for complex obect representation and recognition. However it takes much time to pair proper nodes between the prototype graph and an input data graph. Futhermore it is difficult to decide whether the two graphs in a class are the same hecause real images are degradd in general by noise and other distortions. In this paper we propose a matching algorithm using a matrix. The matrix is suiable for simple and easily understood representation and enables the ordering and matching process to be convenient due to its predefined matrix manipulation. The nodes which constitute a gaph are ordered in the matrix by their geometrical positions and this makes it possible to save much comparison time for finding proper node pairs. for the classification, we defined a distance measure thatreflects the symbo's structural aspect that is the sum of the mode distance and the relation distance; the fornet is from the parameters describing the node shapes, the latter from the relations with othes node in the matrix. We also introduced a subdivision operation to compensate node merging which is mainly due t the prepreocessing error. The proposed method is applied to the recognition of musteal symbols and the result is given. The result shows that almost all, except heavily degraded symbols are recognized, and the recognition rate is approximately 95 percent.

키워드