A Study on Music Summarization

음악요약 생성에 관한 연구

  • Kim Sung-Tak (School of Engineering, Information and Communications University) ;
  • Kim Sang-Ho (School of Engineering, Information and Communications University) ;
  • Kim Hoi-Rin (School of Engineering, Information and Communications University) ;
  • Choi Ji-Hoon (Digital Broadcasting Research Division, ETRI) ;
  • Lee Han-Kyu (Digital Broadcasting Research Division, ETRI) ;
  • Hong Jin-Woo (Digital Broadcasting Research Division, ETRI)
  • 김성탁 (한국정보통신대학교 공학부) ;
  • 김상호 (한국정보통신대학교 공학부) ;
  • 김회린 (한국정보통신대학교 공학부) ;
  • 최지훈 (한국전자통신연구원 디지털방송연구단 방송미디어연구그룹) ;
  • 이한규 (한국전자통신연구원 디지털방송연구단 방송미디어연구그룹) ;
  • 홍진우 (한국전자통신연구원 디지털방송연구단 방송미디어연구그룹)
  • Published : 2006.03.01

Abstract

Music summarization means a technique which automatically generates the most importantand representative a part or parts ill music content. The techniques of music summarization have been studied with two categories according to summary characteristics. The first one is that the repeated part is provided as music summary and the second provides the combined segments which consist of segments with different characteristics as music summary in music content In this paper, we propose and evaluate two kinds of music summarization techniques. The algorithm using multi-level vector quantization which provides a repeated part as music summary gives fixed-length music summary is evaluated by overlapping ration between hand-made repeated parts and automatically generated summary. As results, the overlapping ratios of conventional methods are 42.2% and 47.4%, but that of proposed method with fixed-length summary is 67.1%. Optimal length music summary is evaluated by the portion of overlapping between summary and repeated part which is different length according to music content and the result shows that automatically-generated summary expresses more effective part than fixed-length summary with optimal length. The cluster-based algorithm using 2-D similarity matrix and k-means algorithm provides the combined segments as music summary. In order to evaluate this algorithm, we use MOS test consisting of two questions(How many similar segments are in summarized music? How many segments are included in same structure?) and the results show good performance.

음악요약이란 주어진 음악 컨텐츠에서 가장 중요하고 특징적인 한 부분이나 여러 부분들을 제공하는 것을 말한다. 음악요약 기술에는 크게 두 가지 종류의 음악요약을 위한 기술들이 연구되고 있다. 음악 컨텐츠 내에서 반복되는 구간을 음악요약으로 제공하는 기술과 특정이 다른 부분들의 일정구간을 모두 제공하는 기술이 있다. 본 논문에서는 두 가지 종류의 음악요약을 제공하는 알고리즘들을 제안하고 평가하였다. 반복되는 구간을 음악요약으로 제공하는 다중 레벨 벡터양자화를 이용한 알고리즘은 고정된 길이와 최적의 길이를 가지는 음악요약을 제공하는 알고리즘들을 객관적인 방법으로 성능을 평가하였고, 음악 내에서 특정이 다른 부분들을 일정부분씩 취합하여 제공하는 2-D 유사도 행렬과 k-mean 알고리즘을 이용하는 집단화 방법을 이용한 방법의 평가는 주관적인 평가인 MOS 테스트로 평가하였다. 다중 레벨 벡터양자화를 이용한 음악요약을 제공하는 알고리즘에서 고정된 길이의 음악요약을 제공하는 알고리즘은 사람이 직접 요약한 결과와 제안한 방법으로 구한 요약과의 중첩도 (Overlapping Ratio)를 이용한 결과 기존의 방법들이 42.2% 와 47.3% 임에 비해 제안된 방법은 67.1%로 높은 성능을 보여주었고, 최적의 길이를 가지는 음악요약을 제공하는 알고리즘은 음악에 따라 다른 길이를 가지는 반복되는 부분의 포함 정도를 나타내는 최적 중첩비율 (Optimal Overlapping Ratio) 을 측정한 결과 고정된 길이를 가지는 음악요약 보다 최적의 길이로 음악마다 다른 길이 의 반복되는 부분을 효과적으로 표현함을 알 수 있었다. 집단화 방법을 이용한 알고리즘은 두 가지 질문들 (제공된 세그먼트들 중 특정이 비슷한 것의 개수, 제공된 세그먼트들 중 같은 구조에 속하는 것의 개수)을 이용한 MOS 테스트에서 우수한 결과를 보여주었다. 환자에서 완전관해를 보였고, 원격전이와 국소재발이 각각 2명과 1명에서 관찰되었다. 결론: SMART를 사용한 IMRT를 도입하여 임상적으로나 선량측정상 이하선의 기능 보존이 가능하였으며, 또한 생물학적으로 더욱 효과적일 것으로 생각되었다 향후 정확한 종양억제 효과와 만기 독성을 알기 위해서는 추가적인 연구대상과 추적관찰이 필요하다고 생각한다.ty modulated radiation therapy, IMRT)를 이용한 최근의 결과와 비교하여 CK를 이용한 정위 방사선 치료는 생존율 측면에서 비슷하거나 나은 결과를 보였다. 또한 심각한 부작용은 관찰되지 않았으며 짧은 기간의 치료로 환자에게 편의를 제공할 수 있어 결과적으로 삶의 질을 향상시킬 수 있을 것이다. 따라서, 이 새로운 치료 방법은 국소 진행된, 절제 불가능한 췌장암 환자에서 심각한 부작용 없는 효과적인 치료가 될 것으로 생각된다. 또한 계획용 표적 체적은 CK 치료의 유용한 예후 인자로 사용될 것이다.인위적 활동에 의한 부분이 높은 것으로 추정되었다.가>에는 이 시교의 외면적인 따스함과 내면적인 정(情)과 성(性)의 부드러움이 적고. 그 반대로 풍간하여 지절사정(指切事情)함이 강하였던 모양이다. 풍간하여 사정(事情)을 매몰차게 지적하여 논평하였음을 퇴계는 '완세불공(玩迷不恭)'이라고 판단했을 것이다. 장육당은 청(淸)과 탁(濁)이 있음을 알지 못하고. 그것의 분별도 하지 못하는 세상 사람들을 완농(玩弄)하였다. 그러므로 그는 진환(塵 )에서 초연(超然)했던 것이다. 천석고황(泉石膏 )으로 태평성대(太平聖代)에 사시가흥(四時佳興)을 한가지로 하는 퇴계와는 그래서 다르다. 퇴계는 순풍(淳風)과 어진 인성(人性)을 긍정하였기에 만족하고. '고인(古人)의 녀던 길'을 끊임없이 행(行)하고자 하였다. 여기에서 '완세불공(玩世不恭)'과 '온유돈후(溫柔敦厚)'가 판별되어진다.

Keywords

References

  1. L. Mani and M. T. Mabury, Advances in Automatic Text Summarization, Cambridge, Massashusetts: MIT Press, 1999
  2. F. Ren and Y. Sadanaga, An Automatic Extraction of Important Sentences Using Statistical Information and Structure Feature,NL 98-125, pp. 71-78, 1998
  3. Y. Gong and X. Liu, 'Summarizing Video by Minimizing Visual Content Redundancies,' IEEE International Conference on Multimedia and Expo, pp. 788-791, Tokyo, Japan, 2001
  4. I. Yahiaoui, B. Merialdo and B. Huet, 'Generating Summaries of Muli-Episode Video,' IEEE International Conference on Multimedia and Expo, pp. 792-795, Tokyo, Japan, 2001
  5. Matthew Cooper and Jonathan Foote, 'Automatic Music Summarization via Similarity Analysis,' Proc. IRCAM, pp. 81-85, 2002
  6. Jonathan Foote, 'Visualizing Music and Audio using Self-Similarity,' Proc. ACM Multimedia Conference, pp. 77-80, Orlando, Florida, November 1999
  7. Beth Logan and Stephen Chu, 'Music Summarization Using Key Phrases,' IEEE International Conference on Audio, Speech and Signal Processing, pp. 749-752, 2000
  8. Chansheng Xu, Yongwei Zhu, and Qi Tian, 'Automatic Music Summarization based on Temporal, Spectral and Cepstral Feature,' IEEE International Conference on Multimedia and Expo, pp. 117-120, 2002