A Study of Automatic Detection of Music Signal from Broadcasting Audio Signal

방송 오디오 신호로부터 음악 신호 검출에 관한 연구

  • Yoon, Won-Jung (Dept. of Computer Science and Statistics, Dankook University) ;
  • Park, Kyu-Sik (Dept. of Computer Science and Statistics, Dankook University)
  • 윤원중 (단국대학교 컴퓨터과학 및 통계학과) ;
  • 박규식 (단국대학교 컴퓨터과학 및 통계학과)
  • Received : 2010.06.30
  • Published : 2010.09.25

Abstract

In this paper, we proposed an automatic music/non-music signal discrimination system from broadcasting audio signal as a preliminary study of building a sound source monitoring system in real broadcasting environment. By reflecting human speech articulation characteristics, we used three simple time-domain features such as energy standard deviation, log energy standard deviation and log energy mean. Based on the experimental threshold values of each feature, we developed a rule-based algorithm to classify music portion of the input audio signal. For the verification of the proposed algorithm, actual FM broadcasting signal was recorded for 24 hours and used as source input audio signal. From the experimental results, the proposed system can effectively recognize music section with the accuracy of 96% and non-music section with that of 87%, where the performance is good enough to be used as a pre-process module for the a sound source monitoring system.

본 논문에서는 실제 방송 환경에 적용 가능한 방송용 음원 모니터링 시스템을 구축하기 위한 사전연구로 방송 오디오 신호로부터 음악신호 구간을 자동으로 검출할 수 있는 시스템을 제안하였다. 음악구간과 비음악구간의 구분을 위한 특징으로는 사람의 음성 발화 특성을 반영하여 에너지 표준편차와 log 에너지 표준편차 그리고 log 에너지 평균 등 3개의 간단한 시간영역 특징들을 사용하였으며 최종 음악신호 구간 판별은 각 에너지 한계값(threshold)을 이용한 Rule-base 분류를 기반으로 하였다. 실제 FM 라디오 방송 신호를 24시간 녹음하여 진행한 모의실험에서 음악구간 인식률은 96%, 비-음악구간 인식률은 87%를 나타내어 방송용 음원 모니터링 시스템의 전처리기로 손색이 없음을 확인할 수 있었다.

Keywords

References

  1. J. Saunders, "Real-time discrimination of broadcast speech/music", in Proc. ICASSP 1996, vol 2, pages 993-996, Atlanta, May 1996.
  2. E. Scheirer and M. Slaney, "Construction and Evaluation of a Robust Multifeature Speech/Music Discriminator", in Proc. ICASSP 1997, pages 1331–1334, Munich, Germany
  3. C. Panagiotakis and G. Tziritas, "A Speech/Music Discriminator Based on RMS and Zero-Crossings", IEEE Trans. Multimedia, vol. 7(1), pp. 155-166, Feb. 2005. https://doi.org/10.1109/TMM.2004.840604
  4. 이경록, 서봉수, 김진영, "오디오 인덱싱을 위한 음성/음악 분류 특징 비교", 한국음향학회지, 제 20권, 2호, pp. 10-15, 2001.
  5. 장형종, 엄정권, 인준식, "FM 방송 중 블록 단위음성 음악 판별 시스템의 설계 및 구현", 한국퍼지및 지능시스템학회 추계학술대회논문집, 제 17권, 2호, 2007.
  6. 금지수, 임성길, 이현수, "스펙트럼 분석과 신경망을 이용한 음성/음악 분류", 한국음향학회지, 제 26권, 5호, pp. 207-213, 2007.
  7. 김봉완, 최대림, 이용주, "멜 켑스트럼 모듈레이션 에너지를 이용한 음성/음악 판별", 말소리, 제 64호, pp. 89-103, 2007.
  8. 최무열, 김형순, "MFCC의 단구간 시간 평균을 이용한 음성/음악 판별 파라미터 성능 향상", 말소리, 제 64호, pp. 155-169, 2007.
  9. 강현우, "FM 라디오 환경에서의 실시간 음악 판별 시스템 구현", 정보처리학회논문지, 16권 B편, 2호, pp. 151-156, 2009. https://doi.org/10.3745/KIPSTB.2009.16-B.2.151