가사의 감정 분석과 구조 분석을 이용한 노래 간 유사도 측정

Similarity Evaluation of Popular Music based on Emotion and Structure of Lyrics

  • 이재환 (서울대학교 컴퓨터공학부) ;
  • 임혜원 (서울대학교 컴퓨터공학부) ;
  • 김형주 (서울대학교 컴퓨터공학부)
  • 투고 : 2016.01.28
  • 심사 : 2016.07.01
  • 발행 : 2016.10.15


음악 스트리밍 서비스의 대중화로 음악의 소유 없이 언제든 원하는 듣고 싶은 노래를 들을 수 있게 되었다. 넓어진 선택권은 역설적으로 노래를 선택하기 어렵게 만들었다. 이러한 선택의 어려움을 극복하기 위해 음악 추천에 대한 관심이 높아졌고 판도라와 Last.fm과 같은 상용 서비스뿐 아니라 음악 정보 검색 분야의 연구자들도 다양한 추천 시스템을 제안하였다. 내용 기반 필터링과 협업 필터링 방식이 주류인 기존의 추천 시스템은 음악 감상의 주요 요인인 맥락을 고려하지 않았다는 한계점을 지니고 있다. 본 논문에서는 음악을 선택하는 맥락 중 주요한 요인인 감정을 이용한 노래간 유사도 측정 방법을 제안하여 새로운 추천 시스템에 대한 가능성을 탐색한다. 노래의 감정 추출에 가사를 이용하였고 가사에서 노래의 구조도 추출해 노래의 의미적 분석을 시도하였다. 실험을 통해 제안한 모델이 기존의 추천 시스템에 비해 작은 계산 복잡성으로 기존 모델과 유사한 성능을 보일 수 있음을 보였다.

People can listen to almost every type of music by music streaming services without possessing music. Ironically it is difficult to choose what to listen to. A music recommendation system helps people in making a choice. However, existing recommendation systems have high computation complexity and do not consider context information. Emotion is one of the most important context information of music. Lyrics can be easily computed with various language processing techniques and can even be used to extract emotion of music from itself. We suggest a music-level similarity evaluation method using emotion and structure. Our result shows that it is important to consider semantic information when we evaluate similarity of music.



연구 과제번호 : 대규모 트랜잭션 처리와 실시간 복합 분석을 통합한 일체형 데이터 엔지니어링 기술 개발

연구 과제 주관 기관 : 정보통신기술진흥센터


  1. "Main Music Streaming Services and Technology Analysis Changing Digital Music Market," KOCCA (Korea Creative Content Agency), Jul. 2014.
  2. W. T. Glaser, T. B. Westergren, J. P. Stearns, and J. M. Kraft, "Patent {US7003515}: Consumer item matching method and system," Pandora Media, Inc., Vol. 1, No. 12, 2006.
  3. Z. Hyung, K. Lee, and K. Lee, "Music recommendation using text analysis on song requests to radio stations," Expert Syst. Appl., Vol. 41, No. 5, pp. 2608-2618, 2014.
  4. J. Su, H. Yeh, P. Yu, and V. Tseng, "Music recommendation using content and context information mining," Intell. Syst. IEEE, Vol. 25, No. 1, pp. 16-26, 2010.
  5. I. Fernandez-Tobias, I. Cnatador, and L. Plaza, "An Emotion Dimensional Model based on Social Tags: Crossing Folksonomies and Enhancing Recommendations," Proc. of the 14th International Conference on Electronic Commerce and Web Technologies, pp. 88-100, 2013.
  6. C. Laurier, J. Grivolla, and P. Herrera, "Multimodal music mood classification using audio and lyrics," Proc. - 7th Int. Conf. Mach. Learn. Appl. ICMLA 2008, pp. 688-693, 2008.
  7. X. Hu, J. S. Downie, and A. F. Ehmann, "Lyric text mining in music mood classification," Am. Music, Vol. 183, No. Ismir, pp. 411-416, 2009.
  8. S. M. Mohammad and P. D. Turney, "Emotions Evoked by Common Words and Phrases: Using Mechanical Turk to Create an Emotion Lexicon," Proc. of the NAACL HLT 2010 Workshop on Computational Approaches to Analysis and Generation of Emotion in Text, pp. 26-34, 2010.
  9. C. Orellana-rodriguez, E. Diaz-aviles, and W. Nejdl, "Mining Emotions in Short Films: User Comments or Crowdsourcing?," Proc. of the 22nd international conference on World Wide Web companion, pp. 69-70, 2013.
  10. B. Logan, a. Kositsky, and P. Moreno, "Semantic analysis of song lyrics," 2004 IEEE Int. Conf. Multimed. Expo (IEEE Cat. No.04TH8763), Vol. 2, pp. 27-30, 2004.
  11. R. Mayer, R. Neumayer, and A. Rauber, "Rhyme and Style Features for Musical Genre Classification By Song Lyrics," Science. Ismir, pp. 337-342, 2008.
  12. H. T. Cheng, Y. H. Yang, Y. C. Lin, and H. H. Chen, "Multimodal structure segmentation and analysis of music using audio and textual information," Proc. IEEE International Symposium on Circuits and Systems, pp. 1677-1680, 2009.
  13. "Ten Minute Master No 18: Song Structure," MUSIC TECH magazine, pp. 62-63, 2003.
  14. N. C. Maddage, C. Xu, M. S. Kankanhalli, and X. Shao, "Content-based music structure analysis with applications to music semantics understanding," Proc. 12th Annu. ACM Int. Conf. Multimed., pp. 112-119, 2004.
  15. A. Jamdar, J. Abraham, K. Khanna, and R. Dubey, "Emotion Analysis of Songs Based on Lyrical and Audio Features," Int. J. Artif. Intell. Appl., Vol. 6, No. 3, pp. 35-50, 2015.
  16. T. Bertin-Mahieux, D. P. W. Ellis, B. Whitman, and P. Lamere, "The Million Song Dataset," Ismir, pp. 591-596, 2011.
  17. K. Jarvelin and J. Kekalainen, "IR Evaluation Methods for Retrieving Highly Relevant Documents," Proc. of the 23rd annual international ACM SIGIR conference on Research and development in information retrieval - SIGIR '00, pp. 41-48, 2000.