• Title/Summary/Keyword: 음원

Search Result 1,239, Processing Time 0.028 seconds

A Design of Music Retrieval and Recommendation System based on Emotion (감성 기반 음악 검색 및 추천 시스템 설계)

  • Yoon, Bo-Kook;Hong, Seong-Yong
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06d
    • /
    • pp.153-155
    • /
    • 2011
  • 최근 음악 검색 연구에서 일반적으로 사용되는 방법은 키워드 중심의 텍스트 기반 검색방식, 음원의 특징 정보나 허밍 질의 처리 등을 이용하는 내용기반 검색 방식 등이 있다. 그러나 이러한 검색 방식은 단순히 원하는 음악을 질의에 따라 검색해 주며 인간의 감성을 고려하지 못하고 있다. 따라서 본 논문에서는 질의에 의한 검색뿐만 아니라 질의한 음원과 감성정도가 같은 음원을 추천하는 인간 감성 기반 음악 검색 및 추천 시스템을 제안한다. 인간 감성 기반 음악 검색 및 추천 시스템은 크게 2가지 요소로 구성된다. 첫 번째는 사용자가 질의한 질의어를 분석하는 감성기반 검색추론엔진과 두 번째는 음원의 특징 정보 및 감성 정보를 가지고 있는 음원 감성 정보 데이터베이스로 구성된다. 사용자의 감성에 따라 음악을 검색하고 추천한다는 것은 향후 음반 산업에 큰 발전에 기여할 것으로 기대한다.

Deep Learning based Music Classification System (딥러닝 기반의 음원검색 및 분류 시스템)

  • Lee, Sei-Hoon;Jeong, Ui-Jung
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2018.07a
    • /
    • pp.119-120
    • /
    • 2018
  • 본 논문에서는 음악을 듣고 어떤 음악인지 인식하고 판별하는 음원분류 시스템과 해당 기술 구현을 딥러닝을 통해 적용하도록 제안하였다. 제안한 시스템은 인공심층신경망을 통해 음원파일을 여러 음원 특징 추출 모델에 따라 검출된 특징들을 학습하여 해당 음원의 고유한 보컬이나 반주의 특색 등을 찾아내어 이를 인식할 수 있도록 구현하였다. 이를 통해, 기존의 Fingerprint 방식의 데이터베이스 검색 시스템과는 다른 접근방식으로 보다 사람이 음악을 기억하는 방법에 가깝도록 구현하여 능동성과 유연성을 개선하고 다양한 응용분야로 활용할 수 있는 시스템을 제안하였다.

  • PDF

Non-uniform Linear Microphone Array Based Source Separation for Broadcasting Audio Content Production (방송용 오디오 콘텐츠 제작을 위한 비균등 선형 마이크로폰 어레이 기반의 음원분리 방법)

  • Chun, Chan Jun;Kim, Hong Kook
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2015.11a
    • /
    • pp.21-22
    • /
    • 2015
  • 현재 UHDTV (Ultra-High-Definition TV) 시대에 사용될 멀티미디어 부호화로 MPEG-H를 표준화로 진행하고 있다. 향후 방송용 오디오 콘텐츠는 채널 오디오 콘텐츠에서 진화하여 객체 오디오 콘텐츠까지도 필요하게 된다. 이에 따라, 본 논문에서는 고품질의 방송용 오디오 콘텐츠를 제작하기 위한 비균등 선형 마이크로폰 어레이 기반의 음원분리 방법을 제안한다. 제안된 방법은 주어진 어레이 배치에 따라 채널간의 시간차를 분석하고, 이에 따른 객체 오디오 생성을 위한 음원분리 기술을 적용한다. 제안된 기법의 성능을 검증하기 위하여 음원분리도를 측정하였고, MVDR (Minimum Variance Distortionless Response) 빔형성기와 성능을 비교하였다. 비교 결과, 제안된 기법이 MVDR 빔형성기에 비하여 12.8% 높은 음원분리도 수치를 나타낸 것을 확인하였다.

  • PDF

Performance Testing of MFP for the Underwater Source with Broadband Spectrum (수중 광대역 음원에 대한 정합장처리의 음원위치 추정성능 분석과 평가)

  • Shin Kee Cheol;Park Jae Eun;Kim Jea Soo
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.97-100
    • /
    • 2000
  • 정합장처리(matched-field processing)는 실제 음향자료와 복제음장과의 공간 coherence를 이용한 음장의 역추정 방법이다. 광대역 스펙트럼을 가지는 음원의 경우 협대역 단일 주파수별로 정합장 출력을 계산한 후, 각 출력을 더하는 incoherent 광대역 정합장처리를 사용하였으나, 그 경우 수신기들과 주파수들간의 상호 공간과 주파수 정보를 사용치 못하므로 음원 위치추정 성능이 저하된다. 본 논문에서는 광대역 스펙트럼의 여러 주파수를 사용하여 확장된 CSDM(cross-spectral density matrix)을 구성하여 coherent 정합장처리를 구현하고, 각 정합장처리 기법에 대한 음원 위치추정 성능을 분석하였다.

  • PDF

Audio-Visual Localization and Tracking of Sound Sources Using Kalman Filter (칼만 필터를 이용한 시청각 음원 정위 및 추적)

  • Song, Min-Gyu;Kim, Jin-Young;Na, Seung-You
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.17 no.4
    • /
    • pp.519-525
    • /
    • 2007
  • With the high interest on robot technology and application, the research on artificial auditory systems for robot is very active. In this paper we discuss sound source localization and tracing based on audio-visual information. For video signals we use face detection based on skin color model. Also, binaural-based DOA is used as audio information. We integrate both informations using Kalman filter. The experimental results show that audio-visual person tracking Is useful, specially in the case that some informations are not observed.

영역분할을 이용한 음원인식 칩설계

  • Hwang, Hanchul;Han, Jihyung;Jung, Hakkee;Jeong, Dongsoo;Lee, Jongin;Kwon, Ohshin
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2009.05a
    • /
    • pp.682-685
    • /
    • 2009
  • 오늘날 IT기술과 지능형 로봇기술이 발달하면서 음원인식에 대한 필요성이 점차 부각되고있다. 본 연구에서는 보다 정확하고 빠른 음원인식방법을 칩안에 구현하기위해 기존의 코사인 역함수를 취하는 식의 음원인식 방법보다 정확하고 계산량이 적은 선형구간을 이용한 음원인식 방법을 통해 알고리즘을 간소화 하여 칩에 구현할수 있도록 Modelsim 툴을 사용하여 시뮬레이션 을 하고 Astro 툴을 통해 함칩제작에 필요한 설계 및 검증을하고자 한다.

  • PDF

Music Recommendation System Using Audio Metadata and User Playlists (음원 메타데이터와 사용자 플레이리스트를 활용한 음악 추천 시스템)

  • Kyoung Min Nam;Yu Rim Park;Ji Young Jung;Do Hyeon Kim;Hyon Hee Kim
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2024.05a
    • /
    • pp.731-732
    • /
    • 2024
  • 본 논문은 음원 메타데이터 임베딩 방법론을 기반으로 새로운 음원 추천 방법을 제안한다. 사용자 행동 데이터를 활용한 개인 맞춤형 음악 추천 모델은 신규 사용자의 데이터가 부족할 경우, 적절한 추천이 어려운 콜드스타트 현상을 초래할 수 있다. 본 연구에서는 플레이리스트의 음원 메타데이터를 Song sentence 로 구성하고, 고차원 벡터 공간에 임베딩하여 유사도를 계산한 추천 알고리즘을 구축한다. 사용자 행동 데이터가 아닌 음원의 자체적인 정보에 근거하기 때문에 콜드 스타트 현상을 보완하여 사용자에게 편리한 음악 감상 경험을 제공할 수 있을 것으로 기대된다.

A Study on the Prediction Index for Chart Success of Digital Music Contents based on Analysis of Social Data (소셜 데이터 분석을 통한 음원 흥행 예측 지표 연구)

  • Kim, Ga-Yeon;Kim, Myoung-Jun
    • Journal of Digital Contents Society
    • /
    • v.19 no.6
    • /
    • pp.1105-1114
    • /
    • 2018
  • The growth rate of the domestic digital music contents market has been remarkable recently. Accordingly, the necessity of prediction for chart success of digital music contents has grown. This paper proposes prediction indexes for chart success of digital music contents through analysis of correlation between social data such as Internet news, SNS and entry rankings in Melon's weekly music charts. We collected a total of 10 social data items for each male and female artist, and executed cluster analysis. Through this, we found meaningful prediction indexes for chart success of digital music contents for each male and female artist.

Median HRIR Customization via Principal Components Analysis (주성분 분석을 이용한 HRIR 맞춤 기법)

  • Hwang, Sung-Mok;Park, Young-Jin
    • Transactions of the Korean Society for Noise and Vibration Engineering
    • /
    • v.17 no.7 s.124
    • /
    • pp.638-648
    • /
    • 2007
  • A principal components analysis of the entire median HRIRs in the CIPIC HRTF database reveals that the individual HRIRs can be adequately reconstructed by a linear combination of several orthonormal basis functions. The basis functions represent the inter-individual and inter-elevation variations in median HRIRs. There exist elevation-dependent tendencies in the weights of basis functions, and the basis functions can be ordered according to the magnitude of standard deviation of the weights at each elevation. We propose a HRIR customization method via tuning of the weights of 3 dominant basis functions corresponding to the 3 largest standard deviations at each elevation. Subjective listening test results show that both front-back reversal and vertical perception can be improved with the customized HRIRs.

Comparison of Speech Intelligibility depending on the Sound Source Location in the Classrooms of Middle and High Schools (음원의 위치에 따른 중${\cdot}$고등학교 교실의 음성명료도 비교)

  • Lee Hwan-Hee;Haan Chan-Hoon
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.487-490
    • /
    • 2002
  • 학교 교육의 특성상 많은 부분이 교실에서의 음성정보 전달에 의해 이루어지고 있는 점을 감안하면 바람직한 청취환경의 개선이 검토되어야 한다. 또한 중${\cdot}$ 고등학교의 수학능력시험의 국어, 영어 듣기평가 및 다양한 어학 시험이 시청각 시설을 통해 이루어지고 있는 실정이므로 교실의 음환경은 매우 중요한 요소라하겠다. 본 논문에서는 음환경을 좌우하는 음원의 위치에 따라 명료 도가 어떻게 달라지는지를 실험을 통하여 검증하고, 명료도가 높고, 교실 전체에 균등한 분포를 보이는 음원의 위치를 찾아내고자 하였다. 교실 내의 음원의 위치로는 일반적으로 많이 쓰이고 있는 column(벽면 노출형)과 ceiling(천정 매입형) 위치와 임의의 음원 cluster(전면 중앙)를 선정하여 음장 파라메터를 측정한 결과 RASTI 는 세 타입 모두 $0.54\~0.55$로 값으로 근소한 차이를 보이고 있으며, 잔향시간은 ceiling>cluster>column의 순서로 나타났다. 일반적으로 잔향과 명료도와의 관계는 반비례하는 것으로 알려져 있으나, 실험 결과 잔향시간이 1.33초로 가장 긴 column 스피커의 경우 D50 값이 약 $47\%$로 가장 높은 값으로 나타났다. 이것은 column형 스피커의 경우 음원과 각 학생의 위치에 대한 평균 직접음선거리가 가장 짧기 때문인 것으로 나타났다.

  • PDF