• 제목/요약/키워드: Music retrieval

검색결과 133건 처리시간 0.021초

음악 특징점간의 유사도 측정을 이용한 동일음원 인식 방법 (Same music file recognition method by using similarity measurement among music feature data)

  • 성보경;정명범;고일주
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권3호
    • /
    • pp.99-106
    • /
    • 2008
  • 최근 다양한 분야에서(웹 포털, 유료 음원서비스 등) 디지털 음악의 검색이 사용되고 있다. 기존의 디지털 음악의 검색은 음악 데이터에 포함된 자체 메타 정보를 이용하여 이루어진다. 하지만 메타 정보가 다르게 작성되었거나 작성되지 않은 경우 정확한 검색은 어렵다. 요즘 이러한 문제의 보완 방안으로 음악자체를 이용하는 내용기반정보 검색 기법에 대한 연구가 이루어지고 있다. 본 논문에서는 음악의 파형에서 추출된 특징 정보간의 유사도 측정을 통하여 동일음원을 인식하는 방법에 대해 논하고자 한다. 디지털 음악의 특징 정보는 단순화시킨 MFCC (Mel Frequency Cepstral Coefficient)를 이용하여 음악의 파형으로부터 추출하였다. 디지털 음악간의 유사도는 Vision 및 Speech Recognition 분야에서 사용되던 DTW (Dynamic Time Warping) 기법을 활용하여 측정하였다. 제안된 동일 음원 인식 방법의 검증을 위한 같은 장르에서 무작위 추출된 1000곡에서 시행한 500번의 검색은 모두 성공했다. 검색에 사용된 500개의 디지털 오디오는 60개의 디지털음원을 압축방식과 비트율을 다르게 조합하여 만들었다. 실험의 결과로 DTW을 이용한 유사도 측정법이 동일음원을 인식할 수 있음을 증명하였다.

  • PDF

노이즈에 강인한 음악 시작점 검출 알고리즘 (The Noise Robust Algorithm to Detect the Starting Point of Music for Content Based Music Retrieval System)

  • 김정수;성보경;구광효;고일주
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권9호
    • /
    • pp.95-104
    • /
    • 2009
  • 본 논문에서는 노이즈에 강인한 음악 시작점 검출 알고리즘을 제안한다. 음악의 시작점 검출은 음악을 이용한 신호처리 시스템에 있어서 일관되지 않은 입력데이터를 통한 계산낭비, 비교검색 등의 문제 해결을 위해 필요한 것이다. 특히 신호처리를 이용한 내용기반 음악검색 시스템에서 시간의 순서로 데이터를 비교하는 시간순차적 검색방법에서는 더욱 필요시 된다. 시간순차적 검색 방법은 시간의 순서로 단순 비교를 수행하기 때문에 검색의 속도가 빠르다는 장점이 있는 반면 비교하는 데이터의 시작 시간이 동일해야 하는 단점이 있다. 하지만 디지털화된 음악은 비트레이트 변환에 의한 시작 시간의 동일함을 보장할 수 없다. 따라서 본 논문에서는 검색의 전처리 단계에서 음악의 시작점을 검출함으로써 시간순차적 검색 방법을 적용하여 고속의 검색을 수행하면서도 인식률이 낮아지지 않게 하였다. 시작점 검출은 소리를 검출할 수 있는 최소 파형모형을 이용하였으며 노이즈에 강인하기 위하여 묵음에 존재하는 노이즈는 스킵핑을 하였다. 제안한 알고리즘은 실험을 통해 시작점 검출을 미적용한 결과보다 약 38% 성능이 향상됨을 확인하였으며 노이즈에 강인함을 검증하였다.

잡음에 강인한 내용기반 음악 검색 시스템에 대한 연구 (A Study of Noise Robust Content-Based Music Retrieval System)

  • 윤원중;박규식
    • 대한전자공학회논문지SP
    • /
    • 제45권6호
    • /
    • pp.148-155
    • /
    • 2008
  • 본 논문에서는 모바일 환경에서 적용 가능한 잡음에 강인한 내용기반 음악 검색 시스템을 구축하였다. 제안된 시스템은 기존의 음성인식 분야에서 잡음에 강인한 특성을 가진 것으로 알려진 ZCPA 특징을 내용기반 음악 검색 시스템에 적용시켜 그 성능을 검증하였다. 또한 본 논문에서는 대용량 음악 DB 검색에서 기존의 전수(Exhaustive) 검색에 비해 검색 속도를 99% 가까이 개선할 수 있는 새로운 인덱싱 방법과 고속 검색 알고리즘을 제안하였다. 신호대 잡음비가 15dB - 0dB인 잡음 환경에서의 모의실험 결과, 제안 시스템은 기존의 MFCC와 필터뱅크 에너지 특징에 비해 약 5% - 30% 정도의 우수한 성능을 나타냄을 확인하였다.

내용기반 음악장르 검색에서 시계열 패턴 인덱스 화일의 성능 분석 (Performance Analysis of the Time-series Pattern Index File for Content-based Music Genre Retrieval)

  • 김영인;김선종
    • 한국산업정보학회논문지
    • /
    • 제11권5호
    • /
    • pp.18-27
    • /
    • 2006
  • 음악 데이타의 양이 급속히 증가함에 따라 음악 데이타베이스의 오디오 특정을 이용한 내용기 반 음악 장르의 효율적인 유사도 검색 방법이 요구되고 있다. 이러한 시스템을 구현하기 위해서는 시계열 패턴인 오디오 특징을 인덱싱 할 수 있는 인덱싱 기법과 데이터마이닝 기술이 필요하다. 본 논문에서는 인덱싱 기법을 기반으로 하는 유사 장르 음악 검색 시스템의 개발에 대하여 논의한다. 먼저, 시계열 패턴 인덱싱 기법과 데이터마이닝을 이용한 내용기반 음악장르 검색 시스템의 구조를 제안한다. 또한, 오디오 특정을 이용한 유사 장르 검색의 성능을 보이기 위하여 시계열 패턴 인덱스 화일을 구축하고 성능 분석 을 제시한다. 실제 데이타의 특정값을 이용한 실험을 통하여 제안한 기법의 성능을 확인하였다.

  • PDF

음악검색을 위한 가변임계치 기반의 음성 질의 변환 기법 (A Threshold Adaptation based Voice Query Transcription Scheme for Music Retrieval)

  • 한병준;노승민;황인준
    • 전기학회논문지
    • /
    • 제59권2호
    • /
    • pp.445-451
    • /
    • 2010
  • This paper presents a threshold adaptation based voice query transcription scheme for music information retrieval. The proposed scheme analyzes monophonic voice signal and generates its transcription for diverse music retrieval applications. For accurate transcription, we propose several advanced features including (i) Energetic Feature eXtractor (EFX) for onset, peak, and transient area detection; (ii) Modified Windowed Average Energy (MWAE) for defining multiple small but coherent windows with local threshold values as offset detector; and finally (iii) Circular Average Magnitude Difference Function (CAMDF) for accurate acquisition of fundamental frequency (F0) of each frame. In order to evaluate the performance of our proposed scheme, we implemented a prototype music transcription system called AMT2 (Automatic Music Transcriber version 2) and carried out various experiments. In the experiment, we used QBSH corpus [1], adapted in MIREX 2006 contest data set. Experimental result shows that our proposed scheme can improve the transcription performance.

Music Information Retrieval(MIR)을 활용한 음악적 리듬의 시각화 연구 -Onset 검출(Onset Detection) 알고리즘에 의한 시각화 어플리케이션 (A Study on Visualization of Musical Rhythm Based on Music Information Retrieval)

  • 최수환
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.1075-1080
    • /
    • 2009
  • 이 글은 Music Information Retrieval(MIR) 기법을 사용하여 오디오 콘텐츠의 리듬 정보를 자동으로 분석하고 이를 시각화하는 방법에 대해 다룬다. 특히 MIR을 활용한 간단한 시각화(sound visualization) 어플리케이션을 소개함으로써 음악 정보 분석이 디자인, 시각 예술에서 다양하게 활용될 수 있음을 보이고자 한다. 음악적 정보를 시각 예술로 담아내려는 시도는 20세기 초 아방가르드 화가들에 의해 본격적으로 시작되었다. 80년대 이후에는 컴퓨터 기술의 급속한 발전으로 사운드와 이미지를 디지털 영역에서 쉽게 하나로 다룰 수 있게 되었고, 이에 따라 다양한 오디오 비주얼 예술작품들이 등장하였다. MIR은 오디오 콘텐츠로부터 음악적 정보를 분석하는 DSP(Digital Signal Processing) 기술로 최근 디지털 콘텐츠 시장의 확장과 더불어 연구가 활발히 진행되고 있다. 특히 웹이나 모바일에서는 이미 다양한 상용 어플리케이션이 적용되고 있는데 query-by-humming과 같은 음악 인식 어플리케이션이 대표적인 경우이다. 이 글에서는 onset 검출(onset detection)을 중심으로 음악적 리듬을 분석하는 알고리즘을 살펴보고 기본적인 조형원리에 따라 이를 시각화하는 어플리케이션의 예를 소개한다.

  • PDF

바코드를 이용한 모바일 음악앨범 정보 검색 시스템 (Mobile Music Album Information Retrieval System using Barcode)

  • 이경미
    • 한국콘텐츠학회논문지
    • /
    • 제10권8호
    • /
    • pp.130-137
    • /
    • 2010
  • 휴대용 멀티미디어 기기의 진화와 보급 확산에 따라 디지털 음원 보급이 용이해짐으로써 사용자는 디지털 음원 및 관련된 콘텐츠를 휴대용 멀티미디어 기기를 이용하여 검색 및 감상할 수 있게 되었다. 그러나 디지털 음악서비스 시장과는 대조적으로 CD로 제공되는 오프라인 음악서비스 시장은 점차적으로 침체되어 오프라인 음악서비스 시장 자체가 사장될 위기에 놓여있는 있는 실정이다. 본 논문에서는 오프라인 음악서비스의 중심인 음악앨범에 부착된 1차원 바코드와 휴대폰 음악서비스를 결합하여 두 음악서비스 시장이 상생할 수 있는 시스템을 제안한다. 제안하는 음악앨범 정보 검색 시스템은 실제의 음악앨범으로 부터 디지털 음원과 정보를 획득하기 위해 음악 CD에 부착된 1차원 바코드를 모바일 단말기에 입력하여 음원서버로부터 해당 앨범의 정보를 얻을 수 있도록 하였다. 또한 검색 결과에 사용자 선호도를 반영하기 위해 앨범별 검색 횟수를 이용하여 사용자들이 선택한 음악 장르의 앨범을 최근 선호하는 앨범순으로 검색하도록 하였다. 제안하는 모바일 음악앨범 검색 시스템은 WIPI를 기반으로 구현되어 시범 서비스를 제공하고 있다.

Ranking Tag Pairs for Music Recommendation Using Acoustic Similarity

  • Lee, Jaesung;Kim, Dae-Won
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제15권3호
    • /
    • pp.159-165
    • /
    • 2015
  • The need for the recognition of music emotion has become apparent in many music information retrieval applications. In addition to the large pool of techniques that have already been developed in machine learning and data mining, various emerging applications have led to a wealth of newly proposed techniques. In the music information retrieval community, many studies and applications have concentrated on tag-based music recommendation. The limitation of music emotion tags is the ambiguity caused by a single music tag covering too many subcategories. To overcome this, multiple tags can be used simultaneously to specify music clips more precisely. In this paper, we propose a novel technique to rank the proper tag combinations based on the acoustic similarity of music clips.

Pitch 히스토그램을 이용한 내용기반 음악 정보 검색 (Content-based Music Information Retrieval using Pitch Histogram)

  • 박만수;박철의;김회린;강경옥
    • 방송공학회논문지
    • /
    • 제9권1호
    • /
    • pp.2-7
    • /
    • 2004
  • 본 논문에서는 내용 기반 음악 정보 검색에 MPEG-7에 정의된 오디오 서술자를 적용하는 방법을 제안한다. 특히 Pitch 정보와 timbral 특징들은 음색 구분을 용이하게 할 수 있어 음악 검색뿐만 아니라 음악 장르 분류 또는 QBH(Query By Humming)에 이용 될 수 있다. 이러한 방법을 통하여 오디오 신호의 대표적인 특성을 표현 할 수 있는 특징벡터를 구성 할 수 있다면 추후에 멀티모달 시스템을 이용한 검색 알고리즘에도 오디오 특징으로 이용 될 수 있을 것이다. 본 논문에서는 방송 시스템에 적용하기 위해 영화나 드라마의 배경음악에 해당하는 O.S.T 앨범으로 검색 범위를 제한하였다. 즉, 사용자가 임의로 검색을 요청한 시점에서 비디오 컨텐츠로부터 추출한 임의의 오디오 클립만을 이용하여 그 컨텐츠 전체의 O.S.T 앨범 내에서 음악을 검색할 수 있도록 하였다. 오디오 특징 백터를 구성하기 위해 필요한 MPEG-7 오디오 서술자의 조합 방법을 제안하고 distance 또는 ratio 계산 방식을 통해 성능 향상을 추구하였다. 또한 reference 음악의 템플릿 구성 방식의 변화를 통해 성능 향상을 추구하였다. Classifier로 k-NN 방식을 사용하여 성능평가를 수행한 결과 timbral spectral feature 보다는 pitch 정보를 이용한 특징이 우수한 성능을 보였고 vector distance 방식으로는 특징들의 비율을 이용한 IFCR(Intra-Feature Component Ratio) 방식이 ED(Euclidean Distance) 방식보다 우수한 성능을 보였다.

선율의 음높이와 리듬 정보를 이용한 음악의 유사도 계산 알고리즘 (A Similarity Computation Algorithm Based on the Pitch and Rhythm of Music Melody)

  • 모종식;김소영;구경이;한창호;김유성
    • 한국정보처리학회논문지
    • /
    • 제7권12호
    • /
    • pp.3762-3774
    • /
    • 2000
  • 컴퓨터 하드웨어 및 멀티미디어 정보 처리 기술의 발달로 인하여 멀티미디어 정보 검색 시스템에 대한 요구가 증대되고 있다. 멀티미디어 정보 검색 시스템은 텍스트와 이미지 위주로 발전하였으나 비디오와 오디오 정보, 특히 음악 정보를 위한 멀티미디어 정보 검색 시스템에 대한 요구가 점차 증대되고 있다. 최근의 음악 정보 검색 시스템에서는 해당 음악 정보의 작곡가, 곡명 등과 같은 메타 정보만을 이용한 메타 정보 기반의 검색뿐만 아니라 음악의 내용을 기반으로 하는 내용 기반 검색까지도 가능하다. 음악의 내용 기반 검색에서는 메타 정보 기반 검색에서 흔히 볼 수 있는 문자열에 대한 패턴 매칭보다는 멀티미디어 데이타간의 유사도를 기반으로 검색한다. 본 논문에서는 음악을 일정한 선율에 따른 음들의 배합으로 정의하고, 선율을 구성하는 음의 높이와 음의 길이 정보를 복합적으로 이용하여 두 음악 정보간의 유사도를 계산하는 알고리즘을 제안한다. 또한, 본 논문에서는 제안된 유사도 계산 알고리즘의 검증을 위해 동요를 대상으로 실험을 하였다. 실험 결과에 따르면 제안된 유사도 계산 알고리즘이 기존에 제안된 내용기반 음악 정보 검색 시스템과 비교하여 음악의 선율 정보를 기준으로 음악들간의 유사도를 보다 정확하게 효과적으로 계산하였다.

  • PDF