• 제목/요약/키워드: music information retrieval

검색결과 108건 처리시간 0.024초

음악 장르 분류를 위한 부밴드 분해와 특징 차수 축소에 관한 연구 (An investigation of subband decomposition and feature-dimension reduction for musical genre classification)

  • 서진수;김정현;박지현
    • 한국음향학회지
    • /
    • 제36권2호
    • /
    • pp.144-150
    • /
    • 2017
  • 음악 장르는 음악 검색 및 분류 등의 정보 처리 시스템 구현에 있어서 필수적인 요소이다. 일반적으로 장르 분류를 위한 스펙트럼 특징은 음악의 화음 및 강약 구조를 표현하기 위해 부밴드로 분해하여 구해진다. 본 논문은 음악 장르 분류 성능 개선을 위한 특징 추출을 위한 부밴드 분해 방법에 관해 연구하였다. 또한 부밴드 음악 특징의 차수를 줄일 수 있는 방법에 대해서도 연구하였다. 널리 사용되고 있는 장르 데이터셋들에서 실험을 수행하여 널리 사용되고 있는 옥타브 스케일보다 세분화된 부밴드 분해가 장르 분류 성능을 향상시킬 수 있으며, 특징 차수 축소를 결합하여 분류기의 계산량도 줄일 수 있음을 보였다.

NIFF를 이용한 음악정보 검색에 관한 연구 (A Study on Music Information Retrieval System Using NIFF)

  • 박종도;이두영
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1998년도 제5회 학술대회 논문집
    • /
    • pp.9-13
    • /
    • 1998
  • 디지털도서관에서의 음악정보의 효율적인 검색과 이용을 목적으로 NIFF를 이용해 음악정보를 디지털화하고 이를 기반으로 전율, 가사, 코드, 주석등의 세부 요소를 자동으로 색인하여 검색에 활용하는 방법을 제안하였다. 이 방법을 이용하면 첫째, 전통적인 목록에서는 불가능한 다양한 접근점의 제시가 가능하여 음악정보 이용자의 정보요구를 보다 잘 충족시킬 것이며, 둘째, 향후 정보검색 분야에 있어서 음악정보를 대상으로 하는 다양한 검색기법을 연구하는 중요한 토대가 될 것으로 기대한다.

  • PDF

음악 컨텐츠를 위한 빠른 검색 기법 (A Fast Retrieval Scheme for Music Contents)

  • 노승민;황인준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.647-649
    • /
    • 2003
  • 최근 들어 디지털 음악 컨텐츠의 사용량이 증가하면서 데이터베이스로부터 다양한 포맷의 음악 컨텐츠를 효과적으로 찾을 수 있는 음악 검색 시스템의 필요성이 증가했다. 본 논문에서는 사용자들이 자주 질의하는 멜로디를 이용하여 효율적인 검색을 하기 위한 기법을 제안한다. 사용자의 허밍이나 오선지를 통한 질의로부터 추출된 음높이와 음의 길이를 분석하여 UDR과 LSR 스트링으로 변환하고 자주 검색되는 멜로디의 관리를 통해 검색의 성능을 향상시켰다. 또한 XLM을 사용하여 음악 정보를 구조화하는 새로운 데이터 모델을 제안하고 음높이. 음의 길이 , 리듬 등의 음악 특징 정보를 이용한 복합 질의를 통하여 제안한 시스템의 성능 평가를 하였다.

  • PDF

HAQ 알고리즘과 Moment 기반 특징을 이용한 내용 기반 영상 검색 알고리즘 (Content-Based Image Retrieval Algorithm Using HAQ Algorithm and Moment-Based Feature)

  • 김대일;강대성
    • 대한전자공학회논문지SP
    • /
    • 제41권4호
    • /
    • pp.113-120
    • /
    • 2004
  • 본 논문은 내용 기반 검색 기법에 의한 보다 효율적인 특징 추출 및 영상 검색 알고리즘을 제안하였다. 먼저, MPEG 비디오의 key frame을 입력 영상으로 하여 Gaussian edge detector를 이용하여 객체를 추출하고, 그에 따른 객체 특징들, location feature distributed dimension feature와 invariant moments feature를 추출하였다. 다음, 제안하는 HAQ (Histogram Analysis and Quantization) 알고리즘으로 characteristic color feature를 추출하였다. 마지막으로 key frame이 아닌 shot frame을 질의영상으로 하여 제안된 matching 기법에 따라 4가지 특징들의 단계별 검색을 수행하였다. 본 논문의 목적은 사용자가 요구하는 장면이 속한 비디오의 shot 경계 내의 key frame을 검색하는 새로운 내용 기반 검색 알고리즘을 제안함에 있다. 제안된 알고리즘을 바탕으로 10개의 뮤직비디오, 836개의 시험 영상으로 실험한 결과, 효과적인 검색 효율을 보였다.

Harmonic and Percussive Separation Based on NMF and Tonality Mask

  • Choi, Keunwoo;Chon, Sang Bae;Kang, Kyeongok
    • ETRI Journal
    • /
    • 제34권6호
    • /
    • pp.958-961
    • /
    • 2012
  • In this letter, we present a new algorithm for the harmonic and percussive separation of jazz music. Using a short-time Fourier transform and nonnegative matrix factorization, the signal is decomposed into rank components. Each component is then split into harmonic and percussive parts using masks calculated based on their tonalities. Finally, the harmonic and percussive parts are separated after applying the masks and a summation. We evaluate the algorithm based on real audio examples using both objective and subjective assessments. The proposed algorithm performs well for the separation of harmonic and percussive parts of jazz excerpts.

판소리 자동채보를 위한 구조분석 알고리즘 (Structural Analysis Algorithm for Automatic Transcription 'Pansori')

  • 주영호;김준철;서경숙;이준환
    • 한국콘텐츠학회논문지
    • /
    • 제14권2호
    • /
    • pp.28-38
    • /
    • 2014
  • 서양 음악의 경우 자동채보와 내용기반 음악검색을 위한 음악 정보 분석연구가 활발하게 진행되고 있다. 그러나 한국 전통음악에서는 유사한 연구사례를 찾아보기 어렵다. 본 논문에서는 한국의 전통음악인 판소리 구조를 자동으로 분석하기 위한 알고리즘들을 제안한다. 제안된 알고리즘은 음성과 비음성의 시간 간격비율을 이용하여 '소리' 부분과 '아니리' 부분을 자동으로 구분한다. 뿐만 아니라 알고리즘은 '장단'이라 칭하는 리듬을 템플릿 이용한 다수결 결정 방법으로 강건하게 구분한다. 또한 알고리즘은 칼만 필터를 이용하여 '소리' 부분의 마디 지점을 검지해낸다. 본 논문에서 제안된 알고리즘들은 판소리 샘플들에서 양호하게 동작하였으며 자동채보의 전단계의 구조분석에 유용할 수 있다.

음악의 대표 선율을 이용한 구조-내용 기반 복합 검색을 위한 XML 스키마 설계 (Design of a XML Schema for Structural Content-based Composite Retrieval Using Representative Melodies)

  • 김범수;김주성;김유성
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (하)
    • /
    • pp.1403-1406
    • /
    • 2003
  • XML이 가지는 다양한 장점을 이용하기 위해, 음악을 XML로 표현하려는 다양한 연구가 계속되고 있다. 그러나, SMDL, MNML, MusicXML과 같은 기존의 연구는 악보상의 정보를 그대로 표현하거나, 전자 음악의 표준인 MIDI 포맷과의 상호교환성을 중심으로 연구되어 왔기 때문에 음악에 대해 구조-내용 기반 복합 검색을 하기에는 부적합하다. 이를 해결하기 위해 본 논문에서는 음악의 대표 선율을 이용한 구조-내용 기반 복합 검색을 위한 XML 스키마를 제안한다. 먼저, 본 논문에서는 사용자가 질의할 가능성이 높은 첫 동기, 절정, 일정 유사도 내에서 반복되는 주제 선율을 해당 음악을 대표하는 선율로서 XML 스키마에 표현하였다. 제안한 XML 스키마에 대해 XML 질의 언어를 이용하여 구조-내용 기반 복합 검색시 전체 선율을 검색하지 않고 대표 선율만을 검색하여 사용자의 응답 시간을 빠르게 할 수 있다.

  • PDF

Frequency-Temporal Filtering for a Robust Audio Fingerprinting Scheme in Real-Noise Environments

  • Park, Man-Soo;Kim, Hoi-Rin;Yang, Seung-Hyun
    • ETRI Journal
    • /
    • 제28권4호
    • /
    • pp.509-512
    • /
    • 2006
  • In a real environment, sound recordings are commonly distorted by channel and background noise, and the performance of audio identification is mainly degraded by them. Recently, Philips introduced a robust and efficient audio fingerprinting scheme applying a differential (high-pass filtering) to the frequency-time sequence of the perceptual filter-bank energies. In practice, however, the robustness of the audio fingerprinting scheme is still important in a real environment. In this letter, we introduce alternatives to the frequency-temporal filtering combination for an extension method of Philips' audio fingerprinting scheme to achieve robustness to channel and background noise under the conditions of a real situation. Our experimental results show that the proposed filtering combination improves noise robustness in audio identification.

  • PDF

피치 히스토그램과 MFCC-VQ 동적 패턴을 사용한 음악 검색 (Music Identification Using Pitch Histogram and MFCC-VQ Dynamic Pattern)

  • 박철의;박만수;김성탁;김회린
    • 한국음향학회지
    • /
    • 제24권3호
    • /
    • pp.178-185
    • /
    • 2005
  • 본 논문에서는 내용기반 음악 정보 검색 방법으로써 멜로디의 시간 변화 특성과 통계적 특성을 모두 이용할 수 있는 hybrid 방법에 대해 제안하였다. 실제 방송 환경에의 적용을 위해 드라마 OST의 좁은 검색 범위뿐만 아니라 가요 1,005곡의 넓은 검색 범위에서도 제안한 방법을 이용하여 실험하였다. 제안된 방법은 특징 벡터로써 pitch와 MFCC(Mel Frequency Cepstral Coefficient)를 사용하여 음의 특성을 나타내었으며 멜로디를 표현하기 위해 피치 히스토그램과 VQ (Vector Quantization) 코드화한 MFCC의 템포럴 시퀀스를 이용함으로써 음악 검색 방법에 멜로디의 시간 변화 특성과 통계적 특성을 함께 적용할 수 있었다. 또한 pitch 히스토그램과 MFCC-VQ 템포럴 방법을 모두 사용한 hybrid 방식에 적절한 패턴 매칭 방법을 제안함으로써 기존의 각 단일 방식을 이용한 성능 결과 (MFCC-VQ 템포럴)와 비교하여 볼 때 드라마 OST 검색 범위에서는 평균 $9.9\%$, 가요 1,005곡의 검색 범위에서는 $10.2\%$의 오류 감소율을 나타내었다.

사용자 중심의 멀티미디어 설계: 할인 사용성 공학의 적용 (User-centered multimedia design: The application of discount usability engineering)

  • 임치환
    • 산업경영시스템학회지
    • /
    • 제20권41호
    • /
    • pp.189-196
    • /
    • 1997
  • Multimedia systems present information by various media, for example, video, sound, music, animation, movie, etc., in addition to the text which has long been used for conveying the information. But using several media may cause users' confusion and poorly designed user interface often aggravate the situation. Hypermedia systems allow the retrieval and representation of multimedia information using navigation and browsing mechanisms. Typically, there are two major navigation problems in a hypermedia compared to the ordinary user interface: disorientation and cognitive overload. In this study, the multimedia system was studied from the viewpoint of usability. Practical usability evaluation needs cost-effective, low-skill, and low- investment methods. The 'discount usability engineering' method, one of these methods, is based on the use of the following techniques: scenarios, simplified thinking aloud, and heuristic evaluation. The discount usability engineering method was applied to the usability evaluation of multimedia CD-ROM title.

  • PDF