• 제목/요약/키워드: MPEG-7 오디오 서술자

검색결과 7건 처리시간 0.022초

MPEG-7 오디오 하위 서술자를 이용한 음악 검색 방법에 관한 연구 (A Study on the Music Retrieval System using MPEG-7 Audio Low-Level Descriptors)

  • 박만수;박철의;김회린;강경옥
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2003년도 정기총회 및 학술대회
    • /
    • pp.215-218
    • /
    • 2003
  • 본 논문에서는 MPEG-7에 정의된 오디오 서술자를 이용한 오디오 특징을 기반으로 한 음악 검색 알고리즘을 제안한다. 특히 timbral 특징들은 음색 구분을 용이하게 할 수 있어 음악 검색뿐만 아니라 음악 장르 분류 또는 Query by humming에 이용 될 수 있다. 이러한 연구를 통하여 오디오 신호의 대표적인 특성을 표현 할 수 있는 특징벡터를 구성 할 수 있다면 추후에 멀티모달 시스템을 이용한 검색 알고리즘에도 오디오 특징으로 이용 될 수 있을 것이다 본 논문에서는 방송 시스템에 적용 할 수 있도록 검색 범위를 특정 컨텐츠의 O.S.T 앨범으로 제한하였다. 즉, 사용자가 임의로 선택한 부분적인 오디오 클립만을 이용하여 그 컨텐츠 전체의 O.S.T 앨범 내에서 음악을 검색할 수 있도록 하였다. 오디오 특징벡터를 구성하기 위한 MPEG-7 오디오 서술자의 조합 방법을 제안하고 distance 또는 ratio 계산 방식을 통해 성능 향상을 추구하였다. 또한 reference 음악의 템플릿 구성 방식의 변화를 통해 성능 향상을 추구하였다. Classifier로 k-NN 방식을 사용하여 성능 평가를 수행한 결과 timbral spectral feature들의 비율을 이용한 IFCR(Intra-Feature Component Ratio) 방식이 Euclidean distance 방식보다 우수한 성능을 보였다.

  • PDF

MPEG-7 오디오 특징을 이용한 감성기반 음악검색 (Emotion-Based Music Retrieval using MPEG-7 Audio Descriptors)

  • 임지혜;이준환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.334-337
    • /
    • 2011
  • 음원의 디지털화와 다양한 디지털 기기의 보급으로 인해 사용자는 더욱 쉽게 많은 양의 음악을 접할 수 있게 되었다. 많은 양의 음원중에서 사용자 개개인의 성향에 맞는 음악을 검색하기 위해 내용기반 음악검색과 감성기반 음악검색 방법 등이 제안되고 개발되고 있다. 본 논문에서는 감성기반 음악검색방법에서 다차원 벡터 형태의 MPEG-7 저수준 오디오 서술자들의 중요도를 결정하기 위한 새로운 방법을 제안하였다. 제안된 방법은 한 쌍의 대립되는 감성을 대표하는 음악들의 유사성을 다차원 서술자의 관점에서 측정한다. 그리고 이 유사관계를 러프 근사화와 군집 내/군집 간의 유사성 비율을 이용하여 서술자의 중요성을 결정하는데 사용한다. 이 중요성을 바탕으로 결정된 가중치는 여러 개의 오디오 서술자들의 유사성을 총체화하여 감성기반 음악검색에 이용된다.

검색의 일관성원리와 피드백을 이용한 감성기반 음악 검색 시스템 (Emotion-Based Music Retrieval Using Consistency Principle and Multi-Query Feedback)

  • 신송이;박은종;엄경배;이준
    • 정보처리학회논문지B
    • /
    • 제17B권2호
    • /
    • pp.99-106
    • /
    • 2010
  • 본 논문에서는 검색의 일관성원리와 다중질의 방법을 이용하여 감성을 기반으로 음악을 검색하는 알고리즘을 제안한다. 사용되어지는 특징들은 MPEG-7에서 제공하는 오디오 서술자들이며 이 정보들을 사용하는 것은 국제표준화가 용이 하다는 장점을 가지고 있기 때문이다. 또한 감성에 따라 MPEG-7 오디오 서술자들의 가중치를 부여하는 방법을 제안하여 계산량을 줄이는 방법을 고안하였으며 일관성원리와 다중질의 방법을 사용하는 적합성 피드백을 사용하여 검색의 적합률을 향상시켰다.

방송 환경에서 내용기반 검색 서비스에 관한 연구 (A Study on Content Based Retrieval Service in Broadcasting Environment)

  • 추진호;배태면;진성호;강경옥;노용만
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅲ
    • /
    • pp.1511-1514
    • /
    • 2003
  • 본 논문에서는 지능형 방송에서 내용 기반 검색 서비스에 관해 연구하였다. 이를 통해 MPEG-7 오디오/비주얼 서술자들을 이용하여 TVAF 메타데이타와 메타데이타 전송 서비스 스키마를 확장하였다. 그리고 MPEG-7 오디오 서술자를 이용한 내용 기반 검색 시 나리에 제안된 스키마를 적용하여 효용성을 증명하였다.

  • PDF

Pitch 히스토그램을 이용한 내용기반 음악 정보 검색 (Content-based Music Information Retrieval using Pitch Histogram)

  • 박만수;박철의;김회린;강경옥
    • 방송공학회논문지
    • /
    • 제9권1호
    • /
    • pp.2-7
    • /
    • 2004
  • 본 논문에서는 내용 기반 음악 정보 검색에 MPEG-7에 정의된 오디오 서술자를 적용하는 방법을 제안한다. 특히 Pitch 정보와 timbral 특징들은 음색 구분을 용이하게 할 수 있어 음악 검색뿐만 아니라 음악 장르 분류 또는 QBH(Query By Humming)에 이용 될 수 있다. 이러한 방법을 통하여 오디오 신호의 대표적인 특성을 표현 할 수 있는 특징벡터를 구성 할 수 있다면 추후에 멀티모달 시스템을 이용한 검색 알고리즘에도 오디오 특징으로 이용 될 수 있을 것이다. 본 논문에서는 방송 시스템에 적용하기 위해 영화나 드라마의 배경음악에 해당하는 O.S.T 앨범으로 검색 범위를 제한하였다. 즉, 사용자가 임의로 검색을 요청한 시점에서 비디오 컨텐츠로부터 추출한 임의의 오디오 클립만을 이용하여 그 컨텐츠 전체의 O.S.T 앨범 내에서 음악을 검색할 수 있도록 하였다. 오디오 특징 백터를 구성하기 위해 필요한 MPEG-7 오디오 서술자의 조합 방법을 제안하고 distance 또는 ratio 계산 방식을 통해 성능 향상을 추구하였다. 또한 reference 음악의 템플릿 구성 방식의 변화를 통해 성능 향상을 추구하였다. Classifier로 k-NN 방식을 사용하여 성능평가를 수행한 결과 timbral spectral feature 보다는 pitch 정보를 이용한 특징이 우수한 성능을 보였고 vector distance 방식으로는 특징들의 비율을 이용한 IFCR(Intra-Feature Component Ratio) 방식이 ED(Euclidean Distance) 방식보다 우수한 성능을 보였다.

퍼지 유사관계를 이용한 다차원 특징들의 가중치 결정과 감성기반 음악검색 (The Weight Decision of Multi-dimensional Features using Fuzzy Similarity Relations and Emotion-Based Music Retrieval)

  • 임지혜;이준환
    • 한국지능시스템학회논문지
    • /
    • 제21권5호
    • /
    • pp.637-644
    • /
    • 2011
  • 음원이 디지털화 되면서 쉽게 음악을 구매하고 들을 수 있게 되었다. 하지만 많은 음악 중에서 음악가, 장르, 제목, 앨범 타이틀 등 전통적인 음악 정보를 이용하여 사용자들이 자신의 취향에 맞는 음악을 찾는 데는 여전히 어려움이 있다. 이러한 어려움을 해소하기 위해 내용기반 음악검색과 감성기반 음악검색 방법 등이 제안되고 개발되고 있다. 본 논문에서는 이러한 어려움을 해소하기 위한 감성기반 음악 검색방법에서 다차원 벡터형태의 MPEG-7 저수준 오디오 서술자들의 감성기반 검색에서의 중요도를 결정하기 위한 새로운 방법을 제안하였다. 제안된 방법에서는 상호간에 대립되는 감성을 대표되는 음악들의 유사성을 다차원 서술자 관점에서 측정하고 이 유사관계를 러프 근사화와 군집 내/군집 간의 유사성 비율을 이용하여 서술자의 중요성을 결정한다. 중요성을 바탕으로 결정된 가중치는 여러 개의 오디오 서술자들의 유사성을 총체화하는데 이용되며 이를 활용하여 감성기반 음악검색을 수행한다. 제안된 방법은 내용기반 음악 검색을 기반으로 한 감성기반 음악검색 구조에서 실험한 결과 평균 검색 개수측면에서 기존의 휴리스틱 방법보다 좋은 검색 결과를 나타내었다.

멀티모달 특징을 이용한 비디오 장르 분류 (Video genre classification using Multimodal features)

  • 진성호;배태면;추진호;노용만;강경옥
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2003년도 정기총회 및 학술대회
    • /
    • pp.219-222
    • /
    • 2003
  • 본 논문에서는 멀티모달(multimodal) 특징을 이용한 비디오 장르 식별 방법을 제안한다. 비디오 장르 식별 기술은 방대한 양의 방송 컨텐츠를 보다 효율적으로 분류할 뿐 아니라 자동적인 비디오 요약을 위한 전처리 과정으로 활용될 수 있는 기술이다. 따라서, 그 필요성 및 중요성이 부각되고 있다. 본 논문에서 제안하고 있는 방법은 MPEG-7의 오디오 및 비주얼 서술자들을 적용하여 멀티모달 특징을 추출하고 여러 가지 방송 비디오 장르(genre)들로 구성된 데이터베이스에서 장르 분류를 위해 설계된 인식기(classifier)를 통한 성능을 평가한다.

  • PDF