• 제목/요약/키워드: MPEG-7 Audio Descriptors

검색결과 6건 처리시간 0.022초

검색의 일관성원리와 피드백을 이용한 감성기반 음악 검색 시스템 (Emotion-Based Music Retrieval Using Consistency Principle and Multi-Query Feedback)

  • 신송이;박은종;엄경배;이준
    • 정보처리학회논문지B
    • /
    • 제17B권2호
    • /
    • pp.99-106
    • /
    • 2010
  • 본 논문에서는 검색의 일관성원리와 다중질의 방법을 이용하여 감성을 기반으로 음악을 검색하는 알고리즘을 제안한다. 사용되어지는 특징들은 MPEG-7에서 제공하는 오디오 서술자들이며 이 정보들을 사용하는 것은 국제표준화가 용이 하다는 장점을 가지고 있기 때문이다. 또한 감성에 따라 MPEG-7 오디오 서술자들의 가중치를 부여하는 방법을 제안하여 계산량을 줄이는 방법을 고안하였으며 일관성원리와 다중질의 방법을 사용하는 적합성 피드백을 사용하여 검색의 적합률을 향상시켰다.

Pitch 히스토그램을 이용한 내용기반 음악 정보 검색 (Content-based Music Information Retrieval using Pitch Histogram)

  • 박만수;박철의;김회린;강경옥
    • 방송공학회논문지
    • /
    • 제9권1호
    • /
    • pp.2-7
    • /
    • 2004
  • 본 논문에서는 내용 기반 음악 정보 검색에 MPEG-7에 정의된 오디오 서술자를 적용하는 방법을 제안한다. 특히 Pitch 정보와 timbral 특징들은 음색 구분을 용이하게 할 수 있어 음악 검색뿐만 아니라 음악 장르 분류 또는 QBH(Query By Humming)에 이용 될 수 있다. 이러한 방법을 통하여 오디오 신호의 대표적인 특성을 표현 할 수 있는 특징벡터를 구성 할 수 있다면 추후에 멀티모달 시스템을 이용한 검색 알고리즘에도 오디오 특징으로 이용 될 수 있을 것이다. 본 논문에서는 방송 시스템에 적용하기 위해 영화나 드라마의 배경음악에 해당하는 O.S.T 앨범으로 검색 범위를 제한하였다. 즉, 사용자가 임의로 검색을 요청한 시점에서 비디오 컨텐츠로부터 추출한 임의의 오디오 클립만을 이용하여 그 컨텐츠 전체의 O.S.T 앨범 내에서 음악을 검색할 수 있도록 하였다. 오디오 특징 백터를 구성하기 위해 필요한 MPEG-7 오디오 서술자의 조합 방법을 제안하고 distance 또는 ratio 계산 방식을 통해 성능 향상을 추구하였다. 또한 reference 음악의 템플릿 구성 방식의 변화를 통해 성능 향상을 추구하였다. Classifier로 k-NN 방식을 사용하여 성능평가를 수행한 결과 timbral spectral feature 보다는 pitch 정보를 이용한 특징이 우수한 성능을 보였고 vector distance 방식으로는 특징들의 비율을 이용한 IFCR(Intra-Feature Component Ratio) 방식이 ED(Euclidean Distance) 방식보다 우수한 성능을 보였다.

객체기반 3차원 오디오 방송 시스템 설계 (The Design of Object-based 3D Audio Broadcasting System)

  • 강경옥;장대영;서정일;정대권
    • 한국음향학회지
    • /
    • 제22권7호
    • /
    • pp.592-602
    • /
    • 2003
  • 본 논문은 오디오를 동반한 방송 서비스에 있어서 기존의 단순 청취형의 오디오 서비스에서 탈피한 대화형의 객체 기반 3차원 오디오 방송 시스템의 구조를 설명한다. 객체기반 3차원 오디오 방송 시스템은 3차원 오디오 입력부, 3차원 오디오 편집/제작부, 3차원 오디오 부호화부, 3차원 오디오 복호화부, 3차원 오디오 장면합성부 및 3차원 오디오 재생부로 구성된다. 오디오 입력부에서는 3차원 배경음 객체와 독립적인 오디오 객체들을 획득한다. 편집/제작부에서는 오디오 객체들에 대한 3차원 음상정위 및 오디오 이미지 생성을 위한 파라미터를 설정하고, 이들을 조합하여 3차원 오디오 장면을 편집/제작한다. 부호화부에서는 장면정보와 오디오 객체들을 부호화하고, 복호화부에서는 오디오 객체들을 복원하고 장면정보를 획득한다. 장면 합성부에서는 장면정보와 오디오 객체들을 이용하여 오디오 장면을 구성한다. 3차원 오디오 재생부에서는 3차원 오디오 객체들 재생하고, 사용자의 제어신호를 이용한 대화형 기능을 구현한다.

MPEG-7 오디오 하위 서술자를 이용한 음악 검색 방법에 관한 연구 (A Study on the Music Retrieval System using MPEG-7 Audio Low-Level Descriptors)

  • 박만수;박철의;김회린;강경옥
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2003년도 정기총회 및 학술대회
    • /
    • pp.215-218
    • /
    • 2003
  • 본 논문에서는 MPEG-7에 정의된 오디오 서술자를 이용한 오디오 특징을 기반으로 한 음악 검색 알고리즘을 제안한다. 특히 timbral 특징들은 음색 구분을 용이하게 할 수 있어 음악 검색뿐만 아니라 음악 장르 분류 또는 Query by humming에 이용 될 수 있다. 이러한 연구를 통하여 오디오 신호의 대표적인 특성을 표현 할 수 있는 특징벡터를 구성 할 수 있다면 추후에 멀티모달 시스템을 이용한 검색 알고리즘에도 오디오 특징으로 이용 될 수 있을 것이다 본 논문에서는 방송 시스템에 적용 할 수 있도록 검색 범위를 특정 컨텐츠의 O.S.T 앨범으로 제한하였다. 즉, 사용자가 임의로 선택한 부분적인 오디오 클립만을 이용하여 그 컨텐츠 전체의 O.S.T 앨범 내에서 음악을 검색할 수 있도록 하였다. 오디오 특징벡터를 구성하기 위한 MPEG-7 오디오 서술자의 조합 방법을 제안하고 distance 또는 ratio 계산 방식을 통해 성능 향상을 추구하였다. 또한 reference 음악의 템플릿 구성 방식의 변화를 통해 성능 향상을 추구하였다. Classifier로 k-NN 방식을 사용하여 성능 평가를 수행한 결과 timbral spectral feature들의 비율을 이용한 IFCR(Intra-Feature Component Ratio) 방식이 Euclidean distance 방식보다 우수한 성능을 보였다.

  • PDF

MPEG-7 오디오 특징을 이용한 감성기반 음악검색 (Emotion-Based Music Retrieval using MPEG-7 Audio Descriptors)

  • 임지혜;이준환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.334-337
    • /
    • 2011
  • 음원의 디지털화와 다양한 디지털 기기의 보급으로 인해 사용자는 더욱 쉽게 많은 양의 음악을 접할 수 있게 되었다. 많은 양의 음원중에서 사용자 개개인의 성향에 맞는 음악을 검색하기 위해 내용기반 음악검색과 감성기반 음악검색 방법 등이 제안되고 개발되고 있다. 본 논문에서는 감성기반 음악검색방법에서 다차원 벡터 형태의 MPEG-7 저수준 오디오 서술자들의 중요도를 결정하기 위한 새로운 방법을 제안하였다. 제안된 방법은 한 쌍의 대립되는 감성을 대표하는 음악들의 유사성을 다차원 서술자의 관점에서 측정한다. 그리고 이 유사관계를 러프 근사화와 군집 내/군집 간의 유사성 비율을 이용하여 서술자의 중요성을 결정하는데 사용한다. 이 중요성을 바탕으로 결정된 가중치는 여러 개의 오디오 서술자들의 유사성을 총체화하여 감성기반 음악검색에 이용된다.

퍼지 유사관계를 이용한 다차원 특징들의 가중치 결정과 감성기반 음악검색 (The Weight Decision of Multi-dimensional Features using Fuzzy Similarity Relations and Emotion-Based Music Retrieval)

  • 임지혜;이준환
    • 한국지능시스템학회논문지
    • /
    • 제21권5호
    • /
    • pp.637-644
    • /
    • 2011
  • 음원이 디지털화 되면서 쉽게 음악을 구매하고 들을 수 있게 되었다. 하지만 많은 음악 중에서 음악가, 장르, 제목, 앨범 타이틀 등 전통적인 음악 정보를 이용하여 사용자들이 자신의 취향에 맞는 음악을 찾는 데는 여전히 어려움이 있다. 이러한 어려움을 해소하기 위해 내용기반 음악검색과 감성기반 음악검색 방법 등이 제안되고 개발되고 있다. 본 논문에서는 이러한 어려움을 해소하기 위한 감성기반 음악 검색방법에서 다차원 벡터형태의 MPEG-7 저수준 오디오 서술자들의 감성기반 검색에서의 중요도를 결정하기 위한 새로운 방법을 제안하였다. 제안된 방법에서는 상호간에 대립되는 감성을 대표되는 음악들의 유사성을 다차원 서술자 관점에서 측정하고 이 유사관계를 러프 근사화와 군집 내/군집 간의 유사성 비율을 이용하여 서술자의 중요성을 결정한다. 중요성을 바탕으로 결정된 가중치는 여러 개의 오디오 서술자들의 유사성을 총체화하는데 이용되며 이를 활용하여 감성기반 음악검색을 수행한다. 제안된 방법은 내용기반 음악 검색을 기반으로 한 감성기반 음악검색 구조에서 실험한 결과 평균 검색 개수측면에서 기존의 휴리스틱 방법보다 좋은 검색 결과를 나타내었다.