• 제목/요약/키워드: Content Based Music Recognition

검색결과 7건 처리시간 0.023초

온라인 음악 관리 서비스를 위한 사용자 음원 인식 시스템 개발 (Development of User Music Recognition System For Online Music Management Service)

  • 성보경;고일주
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권11호
    • /
    • pp.91-99
    • /
    • 2010
  • 최근 디지털 콘텐츠 서비스 분야에서 사용자 맞춤형 서비스를 위해 사용자 자원 인식의 필요성이 대두되고 있다. 특히 온라인 기반 음악 서비스의 경우 사용자 취향 분석, 음원 추천 및 음악 관련 정보 제공을 위해 사용자 음원인식 기술이 요구되고 있다. 현재 태그정보를 기초로 사용자 음원 인식 후 음악 관련 정보를 제공하는 서비스가 제공되고 있지만, 태그정보의 변조 및 삭제 등의 취약점으로 인식 오류가 급증하고 있다. 이러한 문제의 보완 방안으로 음악 자체를 이용하는 내용기반 사용자 음원 인식 기법에 대한 연구가 이루어지고 있다. 본 논문에서는 음악의 파형에서 추출된 특징 정보를 기초로 온라인상에서 사용자 음원을 인식하는 방법에 대해 논하고자 한다. 사용자 음원의 내용기반 인식을 위해 구조에 적합한 음원의 전처리 후 특징 추출을 하였다. 추출된 특징은 음악 서버에 특징 형태로 저장된 음원과의 매칭 과정을 통한 인식을 진행하여 태그데이터에 독립적으로 사용자 음원을 인식할 수 있게 되었다. 제안된 사용자 음원 인식 방법의 검증을 위해 600개의 음악을 무작위 선정하고, 각각을 5가지 음질로 변화하였다. 이렇게 생성된 3000개의 실험음원을 30만곡을 포함하는 음악 서버를 기준으로 인식실험을 진행하였다. 평균 인식율은 85%를 나타내었다. 제안하는 내용기반 음원 인식을 통하여 태그기반 음원 인식의 취약점에 대한 극복을 하였으며, 음원 인식의 성능은 실제 온라인 음악 서비스에 적용할 가능성을 보여주었다.

YOLO 기반의 광학 음악 인식 기술 및 가상현실 콘텐츠 제작 방법 (YOLO based Optical Music Recognition and Virtual Reality Content Creation Method)

  • 오경민;홍요섭;백건영;전찬준
    • 스마트미디어저널
    • /
    • 제10권4호
    • /
    • pp.80-90
    • /
    • 2021
  • 딥러닝에 기반한 광학 음악 인식 기술(Optical Music Recognition, OMR)을 사용하여 도출된 결과를 가상현실 (Virtual Reality, VR) 게임에 적용시킨 것을 제안한다. 딥러닝 모델은 YOLO v5를 사용했으며 검출되지 않은 객체를 검출하기 위해 Hough transform 사용, 보표 크기 수정 등을 수행한다. 출력된 결과 파일을 사용하여 VR 게임에서 BPM, 최대 콤보 수, 음정과 박자를 분석하여 사용하고 리소스 관리를 위한 Object Pooling 기술을 통해 노트가 밀리는 현상을 방지한다. 광학 음악 인식 기술을 통해 나온 음악 요소로 VR 게임을 제작하여 VR 콘텐츠 제공과 함께 광학 음악 인식의 활용성을 넓히는 것을 확인하였다.

잡음에 강인한 내용기반 음악 검색 시스템에 대한 연구 (A Study of Noise Robust Content-Based Music Retrieval System)

  • 윤원중;박규식
    • 대한전자공학회논문지SP
    • /
    • 제45권6호
    • /
    • pp.148-155
    • /
    • 2008
  • 본 논문에서는 모바일 환경에서 적용 가능한 잡음에 강인한 내용기반 음악 검색 시스템을 구축하였다. 제안된 시스템은 기존의 음성인식 분야에서 잡음에 강인한 특성을 가진 것으로 알려진 ZCPA 특징을 내용기반 음악 검색 시스템에 적용시켜 그 성능을 검증하였다. 또한 본 논문에서는 대용량 음악 DB 검색에서 기존의 전수(Exhaustive) 검색에 비해 검색 속도를 99% 가까이 개선할 수 있는 새로운 인덱싱 방법과 고속 검색 알고리즘을 제안하였다. 신호대 잡음비가 15dB - 0dB인 잡음 환경에서의 모의실험 결과, 제안 시스템은 기존의 MFCC와 필터뱅크 에너지 특징에 비해 약 5% - 30% 정도의 우수한 성능을 나타냄을 확인하였다.

Pitch 히스토그램을 이용한 내용기반 음악 정보 검색 (Content-based Music Information Retrieval using Pitch Histogram)

  • 박만수;박철의;김회린;강경옥
    • 방송공학회논문지
    • /
    • 제9권1호
    • /
    • pp.2-7
    • /
    • 2004
  • 본 논문에서는 내용 기반 음악 정보 검색에 MPEG-7에 정의된 오디오 서술자를 적용하는 방법을 제안한다. 특히 Pitch 정보와 timbral 특징들은 음색 구분을 용이하게 할 수 있어 음악 검색뿐만 아니라 음악 장르 분류 또는 QBH(Query By Humming)에 이용 될 수 있다. 이러한 방법을 통하여 오디오 신호의 대표적인 특성을 표현 할 수 있는 특징벡터를 구성 할 수 있다면 추후에 멀티모달 시스템을 이용한 검색 알고리즘에도 오디오 특징으로 이용 될 수 있을 것이다. 본 논문에서는 방송 시스템에 적용하기 위해 영화나 드라마의 배경음악에 해당하는 O.S.T 앨범으로 검색 범위를 제한하였다. 즉, 사용자가 임의로 검색을 요청한 시점에서 비디오 컨텐츠로부터 추출한 임의의 오디오 클립만을 이용하여 그 컨텐츠 전체의 O.S.T 앨범 내에서 음악을 검색할 수 있도록 하였다. 오디오 특징 백터를 구성하기 위해 필요한 MPEG-7 오디오 서술자의 조합 방법을 제안하고 distance 또는 ratio 계산 방식을 통해 성능 향상을 추구하였다. 또한 reference 음악의 템플릿 구성 방식의 변화를 통해 성능 향상을 추구하였다. Classifier로 k-NN 방식을 사용하여 성능평가를 수행한 결과 timbral spectral feature 보다는 pitch 정보를 이용한 특징이 우수한 성능을 보였고 vector distance 방식으로는 특징들의 비율을 이용한 IFCR(Intra-Feature Component Ratio) 방식이 ED(Euclidean Distance) 방식보다 우수한 성능을 보였다.

노이즈에 강인한 음악 시작점 검출 알고리즘 (The Noise Robust Algorithm to Detect the Starting Point of Music for Content Based Music Retrieval System)

  • 김정수;성보경;구광효;고일주
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권9호
    • /
    • pp.95-104
    • /
    • 2009
  • 본 논문에서는 노이즈에 강인한 음악 시작점 검출 알고리즘을 제안한다. 음악의 시작점 검출은 음악을 이용한 신호처리 시스템에 있어서 일관되지 않은 입력데이터를 통한 계산낭비, 비교검색 등의 문제 해결을 위해 필요한 것이다. 특히 신호처리를 이용한 내용기반 음악검색 시스템에서 시간의 순서로 데이터를 비교하는 시간순차적 검색방법에서는 더욱 필요시 된다. 시간순차적 검색 방법은 시간의 순서로 단순 비교를 수행하기 때문에 검색의 속도가 빠르다는 장점이 있는 반면 비교하는 데이터의 시작 시간이 동일해야 하는 단점이 있다. 하지만 디지털화된 음악은 비트레이트 변환에 의한 시작 시간의 동일함을 보장할 수 없다. 따라서 본 논문에서는 검색의 전처리 단계에서 음악의 시작점을 검출함으로써 시간순차적 검색 방법을 적용하여 고속의 검색을 수행하면서도 인식률이 낮아지지 않게 하였다. 시작점 검출은 소리를 검출할 수 있는 최소 파형모형을 이용하였으며 노이즈에 강인하기 위하여 묵음에 존재하는 노이즈는 스킵핑을 하였다. 제안한 알고리즘은 실험을 통해 시작점 검출을 미적용한 결과보다 약 38% 성능이 향상됨을 확인하였으며 노이즈에 강인함을 검증하였다.

자유학기제 지원을 위한 통합 주제 중심의 도서관 정보활용교육 프로그램 개발에 대한 연구 (A Study on Development of Libraries' Information Literacy Program based on Integrated Tasks to Support the Free Semester System)

  • 이경화;송기호
    • 한국비블리아학회지
    • /
    • 제27권4호
    • /
    • pp.85-104
    • /
    • 2016
  • 본 연구의 목적은 자유학기제에 참여하는 중학생의 탐구학습능력을 길러주기 위하여 교과 간 연계성을 갖는 통합 주제 중심의 정보활용교육 프로그램 개발 방안을 제안하는 것이다. 이를 위하여 국가 수준의 2015 개정 교육과정의 내용 요소를 분석하여 중학교 1학년 국어, 사회, 미술, 음악 교과 간 관련성을 갖는 통합 주제 6개를 개발하였다. 통합 주제 지도를 위한 교수 학습지도안은 배경지식 형성하기, 탐구하기, 탐구결과 산출 및 평가하기와 같이 3단계로 구성하였다. 그리고 탐구하기의 세부 활동 과정은 문제인식하기, 정보분석 및 해석하기, 정보종합하기, 활동별 평가하기와 같이 4단계로 설정하였다. 본 연구에서는 <환경>과 <감상>을 공공도서관과 학교도서관에서 시범 적용하였다. 그 결과 프로그램에 참여한 학생들은 다양한 주제를 교과와 연계하여 구성한 프로그램에 흥미를 보였으며, 만족스럽다는 반응을 보였다.

K-pop 수용자의 세계관 수용 현상 연구 : 그룹 에스파의 세계관 사례를 중심으로 (A phenomenon Study on Acceptance Universe of K-pop Audience : Focused on Group Aespa's Universe Case)

  • 김나경
    • 트랜스-
    • /
    • 제12권
    • /
    • pp.173-222
    • /
    • 2022
  • 이 논문은 현재 K-pop분야 콘텐츠 전략으로 활용되고 있는 '세계관' 수용 현상에 대해 K-pop수용자 관점에서 살펴본 후, 그들의 수용 경험과 세계관의 의미 인식을 파악하고자 하였다. 이를 위해 현재 가장 활발하게 세계관을 콘텐츠 전략으로 활용하는 그룹 에스파의 세계관 수용경험과 관련된 트윗을 수집하여, 이 자료를 개인 경험의 의미구조 및 현상의 본질을 탐구하고자 하는 접근방식인 현상학적 접근방식에 따라 분석하였다. 무스타카스의 방식을 활용하여 분석한 결과, 총 21개의 주제를 통해 K-pop 수용자들의 세계관 수용 현상의 의미구조를 도출하였다. 현재 K-pop 수용자들은 세계관 수용을 통해 일방적이거나 수동적이기 보다는 능동적인 문화소비 경험을 하고 있는 것으로 나타났다. 이는 의미를 생산하고 팬덤 내부의 활발한 상호작용을 통해 외부 영향력을 행사하는 대안적 공동체인 능동적 수용자의 특성을 K-pop 수용자들이 지니고 있으며, 동시에 이 특성이 세계관을 수용하는 세부 행위들에 영향을 미치고 있음을 의미한다. 다음으로는 능동적 수용 경험을 통해 K-pop 수용자들이'마케팅 자산', '팬덤 공동체 자산', 'K-pop 산업 확장 자산'이라는 의미를 세계관에 부여하고 있음이 발견되었다. 이 중 '마케팅 자산'인식은 관련 선행연구들의 논의들을 뒷받침하는 근거로 재확인 되었다. 뿐만 아니라, 기존의 생산자적 측면의 선행연구들이 발견하지 못한 '팬덤 고유의 자산'과 'K-pop 산업의 확장 자산'의미를 발견하여 K-pop 분야 세계관의 새로운 가치를 도출하였으며, 향후 세계관의 가치 확장 측면에서 그 의미 및 방향성을 논의하여 제시하였다. 결과적으로, 이 연구는 세계관 수용 현상의 의미구조를 밝혀냈다는 것과, 기존에 논의되지 않았던 K-pop 세계관의 새로운 의미를 발견했다는 데 의의가 있으며, 관련 주제의 후속 연구를 다각도에서 제언하는 것을 통해 연구의 장을 넓히는데 기여하고자 하였다.