• 제목/요약/키워드: Music retrieval

검색결과 133건 처리시간 0.022초

멀티미디어 시스템의 동영상 노드를 위한 앵커의 인간공학적 설계지침 (Human factors guidelines for designing anchors in the moving pictures on multimedia systems)

  • 한성호;김미정;곽지영
    • 대한산업공학회지
    • /
    • 제22권2호
    • /
    • pp.265-276
    • /
    • 1996
  • Multimedia systems present information by various media, for example, video, sound, music, animation, movie, etc., in addition to the text which has long been used for conveying the information. Among many multimedia applications, the multimedia information retrieval systems commercialized in the forms of multimedia encyclopedia CD-ROMs, benefited from various media for their ability to present information in an efficient and complete way. But using several media, on the other hand, may cause end users' confusion and furthermore, poorly designed user interface often exacerbates the situation. In this study, the multimedia systems were studied from the standpoint of usability. The conceptual framework of the user interface of the multimedia system was newly defined. And 100 initial variables for user interface design of general multimedia systems were suggested through literature survey and expert opinions based upon the framework developed. Among various application areas, the multimedia information retrieval systems were chosen for investigation, and 36 variables particularly relevant to user interface of the multimedia information retrieval systems were selected. According to the sequential research strategy, the variables that were considered to be most important were finally selected through a screening stage. A part of selected variables were verified through a human factors experiment as the first step of sequential research. Based upon the result of the experiment, guidelines for user interface design were provided. For future study, the variables remained will be Investigated and the study will expand to another application areas.

  • PDF

NIFF를 이용한 음악정보 검색에 관한 연구 (A Study on Music Information Retrieval System Using NIFF)

  • 박종도;이두영
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1998년도 제5회 학술대회 논문집
    • /
    • pp.9-13
    • /
    • 1998
  • 디지털도서관에서의 음악정보의 효율적인 검색과 이용을 목적으로 NIFF를 이용해 음악정보를 디지털화하고 이를 기반으로 전율, 가사, 코드, 주석등의 세부 요소를 자동으로 색인하여 검색에 활용하는 방법을 제안하였다. 이 방법을 이용하면 첫째, 전통적인 목록에서는 불가능한 다양한 접근점의 제시가 가능하여 음악정보 이용자의 정보요구를 보다 잘 충족시킬 것이며, 둘째, 향후 정보검색 분야에 있어서 음악정보를 대상으로 하는 다양한 검색기법을 연구하는 중요한 토대가 될 것으로 기대한다.

  • PDF

음악 컨텐츠를 위한 빠른 검색 기법 (A Fast Retrieval Scheme for Music Contents)

  • 노승민;황인준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.647-649
    • /
    • 2003
  • 최근 들어 디지털 음악 컨텐츠의 사용량이 증가하면서 데이터베이스로부터 다양한 포맷의 음악 컨텐츠를 효과적으로 찾을 수 있는 음악 검색 시스템의 필요성이 증가했다. 본 논문에서는 사용자들이 자주 질의하는 멜로디를 이용하여 효율적인 검색을 하기 위한 기법을 제안한다. 사용자의 허밍이나 오선지를 통한 질의로부터 추출된 음높이와 음의 길이를 분석하여 UDR과 LSR 스트링으로 변환하고 자주 검색되는 멜로디의 관리를 통해 검색의 성능을 향상시켰다. 또한 XLM을 사용하여 음악 정보를 구조화하는 새로운 데이터 모델을 제안하고 음높이. 음의 길이 , 리듬 등의 음악 특징 정보를 이용한 복합 질의를 통하여 제안한 시스템의 성능 평가를 하였다.

  • PDF

음원 데이터베이스의 효율적 확장을 지원하는 내용 기반 음원 검색 시스템 (A Content-based Audio Retrieval System Supporting Efficient Expansion of Audio Database)

  • 박지훈;강현철
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권5호
    • /
    • pp.811-820
    • /
    • 2017
  • 음원 서비스의 주요 기능 중 하나인 내용 기반 검색을 위해 음원의 지문을 채취하여 데이타베이스에 저장하고 색인하여 검색에 활용하는 기법이 널리 사용되고 있다. 그런데 지속적으로 추가되는 신규 음원의 지문이 기존의 데이타베이스에 계속 삽입되면 공간 효율 및 음원 검색 성능의 저하가 점차 초래되는 문제점이 있다. 따라서 시스템 운용 비용의 증가를 가져오는 주기적인 데이터 베이스 재구성 없이 효율적인 음원 데이타베이스의 확장을 지원하는 기법이 요구된다. 본 논문에서는 샤잠의 지문 채취 알고리즘을 기반으로 클러스터 컴퓨팅 환경에서 맵리듀스 및 NoSQL 데이타베이스를 사용하여 이러한 문제를 해결하는 내용 기반 음원 검색 시스템의 설계를 제시하고 실제 음원 데이터를 이용한 다양한 실험을 통해 그 성능을 평가한다.

피치 히스토그램과 MFCC-VQ 동적 패턴을 사용한 음악 검색 (Music Identification Using Pitch Histogram and MFCC-VQ Dynamic Pattern)

  • 박철의;박만수;김성탁;김회린
    • 한국음향학회지
    • /
    • 제24권3호
    • /
    • pp.178-185
    • /
    • 2005
  • 본 논문에서는 내용기반 음악 정보 검색 방법으로써 멜로디의 시간 변화 특성과 통계적 특성을 모두 이용할 수 있는 hybrid 방법에 대해 제안하였다. 실제 방송 환경에의 적용을 위해 드라마 OST의 좁은 검색 범위뿐만 아니라 가요 1,005곡의 넓은 검색 범위에서도 제안한 방법을 이용하여 실험하였다. 제안된 방법은 특징 벡터로써 pitch와 MFCC(Mel Frequency Cepstral Coefficient)를 사용하여 음의 특성을 나타내었으며 멜로디를 표현하기 위해 피치 히스토그램과 VQ (Vector Quantization) 코드화한 MFCC의 템포럴 시퀀스를 이용함으로써 음악 검색 방법에 멜로디의 시간 변화 특성과 통계적 특성을 함께 적용할 수 있었다. 또한 pitch 히스토그램과 MFCC-VQ 템포럴 방법을 모두 사용한 hybrid 방식에 적절한 패턴 매칭 방법을 제안함으로써 기존의 각 단일 방식을 이용한 성능 결과 (MFCC-VQ 템포럴)와 비교하여 볼 때 드라마 OST 검색 범위에서는 평균 $9.9\%$, 가요 1,005곡의 검색 범위에서는 $10.2\%$의 오류 감소율을 나타내었다.

음악의 분위기와 폭소노미 태그의 관계 분석 (Analysis of Association between Mood of Music and Folksonomy Tag)

  • 문창배;김현수;장영완;김병만
    • 감성과학
    • /
    • 제16권1호
    • /
    • pp.53-64
    • /
    • 2013
  • 폭소노미는 폭소노미에 사용되는 태그에 대하여 유사어, 태깅 레벨, 신조어등의 문제점들이 있다. 본 연구자들은 이러한 문제점들을 해결하기 위해 음악의 분위기 강도(Arousal과 Valence의 강도)를 음악의 내부 태그로 활용하는 방법을 사용하고자 한다. 즉, A(Arousal)값과 V(Valence)값을 이용하여 음악의 분위기를 수치적으로 표현하고, 분위기 태그도 AV값으로 대응시켜 검색하게 되면 태그가 일치하지 않더라도 유사한 AV 값을 갖는 음악이 검색되어 결과적으로 분위기가 유사한 음악들을 검색할 수 있게 된다. 본 논문에서는 이의 선행연구로 AV값과 폭소노미 태그와의 관계를 정의하는 매핑테이블을 제안하고, 태그와 AV값의 연관 관계를 분석하기 위해 유명한 음악 검색 사이트인 last.fm에서 수집한 테스트 데이터에 대해 ANOVA 검증을 하였다. 검증결과, A값과 V값에 모두에 대하여 제 1종 오류확률 P가 0.0으로 귀무가설을 기각하고 대립가설을 채택할 수 있었다. 결론적으로 폭소노미 태그에 따라 AV 값 분포가 다르다는 것을 검증 할 수 있었다.

  • PDF

Bi-LSTM 모델을 이용한 음악 생성 시계열 예측 (Prediction of Music Generation on Time Series Using Bi-LSTM Model)

  • 김광진;이칠우
    • 스마트미디어저널
    • /
    • 제11권10호
    • /
    • pp.65-75
    • /
    • 2022
  • 딥러닝은 기존의 분석 모델이 갖는 한계를 극복하고 텍스트, 이미지, 음악 등 다양한 형태의 결과물을 생성할 수 있는 창의적인 도구로 활용되고 있다. 본 고에서는 Niko's MIDI Pack 음원 파일 1,609개를 데이터 셋으로 삼아 전처리 과정을 수행하고, 양방향 장단기 기억 순환 신경망(Bi-LSTM) 모델을 이용하여, 효율적으로 음악을 생성할 수 있는 전처리 방법과 예측 모델을 제시한다. 생성되는 으뜸음을 바탕으로 음악적 조성(調聲)에 적합한 새로운 시계열 데이터를 생성할 수 있도록 은닉층을 다층화하고, 디코더의 출력 게이트에서 인코더의 입력 데이터 중 영향을 주는 요소의 가중치를 적용하는 어텐션(Attention) 메커니즘을 적용한다. LSTM 모델의 인식률 향상을 위한 파라미터로서 손실함수, 최적화 방법 등 설정 변수들을 적용한다. 제안 모델은 MIDI 학습의 효율성 제고 및 예측 향상을 위해 높은음자리표(treble clef)와 낮은음자리표(bass clef)를 구분하여 추출된 음표, 음표의 길이, 쉼표, 쉼표의 길이와 코드(chord) 등을 적용한 다채널 어텐션 적용 양방향 기억 모델(Bi-LSTM with attention)이다. 학습의 결과는 노이즈와 구별되는 음악의 전개에 어울리는 음표와 코드를 생성하며, 화성학적으로 안정된 음악을 생성하는 모델을 지향한다.

시간 지연 신경망을 이용한 음악 장르 분류 (Music Genre Classification using Time Delay Neural Network)

  • 이재원;조찬윤;김상균
    • 한국멀티미디어학회논문지
    • /
    • 제4권5호
    • /
    • pp.414-422
    • /
    • 2001
  • 본 논문에서는 오디오 데이터의 효과적인 검색을 위하여, 시간지연신경망을 이용한 음악 장르 분류 시스템을 제안한다. 분류 대상 장르는 Blues, Country, Hard Core, Hard Rock, Jazz, R&B(Soul), Techno, Trash Metal의 8종류이다. 장르를 분류하기 위한 비교단위는 곡 중에서의 한 마디이다. 이러한 마디는 리듬의 특성을 효과적으로 반영하는 스네어 드럼 소리를 기준으로 추출한다. 분류기는 시간 지연 신경망을 이용하여 구성하며 입력은 추출된 마디에 대한 주파수 특징벡터이다. 제안한 시스템의 유효성을 검증하기 위한 실험에서, 장르별 10곡씩 총 80곡의 학습 데이터와 장르별 5곡씩 총 40곡의 테스트 데이터에 대하여 각각 92.5%와 60%의 정인식율을 보였다

  • PDF

멀티미디어 검색을 위한 shot 경계 및 대표 프레임 추출 (Shot boundary Frame Detection and Key Frame Detection for Multimedia Retrieval)

  • 강대성;김영호
    • 융합신호처리학회논문지
    • /
    • 제2권1호
    • /
    • pp.38-43
    • /
    • 2001
  • 본 논문에서는 MPEG 비디오 스트림을 분석하여 DCT DC 계수를 추출하고 이들로 구성된 DC 이미지로부터 제안하는 robust feature를 이용하여 shot 검출을 수행한 후 각 feature들의 통계적 특성을 이용하여 스트림의 특징에 따라 weight를 부가하여 구해진 characterizing value의 시간 변화량을 구한다. 추해진 변화량의 local maxima와 local minima는 비디오 스트림에서 각각 가장 특징적인 frame과 평균적인 frame을 나타낸다. 이 순간의 shot을 구함으로서 효과적이고 빠른 시간 내에 key frame을 추출한다. 추출되어진 key frame에 대하여 원영상을 복원한 후, 색인을 위하여 다수의 parameter를 구하고, 사용자가 질의한 영상에 대해서 이들 파라메터를 구하여 key frame들과 가장 유사한 대표영상들을 검색한다. 실험결과 일반적인 방법보다 더 나은 결과를 보였고, 높은 검색율을 보였다.

  • PDF

강인한 오디오 핑거프린팅 시스템을 위한 에너지와 통계적 필터링 (Energy and Statistical Filtering for a Robust Audio Fingerprinting System)

  • 정병준;김대진
    • 한국콘텐츠학회논문지
    • /
    • 제12권5호
    • /
    • pp.1-9
    • /
    • 2012
  • 디지털 음악과 스마트 폰이 대중화되면서 잡음에 강인한 실시간 음악 핑거프린트 시스템이 다양하게 개발되고 있다. 특히 핑거프린트 알고리즘 중 Multiple Hashing(MLH)은 잡음에 강인하고 정교한 구조로 되어 있다. 본 논문에서는 음악 데이터베이스로부터 질의 및 응답의 정확도를 개선하기 위해 에너지 집중필터를 사용하고 연속성과 중복성을 제거하는 통계적 필터를 제안한다. 에너지 집중 필터는 하위 비트에 에너지가 집중되는 Discrite Cosine Transform(DCT)의 특징을 이용하고, 통계적 필터는 검색된 핑거프린트 정보들 사이의 상관관계 특성을 이용한다. 실험 결과로 잡음 환경에서 에너지와 통계적 필터링으로 구성된 제안 알고리즘은 우수성을 보인다. 이는 제안된 필터 엔진으로 Philips Robust Hash(PRH)보다 잡음에 강인하고 Multiple Hashing(MLH)보다 간결한 핑거프린트 시스템을 구성할 수 있다.