• 제목/요약/키워드: Audio indexing

검색결과 41건 처리시간 0.018초

Retrieval of Broadcast News Using Audio Content Analysis

  • Kim, Hyoung-Gook
    • The Journal of the Acoustical Society of Korea
    • /
    • 제26권3E호
    • /
    • pp.74-79
    • /
    • 2007
  • In this paper, we report our recent work on a indexing and retrieval system of broadcast news using audio content analysis. Key issues addressed in this work are two major parts of the audio indexing system: anchorperson detection based on audio segmentation, and phone-based spoken document retrieval, developed in the framework of the emerging MPEG-7 standard. Experiments are conducted on a database of Britisch broadcast news videos. We discuss the development of the retrieval system, and the evaluation of each part and the retrieval system.

소파변환을 사용한 오디오 데이터 베이스 검색 기반에서의 오디오 색인에 관한 연구 (A Study on Audio Indexing Using Wavelet Transform for Content-based Retrieval in Audio Database)

  • 최귀열;곽칠성
    • 한국정보통신학회논문지
    • /
    • 제4권2호
    • /
    • pp.461-468
    • /
    • 2000
  • 디지털 기술 발전에 따른 오디오 데이터의 증가는 여러 컴퓨터 응용에 사용되면서 데이터를 관리하고 사용하기 위해, 내용기반 질의와 유사성 검색과 같은 새로운 기능을 갖는 데이터베이스 시스템의 개발이 불가피하게 됐다. 내용 기반 질의를 위한 빠르고 정확한 검색은 이러한 응용 시스템들에 필요하다. 효율적인 내용기반 색인과 유사성 검색의 설계는 관련성 있는 데이터의 빠른 검색을 제공하기 위한 주된 요소이다. 본 논문에서는 소파(Wavelet) 변환을 이용한 한국 전통 음악 데이터베이스의 오디오 색인을 위한 방법을 제안한다. 또한 소파 변환을 이용해 오디오 데이터에 대한 색인의 가능성을 보인다.

  • PDF

An Optimized e-Lecture Video Search and Indexing framework

  • Medida, Lakshmi Haritha;Ramani, Kasarapu
    • International Journal of Computer Science & Network Security
    • /
    • 제21권8호
    • /
    • pp.87-96
    • /
    • 2021
  • The demand for e-learning through video lectures is rapidly increasing due to its diverse advantages over the traditional learning methods. This led to massive volumes of web-based lecture videos. Indexing and retrieval of a lecture video or a lecture video topic has thus proved to be an exceptionally challenging problem. Many techniques listed by literature were either visual or audio based, but not both. Since the effects of both the visual and audio components are equally important for the content-based indexing and retrieval, the current work is focused on both these components. A framework for automatic topic-based indexing and search depending on the innate content of the lecture videos is presented. The text from the slides is extracted using the proposed Merged Bounding Box (MBB) text detector. The audio component text extraction is done using Google Speech Recognition (GSR) technology. This hybrid approach generates the indexing keywords from the merged transcripts of both the video and audio component extractors. The search within the indexed documents is optimized based on the Naïve Bayes (NB) Classification and K-Means Clustering models. This optimized search retrieves results by searching only the relevant document cluster in the predefined categories and not the whole lecture video corpus. The work is carried out on the dataset generated by assigning categories to the lecture video transcripts gathered from e-learning portals. The performance of search is assessed based on the accuracy and time taken. Further the improved accuracy of the proposed indexing technique is compared with the accepted chain indexing technique.

TIP-인덱싱 기법과 오디오 화일의 특징계수에 의한 내용기반 음악 검색 (Content-based Music Retrieval by TIP-indexing Techniques and Features of Audio files)

  • 김영인
    • 한국산업정보학회논문지
    • /
    • 제11권3호
    • /
    • pp.10-14
    • /
    • 2006
  • 방대한 양의 음악 데이터를 효율적으로 검색하기 위해서는 오디오 특징에 의해 인덱싱하고 검색하는 인덱싱 기법이 요구된다. 그러나 이와 관련한 인덱싱 기법에 대한 연구는 미진한 실정이다. 본 논문에서는 TIP-인덱싱 화일을 이용하여 오디오 특징 계수를 인텍싱하고 검색할 수 있는 내용기반 음악 정보 검색 기법을 제안한다. 또한 다양한 블록킹 인수를 이용한 성능 비교 실험을 위하여 TIP-인덱싱 화일을 만들고 실험한다. 실험 결과는 제안한 방법의 유효성을 보여준다.

  • PDF

비교사 토론 인덱싱을 위한 시청각 콘텐츠 분석 기반 클러스터링 (Audio-Visual Content Analysis Based Clustering for Unsupervised Debate Indexing)

  • 금지수;이현수
    • 한국음향학회지
    • /
    • 제27권5호
    • /
    • pp.244-251
    • /
    • 2008
  • 본 연구에서는 시청각 정보를 이용한 비교사 토론 인덱싱 방법을 제안한다. 제안하는 방법은 BIC (Bayesian Information Criterion)에 의한 음성 클러스터링 결과와 거리기반 함수에 의한 영상 클러스터링 결과를 결합한다. 시청각 정보의 결합은 음성 또는 영상 정보를 개별적으로 사용하여 클러스터링할 때 나타나는 문제점을 줄일 수 있고, 토론 데이터의 효과적인 내용 기반의 분석이 가능하다. 제안하는 방법의 성능 평가를 위해 서로 다른 5종류의 토론 데이터에 대해 음성, 영상 정보를 개별적으로 사용할 때와 두 가지 정보를 동시에 사용할 때의 성능 평가를 수행하였다. 실험 결과 음성과 영상 정보를 결합한 방법이 음성, 영상 정보를 개별적으로 사용할 때 보다 토론 인덱싱에 효과적임을 확인하였다.

사용자 질의 패턴을 이용한 효율적인 오디오 색인기법 (An Efficient Audio Indexing Scheme based on User Query Patterns)

  • 노승민;박동문;황인준
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권4호
    • /
    • pp.341-351
    • /
    • 2004
  • 디지털 오디오 컨텐츠의 활용이 보편화되면서 오디오 데이타베이스에 대해 컨텐츠를 효과적으로 질의하고 검색하는 기능이 절실해졌다. 본 논문에서는 사용자들이 자주 질의하는 멜로디 부분을 이용하여 오디오 검색을 효과적으로 수행할 수 있는 새로운 인덱스 기법을 제안한다. 이 기법은 어떤 오디오에 대해 사용자가 기억하고 질의하는 내용이 대개 오디오의 특정 부분에 한정되어 있다는 사실에 기반하고 있다. 사용자의 이러한 질의 패턴을 이용하여 자주 질의되는 부분을 감지하고 인덱스로 사용함으로써 사용자가 원하는 곡을 빠르게 찾아낼 수 있게 해준다. 이러한 방법은 데이타베이스의 모든 컨텐츠를 순차적으로 검색하는 기존의 방법에 비해 적은 비용으로 검색 속도를 크게 향상시키며 특히 기존의 검색 시스템 상위 모듈로 사용이 가능하다. 프로토타입 시스템을 구현하고 다양한 실험을 통하여 논문에서 제안하는 기법의 우수성을 보인다.

효율적인 웨이블렛 기반 오디오 데이터 검색 시스템 구현 (Implementation of an Efficient Wavelet Based Audio Data Retrieval System)

  • 이배호;조용춘;김광희
    • 한국음향학회지
    • /
    • 제21권1호
    • /
    • pp.82-88
    • /
    • 2002
  • 본 논문은 오디오 데이터의 검색을 위해 웨이블렛 (wavelet) 변환을 이용한 효율적인 인덱싱 방법을 제안하였다. 오디오 데이터는 그 자신이 가지고 있는 많은 저장공간의 필요, 전송에 있어서의 실시간 필요성, 큰 대역폭등의 다양한 특성 때문에 좋은 검색효율을 위한 인덱스를 구성하기가 쉽지 않다. 신호 및 영상처리에서 각광받고 있는 웨이블렛을 이용한 인덱스는 웨이블렛 변환이 가지고 있는 여러 특징들로 인해 데이터를 블록으로 나누지 않은 상태에서의 인덱싱과 검색을 가능케 한다. 오디오 데이터의 인덱싱은 웨이블렛의 마지막 단계의 고주파 부분과 저주파 부분의 계수를 이용하여 고주파부분은 스트링 매칭 알고리즘에 의해 스트링의 연속으로 변환하고, 저주파 부분은 영점 교차 히스토그램으로 변환한다. 구축된 인덱스를 이용한 오디오 데이터 검색은 질의 데이터와 데이터 베이스안의 인덱스 각 부분, 즉 고주파 부분과 저주파 부분의 스트링을 비교하여 가장 적은 편차를 갖는 결과를 검색 결과로 한다. 본 논문은 적절한 비교 계수 결정, 질의 길이의 변화에 따른 검색율의 변화, 데이터 각 분류별 유사도 검색 효율에 대한 실험을 하였으며, 본 논문에서 제안한 방법이 기존의 방법보다 우수한 성능 향상을 보였다.

XCRAB :내용 및 주석 기반의 멀티미디어 인덱싱과 검색 시스템 (XCRAB : A Content and Annotation-based Multimedia Indexing and Retrieval System)

  • 이수철;노승민;황인준
    • 정보처리학회논문지B
    • /
    • 제11B권5호
    • /
    • pp.587-596
    • /
    • 2004
  • 최근들어 오디오, 비디오와 이미지 같은 다양한 디지털 멀티미디어 데이터의 인덱싱, 브라우징과 질의를 위한 새로운 형태의 시스템이 개발되었다. 이러한 시스템은 각 미디어 스트림을 실제 물리적 이벤트에 따라서 작은 유닛단위로 나누고, 물리적 이벤트들을 검색을 위해서 효율적으로 인덱스화 시킨다. 본 논문에서는 오디오-비주얼 데이터의 분석과 세그멘테이션을 위해서 각 데이터가 가지고 있는 오디오, 이미지, 비디오 특징을 이용하는 새로운 방법을 사용한다. 이것은 이미지나 비디오만을 분석했던 이전의 방법들을 문제점을 해결 할 수 있다. 본 논문에서는 이와 같은 방법을 이용하여 XCRAB이라고 불리는 웹 기반 멀티미디어 검색 시스템을 구현하였고, 성능평가를 위해서 여러가지 질의의 조합을 이용하여 실험을 하였다.

식별함수를 이용한 오디오신호의 내용기반 분류 (Content Based Classification of Audio Signal using Discriminant Function)

  • 김영섭;이광석;고시영;허강인
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 춘계종합학술대회
    • /
    • pp.201-204
    • /
    • 2007
  • 본 논문은 오디오 색인 검색 시스템을 구현하기 위하여 오디오 신호에 대한 특징 파라미터 풀(pool)을 구성하고, 구성되어진 특징 파라미터 풀을 이용한 오디오 데이터의 내용분석 및 분류에 관한 연구이다. 오디오 데이터는 기본적으로 다양한 형태의 오디오 신호로서 분류되어진다. 본 논문에서는 오디오 데이터의 분류에 이용 가능한 특징 파라미터를 분석하고 추출하는 방법에 대하여 논한다. 그리고 특징 파라미터 풀을 색인 그룹 단위로 구성하여 오디오 카테고리에 대한, 설정된 특징들의 포함 정도와 색인기준을 오디오 데이터의 내용을 중심으로 비교, 분석한다. 그리고 마지막으로 위의 결과를 바탕으로 분류카테고리 별로 오디오 데이터의 특징 벡터를 구성한 뒤 이를 이용하여 식별함수 분류기를 통한 분류를 실험한다.

  • PDF

오디오 데이터의 특징 파라메터 구성에 따른 내용기반 분석 (The Content Based Analysis According to the Composition of the Feature Parameters for the Auditory Data)

  • 한학용;허강인;김수훈
    • 한국음향학회지
    • /
    • 제21권2호
    • /
    • pp.182-189
    • /
    • 2002
  • 본 논문은 오디오 색인·검색 시스템을 구현하기 위하여 오디오 신호에 대한특징 파라메터 풀 (pool)을 구성하고 이에 따른 오디오 데이터의 내용분석 및 분류에 관한 연구이다. 오디오 데이터는 기본적인 다양한 오디오 형태로 분류되어진다. 본 논문에서는 오디오 데이터의 분류에 이용 가능한 특징 파라메터를 분석하고 추출방법에 대하여 논한다. 그리고 특징 파라메터 풀을 색인 그룹 단위로 구성하여 오디오 카테고리에 대한 설정된 특징들의 포함 정도와 색인기준을 오디오 데이터의 내용을 중심으로 비교 ·분석한다. 그리고 위의 결과를 바탕으로 분류절차를 구성하여 오디오 신호를 분류하는 모의실험을 행하였다.