• 제목/요약/키워드: 오디오 검색

검색결과 119건 처리시간 0.025초

오디오와 영상 정보를 이용한 비디오 세그먼테이션 및 크래시피케이션 (Segmentation and Classification Using Audio and Image Information)

  • 정해준;정성환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (하)
    • /
    • pp.891-894
    • /
    • 2000
  • 본 논문에서는 효과적인 내용기반 비디오 검색을 위한 샷 경계 검출, 장면 경계 검출, 그리고 비디오 크래시피케이션 방법을 연구하였다. 먼저, 샷 경계 검출을 위해 칼라 히스토그램과 DCT 변환 계수를 통합하여 사용했다. 그리고 장면 경계 검출을 위해서는 영상 정보뿐만 아니라 오디오 정보를 함께 사용하여 장면 경계를 검출하였다. 또한 비디오 크래시피케이션에서는 장면 경계검출시 추출한 오디오 정보를 이용해 비디오를 내용별로 분류하는 연구를 제안하였다. 뉴스, 광고, 스포츠 등 다양한 3개 분야의 TV 프로그램으로 구성된 약 8,500개 영상 프레임과 약 50,000개의 오디오 프레임을 가진 실험 비디오 데이터베이스를 구성하여 제안된 시스템을 실험하였다. 실험한 결과, 약 88%의 정확도(Precision)를 가지는 장면 경계 검출과 약 85%의 평균 분류율을 보였다.

  • PDF

식별함수를 이용한 오디오신호의 내용기반 분류 (Content Based Classification of Audio Signal using Discriminant Function)

  • 김영섭;이광석;고시영;허강인
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 춘계종합학술대회
    • /
    • pp.201-204
    • /
    • 2007
  • 본 논문은 오디오 색인 검색 시스템을 구현하기 위하여 오디오 신호에 대한 특징 파라미터 풀(pool)을 구성하고, 구성되어진 특징 파라미터 풀을 이용한 오디오 데이터의 내용분석 및 분류에 관한 연구이다. 오디오 데이터는 기본적으로 다양한 형태의 오디오 신호로서 분류되어진다. 본 논문에서는 오디오 데이터의 분류에 이용 가능한 특징 파라미터를 분석하고 추출하는 방법에 대하여 논한다. 그리고 특징 파라미터 풀을 색인 그룹 단위로 구성하여 오디오 카테고리에 대한, 설정된 특징들의 포함 정도와 색인기준을 오디오 데이터의 내용을 중심으로 비교, 분석한다. 그리고 마지막으로 위의 결과를 바탕으로 분류카테고리 별로 오디오 데이터의 특징 벡터를 구성한 뒤 이를 이용하여 식별함수 분류기를 통한 분류를 실험한다.

  • PDF

효율적인 8진 트리 검색 방식의 허프만 복호화기 구현 (Efficient Huffman decoder using octal tree search algorithm)

  • 우광희;김구용;한헌수;차형태
    • 한국통신학회논문지
    • /
    • 제25권12B호
    • /
    • pp.2033-2038
    • /
    • 2000
  • 여러 가지 압축알고리즘 중에서 허프만 부호화는 데이터의 통계적인 중복성을 제거하기 위한 방법으로 많이 사용되어 왔다. 이제까지 허프만 테이블의 특성과 코드워드의 패턴에 따라 효율적으로 복호화할 수 있는 알고리즘이 많이 제안되었다. 본 논문에서는 8진 트리 검색 방법을 이용한 허프만 복호화 알고리즘을 제안하고 효율적인 하드웨어 구현 방법을 제안한다. 하드웨어의 메모리와 게이트 면적을 소형화하였고 빠른 검색을 위하여 알고리즘을 최적화하여 MPEG 오디오 복호화기 시스템에 적용할 수 있게 하였다.

  • PDF

음정 곡선을 이용한 효율적인 오디오 데이터베이스 탐색에 관한 연구 (A Study on the Efficient Search of an Audio Database using Musical Interval Contour)

  • 지정규;오해석
    • 정보기술과데이타베이스저널
    • /
    • 제4권2호
    • /
    • pp.97-104
    • /
    • 1998
  • 본 논문은 디지털 오디오 도서관에 대규모 선율 데이터베이스로부터 임의의 곡을 효율적으로 탐색하기 위하여 음정곡선을 색인키로 사용하는 방법에 대해 기술했다. 사용자가 검색하고자 하는 음악의 일부 선율을 노래하면 입력된 음신호를 인식하여 음높이 정보를 추출한다. 그리고, 음표간의 음정을 계산하여 음표순으로 배열함으로써 음정 곡선을 만든다. 제안한 은표열 탐색 알고리즘에 생성된 음정 곡선을 탐색 패턴으로 입력하여 선율 데이터베이스의 음표열을 비교 조사한다. 그러면 근사 음정 곡선을 가진 후보곡을 탐색할 수 있다. 제안한 음표열 탐색 알고리즘은 실험을 통해 동적 프로그래밍 및 상태 대조 알고리즘과 비교한 결과 탐색 시간이 2배이상 향상되었다.

불연속미디어 처리를 위한 CM Toolkit의 확장 (Extension CM Toolkit for Discrete Media Processing)

  • 김용대
    • 정보처리학회논문지B
    • /
    • 제8B권1호
    • /
    • pp.81-88
    • /
    • 2001
  • 분산 멀티미디어 시스템의 기본적인 요구 사항은 비디오와 오디오 같은 연속미디어의 생성 그리고 검색 시점에서 표현 시점까지의 엄격한 지연과 지터를 요구하는 인트라 미디어 동기화와 다수의 연속 미디어 스트림을 병렬로 표현할 때 트랙들간의 상대적 시간 관계에 관한 제한을 만족시키는 인터미디어 동기화를 제공하는 것이다. 본 논문에서는 분산 환경에서 연속미디어를 이용하는 주문형 시스템 개발도구인 버클리 CMT를 텍스트, 이미지, 그래픽 등의 불연속 미디어와 비디오, 오디오 등의 연속 미디어 형태의 멀티미디어 동기화가 가능하도록 확장-CMT를 설계하고, 이를 분산 원격강의 응용에 구현하였다.

  • PDF

이미지 데이타 클러스터링을 이용한 검색 연구 (Study on the searching of images via clustering)

  • 김진옥;황대준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.97-100
    • /
    • 2002
  • 이미지, 비디오, 오디오와 같은 멀티미디어 데이터들은 텍스트기반의 데이터에 비하여 대용량이고 비정형적인 특성을 가지기 때문에 검색이 어렵다. 또한 멀티미디어 데이터의 특징은 행렬이나 벡터의 형태로 표현되기 때문에 완전일치 검색이 아닌 유사 검색을 수행하여 사용자가 원하는 이미지와 유사한 이미지를 검색해야 한다. 본 연구에서는 멀티미디어 데이터 검색에 클러스터링와 인덱싱 기법을 같이 적용하여 유사한 이미지끼리는 인접 디스크에 클러스터하고 이 클러스터에 접근하는 인덱스를 구축하여 검색이 빠르게 이루어지는 유사 검색방법을 제안한다 제안 검색 방법은 클러스터링을 생성하는 알고리즘과 해싱기법의 인덱싱을 같이 적용함으로써 VQ(Vector Quantization)보다 높은 재현율과 정확도를 보인다.

  • PDF

트리기반 멀티미디어 데이터의 의미적 검색을 위한 프레임워크 설계 (Design of the Framework for Tree-based Semantic Retrieval of Multimedia Data)

  • 안형근;고재진;양상석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.133-135
    • /
    • 2005
  • 현재 웹을 사용하는 사람, 디지털 컨텐츠, 정보의 생성이 계속적으로 증가하여 오고 있다. 최근 웹 데이터는 멀티미디어 데이터(비디오, 오디오, 웹TV, 이미지 등)라고 말해도 무방할 것이다. 이런 방대한 멀티미디어 데이터의 검색은 사용자들에게는 아주 중요한 작업이 되었으며, 효과적인 멀티미디어 검색 시스템의 필요성이 대두되고 있다. 최근까지의 멀티미디어 데이터 검색은 내용${\cdot}$주석기반의 검색이 주를 이루고 있다. 하지만 내용${\cdot}$주석 기반 검색은 의미${\cdot}$추론적 검색에서는 부족함을 보여주고 있는 실정이다. 따라서 본 논문에서는 검색 방법 중에서도 주석 기반 검색에서 가지는 문제점을 살펴보고 그에 대한 해결 알고리즘과 프레임워크를 제안한다.

  • PDF

실시간 멀티미디어 웹 기술 (Real-Time Multimedia Web Technology)

  • 신명기
    • 전자통신동향분석
    • /
    • 제12권4호통권46호
    • /
    • pp.39-51
    • /
    • 1997
  • WWW(World Wide Web)은 인터넷상에 광범위하게 분산된 다양한 형식의 데이터를 손쉽게 검색할 수 있으며, 모든 응용의 사용자 환경을 손쉽게 포함시킴으로써 새로운 미디어 타입의 통합을 위한 가장 성공적인 기술로 평가받고 있다. 1990년 처음 개발될 당시 WWW은 텍스트 기반의 구조에 맞추어 HTTP(Hyper Text Transfer Protocol), HTML (Hyper Text Markup Language), URL(Uniform Resource Locator)이 제안되어, 이를 통해 비동기적인 형태의 검색과 상호작용을 지원하도록 설계되었다. 반면, 최근 인터넷상의 상당수를 차지하는 오디오, 비디오와 같은 실시간 환경의 멀티미디어 데이터들은 연속적, 동기적이며, 대화형 특징을 포함하고 있어 WWW에서 이러한 미디어들을 통합하기 위해서는 구조적인 확장이 요구된다. 본 고에서는 실시간 오디오/비디오를 웹상에서 통합시키기 위한 기술들은 분석한다. 인터넷 실시간 멀티미디어 데이터를 WWW에서 처리하기 위한 현재의 기술과 문제점들을 소개하고, 이를 해결하기 위해 WWW 기본 구조의 확장과 기술적인 해결책들을 제안한다.

MCLT 피크쌍 기반의 강인한 해시 함수를 이용한 오디오 핑거프린팅 (Audio Fingerprinting Using a Robust Hash Function Based on the MCLT Peak-Pair)

  • 이준용;김형국
    • 한국음향학회지
    • /
    • 제34권2호
    • /
    • pp.157-162
    • /
    • 2015
  • 본 논문은 MCLT(Modulated complex lapped transform) 피크쌍 기반의 강인한 해시 함수를 이용한 오디오 핑거프린팅을 제안한다. 기존 방식의 오디오 핑거프린팅은 시간-스케일, 피치-이동, 이퀄라이제이션과 같은 다양한 왜곡이 발생했을 때, 강인한 핑거프린트를 추출하지 못한다는 문제점이 있다. 이를 해결하기 위해 본 논문에서는 MCLT 스펙트럼, 현저한 피크검색을 위한 적응적 문턱값 방식, 개선된 해시 함수를 이용하여 잡음과 왜곡 환경 강인한 오디오 핑거프린팅을 추출하였다. 실험결과 제안된 방식이 잡음과 왜곡 환경에서 보다 강인한 핑거프린팅을 추출할 수 있으며 매칭 인식률을 향상 시키는 것을 보여준다.

미디어웨어즈에서의 데이터 관리 (Data management in the Mediawarez)

  • 윤은일;이상윤;최영식;이상홍
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (A)
    • /
    • pp.568-570
    • /
    • 2001
  • 네트워크 하드웨어와 인터넷 서비스 관련기술의 발전과 더불어 인터넷에서는 매일매일 상상하지 못했던 새로운 서비스가 제공되고 있다. 새롭게 제공되는 대부분의 서비스는 이미지, 오디오, 비디오와 같은 멀티미디어 컨텐트를 포함하고 있다. 현재 제공되고 있는 대부분의 검색서비스는 멀티미디어 컨텐트를 브라우징하거나 검색하는데 부적절하거나 비효율적이다. 따라서 멀티미디어 켄텐트를 효율적으로 검색하고 브라우징하는 새로운 검색서비스가 필요하게 되었다. 본 논문에서는 한국통신 멀티미디어연구소에서 개발한 멀티미디어 검색 시스템인 미디어웨이즈[4]를 기반으로 하여 현재 서비스중인 한미르의 멀티미디어 검색 서비스에 대한 전반적인 시스템 구성을 살펴보겠다. 특히 빠르고 정확한 검색을 위해 데이터관리의 측면에서 모듈로 살펴보겠다.