• 제목/요약/키워드: 오디오 정보 검색

검색결과 98건 처리시간 0.02초

오디오와 영상 정보를 이용한 비디오 세그먼테이션 및 크래시피케이션 (Segmentation and Classification Using Audio and Image Information)

  • 정해준;정성환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (하)
    • /
    • pp.891-894
    • /
    • 2000
  • 본 논문에서는 효과적인 내용기반 비디오 검색을 위한 샷 경계 검출, 장면 경계 검출, 그리고 비디오 크래시피케이션 방법을 연구하였다. 먼저, 샷 경계 검출을 위해 칼라 히스토그램과 DCT 변환 계수를 통합하여 사용했다. 그리고 장면 경계 검출을 위해서는 영상 정보뿐만 아니라 오디오 정보를 함께 사용하여 장면 경계를 검출하였다. 또한 비디오 크래시피케이션에서는 장면 경계검출시 추출한 오디오 정보를 이용해 비디오를 내용별로 분류하는 연구를 제안하였다. 뉴스, 광고, 스포츠 등 다양한 3개 분야의 TV 프로그램으로 구성된 약 8,500개 영상 프레임과 약 50,000개의 오디오 프레임을 가진 실험 비디오 데이터베이스를 구성하여 제안된 시스템을 실험하였다. 실험한 결과, 약 88%의 정확도(Precision)를 가지는 장면 경계 검출과 약 85%의 평균 분류율을 보였다.

  • PDF

내용기반 음악장르 검색에서 시계열 패턴 인덱스 화일의 성능 분석 (Performance Analysis of the Time-series Pattern Index File for Content-based Music Genre Retrieval)

  • 김영인;김선종
    • 한국산업정보학회논문지
    • /
    • 제11권5호
    • /
    • pp.18-27
    • /
    • 2006
  • 음악 데이타의 양이 급속히 증가함에 따라 음악 데이타베이스의 오디오 특정을 이용한 내용기 반 음악 장르의 효율적인 유사도 검색 방법이 요구되고 있다. 이러한 시스템을 구현하기 위해서는 시계열 패턴인 오디오 특징을 인덱싱 할 수 있는 인덱싱 기법과 데이터마이닝 기술이 필요하다. 본 논문에서는 인덱싱 기법을 기반으로 하는 유사 장르 음악 검색 시스템의 개발에 대하여 논의한다. 먼저, 시계열 패턴 인덱싱 기법과 데이터마이닝을 이용한 내용기반 음악장르 검색 시스템의 구조를 제안한다. 또한, 오디오 특정을 이용한 유사 장르 검색의 성능을 보이기 위하여 시계열 패턴 인덱스 화일을 구축하고 성능 분석 을 제시한다. 실제 데이타의 특정값을 이용한 실험을 통하여 제안한 기법의 성능을 확인하였다.

  • PDF

멀티미디어 응용을 위한 SHORE 하부저장 시스템의 확장 (Extension of SHORE storage system for multimedia applications)

  • 정재욱;장재욱
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.6-8
    • /
    • 1999
  • 컴퓨터 통신 기술의 급속한 발달로 인해 정지영상, 오디오, 비디오와 같은 다양한 미디어로 구성된 대용량의 멀티미디어 자료를 효율적으로 저장하고 관리할 수 있는 하부 저장 시스템이 필요하다. 이러한 멀티미디어 자료에 대한 내용-기반 검색을 위해 텍스트 기반 검색과 색상 또는 질감과 같은 특징 벡터에 기반한 검색이 이루어져야 한다. 본 논문에서는 멀티미디어 응용을 위한 하부저장 시스템을 구현하기 위해 미국 위스콘신 대학에서 개발한 지속성 객체 시스템인 SHORE를 확장하고자 한다. 텍스트 기반 검색을 위해 역화일 구조를 구현하였으며, 고차원의 특징 벡터의 검색을 위해 X-트리를 통합하였다.

  • PDF

가우시안의 차를 이용하여 검색속도를 향상한 최소 오디오 핑거프린팅 (Search speed improved minimum audio fingerprinting using the difference of Gaussian)

  • 권진만;고일주;장대식
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권12호
    • /
    • pp.75-87
    • /
    • 2009
  • 본 논문은 오디오 핑거프린트 데이터 생성 방법과 이를 이용한 오디오 데이터 비교 방법에 관한 것으로서, 오디오 데이터의 특징을 이용하여 음악을 식별하는 방법을 제시한다. 일반적으로 영상인식을 위해 많이 사용되는 가우시안의 차(Difference of Gaussian, DoG)를 오디오 데이터에 적용하여 음악이 급진적으로 변하는 부분을 추출하고, 해당 위치를 핑거프린트로 정의하는 방식이다. 이렇게 만들어진 핑거프린트는 음질의 변화에 민감하지 않으며, 음악 데이터의 일정 부분만으로도 원본과 동일 위치의 핑거프린트 추출이 가능하다. 이 시스템은 기존의 주파수 영역을 이용한 시스템 보다 오디오 핑거프린트의 데이터량과 계산량을 줄여줌으로써 검색을 할 때 보다 효율적인 성능을 나타낸다. 이를 응용하여 인터넷에 유통되는 복사된 음악의 저작권 보호, 또는 음악의 메타정보 등을 사용자에게 나타낼 수 있다.

오디오 핑거프린팅기반 입체음향 재현 시스템 (Audio Fingerprinting Based Spatial Audio Reproduction System)

  • 류상현;김형국
    • 전자공학회논문지
    • /
    • 제50권12호
    • /
    • pp.217-223
    • /
    • 2013
  • 본 논문에서는 오디오 핑거프린팅 방식과 스파셜 오디오 처리 방식을 결합한 오디오 핑거프린팅 기반 입체음향 재현 시스템을 제안한다. 제안된 시스템에서는 변조스펙트럼 기반의 명확한 오디오 정점 핑거프린트를 이용하여 잡음환경에서 오디오 핑거프린팅 시스템의 검색정확도를 향상시켰으며, 메타데이터로 제공되는 스파셜 오디오 정보는 청취자에게 소리가 실제로 녹음된 공간에서 소리를 듣는 것 같은 느낌을 준다.

상호대화형 오디오비주얼 서비스의 표준화 현황과 전망 (Scope and Status of Audio Visual Interactive Services Standardization)

  • 현동환;이부호
    • 전자통신동향분석
    • /
    • 제9권3호
    • /
    • pp.97-102
    • /
    • 1994
  • 상호대화형 오디오비주얼 서비스는 텍스트, 도형, 사진, 오디오, 비디오 등과 같은 다양한 형태의 표현 요소로 구성되는 입출력 정보를 사용자의 단말이나 워크스테이션에 제공하는 서비스이다. 이러한 기능의 범위는 간단한 검색에서부터 상호대화적인 문의, 구성요소들의 재배치, 그들 요소들의 수정등의 서비스를 사용자에게 제공 할 수 있다. 이와 관련하여 ITU-T SG8/Q.11에서는 AVI 서비스를 위해 요구되는, 시스템, 데이터 교환형식, 그리고 프로토콜과 같은 일련의 기술적 사항을 표준화하는 작업을 하고 있다. 본고에서는 AVI 서비스의 기술적인 사항에 대하여 논하고, 현재 진행되고 있는 표준화 동향에 대하여 알아본다.

파워 가중치를 이용한 오디오 핑거프린트 정합 (Audio fingerprint matching based on a power weight)

  • 서진수;김정현;김혜미
    • 한국음향학회지
    • /
    • 제38권6호
    • /
    • pp.716-723
    • /
    • 2019
  • 음악 검색을 서비스하기 위해서는 핑거프린트 정합 정확도가 중요하다. 본 논문에서는 파워 가중치를 이용하여 오디오 핑거프린트 정합 성능을 제고하고자 한다. 파워 가중치는 핑거프린트 비트 추출 과정에서 유실되는 정보를 이용하여 구한 핑거프린트 비트의 예측 강인도이다. 기존 파워 마스크 방법은 저장 공간을 줄이기 위해서 이진화를 통해서 강인한 비트와 연약한 비트로 나눈다. 본 논문에서는 정합 성능을 향상시키기 위해서 실수 값 형태의 파워 가중치를 사용하는 방법을 제안한다. 또한 시간축 방향으로 연관성이 강한 파워 가중치의 특성을 이용하여 압축하여 저장공간을 줄일 수 있도록 한다. 공개된 음악 데이터셋에서 실험을 수행하여, 제안된 파워 웨이트가 오디오 핑거프린트 정합성능을 제고함을 확인하였다.

장면 검색을 지원하는 XML 기반 멀티미디어 검색 시스템 (XML Based Multimedia Retrieval System supporting Scene Search)

  • 정미라;황부현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.133-136
    • /
    • 2001
  • 오디오 비디오 데이터의 활용이 증가함에 따라 멀티미디어 데이터의 내용에 대해 표현하려는 연구와 함께 멀티미디어 데이터의 내용이나 메타데이터를 저장하고, 검색하고, 조작하는 연구의 필요성이 증가하였다. 멀티미디어 데이터의 표현은 사용자가 원하는 내용만을 쉽게 검색하고, 접근한 수 있도록 표현되고 저장되어야 한다. 그러나 기존의 멀티미디어 검색 시스템들은 특정 객체에 중점을 두고 색상, 위치, 모양 등의 정보를 가지고 유사 객체를 찾는 방식을 취하고 있으므로 특정 사건이나 구체적인 인물 정보나 에피소드의 정보를 검색하고자 한 때는 키워드에 의한 검색을 해야하므로 불필요한 정보가 다량으로 검색되며 여러 번의 검색이 이루어져야 하는 단점이 있다. 또한 일반 사용자들은 주로 특정 장면에서 특정 객체의 특징이나 행동, 장소, 사건 등의 정보에 대해 관심을 갖고, 이에 따른 질의를 하는 경향이 있다. 따라서 본 논문에서는 "장면"이라는 계층 구조에 중점을 두고 멀티미디어 데이터의 내용 정보와 구조 정보를 표현 및 저장을 하며, 사용자는 특정 사건이나 객체들의 특징 정보를 가지고 장면이나 전체 구조를 검색찬 수 있는 시스템을 설계하고 구현한다. 멀티미디어 데이터의 표현 및 저장 검색의 모든 과정은 데이터의 재사용성과 접근 용이성을 위해 XML을 기반으로 하여 처리된다. 이렇게 XML로 표현된 데이터는 사용자들에게 구조 정보나 내용 정보에 있어서 다양한 검색 결과를 제공할 수 있는 장점이 있다.

  • PDF

임베디드 리눅스 기반의 개인 오디오 레코더 서비스 구현 (The Implementation of Personal Audio Recorder Service based on Embedded Linux)

  • 김도형;이경희;이철훈
    • 정보처리학회논문지D
    • /
    • 제15D권2호
    • /
    • pp.257-262
    • /
    • 2008
  • 본 논문에서는 음성통화를 위해 CDMA 네트워크와 데이터 통신을 위해 와이브로 네트워크를 동시에 사용하는 임베디드 리눅스 기반의 듀얼모드 응용 서비스인 개인 오디오 레코더의 구현에 대해서 기술한다. 개인 오디오 레코더는 듀얼모드 지원 단말에 탑재된 클라이언트에서 음성 녹음을 시작하면, 송신자와 수신자의 CDMA 음성 데이터가 와이브로 네트워크를 통해 인터넷 상의 저장 서버로 전달된다. 개인 오디오 레코더 서버는 통화 번호 및 통화 시간을 기준으로 음성 데이터를 서버에 저장하게 된다. 구현된 개인 오디오 레코더는 단말의 저장공간이 부족한 환경에서도 음성 통화 내용을 저장할 수 있도록 한다. 그리고, 개인 오디오 레코더는 서버에 저장된 통화 목록을 검색하여, 특정 통화 내용을 재생할 수 있다.

리듬정보를 이용한 악보생성 시스템 구현 (Implementation of Musical Note Generation System using Rhythm Information)

  • 소두석;최재원;이종혁
    • 한국정보통신학회논문지
    • /
    • 제7권6호
    • /
    • pp.1210-1216
    • /
    • 2003
  • 본 논문에서는 기존의 오디오검색 관련 시스템의 텍스트 정보기반의 음악 검색의 한계를 극복하기 위해 사용자가 입력한 음악데이터에서 리듬정보를 추출해 내어 데이터 베이스 내의 음악 정보 검색이 가능하게 하는 내용기반 검색 시스템의 일종인 리듬 추출 시스템을 제안하였다. 본 논문에서는 음악정보에서 리듬의 특징 정보를 추출하여 특정 파라미터를 생성하고 신경회로망을 사용하여 악기 인식을 통한 악보생성 시뮬레이션을 하였다.