• Title/Summary/Keyword: 오디오 검색

검색결과 119건 처리시간 0.031초

음악 특징점간의 유사도 측정을 이용한 동일음원 인식 방법 (Same music file recognition method by using similarity measurement among music feature data)

  • 성보경;정명범;고일주
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권3호
    • /
    • pp.99-106
    • /
    • 2008
  • 최근 다양한 분야에서(웹 포털, 유료 음원서비스 등) 디지털 음악의 검색이 사용되고 있다. 기존의 디지털 음악의 검색은 음악 데이터에 포함된 자체 메타 정보를 이용하여 이루어진다. 하지만 메타 정보가 다르게 작성되었거나 작성되지 않은 경우 정확한 검색은 어렵다. 요즘 이러한 문제의 보완 방안으로 음악자체를 이용하는 내용기반정보 검색 기법에 대한 연구가 이루어지고 있다. 본 논문에서는 음악의 파형에서 추출된 특징 정보간의 유사도 측정을 통하여 동일음원을 인식하는 방법에 대해 논하고자 한다. 디지털 음악의 특징 정보는 단순화시킨 MFCC (Mel Frequency Cepstral Coefficient)를 이용하여 음악의 파형으로부터 추출하였다. 디지털 음악간의 유사도는 Vision 및 Speech Recognition 분야에서 사용되던 DTW (Dynamic Time Warping) 기법을 활용하여 측정하였다. 제안된 동일 음원 인식 방법의 검증을 위한 같은 장르에서 무작위 추출된 1000곡에서 시행한 500번의 검색은 모두 성공했다. 검색에 사용된 500개의 디지털 오디오는 60개의 디지털음원을 압축방식과 비트율을 다르게 조합하여 만들었다. 실험의 결과로 DTW을 이용한 유사도 측정법이 동일음원을 인식할 수 있음을 증명하였다.

  • PDF

동영상 카투닝 시스템을 위한 자동 프레임 추출 기법 (Auto Frame Extraction Method for Video Cartooning System)

  • 김대진;구떠올라
    • 한국콘텐츠학회논문지
    • /
    • 제11권12호
    • /
    • pp.28-39
    • /
    • 2011
  • 멀티미디어 산업의 발달과 함께 디지털 콘텐츠 시장의 확산을 가져오고 있다. 그 중 인터넷 만화와 같은 디지털 만화 시장의 확장은 급속하게 커지고 있어서, 콘텐츠의 부족과 다양성 때문에 동영상 카투닝에 대한 연구가 계속되고 있다. 지금까지는 동영상 카투닝은 비사실적 렌더링과 말풍선에 초점이 맞추어졌으나, 이러한 것들을 적용하기 위해서는 카투닝 서비스에 적합한 프레임 추출이 우선시 되어야만 한다. 기존의 방법으로는 동영상의 장면전환이 일어나는 샷(shot)안의 프레임을 추출하여, 사용자가 지정한 영역을 임의의 색상으로 렌더링(Rendering)하는 시스템이 있다. 하지만 이러한 방법은 사람의 손을 거치는 반자동적인 방법으로서 정확한 프레임 추출을 위해 사람의 손을 거쳐야하는 단점이 있다. 따라서 본 논문에서는 이러한 문제점을 해결하고, 보다 정확한 카투닝에 적용할 프레임을 추출하기 위해 오디오 및 비디오 분리를 통한 방법을 제안한다. 먼저 동영상으로부터 오디오와 비디오를 분리한다. 오디오는 먼저 MFCC와 영교차율의 특징을 추출하고, 이 특징 정보를 미리 학습된 데이터와 GMM 분류기를 통하여 음악, 음성, 음악+음성으로 분류한 후 음성 영역을 설정한다. 비디오는 히스토그램을 이용한 방법과 같은 일반적인 장면전환 프레임을 추출 후 얼굴 검색을 통해서 만화에서 의미가 있는 프레임을 추출한다. 그 후 음성 영역내에 얼굴이 존재하는 장면전환 프레임이나 일정 시간동안 음성이 지속되는 영역 중 장면전환 프레임을 추출하여 동영상 카투닝에 적합한 프레임을 자동으로 추출한다.

오디오 포렌식을 위한 소리 데이터의 요소 기술 식별 연구 (A Study on Elemental Technology Identification of Sound Data for Audio Forensics)

  • 유혜진;박아현;정성균;정두원
    • 정보보호학회논문지
    • /
    • 제34권1호
    • /
    • pp.115-127
    • /
    • 2024
  • 최근 디지털 오디오 매체의 증가로 인해 소리 데이터의 규모와 다양성이 크게 확대되었으며, 이로 인해 디지털 포렌식 과정에서 소리 데이터 분석의 중요도가 증가하였다. 하지만 소리 데이터 분석에 대한 표준화된 절차나 가이드 라인이 부족하여 분석 결과의 일관성과 신뢰성에 문제가 발생하고 있다. 디지털 환경은 다양한 오디오 형식과 녹음 조건을 포함하고 있지만, 현재 오디오 포렌식 방법론은 이러한 다양성을 충분히 반영하지 못하고있다. 이에 본 연구에서는 모든 상황에서 효과적인 분석을 수행할 수 있도록 Life-Cycle 기반 소리 데이터 요소기술을 식별하여 소리 데이터 분석의 전반적인 가이드라인을 제시하였다. 이와 더불어, 식별한 요소 기술을 소리 데이터를 대상으로 하는 디지털 포렌식 기술 개발에 활용하기 위해 분석을 진행하였다. 본 연구에서 제시한 Life-Cycle별 소리 데이터 요소 기술 식별 체계의 효과성을 입증하기 위하여 소리 데이터 기반으로 응급상황을 검색할 수 있는 기술을 개발하는 과정에 대한 사례 연구를 제시하였다. 해당 사례 연구를 통해 소리 데이터를 대상으로 하는 디지털 포렌식 기술 개발 과정에서 Life-Cycle 기반으로 식별한 요소 기술이 데이터 분석의 질과 일관성을 보장하게 하고 효율적인 소리 데이터 분석을 가능하게 함을 확인하였다.

비디오 데이타를 위한 그리드 기반의 유사 부분 궤적 검색 기법 (Similar sub-Trajectory Retrieval Technique based on Grid for Video Data)

  • 이기영;임명재;김규호;김정준
    • 한국인터넷방송통신학회논문지
    • /
    • 제9권5호
    • /
    • pp.183-189
    • /
    • 2009
  • 최근, PCS, PDA와 같은 이동기기 보급의 확산, GPS(Global Positioning System)의 활용, 유무선 네트워크의 급속한 발전 등으로 일반 사용자들조차 이미지, 오디오, 비디오 등과 같은 멀티미디어 데이타에 대한 활용이 증가하고 있다. 특히, 멀티미디어 데이타 중에서도 비디오 데이타는 텍스트나 이미지 데이타와는 달리 이동 객체에 대한 움직임 정보를 포함하고 있고 시간의 변화에 따라 공간의 변화를 가지는 시공간적 특성을 가진다. 객체의 공간적 위치가 시간의 흐름에 따라 계속 변하는 이동객체(Moving Object)들의 연속적인 움직임들의 모임을 궤적이라 하며, 데이타베이스에서 사용자로부터 주어진 질의 궤적과 유사한 궤적을 포함하는 데이타를 찾는 것을 유사 부분궤적 검색(Similar Sub-trajectory Retrieval)이라 한다. 그리고 이러한 유사 부분궤적 검색을 하기 위해선 사용자 질의 궤적과 주어진 유사정도(Tolerance) 내에서 유사한 데이타 궤적을 검색 할 수 있는 근사 매칭(Approximate Matching)이 가능해야 한다. 또한, 방대한 멀티미디어 데이타베이스에서 사용자가 원하는 데이타 만을 보다 빠른 시간 내에 찾을 수 있도록 기존 연구와는 다른 효과적인 검색방법이 요구된다. 이를 위해, 본 논문에서는 효과적인 검색을 위해 궤적을 그리드로 분할하여 이동 객체의 궤적에 대한 효율적인 유사 부분궤적 검색을 지원하는 새로운 그리드 기반 검색 기법을 제안한다.

  • PDF

A New Tempo Feature Extraction Based on Modulation Spectrum Analysis for Music Information Retrieval Tasks

  • 김형국
    • 한국ITS학회 논문지
    • /
    • 제6권2호
    • /
    • pp.95-106
    • /
    • 2007
  • 본 논문은 음악 정보검색에 사용되는 효과적인 템포 특징 추출방식을 제안한다. 제안된 템포 정보는 협소 밴드상의 일시적인 변조 성분에 의해 형성된다. 이러한 변조 성분은 시간 축 상의 음악 신호로부터 스펙트럼을 구한 후, 각 스펙트럼 성분에 대한 주파수 영역 분석을 통해 획득된 변조 스펙트럼으로 구성된다. 실제 구현에 있어서는 MP3 음악파일로부터 부분 디코딩에 의해 출력된 변형된 이산 코사인 변환 계수에 퓨리에 변환을 취하여 변조스펙트럼을 구하였다. 획득된 변조 스펙트럼의 진폭으로부터 고속으로 추출된 음악 템포 특징값은 다양한 음악 정보 검색에 적용되었다. 음악 무드 및 장르 분류에서는 로그 변조 주파수 계수를 적용하여 분류 성능을 개선시켰으며, 적응 변조 스펙트럼에서 유도된 비트 벡터는 오디오 핑거프린팅에 적용되어 잡음환경 하에서도 검색 성능을 크게 향상시켰다.

  • PDF

HTML5 기반 스마트TV 하이브리드 미디어서비스 (Smart TV Hybrid Media Service based on HTML5)

  • 이상윤;조준면;유정주;박상택;홍진우
    • 전자통신동향분석
    • /
    • 제29권3호
    • /
    • pp.11-16
    • /
    • 2014
  • 방송과 통신이 융합되면서 새로운 서비스들이 등장하고 있는데 서비스만 보고서는 방송서비스인지 통신서비스인지 분간이 힘든 기술들이 다수 등장하고 있다. 최근 스마트TV가 방송, 통신, 컴퓨팅의 대표적인 서비스로 부각되면서 멀티플랫폼 연동의 하이브리드 미디어서비스가 다양하게 개발되고 있다. 본 논문에서는 방송통신 융합서비스에 대해서 두 매체 간의 연관여부에 따라 2가지로 서비스를 분류하고 각 분류된 방식에 따른 다양한 하이브리드 미디어서비스의 실제 구현사례를 소개한다. 소개되는 서비스에는 개인형 홈스크린, 앱스토어, 콘텐츠 검색 및 추천, 패밀리톡, 대면 통신을 포함하는 스마트TV 홈스크린 기반 미디어 융합서비스와 하이브리드광고 서비스, 멀티앵글뷰 서비스, 멀티오디오 서비스를 포함하는 스마트TV 하이브리드 미디어서비스이다. 본 논문에서는 모든 서비스가 HTML5 기반의 웹브라우저에서 동작하도록 구현하였다.

  • PDF

VHDL을 이용한 MPEG-4 CELP 부호화기의 구현 (Implementation of MPEG-4 CELP Encoder using VHDL)

  • 이시원;김수현;홍민철;차형태
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.561-564
    • /
    • 2000
  • MPEG-4 CELP의 알고리즘은 전송환경에 따라 선택할 수 있는 다양한 전송률을 지원하며 각종 옵션을 추가함으로써 다양한 기능을 부가할 수 있도록 구성되어 있다. 본 논문에서는 MPEG-4 오디오 CELP 부호화기를 VHDL(Very High Speed Intergrated Circuit Hardware Description Language)을 이용하여 구현하였다. MPEG-4 CELP의 부호화 과정을 크게 3부분으로 나누어 LPC 분석부, 코드북 검색부, 비트열 생성부로 나누어 설계하였으며, 내부 메모리의 크기를 줄이기 위하여 중복적인 성격을 갖거나 계산과정에서 나오는 중간 결과 값들을 저장하지 않도록 알고리즘을 최적화하였다. 또 계산 값의 동적 범위(Dynamic Range)가 크거나 정밀도가 요구되는 부분에 대해서는 배밀도(Double Precision) 연산을 사용하여 값의 오차를 줄였다.

  • PDF

사전 DB를 이용한 웹 메일 문서 생성기 (Design and Implementation of Web Mail Document Generator using Dictionary DB)

  • 최지연;민수홍;조동섭
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (상)
    • /
    • pp.451-454
    • /
    • 2003
  • WWW(Word Wide Web)은 인터넷 상에서 광범위하게 분산된 다양한 형식의 데이터를 손쉽게 검색할 수 있도록 하며, 모든 응용의 사용자 환경을 손쉽게 포함시킴으로서 새로운 미디어 타입의 통합을 위한 가장 성공적인 기술로 평가받고 있다. E-Mail 서비스는 WWW 시스템의 가장 기본적인 기능으로, 인터넷 기술이 발전하고 사용자가 기하급수적으로 증가함에 따라 E-Mail 사용자도 늘고있다. 그러나 기존의 서비스는 HTML의 텍스트 기반 구조를 통한 비동기적인 형태의 서비스를 계속 유지하고 있어, 최근 인터넷상의 상당수를 차지하는 오디오, 비디오와 같은 실시간 환경의 멀티미디어 데이터들을 통합하는 좀더 동기적인 표현방법이 요구되고 있다. 본 논문에서는 E-Mail 서비스에 대한 동기적 방법론을 제안하고 구현하고자 한다.

  • PDF

PDA에서의 MPEG-4 BIFS파서 구현 (Imp1ementation of MPEG-4 BIFS Parser on PDA)

  • 여재욱;정재일;신용경;김상욱
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.565-567
    • /
    • 2002
  • 본 논문은 PDA(Personal Digital Assistants)에서의 MPEG-4 BIFS(Binary Format (or Scenes) 파서를 구현한다. 일반 데스크탑 환경의 MPEG-4 재생기에서 장면 구성은 BIFS 파싱 결과로 생긴 장면 그래프의 각 객체정보를 모두 렌더링 한다 그러나, 이동 단말기인 PDA는 메모리 및 디스플레이 자인이 제한되어 있어 기존의 데스크탑 환경에서 구현된 모듈들을 그대로 적용하기가 어렵다. 따라서, 본 논문에서는 BIFS 파싱 결과로 나온 장면 그래프에서 생성된 드로어블 노드 리스트 중 제한된 자원의 PDA에서 디스플레이 가능한 노트들만을 추출하는 새로운 기술을 제안한다. 추출된 드로어블 노드 리스트는 MPEG-4 재생기의 렌더링 모듈에서 검색하여 장면구성 및 비디오/오디오 스트림이 재생된다. 이러할 과정을 내장형 리눅스가 탑재된 PDA에서 구현하고, 기타 이동장치에서도 이용 가능하다.

  • PDF

개인용 미디어 관리 소프트웨어에 대한 사용자 요구사항 (User Requirements for Personal Media Management Software)

  • 서희철;김현기;장명길
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.124-126
    • /
    • 2006
  • 본 논문은 개인이 소장하고 있는 문서, 이미지, 오디오, 동영상 등의 미디어를 통합 관리하는 개인용 미디어 관리 소프트웨어의 필요성, 기능, 인터페이스 등에 관한 사용자 요구사항을 정리한다. 사용자 요구사항은 사용자 설문을 통해서 조사되었으며, 설문에는 사용자 환경과 개인용 미디어 관리 소프트웨어에 필요한 기능, 인터페이스에 관한 내용을 담고 있다 사용자 요구 사항에서 사용자들은 다수의 미디어를 컴퓨터에 저장하고 있으며, 이들을 효율적으로 관리할 수 있는 소프트웨어를 필요로 하고 있다. 이들을 관리하기 위한 기능으로 미디어 분석, 분류, 검색, 재생 기능을 필요로 한다. 그리고 사용자들은 컴퓨터뿐만 아니라 핸드폰, PDA와 같은 모바일 기기에서도 개인용 미디어를 관리하고자 한다. 인터페이스에서는 키보드와 마우스 입력과 함께 모바일 기기를 위한 음성 인터페이스에 대한 요구가 있다.

  • PDF