• 제목/요약/키워드: 오디오 추출

검색결과 170건 처리시간 0.025초

스프레드 스펙트럼 워터마킹 기법의 연구 (A Study on the Spread Spectrum Watermarking Method)

  • 강환일;김갑일;한승수
    • 한국지능시스템학회논문지
    • /
    • 제11권8호
    • /
    • pp.731-735
    • /
    • 2001
  • 본 논문은 새로운 워터마킹기법을 제안하고 이 기법은 실시간 처리에 이용될 수 있다. 웨이브릿변환 대신에 계산량을 줄이기 위해 정수 웨이브릿변환을 이용한다. 본 논문에서 정수 웨이브릿 공간에서 카이자승분포와 관련한 워터마크를 삽입한다. 워터마크를 추출할 때 확산스펙트럼 기법을 이용하고 유사도는 공분산 수열에서 결정하낟. 실험을 통하여 카이 자승분포를 이용한 워터마크를 이용하는 것이 소음에 강인함을 보인다. 이 워터마킹 기법은 동시에 은닉된 정보에 제어되고 오디오 신호에 따라 움직일 수 있는 전기 기기의 제작에 쓰일 수 있다.

  • PDF

유리 베지에곡선을 위한 디지털워터마크 기법 (A Digital Watermark Scheme for Rational Bezier Curves)

  • 김태완;권성화;문환표;최형인;위남숙
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.625-628
    • /
    • 2002
  • 디지틸워터마킹은 디지털콘텐츠의 저작권보호 솔루션으로서 현재 주로 이미지, 오디오, 비디오, 텍스트 등을 대상으로 연구되고 있다. 컴퓨터 하드웨어, 네트워크, 그리고, 응용 소프트웨어의 빠른 발전과 함께 국가 차원의 초고속 통신망의 인프라 구축에 힘입어, 3차원 폴리곤과 곡선 및 곡면에 대한 디지털워터마킹에 관심이 높아지고 있다. 본 논문에서는 유리 베지에곡선에 대한 디지털워터마킹에 대한 하나의 방법을 제시한다. 기존의 베지에곡선의 차수를 증가시키는 일반적인 방법이 아닌 유리항의 분모와 분자에 공통의 다항식을 곱하여 차수를 증가시킨다. 이때 공통으로 칠하는 다항식의 관들의 복비(cross ratio) 값에 우리가 숨기고자하는 마크를 삽입하고, 추출해내는 방법을 제시한다. 본 논문에서 제시된 알고리듬은 워터마크를 삽입하는 과정에서 곡선의 형태를 전혀 변화시키지 않는 형태 유지성(shape preserving property)을 갖는다. 또한. 본 알고리듬의 다른 중요한 특징은 곡선이 CAD 시스템에 의해 이용되는 과정에서 흔히 일어나는 재매개화 방법 중 뫼비우스 변환을 이용한 재매개화에 저항성이 있는 알고리듬이라는 것이다. 마지막으로 본 연구에서 제시한 방범에 의한 예제의 결과를 보여준다.

  • PDF

제한수신시스템을 적용한 디지털 멀티미디어방송 수신시스템 구현에 관한 연구 (A Study on the Realization of Digital Multimedia Broadcast Receiving System using Conditional Access System)

  • 김영빈;류광렬
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 추계종합학술대회
    • /
    • pp.340-343
    • /
    • 2005
  • 본 논문은 유로 가입자에 대해서 수신이 가능하도록 제한하는 제한수신시스템을 적용한 디지털멀티미디어방송 수신시스템 구현에 관한 연구이다. 이 시스템은 스마트카드와 소프트웨어 기법의 제한 수신시스템을 사용하여 스크램블 된 전송 스트림을 역스크램블 하기 위한 제어단어를 추출하므로 강화된 안전성을 제공한다. H.264의 비디오 데이터 복호화 처리를 위한 DSP와 RISP가 있는 듀얼 프로세서를 사용하여 QVGA의 비디오와 24Khz${\sim}$48Khz의 오디오 방송을 평균 15f/s로 재현이 가능하다. 가입자 정보를 추가한 방송 스트림을 수신하여 제한수신의 동작 상태와 역스크램블 된 스트림을 디코딩하였을 때 정상 가입자에 대한 경우 역스크램블 과정이 정상적으로 수행되었음을 확인할 수 있었다.

  • PDF

블록체인 및 분산저장시스템을 활용한 음원 및 시그니쳐 저장 방법 (Music Source and Signature Storage Method using Blockchain and Distributed Storage System)

  • 이경식;김상균
    • 방송공학회논문지
    • /
    • 제24권6호
    • /
    • pp.956-964
    • /
    • 2019
  • 유투브나 트위치와 같은 개인 미디어 시대를 맞아, 개인의 미디어 컨텐츠 제작과 소비가 간편해졌다. 플랫폼 서비스를 통한 엄청난 양의 미디어 컨텐츠가 생성 소비되고 있다. 이와 관련하여 미디어 컨텐츠의 저작권에 대한 관심이 높아지고 있다. 특히, 음원의 경우 거의 모든 미디어 컨텐츠 제작에 있어 없어서는 안 될 중요 요소이다. 본 논문에서는 뮤직 컨텐츠에 대한 저작권을 확인하기 위해 음원과 그의 시그니쳐를 블록체인과 분산저장시스템을 활용하여 저장할 수 있는 방안을 제안한다. 음원의 오디오 시그니쳐 추출 결과를 블록체인 트랜잭션 데이터로 포함할 수 있는지의 가능성을 파악한다. 실험을 통해 음원과 그의 시그니쳐를 분산저장시스템에 저장했을 때의 입출력 속도를 비교 확인한다.

영상 캡션 정보를 이용한 멀티미디어 데이터 검색 시스템의 설계 및 구현 (Design and Implementation of Multimedia Data Retrieval System using Image Caption Information)

  • 이현창;배상현
    • 한국정보통신학회논문지
    • /
    • 제8권3호
    • /
    • pp.630-636
    • /
    • 2004
  • 오디오 비디오 데이터의 활용이 증가함에 따라 멀티미디어 데이터의 내용에 대해 표현하려는 연구와 함께 멀티미디어 데이터의 내용이나 메타데이터를 저장하고, 검색하고, 조작하는 연구의 필요성이 증가하였다. 멀티미디어 데이터 표현은 사용자가 원하는 내용만을 쉽게 검색하고, 접근할 수 있도록 표현되고 저장되어야 한다. 본 논문은 멀티미디어 데이터가 포함된 문서를 검색하기 위해서 멀티미디어 데이터의 캡션(Caption) 정보를 이용하거나 문서 내용을 기반으로 멀티미디어 데이터를 검색 할 수 있는 시스템을 설계하고 구현하였다. 멀티미디어 데이터의 캡션 정보와 문서의 텍스트는 모두 키워드를 추출하기 위해 필터링(Filtering) 단계를 거치고, B+ 트리를 이용한 역 파일 구조를 사용하여 빠르고 대용량의 문서 검색을 할 수 있도록 하였다.

확률적 은닉 성분 분석 및 음향 기술자를 사용한 내용 기반 음악 요소 검색 방법 (A Scheme for Content-based Music Element Retrieval Using Probabilistic Latent Component Analysis and Acoustic Descriptor)

  • 한병준;이교구;노승민;황인준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.475-478
    • /
    • 2011
  • 지금까지 음악 정보 검색을 위한 다양한 내용 기반 음악 검색 및 비교 방법이 제안되었다. 그런데, 기존 연구들은 질의 방식 및 검색 카테고리가 변화함에 따라 상이한 방법을 제시하고 있어 음악 검색 방법을 통합하는 데에 한계가 있다. 이러한 문제를 해결하기 위해, 본고에서는 내용 기반 음악 검색의 일반화를 위한 내용 기반 음악 요소 검색(CBMER) 방법을 제안하였다. 제안 방법에서는 확률적 은닉 성분 분석(PLCA)을 사용하여 음원을 분해하고, 각 분해 요소로부터 오디오 특성을 추출하였다. 제안 방법을 사용하여 다양한 질의 방식 및 검색 카테고리로 내용 기반 음악 요소 검색이 가능함을 보이기 위해, 남성/여성의 목소리로부터 질의를 생성하여 목소리 성별에 따른 음악을 검색하는 실험을 수행하고 그 결과를 분석하였다.

A New Tempo Feature Extraction Based on Modulation Spectrum Analysis for Music Information Retrieval Tasks

  • 김형국
    • 한국ITS학회 논문지
    • /
    • 제6권2호
    • /
    • pp.95-106
    • /
    • 2007
  • 본 논문은 음악 정보검색에 사용되는 효과적인 템포 특징 추출방식을 제안한다. 제안된 템포 정보는 협소 밴드상의 일시적인 변조 성분에 의해 형성된다. 이러한 변조 성분은 시간 축 상의 음악 신호로부터 스펙트럼을 구한 후, 각 스펙트럼 성분에 대한 주파수 영역 분석을 통해 획득된 변조 스펙트럼으로 구성된다. 실제 구현에 있어서는 MP3 음악파일로부터 부분 디코딩에 의해 출력된 변형된 이산 코사인 변환 계수에 퓨리에 변환을 취하여 변조스펙트럼을 구하였다. 획득된 변조 스펙트럼의 진폭으로부터 고속으로 추출된 음악 템포 특징값은 다양한 음악 정보 검색에 적용되었다. 음악 무드 및 장르 분류에서는 로그 변조 주파수 계수를 적용하여 분류 성능을 개선시켰으며, 적응 변조 스펙트럼에서 유도된 비트 벡터는 오디오 핑거프린팅에 적용되어 잡음환경 하에서도 검색 성능을 크게 향상시켰다.

  • PDF

하모닉 정보를 이용한 SAOC의 보컬 신호 제거 방법에 관한 연구 (A Study on Vocal Removal Scheme of SAOC Using Harmonic Information)

  • 박지훈;장대근;한민수
    • 한국멀티미디어학회논문지
    • /
    • 제16권10호
    • /
    • pp.1171-1179
    • /
    • 2013
  • IAS는 대게 사용자가 자신의 취향에 맞는 음악을 직접 제작 및 편집 가능한 기능을 제공하는 서비스이다. SAOC는 낮은 전송률로 IAS가 가능한 다객체 오디오 코딩 기술이다. 하지만 SAOC 기법은 특정 객체를 제거하는 경우, 특히 보컬 객체를 제거하는 경우 배경음악에 보컬 객체의 하모닉이 남아있는 문제점이 있다. 그래서 본 논문은 하모닉 추출과 제거를 사용한 보컬 객체 제거 기법을 제안한다. 제안 하는 기법은 부호화기에서 추출한 하모닉 정보를 이용하여 복호화기에서 보컬 객체 신호를 다운믹스 신호에서 제거하는 기법이다. 하모닉 정보로써, 기본 주파수, MVF, 하모닉 크기를 사용한다. 성능평가로 객관적, 주관적 실험을 수행하였으며 모든 실험 결과를 통해 SAOC 기법보다 제안하는 기법이 우수함을 확인한다.

잡음 환경에서의 음성인식을 위한 온라인 빔포밍과 스펙트럼 감산의 결합 (Combining deep learning-based online beamforming with spectral subtraction for speech recognition in noisy environments)

  • 윤성욱;권오욱
    • 한국음향학회지
    • /
    • 제40권5호
    • /
    • pp.439-451
    • /
    • 2021
  • 본 논문에서는 실제 환경에서의 연속 음성 강화를 위한 딥러닝 기반 온라인 빔포밍 알고리듬과 스펙트럼 감산을 결합한 빔포머를 제안한다. 기존 빔포밍 시스템은 컴퓨터에서 음성과 잡음을 완전히 겹친 방식으로 혼합하여 생성된 사전 분할 오디오 신호를 사용하여 대부분 평가되었다. 하지만 실제 환경에서는 시간 축으로 음성 발화가 띄엄띄엄 발성되기 때문에, 음성이 없는 잡음 신호가 시스템에 입력되면 기존 빔포밍 알고리듬의 성능이 저하된다. 이러한 효과를 경감하기 위하여, 심층 학습 기반 온라인 빔포밍 알고리듬과 스펙트럼 감산을 결합하였다. 잡음 환경에서 온라인 빔포밍 알고리듬을 평가하기 위해 연속 음성 강화 세트를 구성하였다. 평가 세트는 CHiME3 평가 세트에서 추출한 음성 발화와 CHiME3 배경 잡음 및 MUSDB에서 추출한 연속 재생되는 배경음악을 혼합하여 구성되었다. 음성인식기로는 Kaldi 기반 툴킷 및 구글 웹 음성인식기를 사용하였다. 제안한 온라인 빔포밍 알고리듬 과 스펙트럼 감산이 베이스라인 빔포밍 알고리듬에 비해 성능 향상을 보임을 확인하였다.

Conformer 모델을 이용한 물체 표면 재료의 특성에 따른 가속도 신호 기반 햅틱 질감 인식 (Acceleration signal-based haptic texture recognition according to characteristics of object surface material using conformer model)

  • 김형국;정동기;김진영
    • 한국음향학회지
    • /
    • 제42권3호
    • /
    • pp.214-220
    • /
    • 2023
  • 본 논문에서는 합성곱 신경망과 트랜스포머의 장점을 결합한 Conformer 모델을 이용하여 물체 표면의 질감특성을 나타내는 햅틱 가속도 신호로부터 질감 인식 성능을 향상시키는 방식을 제안한다. 제안한 방식에서는 사람이 스타일러스와 같은 도구를 이용하여 물체 표면과 접촉하는 동안 충격음과 진동에 의해 발생한 3축 가속도 신호를 1차원 가속도 데이터로 결합하고, 오디오 신호와 유사성을 갖는 햅틱 가속도 신호로부터 로그 멜-스펙트로그램을 추출한다. 그리고 추출된 로그 멜-스펙트로그램에 Conformer 모델을 적용하여 다양한 물체의 질감을 인식하는 데 있어 주요한 지역적 및 전역적인 주파수 특징을 학습한다. 제안된 모델의 성능 평가를 위해 60개의 재질로 구성된 Lehrstuhl für Medientechnik(LMT) 햅틱 질감 데이터세트를 실험한 결과 제안된 방식이 기존 방식들보다 물체 표면 재료의 질감을 효과적으로 잘 인식할 수 있음을 보였다.