• 제목/요약/키워드: audio data.

검색결과 887건 처리시간 0.022초

음원 내 보컬 주파수 대역 분석에 기반한 음향기기 추천시스템 (A system for recommending audio devices based on frequency band analysis of vocal component in sound source)

  • 김정현;석철민;김민주;김수연
    • 한국산업정보학회논문지
    • /
    • 제27권6호
    • /
    • pp.1-12
    • /
    • 2022
  • 음원 스트리밍 서비스와 Hi-Fi 시장이 성장함에 따라 다양한 음향기기들이 출시되고 있다. 이로 인해 소비자들의 제품 선택에 대한 폭은 넓어졌지만 자신의 음악적 취향과 일치하는 제품을 찾기는 더욱 어려워졌다. 본 연구에서는 사용자가 선호하는 음원으로부터 보컬 성분을 추출하고 이를 토대로 사용자에게 가장 적합한 음향기기를 추천하는 시스템을 제안하였다. 이를 위해 먼저 원본 음원을 Python의 Spleeter Library를 통해 분리하여 보컬 음원을 추출하고 제조사의 음향기기의 주파수 대역 데이터를 수집한 결과를 각각 격자 그래프로 나타내었다. 추출한 보컬 음원의 주파수 대역과 음향기기의 주파수 대역 측정치 데이터를 비교하기 위한 지표로서 Matching Gap Index(MGI)를 제안하였다. 산출된 MGI 값을 토대로 사용자 선호와의 유사도가 가장 높은 음향기기를 추천한다. 추천 결과는 음향 전문업체에서 제공하는 장르별 Equalizer 데이터를 이용하여 검증하였다.

MPEG-7 기반의 멀티미디어 데이터 검색 시스템 설계 (Design of Multimedia data Retrieval System based on MPEG-7)

  • 김경수
    • 융합보안논문지
    • /
    • 제8권4호
    • /
    • pp.91-96
    • /
    • 2008
  • 멀티미디어 데이터의 급격한 양적 팽창은 원하는 데이터를 빠르고 정확하게 검색해야 한다는 새로운 과제를 안겨주었다. 이러한 효율적 검색을 위해 가장 중요한 기반이 되는 것이 바로 데이터의 적절한 표준화이다. 2001년 국제 표준으로 제정된 MPEG-7은 바로 이러한 이유로 멀티미디어 데이터의 표현에 대한 표준화를 다루고 있다. 본 논문에서 설계한 시스템은 MPEG-7에서 요구하는 내용기반 검색 방법인 하위 레벨 메타데이터들을 이용한 유사성 검색과 상의 레벨 메타데이터들을 이용한 키워드 검색 기능을 제공할 것이다. 또한, 상위 레벨 메타데이터와 하위 레벨 메타데이터들을 통합하여 검색하는 기능을 제공하여 사용자가 원하는 멀티미디어 정보를 보다 효율적으로 검색할 수 있도록 할 것이다.

  • PDF

오디오의 파형과 FFT 분석을 이용한 대표 선율 검색 (Representative Melodies Retrieval using Waveform and FFT Analysis of Audio)

  • 정명범;고일주
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권12호
    • /
    • pp.1037-1044
    • /
    • 2007
  • 최근 내용 기반 음악 검색 시스템에서는 사용자의 응답 시간을 단축시키기 위해 음악의 대표성을 갖는 선율을 추출하여 색인하고, 검색 시 이를 사용한다. 기존 연구에서는 미디(midi) 데이타를 이용하여 대표 선율을 추출하는 방법이 제안되었으나, 미디 데이타에 한정되는 단점이 있었다. 따라서 본 논문에서는 디지털 신호처리를 이용하여 모든 오디오 파일 포맷에 적용 가능한 대표 선율 검색을 제안한다. 대표 선율 검색을 위해 FFT(Fast Fourier Transform)을 이용하여 박자와 마디를 찾고 각 마디들의 PCM 데이타로부터 높은 수치가 나타나는 빈도를 측정한다. 이때 높은 수치들이 가장 많이 뭉쳐 있는 영역에서 여덟 마디 간격이 오디오 데이타의 대표 선율 영역이다. 제안 방법의 유효성을 검증하기 위한 실험으로 총 1000곡을 선택하여 대표 선율을 추출하였고, 그 결과 템포를 찾아낸 737곡 중 79.5%의 정확성을 보였다.

식별함수를 이용한 오디오신호의 내용기반 분류 (Content Based Classification of Audio Signal using Discriminant Function)

  • 김영섭;이광석;고시영;허강인
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 춘계종합학술대회
    • /
    • pp.201-204
    • /
    • 2007
  • 본 논문은 오디오 색인 검색 시스템을 구현하기 위하여 오디오 신호에 대한 특징 파라미터 풀(pool)을 구성하고, 구성되어진 특징 파라미터 풀을 이용한 오디오 데이터의 내용분석 및 분류에 관한 연구이다. 오디오 데이터는 기본적으로 다양한 형태의 오디오 신호로서 분류되어진다. 본 논문에서는 오디오 데이터의 분류에 이용 가능한 특징 파라미터를 분석하고 추출하는 방법에 대하여 논한다. 그리고 특징 파라미터 풀을 색인 그룹 단위로 구성하여 오디오 카테고리에 대한, 설정된 특징들의 포함 정도와 색인기준을 오디오 데이터의 내용을 중심으로 비교, 분석한다. 그리고 마지막으로 위의 결과를 바탕으로 분류카테고리 별로 오디오 데이터의 특징 벡터를 구성한 뒤 이를 이용하여 식별함수 분류기를 통한 분류를 실험한다.

  • PDF

차세대 디지털 TV 방송을 위한 오디오 규격 비교 분석 및 제언 (Audio Format Comparative Study and Suggestion for Next Generation DTV)

  • 이재홍
    • 한국음향학회지
    • /
    • 제30권6호
    • /
    • pp.337-343
    • /
    • 2011
  • 3D 디지털 시험 방송 개시와 함께, 다가오는 UHDTV 시대에 대비 한 차세대 디지털 방송 방식에 관한 연구가 활발히 진행되고 있다. 본 논문에서는 현행 사용 중이거나 연구되고 있는 주요 서라운드 오디오 규격을 비교 분석하고 차세대 디지털 방송용 오디오 규격을 제시한다. 현재 주목받고 있는 손실 및 비손실 압축 방식을 채용한 디지털 서라운드 오디오 규격인 Dolby True HD와 DTS HD MA (Master Audio) 규격과 함께 일본 NHK 연구소가 제안한 UHDTV용 22.2 채널 서라운드 규격에 대해 비교 검토한다. 이를 기초로 하여 우리나라의 주택 사정을 감안한 3D 서라운드 7.1 손실 압축 오디오 규격과 하이파이 오디오와의 호환성을 중시하는 2.0, 4.0 비손실 압축규격을 차세대 디지털 방송용 규격으로 제시한다. 이와 함께 개인별 HRTF (Head Related Transfer Function) 생성을 통하여 홀로그래픽 사운드에 근접하는 3차원 입체 음장 제공을 해줄 수 있는 바이노럴 (binaural) 헤드폰용 2 채널 오디오 데이터를 부음성 규격으로 별도로 전송 방안도 함께 제시한다. 각 전송 규격 별 소요 비트 레이트 율도 함께 산출하여 제시하였다.

컴퓨터 영상회의를 위한 멀티미디어 통합처리장치의 설계 및 구현 (Design and Implemention of Multimedia Integrated Processing Unit for Computer-Nased Video Conference)

  • 김현기;홍재근
    • 전자공학회논문지C
    • /
    • 제35C권3호
    • /
    • pp.59-68
    • /
    • 1998
  • This paper propose a hardware architecure of multimediasysgem for integrated processing of the multimedia data such as audio and video, and describes on the design and implementation of multimedia integrated processing Unit. The unit comprises most commonly needed multimedia processing function for computer-based video conference: audio-visual datacapture, playback, compression, decompression as well as interleaving/disinterleaving of compressed audio-visual data. The proposed architecture minimizes the CPU overhead that might be caused by multimedia data processing and assures the fluent data flow among system components. Also, this unit is tested and analyzed under the computer-based video conference to confirm the multimedia unit of proposed architecture using communication protocol and application software through Ethernet and FDDI (Fiber Distributed Data Interface) networks.

  • PDF

오디오 스테가노그래피에 자료를 숨기기 위한 개선된 LSB 기법 (Advanced LSB Technique for Hiding Messages in Audio Steganography)

  • 지선수
    • 한국산업정보학회논문지
    • /
    • 제19권1호
    • /
    • pp.69-75
    • /
    • 2014
  • 오디오 스테가노그래피는 새로운 비밀통신 기술로서 발전한 은닉메시지를 기록하는 과학이며 예술이다. 그리고 오디오 스테가노그래피는 이진화 된 메시지를 이미지의 8번째 LSB 층에 숨기는 과정과 유사하다. 효과적인 스테가노그래픽 기법은 비밀자료를 많이 숨기고, 감지할 수 없게 하는 것이다. 이 논문에서는 외부적 공격으로부터 비밀 메시지를 안전하게 숨기기 위해 재배열 순서키와 수정된 LSB 기법에 의한 방법을 제안한다.

LSB 기법을 이용하는 개선된 오디오 스테가노그래피 (The Improved-Scheme of Audio Steganography using LSB Techniques)

  • 지선수
    • 한국산업정보학회논문지
    • /
    • 제17권5호
    • /
    • pp.37-42
    • /
    • 2012
  • 오디오 스테가노그래피는 오디오 매체(신호)에 암호화된 비밀 메시지를 은닉하여 전송하는 일반적이고, 폭넓게 이용되는 통신기법이다. 인간은 청각시스템의 지각능력의 한계 때문에 커버 오디오 파일과 스테고 오디오 파일의 지각품질(perceptual quality) 차이는 없다. 또한 공격자로부터의 안전성과 견고성 측면에서 LSB 기법은 디지털화된 오디오 신호에 메시지를 삽입하는 효율적이고, 경제적인 방법으로 널리 이용되고 있다. 이 논문에서는 LSB 기법을 기반으로 하고, 디지털화된 비밀 메시지의 비트별 위치를 변경하고, 암호화한 후 커버 오디오 매체에 은닉하는 개선된 방법을 제시한다.

High Embedding Capacity and Robust Audio Watermarking for Secure Transmission Using Tamper Detection

  • Kaur, Arashdeep;Dutta, Malay Kishore
    • ETRI Journal
    • /
    • 제40권1호
    • /
    • pp.133-145
    • /
    • 2018
  • Robustness, payload, and imperceptibility of audio watermarking algorithms are contradictory design issues with high-level security of the watermark. In this study, the major issue in achieving high payload along with adequate robustness against challenging signal-processing attacks is addressed. Moreover, a security code has been strategically used for secure transmission of data, providing tamper detection at the receiver end. The high watermark payload in this work has been achieved by using the complementary features of third-level detailed coefficients of discrete wavelet transform where the human auditory system is not sensitive to alterations in the audio signal. To counter the watermark loss under challenging attacks at high payload, Daubechies wavelets that have an orthogonal property and provide smoother frequencies have been used, which can protect the data from loss under signal-processing attacks. Experimental results indicate that the proposed algorithm has demonstrated adequate robustness against signal processing attacks at 4,884.1 bps. Among the evaluators, 87% have rated the proposed algorithm to be remarkable in terms of transparency.

An Improved Detection Technique for Spread Spectrum Audio Watermarking with a Spectral Envelope Filter

  • Jung, Sa-Rah;Seok, Jong-Won;Hong, Jin-Woo
    • ETRI Journal
    • /
    • 제25권1호
    • /
    • pp.52-54
    • /
    • 2003
  • We propose an improved algorithm for detecting audio watermarks based on a spread spectrum in the spectral domain. Since the energy of a watermark is much smaller than that of the cover audio data, pre-processing to reduce the effect of the cover data is needed to reliably extract watermarks. We introduce a spectral envelope filter as a pre-process that enhances detecting performance by filtering out the intrinsic spectral character of cover data. The proposed watermarking structure can be easily included in the compression system and can extract watermarks from partially decompressed spectral data. Our experimental results demonstrate that with a bit error rate of around 10 dB against general attacks, the proposed detecting scheme works better than detectors without the spectral filter.

  • PDF