• 제목/요약/키워드: Audio Analysis

검색결과 544건 처리시간 0.028초

The Audio Signal Classification System Using Contents Based Analysis

  • Lee, Kwang-Seok;Kim, Young-Sub;Han, Hag-Yong;Hur, Kang-In
    • Journal of information and communication convergence engineering
    • /
    • 제5권3호
    • /
    • pp.245-248
    • /
    • 2007
  • In this paper, we research the content-based analysis and classification according to the composition of the feature parameter data base for the audio data to implement the audio data index and searching system. Audio data is classified to the primitive various auditory types. We described the analysis and feature extraction method for the feature parameters available to the audio data classification. And we compose the feature parameters data base in the index group unit, then compare and analyze the audio data centering the including level around and index criterion into the audio categories. Based on this result, we compose feature vectors of audio data according to the classification categories, and simulate to classify using discrimination function.

Retrieval of Broadcast News Using Audio Content Analysis

  • Kim, Hyoung-Gook
    • The Journal of the Acoustical Society of Korea
    • /
    • 제26권3E호
    • /
    • pp.74-79
    • /
    • 2007
  • In this paper, we report our recent work on a indexing and retrieval system of broadcast news using audio content analysis. Key issues addressed in this work are two major parts of the audio indexing system: anchorperson detection based on audio segmentation, and phone-based spoken document retrieval, developed in the framework of the emerging MPEG-7 standard. Experiments are conducted on a database of Britisch broadcast news videos. We discuss the development of the retrieval system, and the evaluation of each part and the retrieval system.

Audio 회로의 잡음해석과 시뮬레이숀 (Noise analysis and simulation of the audio circuits)

  • 차균현;이근철
    • 전기의세계
    • /
    • 제29권12호
    • /
    • pp.798-803
    • /
    • 1980
  • A computer program for noise analysis of the audio circuit is developed. The application of the program to the equalizer, low frequency amplifier of radio circuit and cascaded amplifier show good results. The general noise analysis method for cascade operational amplifier is presented. The noise spectral power density is calculated for a resonator active filter.

  • PDF

Analysis of Storage and Retrieval Results of Audio Sources and Signatures using Blockchain and Distributed Storage System

  • Lee, Kyoung-Sik;Kim, Sang-Kyun
    • 방송공학회논문지
    • /
    • 제24권7호
    • /
    • pp.1228-1236
    • /
    • 2019
  • Recently, media platforms such as YouTube and Twitch provide services that can generate personal revenue by utilizing media content produced by individuals. In this regard, interest in the copyright of media content is increasing. In particular, in the case of an audio source, competition for securing audio source copyright is fierce because it is an essential element for almost all media content production. In this paper, we propose a method to store the audio source and its signature using a blockchain and distributed storage system to verify the copyright of music content. To identify the possibility of extracting the audio signature of the audio source and to include it as blockchain transaction data, we implement the audio source and its signature file upload system based on the proposed scheme. In addition, we show the effectiveness of the proposed method through experiments on uploading and retrieving audio files and identify future improvements.

체감형 미디어 서비스를 위한 공간음향 기술 동향 (Spatial Audio Technologies for Immersive Media Services)

  • 이용주;유재현;장대영;이미숙;이태진
    • 전자통신동향분석
    • /
    • 제34권3호
    • /
    • pp.13-22
    • /
    • 2019
  • Although virtual reality technology may not be deemed as having a satisfactory quality for all users, it tends to incite interest because of the expectation that the technology can allow one to experience something that they may never experience in real life. The most important aspect of this indirect experience is the provision of immersive 3D audio and video, which interacts naturally with every action of the user. The immersive audio faithfully reproduces an acoustic scene in a space corresponding to the position and movement of the listener, and this technology is also called spatial audio. In this paper, we briefly introduce the trend of spatial audio technology in view of acquisition, analysis, reproduction, and the concept of MPEG-I audio standard technology, which is being promoted for spatial audio services.

Dimension-Reduced Audio Spectrum Projection Features for Classifying Video Sound Clips

  • Kim, Hyoung-Gook
    • The Journal of the Acoustical Society of Korea
    • /
    • 제25권3E호
    • /
    • pp.89-94
    • /
    • 2006
  • For audio indexing and targeted search of specific audio or corresponding visual contents, the MPEG-7 standard has adopted a sound classification framework, in which dimension-reduced Audio Spectrum Projection (ASP) features are used to train continuous hidden Markov models (HMMs) for classification of various sounds. The MPEG-7 employs Principal Component Analysis (PCA) or Independent Component Analysis (ICA) for the dimensional reduction. Other well-established techniques include Non-negative Matrix Factorization (NMF), Linear Discriminant Analysis (LDA) and Discrete Cosine Transformation (DCT). In this paper we compare the performance of different dimensional reduction methods with Gaussian mixture models (GMMs) and HMMs in the classifying video sound clips.

Audio Watermarking Using Independent Component Analysis

  • Seok, Jong-Won
    • Journal of information and communication convergence engineering
    • /
    • 제10권2호
    • /
    • pp.175-180
    • /
    • 2012
  • This paper presents a blind watermark detection scheme for an additive watermark embedding model. The proposed estimation-correlation-based watermark detector first estimates the embedded watermark by exploiting non-Gaussian of the real-world audio signal and the mutual independence between the host-signal and the embedded watermark and then a correlation-based detector is used to determine the presence or the absence of the watermark. For watermark estimation, blind source separation (BSS) based on independent component analysis (ICA) is used. Low watermark-to-signal ratio (WSR) is one of the limitations of blind detection with the additive embedding model. The proposed detector uses two-stage processing to improve the WSR at the blind detector; the first stage removes the audio spectrum from the watermarked audio signal using linear predictive (LP) filtering and the second stage uses the resulting residue from the LP filtering stage to estimate the embedded watermark using BSS based on ICA. Simulation results show that the proposed detector performs significantly better than existing estimation-correlationbased detection schemes.

비교사 토론 인덱싱을 위한 시청각 콘텐츠 분석 기반 클러스터링 (Audio-Visual Content Analysis Based Clustering for Unsupervised Debate Indexing)

  • 금지수;이현수
    • 한국음향학회지
    • /
    • 제27권5호
    • /
    • pp.244-251
    • /
    • 2008
  • 본 연구에서는 시청각 정보를 이용한 비교사 토론 인덱싱 방법을 제안한다. 제안하는 방법은 BIC (Bayesian Information Criterion)에 의한 음성 클러스터링 결과와 거리기반 함수에 의한 영상 클러스터링 결과를 결합한다. 시청각 정보의 결합은 음성 또는 영상 정보를 개별적으로 사용하여 클러스터링할 때 나타나는 문제점을 줄일 수 있고, 토론 데이터의 효과적인 내용 기반의 분석이 가능하다. 제안하는 방법의 성능 평가를 위해 서로 다른 5종류의 토론 데이터에 대해 음성, 영상 정보를 개별적으로 사용할 때와 두 가지 정보를 동시에 사용할 때의 성능 평가를 수행하였다. 실험 결과 음성과 영상 정보를 결합한 방법이 음성, 영상 정보를 개별적으로 사용할 때 보다 토론 인덱싱에 효과적임을 확인하였다.

DWT영역에서 LMS를 이용한 저 샘플링 비율 오디오 신호의 음질 향상 (Sound Enhancement of low Sample rate Audio Using LMS in DWT Domain)

  • 백수진;윤원중;박규식
    • 한국음향학회지
    • /
    • 제23권1호
    • /
    • pp.54-60
    • /
    • 2004
  • 44.1 kHz 샘플링 비율의 표준 CD음질의 오디오 신호를 인터넷 상에서 전송 및 분배하기 위해서 네트워크 대역폭과 저장 공간의 제한점을 고려해야 한다. 이러한 제한은 오디오 신호의 샘플링 비율을 낮추거나 MP3와 같은 오디오 데이터 압축 기법을 이용하여 해결할 수 있지만, 공통적으로 고 주파수 (High frequency) 대역의 정보가 손실 된다는 문제가 발생한다. 이러한 고 주파수 손실은 결국 저 샘플링 비율의 오디오 신호를 생성하게 되며 표준 CD음질을 가지는 오디오 신호보다 제한된 저 주파수 대역만을 재생할 수 있게 된다. 일반적으로 오디오 신호의 고주파 성분은 위치정보와 명료도, 재생 환경 등에 대한 음의 풍부한 정보를 제공한다. 본 논문의 목적은 LMS 적응 필터링과 DWT 분석/합성을 이용하여 저 샘플링 비율을 가지는 오디오 신호로부터 고 주파수 대역의 정보를 효과적으로 추정하는 것이다. 제안된 알고리즘은 DWT 영역에서 LMS 적응 알고리즘을 이용하여 고 주파수 정보를 추정하고 DWT 합성을 이용하여 고 주파수 정보가 강화된 고음질의 오디오 신호를 재생한다. 제안된 알고리즘의 성능 평가를 위해 실제 음성신호와 음악 신호를 이용하여 컴퓨터 모의 실험과 청취 평가를 수행하여 기존 알고리즘과 비교하였으며, 실험 결과 제안된 알고리즘의 우수성을 확인하였다.

오디오 기반 SNS의 인터페이스 디자인 요소 연구 (A Study on the Elements of Interface Design of Audio-based Social Networking Service)

  • 김연수;최종훈
    • 한국융합학회논문지
    • /
    • 제13권2호
    • /
    • pp.143-150
    • /
    • 2022
  • 오디오 기반 SNS 또한 사용자가 원하는 콘텐츠에 도달하기 위한 시각적 가이드가 필요하다. 이에 본 연구는 오디오 기반 SNS에서 오디오 콘텐츠의 사용 경험에 영향을 미치는 시각적 인터페이스 디자인 요소에 대해 연구하였다. 선행연구를 통해 기존의 일반적인 인터페이스 디자인 요소가 오디오 콘텐츠의 사용성에 중요함을 파악하였다. 현재 출시된 오디오 기반 SNS의 분석을 통해 기존 인터페이스 요소의 의미와 영향을 확인하였고, 기타 오디오 콘텐츠 서비스의 분석을 통해 오디오 SNS에 있어 고려할 새로운 기준의 인터페이스 평가 속성을 도출하였다. 이에 일반적인 다섯 가지 인터페이스 평가 요소인 레이아웃, 컬러, 아이콘, 타이포그래피, 그래픽 이미지에 멀티미디어 요소를 새롭게 정의하며, 오디오 기반 SNS의 UI를 고려할 요소로 제안한다.