• 제목/요약/키워드: Audio Analysis

검색결과 544건 처리시간 0.039초

Audio Transcoding for Audio Streams from a T-DTV Broadcasting Station to a T-DMB Receiver

  • Bang, Kyoung-Ho;Park, Young-Cheol;Seo, Jeong-Il
    • ETRI Journal
    • /
    • 제28권5호
    • /
    • pp.664-667
    • /
    • 2006
  • We propose an efficient audio transcoding algorithm that can convert audio streams from terrestrial digital television broadcasting service stations to those for terrestrial digital multimedia broadcasting hand-held receivers. The proposed algorithm avoids the complicated psychoacoustic analysis by calculating the scalefactors of the bit-sliced arithmetic coding encoder directly from the signal-to-noise ratio parameters of the AC-3 decoder. The bit-allocation process is also simplified by cascading the nested distortion control loop. Through subjective evaluation, it is shown that the proposed algorithm provides comparable audio quality to tandem coding but it requires much smaller complexity.

  • PDF

High Frequency Enhancement of Sound Using Wavelet Transform

  • Yoon Won-Jung;Lee Kang-Kyu;Park Kyu-Sik
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2004년도 ICEIC The International Conference on Electronics Informations and Communications
    • /
    • pp.233-236
    • /
    • 2004
  • This paper proposes new method for the enhancement of nonexistent high frequency spectral contents from low sample rate audio signal. For example, Due to the protocol constraint, the audio bandwidth of MP3 is restricted to 16Khz. Although band-restricted MP3 audio provide savings of storage space and network bandwidth, it suffers a major problem of a loss in high frequency fidelity such as localization, ambient information, and bright nature of audio. This paper provides a new mathematical analysis for the adaptive estimation of the high frequency contents based on the nature of the input low sample rate audio. Proposed method can be worked globally to any kind of audio such as speech and music that are restricted by sampling rate and bandwidth.

  • PDF

Research on Machine Learning Rules for Extracting Audio Sources in Noise

  • Kyoung-ah Kwon
    • International Journal of Advanced Culture Technology
    • /
    • 제12권3호
    • /
    • pp.206-212
    • /
    • 2024
  • This study presents five selection rules for training algorithms to extract audio sources from noise. The five rules are Dynamics, Roots, Tonal Balance, Tonal-Noisy Balance, and Stereo Width, and the suitability of each rule for sound extraction was determined by spectrogram analysis using various types of sample sources, such as environmental sounds, musical instruments, human voice, as well as white, brown, and pink noise with sine waves. The training area of the algorithm includes both melody and beat, and with these rules, the algorithm is able to analyze which specific audio sources are contained in the given noise and extract them. The results of this study are expected to improve the accuracy of the algorithm in audio source extraction and enable automated sound clip selection, which will provide a new methodology for sound processing and audio source generation using noise.

4G 휴대 단말기 송신에 의한 오디오 잡음 영향 (The Noise Influence of 4G Mobile Transmitter on Audio Devices)

  • 윤혜주;이일규
    • 한국위성정보통신학회논문지
    • /
    • 제8권1호
    • /
    • pp.31-34
    • /
    • 2013
  • 본 논문은 4세대 이동통신인 Long Term Evolution (LTE) 단말기에 의해 발생된 간섭 신호가 음향기기에 유입되었을 때 음향기기의 잡음영향에 대해 검토하였다. 먼저, LTE 송신 신호에 대한 분석 및 측정을 바탕으로 음향기기에 간섭을 주는 LTE 간섭 신호는 송신 전력의 크기에 의해 결정됨을 확인하였다. 또한, LTE 단말기의 송신전력 및 단말기와 음향기기간의 거리를 변화시키면서 발생하는 음향기기의 잡음을 측정하였다. 측정 결과, LTE 단말기가 최대 전력(22 dBm)을 송신하더라도 단말기와 음향기기의 거리를 25 cm 이상 이격시킴으로써 음향기기에서 발생하는 잡음을 방지할 수 있었다.

법적 증거 능력을 위한 오디오 파일의 메타데이터 및 파일 구조 분석의 한계: 삼성 스마트폰을 중심으로 (Limitations of Analyzing Metadata and File Structure of Audio Files for Legal Evidence: Focusing on Samsung Smartphones)

  • 백성원;손호민;박재완
    • 문화기술의 융합
    • /
    • 제9권6호
    • /
    • pp.1103-1109
    • /
    • 2023
  • 오늘날, 스마트폰의 확산에 따라 오디오 파일이 법적 증거로 제출되는 수가 증가하면서 오디오 파일의 무결성은 중요한 이슈가 되고 있다. 이에 본 연구는 삼성 스마트폰에서 녹음된 오디오 파일의 메타데이터 및 파일 구조가 원본과 동일하게 조작될 수 있는지를 탐구하는 것을 목적으로 한다. 본 연구는 국내에서 가장 많이 사용되고 있는 삼성 스마트폰을 기반으로, 내장된 음성 녹음 앱과 녹음 앱으로 가장 인기가 높은 '이지 보이스 레코더' 앱을 대상으로 실험을 수행했다. 본 연구의 실험을 통해 오디오 파일의 메타데이터와 파일 구조는 조작이 가능하다는 것이 증명되었다. 따라서 본 연구는 오디오 파일이 법적 증거 채택을 위한 감정이 수행될 때, 메타데이터 및 파일 구조 분석은 무결성을 증명하는 데 한계를 지닌다는 점을 밝힌다. 또한 메타데이터 및 파일 구조 분석에 의존하지 않는 새로운 음성 파일 위변조 기술의 개발이 필요성을 주장한다.

Towards automatic inspection of nuclear fuel elements in spent fuel pools: Audio analysis

  • Sergio Segovia;Angel Ramos;David Izard;Doroteo T. Toledano
    • Nuclear Engineering and Technology
    • /
    • 제56권10호
    • /
    • pp.4062-4067
    • /
    • 2024
  • In this article, we propose and explore a novel step in the digitization of the mapping of the spent fuel pool of nuclear power plants, in which the audio signal from the operator's microphone is used to obtain the identification codes of those components that are in each of the cells of the pool. In this way, we have not only an acquisition system but also a verification system that can be used in combination with the outcome of the analysis of the video signal. We developed an algorithm that uses at its core one of the latest models of multilingual Automatic Speech Recognition to transcribe audio signal, and with a post-processing of the timed transcriptions we build the identification code of fuel heads and other components. Results show a very high accuracy in audios from real recording of Spanish nuclear facilities, and the methodology proposed is easily extensible to other nuclear facilities in the world.

음질향상 알고리즘을 내장한 MPEG-1 오디오 디코더의 Embedded OS 플랫폼에의 구현 (An Implementation of Sound Enhanced MPEG-1 Audio Decoder on Embedded OS Platform)

  • 홍성민;박규식
    • 한국멀티미디어학회논문지
    • /
    • 제10권8호
    • /
    • pp.958-966
    • /
    • 2007
  • 본 논문에서는 음질향상 알고리즘을 내장한 MPEG-1 오디오 디코더를 Embedded OS(Linux)기반 플랫폼에 구현하였다. 네트워크 대역폭과 저장 공간의 제한점을 고려한 MP3, AAC, OGG 등과 같은 손실 오디오 압축 코덱들은 공통적으로 고주파 대역의 정보가 손실되는데, 이러한 고주파 신호성분 손실은 결국 표준 CD음질을 가지는 오디오 신호보다 제한된 저주파 대역만을 재생할 수 있게 된다. 본 논문은 손실된 고주파 대역의 신호성분과 하모닉 성분을 효과적으로 추정 및 복원할 수 있는 음질 향상 알고리즘을 MPEG-1 오디오 디코더 내부에 각 계층 I, II, III 특성별로 최적화하여 Embedded Linux 플랫폼으로 구현하였다. 기존의 MPEG-1 오디오 디코더와의 비교 청취 실험을 통해 본 논문에서 구현된 시스템이 신호 스펙트럼 및 음질 면에서 향상되었음을 확인할 수 있었다.

  • PDF

ARM 플랫폼 기반의 MP3 오디오 음질 향상 시스템 구현 (An Implementation of an ARM Platform based MP3 Sound Enhancement System)

  • 오상헌;박규식
    • 대한전자공학회논문지SP
    • /
    • 제44권1호
    • /
    • pp.70-75
    • /
    • 2007
  • 44.1kHz 샘플링 레이트의 표준 CD 음질의 오디오 신호를 인터넷 상에서 전송 및 분배하기 위해서는 네트워크 대역폭과 저장 공간의 제한 점을 고려해야 한다. 이러한 제한은 MP3, AAC, OGG 등과 같은 오디오 신호 압축 코덱을 이용하여 해결할 수 있지만, 이러한 코덱들은 공통적으로 고 주파수(High frequency) 대역의 정보가 손실 된다는 문제가 발생한다. 이러한 고주파수 손실은 결국 표준 CD음질을 가지는 오디오 신호보다 제한된 저 주파수 대역만을 재생 할 수 있게 된다. 일반적으로 오디오 신호의 고 주파수 성분은 위치정보 와 명료도, 재생 환경 등에 대한 음의 풍부한 정보를 제공한다. 본 연구에서는 MP3 오디오 코덱으로 디코드(decode) 된 오디오 신호에서 손실된 고 주파수 대역의 정보를 효과적으로 추정 및 복원하는 ARM 플랫폼 기반의 MP3 오디오 음질향상 시스템을 구축하였다. 제안된 시스템과 기존의 대표적인 알고리즘인 Liu의 HFR 과의 비교실험을 통해 제안된 알고리즘이 신호 스펙트럼상에서 고주파 신호 추정 및 복원 능력이 우수함을 볼 수 있고, 알고리즘 연산량도 약 2배 정도 절약할 수 있었다.

An Efficient Time-Frequency Representation for Parametric-Based Audio Object Coding

  • Beack, Seung-Kwon;Lee, Tae-Jin;Kim, Min-Je;Kang, Kyeong-Ok
    • ETRI Journal
    • /
    • 제33권6호
    • /
    • pp.945-948
    • /
    • 2011
  • Object-based audio coding can provide new music applications with interactivity. To efficiently compress a lot of target audio objects, a subband-based parametric coding scheme has been adopted for MPEG spatial audio object coding. In this letter, the time-frequency (T/F) subband analysis structure is investigated. A reconfigured T/F structure is also proposed to enhance the generating performance of sound scenes such as 'karaoke' and 'solo' play in interactive music scenarios. From the experimental results, it was confirmed that the proposed scheme remarkably improves the SNR and sound quality.

LTE-R 네트워크에서 스트리밍 오디오 전송성능 (Transmission Performance of Streaming Audio over LTE-R Network)

  • 김영동
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.456-458
    • /
    • 2019
  • 본 연구에서는 LTE-R을 기반으로 하는 철도통신에서 응용서비스로서 스트리밍 오디오의 전송성능을 분석하고자 한다. 본 연구에서 성능분석은 NS(Network Simulator)-3에 기반한 컴퓨터 시뮬레이션을 사용하여 수행하며, 분석대상 응용서비스로는 MPEG(Moving Picture Experts Group)-4의 오디오 프레임을 사용한다. 본 연구의 결과는 LTE-R 네트워크 구축뿐 아니라 LTE-R 네트워크를 대상으로 하는 응용서비스 개발의 기초자료로 활용이 가능하다.

  • PDF