• 제목/요약/키워드: Audio Comparison

검색결과 89건 처리시간 0.023초

시청각 감성 지표에 관한 비교 연구 (The Comparison Study between standardizations of Visual-Audial Sensibility)

  • 이동춘;윤훈용;이상도;부진후;심정훈;강재철;황성환
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 1999년도 추계학술대회 논문집
    • /
    • pp.348-351
    • /
    • 1999
  • 시청각 관련 지표 개발은 3차원 시청각 환경 제시기술, 시청각 감성을 활용한 Audio의 개발과 시청각 감성 측정기술 및 DB개발 등에 대하여 진행되었다. 3차원 시청각 환경 제시기술 개발은 VR 환경 제시 기술 개발과 모의 시뮬레이터를 통한 평가 단계 및 인간의 공간 인식 특성에 관한 연구로 이루어져 있다. 따라서 지표화 과정에서 VR 제시 시스템 관련 지표(3개), VR평가 지표(3개), 그리고 정보물(2개) 등 총 8개의 지표가 완성되었다. 시청각 감성을 활용한 Audio 개발과 시청각 감성 측정기술 및 DB개발에서는 시청각 감성에 대하여 주관적 평가 실시 후, 이를 이용한 제품개발 및 DB화하는 과정으로 구성되었으며, 각각의 연구물에 대하여 각각 6개와 13개의 지표가 완성되었다. 시청각 감성을 활용한 Audio 개발과 시청각 감성 측정기술 및 DB개발은 감성측정방법에서 제시 자극과 실험육법에서의 다소의 차이는 있었으나, 감성어휘 도출을 통한 SD척도법, 생체신호 측정, 자료처리방법 및 평가기준 등에서 유사성이 있었다. 따라서 각각의 연구물에 대한 지표 개발뿐만 아니라 지표간의 관련성을 비교ㆍ분석함으로써 체계화된 지표 표준화 과정이 필요한 것으로 보인다.

  • PDF

ARM 프로세서를 이용한 MP3 인코딩용 고속 MDCT 구현 (Implementation of MDCT for MP3 using ARM Processor)

  • 조경연;최종찬;이철동
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1999년도 하계종합학술대회 논문집
    • /
    • pp.708-711
    • /
    • 1999
  • MDCT( Modified Discrete Cosine Transform ) is one of the most compute-intensive operations in the MPEG audio coding standard. In this paper a fast algorithm to perform MDCT operation is presented. The algorithm presented in the MPEG audio coding standard requires (N/2) $\times$ N multiplications and (N/2) $\times$ (N-1) additions to generate the result, but the algorithm presented in this paper requires (N/2) $\times$ (N/2) multiplications and (N/2) $\times$ (N/2) additions to perform the same task. In this algorithm N should be multiple of 4. The algorithm was implemented using ARM processor and the processing time comparison between the original algorithm and the fast algorithm is presented.

  • PDF

보안 시스템을 위한 비명 검출 엔진 설계 (A Design of a Scream Detecting Engine for Surveillance Systems)

  • 서지훈;이혜인;이석필
    • 전기학회논문지
    • /
    • 제63권11호
    • /
    • pp.1559-1563
    • /
    • 2014
  • Recently, the prevention of crime using CCTV draws special in accordance with the higher crime incidence rate. Therefore security systems like a CCTV with audio capability are developing for giving an instant alarm. This paper proposes a scream detecting engine from various ambient noises in real environment for surveillance systems. The proposed engine detects scream signals among the various ambient noises using the features extracted in time/frequency domain. The experimental result shows the performance of our engine is very promising in comparison with the traditional engines using the model based features like LPC, LPCC and MFCC. The proposed method has a low computational complexity by using FFT and cross correlation coefficients instead of extracting complex features like LPC, LPCC and MFCC. Therefore the proposed engine can be efficient for audio-based surveillance systems with low SNRs in real field.

복층 자기부호화기를 이용한 음향 신호 군집화 및 분리 (Audio signal clustering and separation using a stacked autoencoder)

  • 장길진
    • 한국음향학회지
    • /
    • 제35권4호
    • /
    • pp.303-309
    • /
    • 2016
  • 본 논문은 자기부호화기를 이용한 음향신호 분리방법을 제안한다. 사용된 복층구조 신경망 자기부호화기는 입력 신호의 효율적인 표현방법을 자동으로 학습하며, 유사한 특징을 가지고 있는 요소신호들을 군집함으로써 다른 특징의 신호들을 분리할 수 있다. 시간영역과 주파수영역의 변이특성을 추출하기 위하여 단구간푸리에변환(Short-Time Fourier Transform, STFT)을 수행하였으며, 정해진 크기의 사각형 창을 모든 가능한 위치에 적용하여 얻은 단구간 주파수 스펙트럼을 자기부호화기의 입력으로 사용하였다. 자기부호화기의 부호노드들의 값을 이용하여 유사한 스펙트럼 창들을 군집하고, 이를 이용하여 원래의 음원들로 분리해 낼 수 있었다. 분리된 원음들은 원래의 입력신호의 특징을 확실히 나타내었으며, 기존의 비음수 행렬분해(Non-negative Matrix Factorization, NMF) 결과와 주파수 스펙트럼 비교를 통해 그 유효성을 보일 수 있었다.

주부호화기 대역폭에 따른 오디오 부호화의 성능비교 (Performance Comparison of Audio Coders According to Core Codec Bandwidth)

  • 정용석;김인철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2010년도 하계학술대회
    • /
    • pp.177-178
    • /
    • 2010
  • 본 논문에서는 음향신호의 부호화에 있어 주부호화기로 부호화 되는 주파수 대역폭이 음질에 미치는 영향에 대하여 고찰한다. 또한 비트율을 변화시켜 양자화 잡음 발생을 줄일 수 있는 비트율의 기준에 대하여 고찰한다. 마지막으로 주관적 음질평가 및 객관적 음질평가를 통하여 그에 따른 성능을 평가한다.

  • PDF

Wavelet 변환과 DCT 변환을 이용한 워터마킹에 관한 연구 (Performance Comparison of Wavelet Transform Based Watermarking and DCT Transform Based Watermarking)

  • 장용원;한승수;김인택
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 추계종합학술대회 논문집(3)
    • /
    • pp.85-88
    • /
    • 2000
  • With the rapid growth of network distributions of digitized media(audio, image, and video), there is an urgent need for copyright protection. For now watermarking is a well-known technique for copyright protection of digital data. To embed a digital watermark to the image, discrete cosine transform(DCT) and wavelet transform are commonly used. In this paper, the performance of the DCT based watermarking technique and wavelet based watermarking technique were compared and the influences of the parameter a that decides the strength of the watermarking data were considered.

  • PDF

음향 신호의 양방향적 연관성을 고려한 유해 콘텐츠 검출 기법 (Pornographic Content Detection Scheme Using Bi-directional Relationships in Audio Signals)

  • 송광호;김유성
    • 한국콘텐츠학회논문지
    • /
    • 제20권5호
    • /
    • pp.1-10
    • /
    • 2020
  • 본 논문에서는, 최근 인터넷을 통해 빠르게 확산하고 있는 음향 중심의 음란 콘텐츠를 정확하게 검출하기 위해, 음향의 이웃 신호들 사이에 존재하는 양방향적 연관성을 기반으로 콘텐츠의 유해성을 판단하는 기법을 제안한다. 이웃한 음향 신호들간의 양방향적 연관성을 추출하기 위하여, 양방향 확장-인과 컨벌루션 연산(bi-directional dilated-causal convolution operation)들을 수행하는 확장-인과 컨벌루션 블록을 쌓아 만든 다층구조 양방향 확장-인과 컨벌루션 네트워크를 제안한다. 제안된 유해 콘텐츠 검출 기법의 효용성 검증을 위한 실험에서는 음향 신호의 각 시점으로부터 추출한 단순 특징 벡터를 기계학습 모델로 분류하는 기존 방법, 기존의 확장-인과 컨벌루션 블록을 적용해 음향 시계열 데이터의 순 방향 연관성만을 이용하는 기법, 그리고 본 연구에서 제안한 음향 시계열 데이터의 양방향 연관성까지 이용하여 유해성을 판단하는 기법의 분류 정확성을 비교하였다. 실험 결과에 의하면 본 연구에서 제안한 기법이 최대 84.38%의 인식 정확도를 가지며 이는 기존의 단순 특징 벡터를 이용하는 방법보다 약 25.80% 높고 순 방향 연관성만을 이용하는 기법보다 약 3.10% 높은 것으로 분석되었다.

Hybrid 무손실 오디오 부호화기의 설계 (A Design of Hybrid Lossless Audio Coder)

  • 박세형;신재호
    • 대한전자공학회논문지SP
    • /
    • 제41권6호
    • /
    • pp.253-260
    • /
    • 2004
  • 본 논문에서는 정수 웨이블릿 변환(Integer Wavelet Transform)과 선형 예측(Linear Prediction)을 이용한 Hybrid 무손실 오디오 부호화 알고리즘을 제안하였다. 제안된 부호화기는 입력된 신호를 적당한 프레임으로 분할 후, 정수 웨이블릿 변환과 정수 예측기를 사용하여 입력된 오디오 신호내의 상관관계(Correlation)를 제거하였다. 그리고 신호내의 상관이 제거된 신호를 엔트로피 부호화(Entropy Coding) 하였다. 엔트로피 부호화기로는 정수 입력원의 특성에 따라 최적의 압축 효율을 갖는 옵션을 선택적으로 처리하는 Adaptive Golomb-Rice 부호화기법을 이용하였다. 제안된 부호화 방식은 모든 연산을 정수 연산으로 가능케 하므로 기존의 실수를 사용하는 연산과 비교하여 연산 속도의 개선과 시스템의 복잡성을 낮추어 고속처리 및 저전력화가 가능하다. 또한 각 프레임은 독립적으로 부호화되고, 부호화된 데이터는 프레임헤더와 바이트 단위로 정렬이 되도록 데이터 포맷을 설계하여, 압축 부호화된 데이터의 이동, 찾기, 편집이 편리하도록 하였다.

저전력 기법을 사용한 고해상도 오디오용 Sigma Delta Decimation Filter 설계 (Sigma Delta Decimation Filter Design for High Resolution Audio Based on Low Power Techniques)

  • 휸 하이 아우;김소영
    • 전자공학회논문지
    • /
    • 제49권11호
    • /
    • pp.141-148
    • /
    • 2012
  • Oversampling 기법을 사용한 analog-to-digital (A/D) 컨버터에서 샘플링 된 신호의 signal bandwidth를 낮추어 주기 위해 데시메이션 필터가 사용된다. 본 논문은 sigma-delta ADC에 사용될 수 있는 저전력 4 단 32 bit 데시메이터 필터 디자인을 제안한다. 디지털 데시메이션 필터는 CIC(cascaded integrator-comb) filter와 세 개의 half-band FIR filter로 이루어져 있다. 전력소모를 최소화하기 위하여 CIC filter에는 pipeline구조가 사용되었고, FIR 필터의 multiplier 구조를 최적화하기 위하여 Canonic Signed Digit (CSD) 코드가 사용되었다. 130nm CMOS 공정으로 설계 자동화 CAD 도구를 사용하여 타이밍, 면적, 전력소모를 최적화하여 98.304 MHz 주파수에서 697 uW의 전력을 소모면서 32 bit, 192 kHz 아웃풋을 낼 수 있다.

MPEG-1 오디오 부호화를 위한 2단계 비트 할당 알고리듬 (A Two-Stage Bit Allocation Algorithm for MPEG-1 Audio Coding)

  • 임창헌;천병훈
    • 한국멀티미디어학회논문지
    • /
    • 제5권4호
    • /
    • pp.393-398
    • /
    • 2002
  • 기존의 MPEG-1 오디오 부호화 방식 이 사용하는 비트 할당 알고리듬은 비트 할당이 종료될 때까지 최소의 MNR을 갖는 서브밴드를 탐색하는 과정을 반복적으로 수행한다. 따라서 비트 할당을 수행하는데 필요한 전체 계산량의 상당 부분을 서브밴드 탐색 과정이 차지한다. 본 논문에서는 서브 밴드 탐색을 좀 더 효율적으로 수행 할 수 있는 방안을 제 시 하고, 기존의 방식과 음질과 계산량 측면에서 비교하고자 한다. EBU(Europe Broadcasting Union)가 제공하는 음질 평가용 CD에 수록되어 있는 팝 음악 신호를 사용하여 실험한 결과, 128 kbps의 비트율로 오디오를 압축하는 계층 2 알고리듬 환경에서, 제안한 방식이 필요로 하는 계산량은 [1]의 방식이 필요로 하는 계산량의 42% 정도이며, MNR로 측정한 두 방식간의 음질 차이는 0.2 ㏈ 정도로 별 차이가 없음을 확인할 수 있었다.

  • PDF