• Title/Summary/Keyword: 오디오 코딩

Search Result 94, Processing Time 0.026 seconds

Research on audio bandwidth extension using residual signal replication (잔차 신호 복제 기반 오디오 대역 확장 방법)

  • Lim, Wootaek;Beack, Seungkwon;Lee, Taejin
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2021.06a
    • /
    • pp.57-60
    • /
    • 2021
  • 오디오 대역 확장 기술은 저 해상도의 오디오 신호를 고 해상도의 오디오 신호로 복원 또는 생성해 내는 기술이다. 이와 관련하여 오디오 코덱에서는 고 대역 오디오 신호의 저 비트 부호화를 위해 사람이 청각이 둔감하게 인지하는 고 대역의 오디오 신호에 대해 실제 신호에 대한 양자화를 수행하지 않고, 코딩 되어 전송된 저 대역 신호와 고 대역의 파라미터를 이용하여 신호를 합성하는 스펙트럼 대역 복제 기술이 널리 사용된다. 본 연구에서는 선형 예측 기반의 주파수 대역 복제 방법을 통해 추가 정보를 활용한 오디오 대역 확장을 수행하고 신경망 기반의 오디오 신호 개선을 통해 복제된 신호의 개선 가능성을 검토하였다. 실험 평가는 MPEG 에서 코덱 평가용으로 사용되는 테스트 시퀀스를 사용하였으며, 실험 결과 제안하는 방법을 적용하여 기존 오디오 대역 확장 기술 대비 성능이 향상됨을 확인하였다.

  • PDF

MPEG-2 AAC Encoder Implementation Using a floating-Point DSP (부동 소수점 DSP를 이용한 MPEG-2 AAC 부호차기 구현)

  • Kim Seung-Woo
    • Journal of Korea Multimedia Society
    • /
    • v.8 no.7
    • /
    • pp.882-888
    • /
    • 2005
  • MPEG-2 Advanced Audio Coding (AAC) has already been standardized as a sophisticated next generation technology AAC provides an audio signal that has CD quality at 96-128kbps/stereo. This paper describes a high-quality and efficient software implementation of an MPEG-2 AAC LC Profile encoder. Common scalefactor and noisless coding are accelerated by $45\%$ and $27\%$, respectively, through the use of TMS320C30 instructions. The implemented encoder uses 7.5kWords of program memory, 18kWords of data ROM and 92kBytes of data RAM, respectively. The results of subjective Qualify test showed that the sound quality achieved at 96kbps/stereo was equivalent to that of MP3 at 128kbps/stereo.

  • PDF

Complex Spatial Cue based Channel Audio Coding (복소 공간큐를 활용한 다채널 오디오 코딩 기술)

  • Beack, Seungkwon;Lim, Wootaek;Lee, Taejin
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2022.06a
    • /
    • pp.58-60
    • /
    • 2022
  • 본 논문에서는 복소(complex) 공간큐를 활용한 다채널 오디오 부호화 기술을 제안한다. 복소 공간큐 방식의 다채널 오디오 부호화 기술은 시간영역에서 수행된다. 시간영역의 오디오 채널 신호를 복소 데이터로 변환하여 각 오디오 채널 간의 상관관계를 복소 공간큐로 표현하고, 이를 활용하여 채널 부호화를 수행하기 위한 오디오 채널 신호를 생성한다. 참조 기술로는 최고 성능의 오디오 코덱인 USAC의 예측 부호화 방식의 다채널 오디오 부호화 기술과 비교하여 정보량 감축 측면에 있어서 평균 2.24 dB 이상의 높은 SNR을 나타냄을 관측할 수 있었다.

  • PDF

High-Band Coding of Audio Signal Based on Conditional Auto Encoder (조건부 오토 인코더를 이용한 오디오 고대역 부호화 기술)

  • Cho, Hyo-Jin;Beak, Seung-Kwon;Jang, Won;Shin, Seong-Hyeon;Park, Hochong
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2018.06a
    • /
    • pp.51-52
    • /
    • 2018
  • 본 논문에서는 조건부 오토 인코더를 사용하여 오디오 고대역 신호를 부호화 하는 기술을 제안한다. 오토 인코더의 데이터 압축 특성을 이용하여 부호화를 위한 데이터의 양을 크게 줄인다. 제안하는 알고리즘은 기존의 오토 인코더와 달리 과거의 정보가 포함된 2차원 조건을 함께 입력하여 오토 인코더가 코딩 프레임의 고대역을 복원하는 것을 돕도록 한다. 2차원 조건과 입력을 압축하여 연결한 후 디코딩하여 코딩 프레임의 고주파 대역을 만든다. 제안하는 방법을 사용하면 저대역 MDCT 계수와 고대역 MDCT 계수를 오토 인코더로 압축한 결과만으로 원본과 유사한 음질을 청취할 수 있다.

  • PDF

LED Communication based Multi-hop Audio Data Transmission Network System (LED 통신 기반 멀티 홉 오디오 데이터 전송네트워크시스템)

  • Jo, Seung Wan;Le, The Dung;An, Beongku
    • Journal of the Institute of Electronics and Information Engineers
    • /
    • v.50 no.6
    • /
    • pp.180-187
    • /
    • 2013
  • In this paper, we propose a LED communication based multi-hop audio data transmission network system. The main contribution and features of the proposed system are as follows. First, the contribution of this research is to develope the LED communication based multi-hop transmission network system which can transmit audio data signal with long distance via multi-hops. Second, the developed system has the following features: In transmitter, audio data is transmitted after encoding with S/PDIF format via a general LED. The relay receives digital audio signal by using photo diode and then transmits the signal to receiver after error checking and amplifying. The receiver receives the encoded audio data via photo diode and then converts to analog audio signal by using decoding and amplifying. The performance evaluation of the proposed system is conducted in the laboratory with fluorescent light source. The results of the performance evaluation confirm that the system can provide high quality audio transmission from transmiter to receiver via multi-hop relays in a long distance while we can see there are differences in the transmitted audio quality according to the used LED colors.

Thumbnail Generation of Golf Videos Using Audio-Based Boundary Detection for Smart TV (스마트 TV의 골프동영상 썸네일 생성을 위한 오디오기반 경계영역 검출 기법)

  • Choi, Hee-Min;Lee, Jin-Ho;Kim, Hyoung-Gook
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2011.07a
    • /
    • pp.494-495
    • /
    • 2011
  • 본 논문에서는 스마트 TV 시청시에 녹화하는 골프 동영상에서 오디오기반의 경계영역 검출를 이용하여 썸네일을 고속으로 생성하는 방법을 제안한다. 제안된 방법은 녹화되는 골프동영상의 인코딩된 오디오 정보로 부터 추출된 MDCT계수를 이용하여 온셋 구간 검출 및 오디오 세그먼테이션을 수행함으로써 골프 동영상을 6개의 오디오 클래스로 자동 분할한다. 분할된 오디오 세그먼트와 상응하는 비디오 프레임을 맵핑하여 골프 동영상의 썸네일을 생성한다. 제안된 오디오기반 경계영역 검출방법의 성능 측정 결과, 97.4%의 Recall과 96.85%의 Precision의 우수한 분류 성능을 나타내었다.

  • PDF

Performance Evaluation of MCLT-based Audio Watermark in DTV System (DTV 시스템에서의 MCLT 기반 오디오 워터마크 성능 평가)

  • Jeong, Youngho;Lee, Misuk;Lee, Taejin;Kim, Huiyong
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2017.06a
    • /
    • pp.219-222
    • /
    • 2017
  • 본 논문에서는 DTV 시스템을 대상으로 PN 시퀀스를 이용한 MCLT(Modulated Complex Lapped Transform) 기반 오디오 워터마크 알고리즘에 대한 BER 및 PEAQ(Perceptual Evaluation of Audio Quality) 성능 평가를 통해 오디오 신호 압축에 대한 워터마크의 강인성 및 워터마크 삽입에 따른 오디오 품질 열화 정도를 분석하였다. 이를 위해 오디오 신호 특성을 고려한 프로그램 장르별 시험용 방송 콘텐츠를 제작하고, Lab. Test 를 위한 DTV 송수신 시스템을 구축하였다. 오디오 인코딩 비트율 변화에 따른 성능 평가 결과, 광고 콘텐츠를 제외한 평균 BER(%)에서 192kbps 비트율이 128kpbs 비트율에 비해 0.0767 더 우수한 성능을 보였다. 오디오 워터마크 삽입에 따른 객관적 음질 평가에서는 PEAQ 점수가 약 -0.2 로 원래 오디오 신호와의 품질 차이가 매우 작은 것으로 나타났으며, 또한 DTV 시스템상의 신호 압축에 의해 발생하는 오디오 신호의 품질 저하 이외에 워터마크 삽입으로 인한 추가적인 음질 저하는 거의 발생하지 않는 것으로 분석되었다.

  • PDF

Prediction of Efficient Adaptive Perceptual Filter Iterate Coefficient through Analysis of Noisy Signal (잡음에 열화된 오디오 신호의 분석을 통한 효율적인 적응지각필터 반복 수행 계수의 예측)

  • Ryu, Il-Hyun;Cha, Hyung-Tai;Koo, Kyo-Sik;Seo, Bo-Kook
    • Proceedings of the Korea Institute of Convergence Signal Processing
    • /
    • 2005.11a
    • /
    • pp.238-241
    • /
    • 2005
  • 디지털 미디어 기술의 발전은 코딩 분야를 비롯하여 다양하게 발전하고 있다. 특히 오디오 신호 처리 분야에서는 디지털 오디오 신호의 생성, 압축, 복원의 단계가 다양한 형태로 개발되고 있다. 오디오 신호 처리에서 인간의 청각 기관을 모델링한 심리음향 기법은 이용하여 압축뿐만 아니라 잡음 신호의 개선에서도 효과적으로 이용되고 있다. 이러한 심리음향모델을 기반으로 하여 구성된 적응지각필터는 지각필터를 이용하여 적응적으로 잡음에 열화된 신호를 개선한다. 이때, 적응지각필터 반복 수행 계수의 효과적인 결절은 오디오 신호의 청각적 손실을 줄이는 동시에 정확한 잡음 제거를 수행한다. 성능을 확인하기 위해서 SNR 및 NMR 비교를 수행하였다.

  • PDF

Conversion of Stereo to Surround Audio Signal Using Hidden Markov Model (은닉 마르코프 모델을 이용한 스테레오에서 서라운드 오디오 신호로의 변환)

  • Jeong, Seok Hee;Chun, Chan Jun;Kim, Hong Kook
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2014.06a
    • /
    • pp.1-2
    • /
    • 2014
  • 본 논문에서는 hidden Markov model (HMM) 기반의 스테레오 신호로부터 서라운드 오디오 신호를 생성하는 기법을 제안한다. 먼저 5.1 채널 오디오 훈련 데이터베이스로부터 MDCT 영역에서 전방/서라운드 채널의 서브밴드 에너지를 프레임 단위로 계산하고, 이를 특징 벡터로 하여 좌측과 우측 채널 두 개의 HMM 이 구성된다. 다음으로, 입력된 스테레오 신호에 대해 HMM decoding 을 통해 서라운드 채널의 MDCT 영역의 서브밴드 에너지가 예측된다. 이 예측된 서브밴드 에너지로부터 역 MDCT 를 통해 서라운드 오디오 신호가 생성된다. 제안된 방법의 성능평가를 위해 MUSHRA 청취 실험을 수행한 결과, 제안된 HMM 기반의 방식으로 생성된 서라운드 오디오 신호가 기존의 패시브 서라운드 디코딩 기반으로 생성된 서라운드 신호에 비해 높은 선호도를 보였다.

  • PDF