통합 검색 | Korea Science

AC-3 복호화 알고리듬의 고정 소수점 오차 최적화 (Fixed-point Error Optimization of AC-3 Decoding Algorithm)

이근섭
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
- /
- pp.438-441
- /
- 1998
최근 미국 내 표준안으로서 많이 사용되고 있는 AC-3 오디오 알고리듬은 그 복잡성으로 인하여 실시간 구현을 위해선 프로세서로 구현하는 것이 적합하다. AC-3 복호화 알고리듬은 많은 부분이 실수연산으로 이루어져 있으므로 소수점을 고려한 연산이 필요한데, 프로세서로 구현할 때는 적은 비용과 빠른 속도로 실수연산을 수행하기 위해서 부동소수점보다는 고정소수점 연산이 유리하다. 그러나 고정소수점 연산시 발생하는 유한 단어길이 효과로 인하여 양자화 오차가 발생하므로 복호화된 오디오 신호의 음질저하를 최소화하기 위해서는 최적화가 필요하다. 본 논문에서는 AC-3 복호화 알고리듬의 부분별 양자화 오차를 분석하고 그 결과 가장 많은 오차를 발생시키는 역 TDAC 변환의 오차를 최적화하였다. Fast TDAC 변환이 FFT로 이루어져 있으므로 고정 소수점 연산시 오차가 적은 FFT 구조를 제안하였다. 제안된 구조를 사용하여 AC-3 고정소수점 복호화기를 C 언어를 사용하여 구현하였으며, AC-3 부동소수점 복호화기와 최종 PCM을 비교하여 그 성능을 평가하였다.
PDF

통합 음성/오디오 부호화기의 Noise Filling 알고리즘에 대한 연구 (Study on Noise Filling algorithm of Unified Speech and Audio Coding)

송정욱;강홍구
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송공학회 2012년도 하계학술대회
- /
- pp.260-261
- /
- 2012
본 논문에서는 Unified Speech and Audio Coding (USAC)에 적용된 Noise Filling의 부호화 과정에서 음질 왜곡 정도에 따라 Noise level을 설정하는 방법을 제안한다. USAC는 Moving Picture Experts Group (MPEG)에서 표준화한 최신의 음성/오디오 통합 코덱으로 현존하는 코덱 중에 최고의 성능을 가지고 있다. 하지만, 복호화기 기술만 표준화하여, 인코더를 설계하는 방법에 따라 음질의 차이가 존재한다 현재 오픈 소스 기반으로 진행되고 있는 프로젝트 JAME에서는 이러한 음질 차이를 극복하고, USAC에 적용된 핵섬 인코더 기술의 성능을 최대화 할 수 있는 여러 가지 방법을 포함하고 있다. 그 중 Noise Filling은 저 전송률 부호화 과정에서 양자화 되지 않는 스펙트럼에 대하여 일정한 noise level을 넣어 인지적으로 음질을 향상시키는 방법이다. 제안된 Noise Filling 부호화 방법은 현재 프레임의 음질 왜곡 정도를 반영하여, noise-like 신호 성분을 더욱 정교하게 부호화 할 수 있게 하였다.
PDF

음질 평가법의 표준과 연구 동향 - 전송 처리음 분야 (Review of Standard Sound Quality Assessment Methods for the Transmitted and Processed Sounds)

오원근
- 한국음향학회지
- /
- 제32권3호
- /
- pp.214-226
- /
- 2013
음질 평가는 좋은 소리를 만들기 위해 필수적인 요소이며, 음향의 특성과 대상 시스템에 따라 다양한 방법이 사용되고 있다. 본 논문에서는 음질 평가법의 전반적인 방법론 및 전송 처리된 음향 신호의 품질 평가법에 대해 ITU-T, ITU-R, IEC, 그리고 ANSI 등의 권고안에 기술된 국제 표준을 중심으로 요약하고 분석하였다. 분야별로는 음성 명료도, 음성 음질, 그리고 오디오 음질 평가법을 다루었으며, 현재 사용되는 권고안의 기술적인 내용과 최신 연구 동향 및 향후 발전 방향 등에 대해 기술하였다.
https://doi.org/10.7776/ASK.2013.32.3.214 인용 PDF KSCI

워터마킹을 이용한 동적캐릭터 (A dynamic character using watermarking technique)

박귀태;김갑일;손영익
- 대한전기학회:학술대회논문집
- /
- 대한전기학회 2003년도 학술회의 논문집 정보 및 제어부문 B
- /
- pp.464-467
- /
- 2003
본 논문에서는 워터마킹을 응용한 동적 캐릭터 기술을 제안한다. 오디오 신호에 임의의 동작을 위한 일련의 동작코드를 들리지 않게 삽입하면, 이 캐릭터는 선행 처리된 오디오 파일이 재생될 때 마이크를 통해 얻은 소리를 처리하고 은닉된 코드를 추출함으로써 그 코드에 지정된 행동을 할 수 있다. 예를 들어 로봇이 동작코드가 은닉된 음악에 맞추어 지시된 춤을 출 수 있는 것이다. 이를 위해 우리는 워터마킹 기술을 적절히 응용하였으며, 제안된 기술은 공기(air)를 매질로 삼는 아날로그 채널에서 발생하는 잡음, 로봇과 음원의 거리에 따른 음의 감쇄, 그리고 동기화 등과 같은 문제들을 해결하였다. 여러 가지 상황에 따른 제안된 기술의 실험을 통해 제안된 기술의 성능을 입증하였다.
PDF

조건부 오토 인코더를 이용한 오디오 고대역 부호화 기술 (High-Band Coding of Audio Signal Based on Conditional Auto Encoder)

조효진;백승권;장원;신성현;박호종
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2018년도 하계학술대회
- /
- pp.51-52
- /
- 2018
본 논문에서는 조건부 오토 인코더를 사용하여 오디오 고대역 신호를 부호화 하는 기술을 제안한다. 오토 인코더의 데이터 압축 특성을 이용하여 부호화를 위한 데이터의 양을 크게 줄인다. 제안하는 알고리즘은 기존의 오토 인코더와 달리 과거의 정보가 포함된 2차원 조건을 함께 입력하여 오토 인코더가 코딩 프레임의 고대역을 복원하는 것을 돕도록 한다. 2차원 조건과 입력을 압축하여 연결한 후 디코딩하여 코딩 프레임의 고주파 대역을 만든다. 제안하는 방법을 사용하면 저대역 MDCT 계수와 고대역 MDCT 계수를 오토 인코더로 압축한 결과만으로 원본과 유사한 음질을 청취할 수 있다.
PDF

감시 시스템에서의 비정상 소리 탐지 및 식별 (Abnormal Sound Detection and Identification in Surveillance System)

주영민;이의종;김정식;오승근;박대희
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2010년도 추계학술발표대회
- /
- pp.592-595
- /
- 2010
본 논문에서는 감시카메라 환경에서 취득한 오디오 데이터를 입력으로 하여, 비정상 상황을 인식하는 시스템을 제안한다. 제안된 시스템은 단일클래스 SVM의 대표적인 모델인 SVDD와 최근 얼굴 인식 분야에서 성공적인 업적을 보여주고 있는 신호 처리 분야의 SRC를 계층적으로 결합한 구조로써, 첫 번째 계층에서는 SVDD로 비정상 소리를 신속하게 탐지하여 관리자에게 알람 경고하고, 두 번째 계층의 SRC는 탐지된 비정상 소리를 유형별로 세분화 식별하여 관리자에게 비상 상황을 보고함으로써 관리자의 위기 상황 대처를 돕는다. 제안된 시스템은 실시간 처리가 가능하며, 점증적 갱신의 학습 능력으로 인하여 비정상 오디오 데이터베이스의 변화에도 능동적으로 적응할 수 있다. 실험을 통하여 제안된 시스템의 성능을 검증한다.
https://doi.org/10.3745/PKIPS.y2010m11a.592 인용 PDF

실시간 처리를 위한 멀티채널 오디오 코덱의 구현 (The Implementation of Multi-Channel Audio Codec for Real-Time operation)

홍진우
- The Journal of the Acoustical Society of Korea
- /
- 제14권2E호
- /
- pp.91-97
- /
- 1995
본 논문은 저비트율을 갖는 고품질의 HDTV용 멀티채녈 오디오 코덱을 구현에 대해 기술한다. 이 코덱은 저주파수 효과 채널을 포함한 최대 3/2 스테레오 채널 구성, 최대 채널 구성보다 낮은 채널 구성과의 호환성, 기존 2채널 스테레오 시스템과의 호환성(MPEG-1 오디오), 그리고 다중 대화 채널 등을 제공하는 특징을 갖는다. 구현한 멀티채널 오디오 코덱의 인코더는 3개의 DSP(TI의 TMS320C40)로 구성되었고, 최대 48KHz 샘플링율과 16비트의 부호화를 갖는 5.1 채널의 아날로그 및 AES/EBU, IEC 958등의 포맷을 갖는 스테레오 2채널의 디지털 오디오를 이력으로 받아 지각 심리음향 모델을 사용하여 압축한후 384Kbps의 빛 스트림으로 전송하는 특징을 가지며, 디코더는 2개의 DSP로 구성되어 있고, 384Kbps로 입력되는 비트 스트림을 받아 최대 5.1 채널의 아날로그 및 2개의 2채널 스테레오의 디지털 오디오 신호로 출력시키는 특징을 갖는다. DSP를 이용한 다중처리는 DMA를 통한 통신포트를 이용한 DSP들간의 고속 데이터 전송에 의해 이루어진다. 끝으로, 멀티 채널 오디오 코덱의 구현을 통하여 나타난 실시간 처리는 위해 고려해야할 기술적 사항을 제안한다.
PDF

동일채널 FM 간섭원에 대한 IBAC DAB 시스템의 혼신 보호비 분석 (Analysis on Protection Ratio of IBAC DAB System for Co-Channel FM Interferer)

정영호;박소라;김건;이현;이수인
- 방송공학회논문지
- /
- 제5권2호
- /
- pp.199-210
- /
- 2000
IBAC(In-Band Adjacent-Channel) 디지털 오디오방송(Digital Audio Broadcasting : DAB) 시스템은 기존 아날로그 라디오방송이 서비스되는 FM 대역(88~108 MHz)에서 CD 음질의 다채널 오디오 및 멀티미디어 데이터 서비스 제공을 목표로 하고 있다. 따라서 기존 아날로그 FM 신호와의 간섭에 따른 혼신 보호비 분석은 두 방식간의 양립성 검증 및 신규 DAB 채널 할당을 위해 반드시 수행되어야 한다. 이를 위해 FM 신호가 DAB 신호에 주는 간섭 영향, DAB 신호가 FM 신호에 주는 간섭 영향, DAB 신호가 DAB 신호에 주는 간섭 영향에 대한 분석이 이루어져야 한다. 본 논문에서는 FM 간섭원에 대한 모델링과 다중경로 페이딩 채널 환경을 고려한 컴퓨터 시뮬레이션을 통하여 상기 간섭조건 중에서 동일채널 FM 간섭원에 대한 IBAC DAB 시스템의 혼신 보호비를 분석하였다. IBAC DAB 시스템은 Eureka 147 시스템에 비해 월등히 높은 수신 감도를 가지며, 1/3 정도 적은 신호 대역폭으로 인해 동일채널 FM 간섭원에 대한 혼신 보호비는 비교적 높은 값을 나타내었다.
PDF

주파수 위상 응답과 크기 응답에 QIM을 이용한 다중 오디오 워터마킹 (Multiple Audio Watermarking using Quantization Index Modulation on Frequency Phase and Magnitude Response)

서예진;조상진;정의필
- 한국음향학회지
- /
- 제32권1호
- /
- pp.71-78
- /
- 2013
본 논문에서는 주파수 위상 응답과 크기 응답에 QIM을 이용하여 워터마크를 삽입하는 다중 오디오 워터마킹을 제안한다. 워터마크 삽입은 두 단계로 나뉘며 주파수 영역에서 수행된다. 1단계에서는 주파수 위상 응답의 전체 샘플을 대상으로 QIM을 이용하여 워터마크를 삽입하고 2단계에서는 먼저 무음 구간 여부에 따라 워터마크를 삽입할 프레임을 정하고 해당 프레임에서 주파수 크기 응답의 최대값을 기준으로 정규화한 후 고정된 스텝사이즈를 적용하는 방법으로 적응적인 QIM을 구현하여 워터마크를 삽입한다. 워터마크 삽입 단계를 거친 주파수 위상 응답과 크기 응답을 역푸리에 변환을 통해 시간 영역의 신호로 복원한다. 워터마크 검출은 유클리디안 거리(Euclidean distance)를 이용하여 블라인드 검출 방식으로 수행된다. 오디오 워터마크 벤치마킹을 통한 강인성 검증에서 대부분 강인한 특성을 보였으며 특히 푸리에 공격에서 복원율은 95% 이상으로 매우 강인한 결과를 보였다.
https://doi.org/10.7776/ASK.2013.32.1.071 인용 PDF KSCI

오디오의 Peak 특징을 이용한 동일 영화 콘텐츠 검색 (Similar Movie Contents Retrieval Using Peak Features from Audio)

정명범;성보경;고일주
- 한국멀티미디어학회논문지
- /
- 제12권11호
- /
- pp.1572-1580
- /
- 2009
검색을 위해 동영상 데이터 전체를 이용하면 많은 시간과 저장 공간이 필요하다. 이를 보완하고자 기존의 동일 영화 검색은 영상 정보의 일부를 이용하여 동일한 영상 검색에 사용해 왔다. 그러나 이 방법은 같은 영상임에도 비디오 부호화기이나 해상도가 다른 경우 전혀 다른 영상으로 인식한다. 따라서 본 논문에서는 동영상의 오디오 정보를 이용하여 동일한 동영상을 찾는 알고리즘을 제안한다. 제안 방법은 부호화율, 부호화기, 샘플링 수의 변화에도 유사한 파형을 형성하는 Peak 정보를 바탕으로 데이터베이스에 색인하고, 검색한다. 논문에서는 제안 방법의 성능을 확인하기 위해 1,000개의 동영상 데이터를 검색 실험하였으며, 92.1%의 성공률을 나타내었다.
PDF

검색결과 435건 처리시간 0.027초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)