통합 검색 | Korea Science

권오균;송문빈;이승원;이영원;정연모
- 한국음향학회지
- /
- 제24권7호
- /
- pp.387-394
- /
- 2005
본 논문에서는 다채널 오디오 시스템의 스피커들을 직렬로 연결하기 위한 새로운 오디오 신호 전송 기법을 제시한다. 다채널 오디오 본체로부터의 아날로그 신호는 디지털 신호로 변환되고 신호 처리 과정을 거쳐서 직렬로 연결된 각 스피커에 전달된다. 여기서 신호 처리 과정은 오디오 신호의 특성을 고려한 데이터 압축과 전송을 위한 패킷 생성을 포함한다. 각 스피커는 전달된 패킷으로부터 해당하는 디지털 신호만을 검출하여 아날로그 신호로 다시 변환하여 음향을 재생한다. 제시된 모든 기능은 VHDL을 사용하여 모델링되었으며 FPGA 칩으로 구현하였고 실제 다채널 오디오 시스템에서 테스트하였다.
PDF KSCI

김선태;마평수
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (3)
- /
- pp.403-405
- /
- 2001
MPEG-4 미디어 파일은 저비트율에서 고비트율까지 다양한 응용범위에서 이용 가능하므로, 요즘들어서 MPEG-4의 미디어 파일이 많은 분야에서 사용되고 있다. 하지만 미디어를 다루는 전문가 외에는 MPEG-4 알고리즘을 이용한 미디어 파일을 생성하여 서비스하기에는 많은 어려움이 있다. 따라서, 본 논문에서는 사용자가 사용하기 편리한 인터페이스를 갖춘 MPEG-4파일 생성 도구를 만들었다. 본 파일 생성도구는 일반 PC에 보편화된 미디어 포맷인 AVI과일을 입력으로 오디오와 비디오를 포함한 MPEG-4 파일을 생성하는 도구이다. 이 도구에는 비디오의 화면 크기 변환, 오디오의 채널변환 및 샘플링 주파수 변환 등의 전처기와 비디오/오디오 압축을 위한 각각의 MPEG-4 비디오/오디오 부호기 및 생성된 두개의 미디어 파일을 하나로 묶어 표준에 맞은 파일을 생성하는 포맷터를 포함한다. 본 파일 생성도구는 응용 비트율에 따른 파일 생성뿐 만 아니라 각각의 미디어 파일의 조건을 사용자 인터페이스의 간단한 입력으로 원하는 응용에 맞는 다양한 파일을 생성할 수 있다.
PDF

오현오;정양원
- 대한전자공학회논문지SP
- /
- 제47권5호
- /
- pp.45-55
- /
- 2010
객체 기반 오디오 부호화 기술은 다양한 응용 분야를 기대할 수 있는 차세대 오디오 기술로써 관심이 높다. 최근 MPEG에서는 SAOC (Spatial Audio Object Coding)라는 압축 효율이 우수한 Parametric 객체 부호화 방법을 표준화하였다. 본 논문에서는 SAOC를 중심으로 Parametric 객체 오디오 부호화의 기술을 소개하고, 이를 실제 적용하기 위한 고려사항들에 대해 다룬다.
PDF KSCI

방희석
- 방송공학회논문지
- /
- 제16권5호
- /
- pp.714-721
- /
- 2011
MPEG 오디오에서는 오디오 신호의 효율적인 압축을 위해서 마스킹 효과, spectral band replication을 이용한 고주파 성분 합성, parametric stereo를 이용한 채널 확장 등의 기술을 이용하고 있다. 본 논문에서는 이 중 최신 기술에 해당하는 채널 확장 기술에 대해서 소개한다. 또한, MPEG 오디오 코덱 중 이 기술을 이용하는 HE-AAC v.2, MPEG Surround, Spatial Audio Object Coding(SAOC), Unified Speech and Audio Coding (USAC)에 대해 기술 소개 및 방송의 적용 예를 기술한다.
https://doi.org/10.5909/JEB.2011.16.5.714 인용 PDF KSCI

구대성;정양권;김종빈
- 한국통신학회논문지
- /
- 제28권9C호
- /
- pp.851-859
- /
- 2003
최근 사용자들의 멀티채널 선호도는 급속도로 전파되고 있다. MPEG은 동영상 및 음향시스템의 데이터 압축기술을 제공하는데, 현재 각광을 받고있는 것이 디지털 오디오이다. MPEG 표준안은 MPEG-1오디오 알고리즘을 MPEG-2 알고리즘에 동일하게 사용해도 멀티채널 및 5.1채널 사운드륵 제공한다. MDCT(Modified Discrete Cosine Transform)는 TDAC(Time Domain Aliasing Cancellation)에 기반을 두고있는 변형이산 여현 변환을 나타낸 것이다. 본 논문에서는 오디오 부분의 핵심이라 할 수 있는 MDCT/IMDCT(Inverse MDCT) 알고리즘을 최적화하여 효율적인 알고리즘을 제안하였다. 그리고 연산과정에서 중복되는 영역을 묶음으로써 연산에 필요한 계수를 줄였다. 최적화 전에 비해 코사인 계수를 0.5%이하로 최적화하였고, 승산에서 0.098%, 가산에서 0.58% 효율을 보였다. 알고리즘 검증은 C언어를 사용하여 검증하였고, 최적화된 알고리즘을 적용하여 마이크로 프로그램 방식의 하드웨어 구조론 설계하였다.
PDF KSCI

김범준;문현기;박성욱;박영철
- 한국음향학회지
- /
- 제37권6호
- /
- pp.475-482
- /
- 2018
본 논문에서는 DNN(Deep Neural Network) 기반 오디오 표식을 위한 데이터 증강 방법을 연구한다. 본 시스템에서는 오디오 신호를 멜-스펙트로그램으로 변환하여 오디오 표식을 위한 심층신경망의 입력으로 사용한다. 적은 수의 훈련 데이터를 사용하는 경우 발생하는 문제를 해결하기 위해, 타임 스트레칭, 피치 변화, 동적 영역 압축, 블록 혼합 등의 방법을 사용하여 훈련 데이터를 증강시켰다. 사용된 데이터 증강 기법의 최적 파라미터와 최적 조합을 오디오 표식 시뮬레이션을 통해 확인하였다.
https://doi.org/10.7776/ASK.2018.37.6.475 인용 PDF KSCI HTML