• 제목/요약/키워드: 오디오 신호 개선

검색결과 72건 처리시간 0.028초

사용자 정보를 반영한 객체 기반 오디오 재생 기술 (Object-based Audio Player using a User Information)

  • 문재원;정종진;김경원;임태범;이석필
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(B)
    • /
    • pp.197-200
    • /
    • 2010
  • 멀티미디어 서비스는 신호 처리 기술의 발달 및 전송 환경의 개선으로 정보 전달의 기존 역할 뿐 아니라 사용자의 다양한 요구 및 재생 환경을 반영하는 맞춤형 서비스로 진화하고 있다. 본 논문에서는 사용자의 다양한 청취 환경 변화, 선호도 및 감정을 네트워크상 입력 디바이스를 통해 전송하고, 이를 바탕으로 처리한 객체 기반 음원을 다채널 스피커를 통해 출력하는 능동형 재생 플랫폼을 제안한다. 다수의 청취자는 각각의 감성 및 환경 정보 등 음원 처리에 관련 데이터베이스를 실시간 저장하여 동일한 음원으로 단일 플랫폼에서 다양한 청취감으로 음원 재생이 가능하다.

  • PDF

여기신호의 상관관계 기반 joint coding을 이용한 MPEG-4 audio lossless coding 인코더 복잡도 감소 방법 (A Complexity Reduction Method of MPEG-4 Audio Lossless Coding Encoder by Using the Joint Coding Based on Cross Correlation of Residual)

  • 조충상;김제우;최병호
    • 대한전자공학회논문지SP
    • /
    • 제47권3호
    • /
    • pp.87-95
    • /
    • 2010
  • 오디오 신호를 무손실 압축하여 휴대용 멀티미디어 기기에서 최고의 오디오 품질을 제공하는 기기들이 등장하고 있으며, 무손실 오디오 압축을 위한 기술에서는 2006년 MPEG-4 audio lessless coding(ALS)와 MPEG-4 scalable lossless coding(SLS)가 국제 표준으로 채택 되었다. 2009년에는 MPEG에서 최대 스테레오 음원까지만 지원하는 MPEG-4 ALS simple profile을 정의하였다. 표준화된 무손실 오디오 코덱이 휴대용 멀티미디어 기기에서 널리 이용되기 위해서는 휴대용 멀티미디어 기기에서 가장 널리 쓰이는 스테레오 조건에서 낮은 복잡도를 보여야 한다. 하지만 기존 연구에서는 MPEG-4 ALS의 압축률을 향상시키거나, 혹은 다채널 환경에서의 복잡도를 개선하기 위한 연구들이 주로 이루어졌다. 본 논문에서는 MPEG-4 ALS 인코더의 복잡도와 압축률을 분석하고, 이를 바탕으로 MPEG-4 ALS simple profile 조건에서 MPEG-4 ALS 인코더의 복잡도를 개선하기 위한 방법을 제안한다. 분석 결과 MPEG-4 ALS 인코더의 analysis 블록에서 전체 복잡도의 75% 발생하므로, 기존의 연구에서 개발된 저 복잡도 필터를 인코더에 적용하여 복잡도를 감소시키며, joint coding의 압축 효율과 여기 신호의 상호상관계수의 관계를 기반으로 joint coding 결정 방법을 제안한다. 제안된 방법과 저 복잡도 필터가 포함된 MPEG-4 ALS 인코더의 성능은 MPEG-4 conformance test 파일과 일반 음악 파일을 이용하여 복잡도 및 압축률로써 평가된다. 실험 결과 제안된 방법이 적용되었을 경우 압축률은 유사하면서 인코더 복잡도가 24% 감소한다. 이를 통해 본 논문에서 제안된 방법이 MPEG-4 ALS 인코더의 복잡도 감소에 탁월한 성능을 가짐을 보였다.

코로나 표면 처리의 접착력 향상에 의한 이차원 오디오 시스템의 출력 개선 (Output Improvement of Two-dimensional Audio Actuators by Corona Surface Treatments to Increase Adhesive Properties of Piezoelectric Materials)

  • 엄기홍
    • 한국인터넷방송통신학회논문지
    • /
    • 제12권5호
    • /
    • pp.91-97
    • /
    • 2012
  • 근래의 전기 전자 제품은 기능은 향상되는 반면 크기는 소형화되는 추세에 있다. 기존 입체 형태의 음향 신호 재생 장치로서의 엑츄에이터 대신 압전 소자를 이용한 스피커가 개발되기 시작하였다. 압전 소자는 압전 특성을 갖는 물질로서 물체의 외부에서 전압을 가할 때 기계적인 변형을 일으키는 특징(즉 피에조 특징)을 이용한다. 초기의 필름 스피커는 화학적 성질의 한계로 인하여 전도성 고분자 막을 형성하기 힘들다는 한계가 있었고, 도포한 두께를 균일하게 유지하기 힘들었으며, 음향 신호의 출력과 동작 주파수의 한계가 있다는 등의 종래 기술의 문제점을 해결하기 위해, 전도 물질과 피에조 물질(필름)의 결합력을 증가시킴으로써 전도체의 저항을 줄이고 주파수 영역을 확장하고자 한다. 피에조 필름의 표면 접착력을 향상시키고, 고분자 전도체 막의 흡착력을 증가시킴으로써 음향시스템의 출력 향상을 위해 코로나 표면처리방식에 의한 표면 특징을 변화시킴으로써 출력개선을 하였다.

2채널 오디오 시스템에서 전달계 변동에 강인한 역필터 설계 기법 (The Method of New Robust Inverse Filter Design in 2-Ch Audio System)

  • 박병욱;김학윤
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권1호
    • /
    • pp.185-192
    • /
    • 2008
  • 2개 이상의 스피커로 오디오 신호를 재생할 경우에 발생하는 가장 커다란 문제점은 크로스토크 현상이다. 크로스토크 현상을 제거하기 위하여 역필터를 설계하는 대표적인 방법 중 하나인 LNS 방법은 구현이 쉽고, 계산량이 적다는 장점이 있지만, 전달계의 변동이 발생하였을 경우에는 쉽게 대응할 수 없기 때문에 역필터의 성능이 저하되는 문제점을 갖고 있다.본 논문에서는 LNS방법을 이용하여 기 역필터를 설계하고, 그 역필터를 계속적으로 적응시켜 전달계가 변동하였을 때에도 변동된 전달계에 쉽게 대처할 수 있는 새로운 알고리즘을 제안하였다. 제안한 기법의 타당성을 입증하기 위하여 컴퓨터 시뮬레이션을 수행하여 기존의 방법과 비교한 결과, 크로스토크 제거 성능이 전 주파수 영역에서 개선됨을 확인하였다.

  • PDF

심층 신뢰 신경망을 이용한 오푸스 코덱 기반 인공 음성 대역 확장 기술 (Artificial speech bandwidth extension technique based on opus codec using deep belief network)

  • 최윤상;이아성;강상원
    • 한국음향학회지
    • /
    • 제36권1호
    • /
    • pp.70-77
    • /
    • 2017
  • 대역폭 확장 기술은 300 ~ 3,400 Hz 대역의 협대역 음성 신호를 50 ~ 7,000 Hz 대역의 광대역 음성신호로 확장하여 음질, 명료도, 그리고 자연성을 높이는 기술이다. 본 논문에서는 협대역 음성 정보를 이용하여 광대역 음성신호를 추정하는 인공 대역폭 확장 기술을 설계하여, 오푸스(Opus) 오디오 복호화기에 내장시킴으로써, 대역폭 확장 모듈에서의 LPC(Linear Prediction Coding) 분석 및 LSF(Line Spectral Frequencies) 해석과 관련된 계산량을 감소시켰고 알고리즘 지연도 줄였다. 이를 위해 현재 다양한 분야에 적용되고 있는 딥 러닝 기술 중 하나인 심층 신뢰 신경망(Deep Belief Network, DBN) 방식을 스펙트럼 포락선 확장에 도입하여 전통적인 코드북 매핑법보다 더 좋은 품질의 스펙트럼을 만들 수 있었다.

HE-AAC 부호화의 저비트율에서 음질향상 기법 (Quality Improvement of Low-Bitrate HE-AAC Encoder)

  • 김정근;이재성;이태진;강경옥;박영철
    • 한국음향학회지
    • /
    • 제27권2호
    • /
    • pp.66-74
    • /
    • 2008
  • 본 논문에서는 HE-AAC (High Efficiency Advanced Audio Coding) 오디오 부호화기의 저주파 대역과 고주파 대역을 담당하고 있는 AAC부호화기와 SBR (Spectral Band Replication) 부호화기에 대해 낮은 비트율에서 효과적인 개선 방법을 제안한다. AAC 부호화기가 담당하는 저주파 대역에서 과도신호가 발생하는 부분의 프리에코를 줄이기 위하여 적용 주파수범위가 저주파 대역 방향으로 선택적으로 확장되는 eTNS (exteded Temporal Noise Shaping) 방법을 고안하였다. 또한 SBR에 의해 부호화되는 고주파 대역에서 톤 성분 복원 시에 잡음층 (Noise floor)이 추가 발생되지 않도록 정현파 모델을 통해 톤을 사전 인지하고 인지된 톤들의 주파수를 QMF 밴드의 중앙으로 재배치하여 성능 향상을 이루었다. 제안한 방법들을 사용하여 복호화한 샘플 음원들에 대해 주/객관적 음질평가를 실시한 결과, 표준 HE-AAC에 비해 향상된 결과를 보여주었다.

입력 범위를 개선한 FDPA 방식의 3차 시그마-델타 변조기 (3rd SDM with FDPA Technique to Improve the Input Range)

  • 권익준;김재붕;조성익
    • 전기전자학회논문지
    • /
    • 제18권2호
    • /
    • pp.192-197
    • /
    • 2014
  • 본 논문은 개선된 입력 범위를 갖는 FDPA(Feedback Delay Pass Addition) 방식의 3차 SDM(Sigma-Delta Modulator) 구조를 제안한다. 기존의 구조는 2차 SDM 구조에서 디지털 딜레이 패스만을 추가하여 3차 전달함수를 구현하였지만, 첫 번째 적분기로 피드백 하는 패스가 많아짐에 따라 입력 범위가 매우 작은 단점이 있다. 그러나 제안된 구조는 첫 번째 적분기로 피드백 하는 디지털 패스를 2차 적분기로 피드백 하여 입력 범위를 9dB 개선할 수 있었다 이를 이중 샘플링 기법을 통해 연산 증폭기 한 개 만으로 3차 SC SDM을 구현하였다. 공급전압 1.8V, 신호대역폭 20KHz, 오디오 대역 샘플링 주파수 2.8224MHz 조건에서 $0.18{\mu}m$ CMOS 공정을 이용하여 제안한 SDM을 시뮬레이션한 결과, SNR(Signal to Noise Ratio)은 83.8dB, 전력소비는 $700{\mu}W$, Dynamic Range는 82.8dB이다.

AVB 기반의 버스안전용 멀티뷰어의 FPGA 카메라모듈 설계 (Design of FPGA Camera Module with AVB based Multi-viewer for Bus-safety)

  • 김동진;신완수;박종배;강민구
    • 인터넷정보학회논문지
    • /
    • 제17권4호
    • /
    • pp.11-17
    • /
    • 2016
  • 본 논문에서는 버스안전을 위한 다중 HD 카메라 기반의 IP통신망 AVB(Audio Video Bridge) 이더넷 케이블을 연동한 FPGA(Xilinx Zynq702)로 멀티뷰어 플랫폼을 제안하였다. 이러한 AVB(IEEE802.1BA) 시스템은 차량용 네트워크에서 다중 HD 비디오와 오디오 디지털 신호의 실시간 전송이 가능하다. 제안한 멀티뷰어 플랫폼은 기존 이더넷 케이블 1Gbps전송과 2-선 100Mbps 스트림 전송방식을 통해 4개의 초광각 HD 카메라로 부터 H.264 비디오 신호를 다중화하기 위한 지연속도의 개선을 위해 FPGA로 설계하였다. 아울러, 차량용 HD 동영상 전송망에서 시간지연을 최소화하기 위한 AVB 플랫폼은 Zynq 702기반의 H.264 AVC 저지연 코덱의 설계 방안을 제안하였다. 이러한 H.264 AVC 코덱의 부호화/복호화 결과확인을 위해 JM 모델을 참조한 PSNR(Peak Signal-to-noise-ratio)을 분석하였다. 설계한 Zynq 702기반의 H.264 AVC CODEC은 다중 HD 카메라의 다중뷰어 동영상 손실 압축에서 화질 손실에 대한 PSNR은 이론 값과 유사한 HW 결과 값을 확인하였다. 이로서 제안한 AVB기반의 다중 HD 카메라 연동형 멀티뷰어 플랫폼은 H.264 AVC CODEC의 저지연 특성이 차량용 특성에 만족함으로서 버스안전을 위한 주변의 오디오와 비디오 영상감시가 가능할 것이다.

CogTV를 위한 생체신호기반 시청자 선호도 모델 (A Viewer Preference Model Based on Physiological Feedback)

  • 박태서;김병희;장병탁
    • 한국지능시스템학회논문지
    • /
    • 제24권3호
    • /
    • pp.316-322
    • /
    • 2014
  • 본 논문은 TV를 이용한 영화시청 환경에서 해당 컨텐트에 대한 시청자의 암묵적 반응과 컨텐트의 멀티모달 피쳐를 실시간으로 측정 및 동기화하여 이를 기반으로 동영상 선호모델을 지속적으로 개선하고 필요시 영화추천을 수행하는 시스템을 제안한다. 제안한 시스템에선 이미지, 소리, 자막 스트림으로부터 실시간 추출되는 저수준 피쳐들과 동기화되어 측정된 얼굴표정, 자세 및 생체신호로부터 해당 동영상이 유발한 시청자의 감정상태를 추정하여 선호모델 학습에 사용한다. 제안한 컨텐트-시청자 연계 추천모델의 일례로서 컨텐트의 오디오 및 자막 정보를 이용하여 시청자의 피부전기활성도로 측정된 arousal반응을 예측할 수 있음을 보인다.

차세대 무선 스피커 시스템의 전송거리 증대를 위한 MB-OFDM UWB 기술 (MB-OFDM UWB Technology for Increasing Transmission Reach of Wireless Speaker Systems)

  • 김도훈;위정욱;이현석;이충용
    • 대한전자공학회논문지TC
    • /
    • 제48권6호
    • /
    • pp.1-5
    • /
    • 2011
  • 차세대 무선 스피커의 오디오 신호 전송 거리의 증대를 위한 Multi-band orthogonal frequency division multiplexing ultra-wideband (MB-OFDM UWB) 기술을 제안한다. 제안된 기술은 기존의 MB-OFDM UWB기술을 바탕으로 리드 솔로몬 코딩 기법을 추가하여 간헐적인 랜덤 에러를 완벽하게 보상하여 SNR을 이득을 얻음으로써 전송거리를 개선하였다. 시뮬레이션 환경으로 WPAN 채널모델중 CM1을 사용하였고, 백색잡음과 캐리어 주파수 오프셋, 샘플링 주파수 오프셋을 반영하여 시뮬레이션 환경이 실제 모뎀의 동작 환경과 유사하도록 설정하여 시뮬레이션의 신뢰를 높혔다. 시뮬레이션을 통해서 최대 2dB의 SNR 이득을 얻었고, 이는 수신기의 수신감도를 향상시켜 제안된 시스템은 최대 12.6미터까지 신호 전송이 가능한 것을 확인하였다.