• 제목/요약/키워드: 3D Audio

검색결과 210건 처리시간 0.026초

저전력 오디오 응용을 위한 Class-C 인버터 사용 단일 비트 3차 피드포워드 델타 시그마 모듈레이터 (A Single-Bit 3rd-Order Feedforward Delta Sigma Modulator Using Class-C Inverters for Low Power Audio Applications)

  • 황준섭;천지민
    • 한국정보전자통신기술학회논문지
    • /
    • 제15권5호
    • /
    • pp.335-342
    • /
    • 2022
  • 본 논문에서는 오디오 애플리케이션을 위한 단일 비트 3차 피드포워드 델타 시그마 변조기를 제안한다. 제안된 변조기는 저전압 및 저전력 애플리케이션을 위한 클래스-C 인버터를 기반으로 한다. 고정밀 요구 사항을 위해 레귤레이티드 캐스코드 구조의 클래스-C 인버터는 DC 이득을 증가시키고 저전압 서브쓰레스홀드 증폭기 역할을 한다. 제안된 클래스-C 인버터 기반 변조기는 180nm CMOS 공정으로 설계 및 시뮬레이션되었다. 성능 손실이 없으면서 낮은 공급 전압 호환성을 가지도록 제안된 클래스-C 인버터 기반 스위치드 커패시터 변조기는 높은 전력 효율을 달성하였다. 본 설계는 20kHz의 신호 대역폭 및 4MHz의 샘플링 주파수에서 동작시켜 93.9dB의 SNDR, 108dB의 SNR, 102dB의 SFDR 및 102dB의 DR를 달성하면서 0.8V 전원 전압에서 280μW의 전력 소비만 사용한다.

Efficient Individualization Method of HRTFs Using Critical-band Based Spectral Cue Control

  • Hur, Yoo-Mi;Park, Young-Cheol;Lee, Seok-Pil;Youn, Dae-Hee
    • 한국음향학회지
    • /
    • 제30권4호
    • /
    • pp.167-180
    • /
    • 2011
  • Recently, 3-D audio technologies are commonly implemented through headphones. A major problem of the headphone-based 3-D audio is in-the-head localization, which occurs due to the inaccurate Head-Related Transfer Function (HRTF). Since the individual measurements of HRTFs are impractical, there have been several researches for HRTF customization. In this paper, an efficient method of customizing HRTFs for the sound externalization is proposed. Firstly, it is determined which part will be customized in HRTF through psychoacoustical experiments. Then, the method controlling spectral notches and envelopes to provide individual localization cues are described. Since the proposed method is based on a critical-band rate, the structure is much simpler than that of previous studies, but still effective. The performance was evaluated through a series of subjective tests, and the results confirmed that the customized HRTF using proposed method could replace the measured individual HRTF successfully.

디코더 구현 관점에서 본 MPEG-H TV Audio System 소개 (Introduction of MPEG-H TV Audio System from the Perspective of Decoder Implementation)

  • 곽경철;양진영;배성용
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 하계학술대회
    • /
    • pp.158-160
    • /
    • 2018
  • 최근 다양한 국제 방송표준에서 차세대 오디오 코덱의 하나로 MPEG-H 3DA(3D Audio)가 채택되었으며, 이를 활용한 몰입형 오디오 서비스들이 개발되고 있다. 이러한 몰입형 서비스를 원활히 제공하기 위해서는 표준에 정의된 기술을 구현한 제품간의 상호호환성 검증이 필수적으로 추진되어야 하며, 이를 위해 개발된 MPEG-H TV Audio System 인증 프로그램에 대해 대상 제품과 시험서비스의 구조에 대해 설명하고 있다.

  • PDF

개선된 3차원 오디오 재생을 위한 크로스토크 제거 기법 (A Cross-talk Cancelling Technique for Improved 3-Dimensional Audio Reproduction)

  • 오승수;김기만
    • 한국정보통신학회논문지
    • /
    • 제5권1호
    • /
    • pp.8-13
    • /
    • 2001
  • 일반적으로 라우드 스피커를 이용한 3차원 오디오에서의 크로스토크 제거는 "sweet spot" 이라 부르는 청취자의 위치에 따라 성능이 크게 의존하는 것으로 알려져 있다. 따라서 머리의 움직임, 잔향, 머리모양의 차이 같은 혼란을 주는 요소에 강한 새로운 크로스토크 제거기가 제안되었는데 이는 스피커의 대칭 구조와 비대칭 구조를 합성하여 3개의 라우드 스피커가 필요한 구조로 되어있다. 본 논문은 3개의 스피커가 필요한 기존의 크로스토크 제거기 구조를 2개의 스피커만 사용하여 동등한 성능을 구현할 수 있도록 하였다. 연구된 방법은 청취 실험을 통해 성능을 검증하였다.성능을 검증하였다.

  • PDF

청각시스템을 기반으로 한 새로운 오디오 워터마킹 시스템 설계 (Design of a New Audio Watermarking System Based on Human Auditory System)

  • 신동환;신승원;김종원;최종욱;김덕영;김성환
    • 대한전기학회논문지:시스템및제어부문D
    • /
    • 제51권7호
    • /
    • pp.308-316
    • /
    • 2002
  • In this paper, we propose a robust digital copyright-protection technique based on the concept of human auditory system. First, we propose a watermarking technique that accepts the various attacks such as, time scaling, pitch shift, add noise and a lot of lossy compression such as MP3, AAC WMA. Second, we implement audio PD(portable device) for copyright protection using proposed method. The proposed watermarking technique is developed using digital filtering technique. Being designed according to critical band of HAS(human auditory system), the digital filers embed watermark without nearly affecting audio quality. Before processing of digital filtering, wavelet transform decomposes the input audio signal into several signals that are composed of specific frequencies. Then, we embed watermark in the decomposed signal (0kHz~11kHz) by designed band-stop digital filer. Watermarking detection algorithm is implemented on audio PD(portable device). Proposed watermarking technology embeds 2bits information per 15 seconds. If PD detects watermark '11', which means illegal song. PD displays "Illegal Song" message on LCD, skips the song and plays the next song, The implemented detection algorithm in PD requires 19 MHz computational power, 7.9kBytes ROM and 10kBytes RAM. The suggested technique satisfies SDMI(secure digital music initiative) requirements of platform3 based on ARM9E core.

Classification of Infant Crying Audio based on 3D Feature-Vector through Audio Data Augmentation

  • JeongHyeon Park;JunHyeok Go;SiUng Kim;Nammee Moon
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권9호
    • /
    • pp.47-54
    • /
    • 2023
  • 영아는 비언어적 의사 소통 방식인 울음이라는 수단을 사용한다[1]. 하지만 영아의 울음소리를 파악하는 것에는 어려움이 따른다. 영아의 울음소리를 해석하기 위해 많은 연구가 진행되었다[2,3]. 이에 본 논문에서는 다양한 음성 데이터 증강을 통한 3D 특징 벡터를 이용한 영아의 울음소리 분류를 제안한다. 연구에서는 총 5개의 클래스 복통, 하품, 불편함, 배고픔, 피곤함(belly pain, burping, discomfort, hungry, tired)로 분류된 데이터 세트를 사용한다. 데이터들은 5가지 기법(Pitch, Tempo, Shift, Mixup-noise, CutMix)을 사용하여 증강한다. 증강 기법 중에서 Tempo, Shift, CutMix 기법을 적용하였을 때 성능의 향상을 보여주었다. 최종적으로 우수한 데이터 증강 기법들을 동시 적용한 결과 단일 특징 벡터와 오리지널 데이터를 사용한 모델보다 17.75%의 성능 향상을 도출하였다.

멀티채널 3차원 마이크를 이용한 입체음향 처리 기술 (Spatial Audio Signal Processing Technology Using Multi-Channel 3D Microphone)

  • 강경옥;이태진
    • 한국음향학회지
    • /
    • 제24권2호
    • /
    • pp.68-77
    • /
    • 2005
  • 입체음향 시스템의 목적은 청취자에게 음원을 획득한 장소에 있는 것과 같은 느낌을 주는 것이다. 이를 위해 일반적으로 더미헤드가 많이 사용되고 있다. 인간의 머리형태를 한 더미헤드의 특성 때문에 더미헤드를 통해 획득한 음원을 헤드폰을 통해 청취하는 경우 현장감을 느낄 수 있다. 하지만 더미헤드의 형태 및 크기는 공공장소에서 사용하기에는 제약이 있고 더미헤드를 통해 획득한 신호는 멀티채널로 확장하기가 어렵기 때문에 본 논문에서는 이러한 더미헤드를 구체로 간략화 한 후 구체 위에 다수 개의 마이크를 배치하여 입체음원을 획득하기 위한 멀티채널 3차원 마이크 기술에 대해 제안한다. 본 논문에서 제안하는 멀티채널 3차원 마이크는 구체 위의 수평면 상에 5개의 마이크를 배치하여 입체 음원을 획득한 다음 후처리 과정을 통해 헤드폰, 스테레오, 스테레오 다이폴, 4채널 및 5채널 재생환경 등에서 재생이 가능하다. 다양한 재생신호의 생성을 위한 후처리 과정은 많은 연산량을 필요로 하기 때문에, H/W로 제작하였다. 멀티채널 3차원 마이크의 성능을 검증하기 위해 방향성 실험을 수행한 결과, 멀티채널 재생환경에서 더미헤드 기술의 단점인 전/후방 혼동현상을 현저하게 줄일 수 있었다.

저작권 보호를 위한 주파수 영역에서의 강인한 오디오 워터마킹 (Robust Audio Watermarking in Frequency Domain for Copyright Protection)

  • 프라납 쿠마르 다르;김종면
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권2호
    • /
    • pp.109-117
    • /
    • 2010
  • 디지털 워터마킹은 불법 복제로부터 디지털 콘텐츠를 보호하기 위해 광범위하게 주목을 받아왔다. 본 논문은 디지털 오디오의 저작권 보호를 위해 주파수 영역에서의 새로운 워터마킹 구조를 제안한다. 제안하는 워터마킹 시스템에서는 디지털 오디오가 중첩되지 않는 프레임들로 분리된다. 분리된 각 프레임의 크기 대역에서 선택된 최고치에 워터마크가 삽입된다. 모의실험 결과, 제안하는 방법은 노이즈 추가, 잘라내기, 재배열, 양자화, MP3 압축, 저역통과 필터 등과 같은 공격에서 강인성을 보인다. 제안한 방법의 이러한 결과는 잘 알려진 Cox방법과 비교하여 유사한 강인성을 보이지만, SNR 측면에서는 Cox방법보다 우수한 성능을 보였다. 제안한 방법은 20dB에서 28dB의 SNR을 보인반면, Cox방법은 단지 14dB에서 23dB의 성능을 보였다.

A Spatial Audio System Using Multiple Microphones on a Rigid Sphere

  • Lee, Tae-Jin;Jang, Dae-Young;Kang, Kyeong-Ok;Kim, Jin-Woong;Jeong, Dae-Gwon;Hamada, Hareo
    • ETRI Journal
    • /
    • 제27권2호
    • /
    • pp.153-165
    • /
    • 2005
  • The main purpose of a spatial audio system is to give a listener the same impression as if he/she were present in a recorded environment. A dummy head microphone is generally used for such purposes. Because of its human-like shape, we can obtain good spatial sound images. However, its shape is a restriction on its public use and it is difficult to convert a 2-channel recording into multi-channel signals for an efficient rendering over a multi-speaker arrangement. In order to solve the problems mentioned above, a spatial audio system is proposed that uses multiple microphones on a rigid sphere. The system has five microphones placed on special points of the rigid sphere, and it generates audio signals for headphone, stereo, stereo dipole, 4-channel, and 5-channel reproduction environments. Subjective localization experiments show that front/back confusion, which is a common limitation of spatial audio systems using the dummy head microphone, can be reduced dramatically in 4-channel and 5-channel reproduction environments and can be reduced slightly in a headphone reproduction.

  • PDF