• 제목/요약/키워드: 오디오신호

검색결과 435건 처리시간 0.028초

Meta Data를 이용한 HRTF DB 설계 (An architecture for HRTF DB using Meta data)

  • 강상길;황재민;송주형;김정혁;김찬형
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1078-1080
    • /
    • 2013
  • 본 논문에서는 5.1 채널 입체 음향 오디오 신호를 2채널의 헤드폰으로 재생하기 위해 사용하는 HRTF(Head-related transfer funcion) DB를 다룬다. 다양한 HRTF DB의 사례를 분석하고, 이를 통해서 더 나은 HRTF DB를 설계 한다. 기존의 HRTF DB에 Audio Meta data를 이용하여 파일의 정보를 저장하고, 이를 DB에 저장함으로써 Meta data를 비교 검색하고 저장함으로써 편의성을 높인다. 또한 기존의 HRTF DB들이 오래 되고 현재의 시스템에 맞지 않기 때문에 이를 현재의 시스템에 맞게 Converting하고 UI를 3D로 구현함으로써 UX를 높이고 직관성을 개선함으로써 사용자 접근성을 높인다. 이를 통해서 HRTF DB의 범용성을 개선하고 관련 연구에 효율적으로 사용할 수 있게 될 것이다.

신호의 복원된 위상 공간을 이용한 오디오 상황 인지 (Audio Context Recognition Using Signal's Reconstructed Phase Space)

  • ;;;이승룡;구교호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.243-244
    • /
    • 2009
  • So far, many researches have been conducted in the area of audio based context recognition. Nevertheless, most of them are based on existing feature extraction techniques derived from linear signal processing such as Fourier transform, wavelet transform, linear prediction... Meanwhile, environmental audio signal may potentially contains non-linear dynamic properties. Therefore, it is a big potential to utilize non-linear dynamic signal processing techniques in audio based context recognition.

신호의 복원된 위상 공간을 이용한 오디오 상황 인지 (A new approach technique on Speech-to-Speech Translation)

  • ;이승룡
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.239-240
    • /
    • 2009
  • We live in a flat world in which globalization fosters communication, travel, and trade among more than 150 countries and thousands of languages. To surmount the barriers among these languages, translation is required; Speech-to-Speech translation will automate the process. Thanks to recent advances in Automatic Speech Recognition (ASR), Machine Translation (MT), and Text-to-Speech (TTS), one can now utilize a system to translate a speech of source language to a speech of target language and vice versa in affordable manner. The three phase process establishes that the source speech be transcribed into a (set of) text of the source language (ASR) before the source text is translated into the target text (MT). Finally, the target speech is synthesized from the target text (TTS).

하이브리드 인식을 이용한 불법 콘텐츠 추적시스템 설계 및 구현 (Design and Implementation of Illegal Content Tracking System Using Hybrid Content Recognition)

  • 김원겸;박경수;김상진;유원영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.1555-1558
    • /
    • 2011
  • 본 논문에서는 멀티미디어 데이터에 대한 내용기반 인식 기법을 이용하여 인터넷에 불법으로 배포되어 있는 콘텐츠를 추적하는 기법을 소개한다. 내용기반 인식 기법은 콘텐츠의 원신호에서 내용기반 해쉬나 혹은 축약된 형태의 특징벡터를 추출하여 콘텐츠를 인식하는 기술로 저작권보호 분야에서 불법 저작물을 필터링하는데 많이 활용되고 있다. 불법 콘텐츠 추적시스템은 인터넷에서 광범위하게 유포되어 있는 저작물을 검색하여 그 내용을 기반으로 인식하여 불법 여부를 판단한 후 삭제메일이나 재전송 중지 등의 후속 조치를 자동으로 수행하는 저작권보호 시스템이다. 본 논문에서는 오디오, 비디오, 어문, 게임 콘텐츠에 대해 내용을 기반으로 인식을 수행하고 불법 여부를 판단하여 재전송 중지 조치를 취하는 능동적 저작물 추적 시스템을 제안한다. 제안된 시스템에서는 검색모듈에 의해 수집된 다양한 저작물에 대해 저작물별 독립적으로 인식 기능을 수행하는 기능을 제공한다.

다중밴드 양자화를 적용한 USAC 부호화 기술

  • 백승권;임우택;이태진
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.329-332
    • /
    • 2020
  • 본 논문은 USAC(Unified Speech and Audio Coding) 오디오 부호화 기술의 성능 개선에 관련한 것이다. USAC 은 FD(Frequency domain) 양자화 모듈과 LPD(Linear prediction domain) 양자화 모듈을 탑재하고 있다. 본 논문에서는 LPD 모드로부터 생성되는 잔차신호에 대하여 주파수 영역에서 다중밴드로 분할하고 각 밴드 별 양자화를 독립적으로 수행함으로써 USAC 의 LPD 모드의 양자화 효율을 개선하였다. 그 결과 동일 조건에서 제안방법이 기존의 LPD 모드의 성능을 음질 측면에서 향상시킴을 확인할 수 있었다.

  • PDF

타원 곡선 암호화를 이용한 영상 저작권 보호 시스템 설계 (Design of Digital Media Protection System using Elliptic Curve Encryption)

  • 이찬호
    • 대한전자공학회논문지SD
    • /
    • 제46권1호
    • /
    • pp.39-44
    • /
    • 2009
  • 통신 기술이 발달하면서 유무선을 통한 네트워크 접속이 빈번해지고 고화질의 비디오/오디오 압축 방식의 출현으로 데이터의 교류는 더욱 활발해지고 있다. 데이터 교류의 증가로 개인 정보와 비디오/오디오 콘텐츠 등의 사업적 이윤을 목적으로 하는 유료정보에 대한 접근권한과 보호가 중요한 요소로 인식되고 있다. 따라서 본 논문에서는 타원 곡선 암호화 알고리즘을 이용한 디지털 미디어 저작권 보호 기술을 제안한다. 제안된 방식에서는 H.264 영상신호의 핵심 파라미터만을 암호화하여 암호 및 복호에 따른 부담을 줄이고 해당 정보를 복호하지 못할 경우 영상 재생이 안 되거나 매우 열악한 화질의 영상이 재생되도록 한다. 이러한 시스템을 구현하기 위해서는 영상 재생 단말기에 암호 복호화 하드웨어가 필요하다. 제안된 시스템의 동작을 검증하기 위해 재구성 가능한 타원곡선 암호화 프로세서를 구현하고 H.264 영상 복호기에 적용하였다. 검증 결과 암호화된 데이터를 복호하지 못하는 경우 영상이 제대로 재생되지 않음을 확인하였다.

2채널 오디오 시스템에서 전달계 변동에 강인한 역필터 설계 기법 (The Method of New Robust Inverse Filter Design in 2-Ch Audio System)

  • 박병욱;김학윤
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권1호
    • /
    • pp.185-192
    • /
    • 2008
  • 2개 이상의 스피커로 오디오 신호를 재생할 경우에 발생하는 가장 커다란 문제점은 크로스토크 현상이다. 크로스토크 현상을 제거하기 위하여 역필터를 설계하는 대표적인 방법 중 하나인 LNS 방법은 구현이 쉽고, 계산량이 적다는 장점이 있지만, 전달계의 변동이 발생하였을 경우에는 쉽게 대응할 수 없기 때문에 역필터의 성능이 저하되는 문제점을 갖고 있다.본 논문에서는 LNS방법을 이용하여 기 역필터를 설계하고, 그 역필터를 계속적으로 적응시켜 전달계가 변동하였을 때에도 변동된 전달계에 쉽게 대처할 수 있는 새로운 알고리즘을 제안하였다. 제안한 기법의 타당성을 입증하기 위하여 컴퓨터 시뮬레이션을 수행하여 기존의 방법과 비교한 결과, 크로스토크 제거 성능이 전 주파수 영역에서 개선됨을 확인하였다.

  • PDF

PC-based DAB 수신기용 USB Interface Bridge 설계 및 구현 (Design and Implementation of USB Interface Bridge for PC-based DAB Receiver)

  • 박노경;진현준;박상봉;김상복;한성호;이상철
    • 한국통신학회논문지
    • /
    • 제30권2A호
    • /
    • pp.90-97
    • /
    • 2005
  • 일반적으로 DAB 시스템은 크게 stand-alone 방식과 PC/PDA 기반 방식으로 구분할 수 있다. PC/PDA 기반 방식은 stand-alone 방식에 비하여 휴대성이 떨어지나 연결된 PC/PDA의 메모리와 오디오/비디오 디코더 등 다양한 리소스를 이용할 수 있는 장점이 있다. 본 논문에서 구현한 DAB 수신기는 USB 인터페이스를 이용한 PC 기반의 수신기 시스템으로 USB 인터페이스 브리지는 FPGA와 EZ-USB 개발 키트를 이용하여 설계하였으며 실험을 위하여 기존의 stand-alone 방식의 DRK-026 DAB 수신기를 이용하여 PC 기반의 수신기를 구현하였다. USB 인터페이스 브리지는 시리얼 데이터를 USB 패킷 형태로 변환시켜주며 모든 신호는 하드웨어적으로 제어한다. 구현한 PC 기반 DAB 수신기의 동작 여부는 DAB 수신기로부터 오디오 데이터를 수신하여 USB 인터페이스를 통하여 PC에 전송한 후 디코딩 기능을 수행하는 것으로 확인하였다.

부가 정보를 이용하는 오토 인코더 기반의 오디오 고대역 부호화 기술 (Audio High-Band Coding based on Autoencoder with Side Information)

  • 조효진;신성현;백승권;이태진;박호종
    • 방송공학회논문지
    • /
    • 제24권3호
    • /
    • pp.387-394
    • /
    • 2019
  • 본 논문에서는 부가 정보를 이용하는 오토 인코더 기반의 새로운 오디오 고대역 부호화 방법을 제안한다. 제안하는 방법은 MDCT 영역에서 동작하고, 부호화 할 정보만 입력하는 기존의 오토 인코더와 다르게, 과거와 현재의 저대역 정보로 구성된 부가 정보를 추가로 입력하여 오토 인코더의 복원 성능을 향상시킨다. 특히, 시간-주파수 영역의 부가 정보를 사용하여 시간에 따른 신호 특성을 고대역 복원에 활용하도록 한다. 제안하는 방법에서 부호화기는 매 프레임마다 오토 인코더가 생성한 4차원 latent 벡터와 이득 정보를 12비트로 양자화 하여 전송한다. 복호화기는 과거와 현재 프레임에서 복원된 저대역 정보와 전송 받은 정보를 오토 인코더에 입력하여 고대역 정보를 복원한다. 청취 평가를 통하여 제안하는 방법이 SBR에 비하여 약 1/2의 비트율로 SBR과 동등 품질의 고대역 정보를 복원하는 것을 확인하였다.

저전력 오디오 응용을 위한 Class-C 인버터 사용 단일 비트 3차 피드포워드 델타 시그마 모듈레이터 (A Single-Bit 3rd-Order Feedforward Delta Sigma Modulator Using Class-C Inverters for Low Power Audio Applications)

  • 황준섭;천지민
    • 한국정보전자통신기술학회논문지
    • /
    • 제15권5호
    • /
    • pp.335-342
    • /
    • 2022
  • 본 논문에서는 오디오 애플리케이션을 위한 단일 비트 3차 피드포워드 델타 시그마 변조기를 제안한다. 제안된 변조기는 저전압 및 저전력 애플리케이션을 위한 클래스-C 인버터를 기반으로 한다. 고정밀 요구 사항을 위해 레귤레이티드 캐스코드 구조의 클래스-C 인버터는 DC 이득을 증가시키고 저전압 서브쓰레스홀드 증폭기 역할을 한다. 제안된 클래스-C 인버터 기반 변조기는 180nm CMOS 공정으로 설계 및 시뮬레이션되었다. 성능 손실이 없으면서 낮은 공급 전압 호환성을 가지도록 제안된 클래스-C 인버터 기반 스위치드 커패시터 변조기는 높은 전력 효율을 달성하였다. 본 설계는 20kHz의 신호 대역폭 및 4MHz의 샘플링 주파수에서 동작시켜 93.9dB의 SNDR, 108dB의 SNR, 102dB의 SFDR 및 102dB의 DR를 달성하면서 0.8V 전원 전압에서 280μW의 전력 소비만 사용한다.