• 제목/요약/키워드: 오디오신호

검색결과 435건 처리시간 0.022초

인터넷 화상 전화용 음성 코텍을 위한 MPEG4-CELP 부호화기의 구현 (Implementation of MPEG4-CELP Vocoder for Speech Codec of Internet Video Phone)

  • 김병수;김동형;강경옥;홍진우;정재호
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.119-122
    • /
    • 2000
  • 인터넷이 일상생활에 다양하게 활용되면서 인터넷 채널을 통한 정보의 형태는 문자와 이미지 외에 음성, 오디오 신호 및 동영상 부분까지 확대되고 있다. 본 논문에서는 MPEG4-CELP를 인터넷 화상 통신의 음성 코덱용으로 사용하기 위한 최적화 기법 및 알고리듬의 개선을, DSP칩이 내장된 보드가 아닌 인터넷의 터미널로 사용되고 있는 펜티엄 프로세서를 장착한 PC에 초점을 맞추어 수행하였다. MPEG4-CELP VM C소스를 분석 및 프로파일(Profile)한 결과를 토대로 패라미터 추출을 위해 많은 연산을 수행하는 부호화기에 대해서 CPU상에 부하를 많이 주는 함수들을 제 1차 최적화 대상 함수들로 선정하고, CPU에 부하를 많이 주지는 않으나 호출되는 회수가 많은 함수를 2차 최적화 대상 함수로 선정해, C소스 레벨의 소프트웨어 파이프 라이닝(Software Pipelinging) 기법들을 적용하여 최적화를 수행하였다. 또한 1차 최적화 대상 함수의 경우에는 소프트웨어 파이프라이닝의 적용과 함께 연산량 감소를 위한 알고리듬 변형까지 수행하였다. 위의 과정을 거쳐 최적화 된 MPEG4-CELP는 펜티엄Ⅲ 450㎒ PC에서 음성을 부호화 하는데 원 VM소스에 비해 약 2배정도의 시간이 단축되는 것을 확인하였다.

  • PDF

TMS320C6701 DSP를 이용한 MPEG-4 오디오 HVXC 코덱의 실시간 구현 (Real-time Implementation of HVXC codec conforming to MPEG-4 audio using TMS320C6701 DSP)

  • 강경옥;홍진우;김진웅;나훈;정대권
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1999년도 학술대회
    • /
    • pp.261-266
    • /
    • 1999
  • 본 논문에서는 인터넷 폰이나 디지털 이동통신에서와 같이 낮은 비트율이 요구되는 응용분야에서 사용될 수 있는 HVXC 부호화 및 복호화 알고리즘을 TMS320C6701 160MHz DSP를 사용하여 실시간 동작을 구현한 내용을 기술한다. 사용한 최적화 방법으로는 기본적으로 연산 시간이 많이 소요되는 함수 루틴에 대한 C 언어레벨의 최적화 및 어셈블리어 레벨의 최적화를 수행하였고, TMS320C6701 DSP 내부 프로그램 메모리를 프로그램 캐쉬로 사용하였다. 또한, 계산량이 많은 부분과 테이블 참조가 필요한 연산을DSP의 내부 데이터 메모리 영역에서 수행하여 소요시간을 단축하였으며, 음성신호 및 비트스트림의 입출력에는 background DMA(direct memory access) 방식을 이용하였다. 이와 같은 최적화결과 2kbps 및 4kbps의 비트율에서 압축 및 복원을 실시간으로 수행할 수 있다.

  • PDF

디지털 오디오의 인터넷 방송 서비스를 위한 저작물 식별 코드 은닉 기술 (A Unique Identification hiding technique for Internet Broadcast service of Digital Audio)

  • 신승원;김종원;최종욱
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2001년도 정기총회 및 학술대회
    • /
    • pp.163-168
    • /
    • 2001
  • 본 논문은 인터넷을 이용한 방송 서비스에서 저작권 보호 및 저작물 식별을 위한 고유 식별 정보(unique identification)를 삽입, 추출하는 기술을 제안한다. 인터넷을 통한 방송 서비스의 활성화를 위해서는 저작권의 보호와 저작물의 불법 사용 방지, 저작물에 대한 저작권료 지불, 그리고 차후에 불법 사용자의 적발 등을 할 수 있는 기술이 필요하다. 본 논문에서 제안하는 기술은 디지털 음악을 소비자에게 서비스할 때, 사용자의 아이디(ID)와 신상 정보를 이용해서 생성된 정보와 음악의 식별 정보를 같이 저작물에 삽입하여 다운로드 받은 음악 파일이나 또는 청취 중에 녹음한 음악 파일을 불법으로 유통시킬 경우에 유통된 음악 파일에서 삽입된 식별코드를 추출하여 음악 파일의 불법 유통경로를 추적하여 불법 사용자를 적발할 수 있는 기능을 갖고 있다. 이러한 기능을 만족시키기 위해서 인터넷 서비스에서 널리 이용되는 MP3, AAC, WMA 등과 같은 손실 압축을 거친 이후에도 삽입된 워터마크를 검출할 수 있으며, 일반 사용자들이 손쉽게 접할 수 있는 여러 신호처리에도 강인한 특성을 갖는 기술을 제안한다.

  • PDF

채널 변경에 강인한 자동 음량 보정 알고리즘 (Automatic Volume Control Algorithm Robust to Channel Switching)

  • 오윤학;김승훈;세르게이 야르긴
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.245-248
    • /
    • 2004
  • 본 논문에서는 텔레비전 수신기에서 채널 변경에 따른 음량 자동 보정 방법에 대해서 기술하고자 한다. 지금까지 텔레비전 수상기에서는 사용자가 방송 채널을 전환하는 경우 각 방송 채널마다 음량 레벨이 조금씩 다르다는 것을 느끼게 된다. 그러므로 이러한 채널 변경에 따른 음량 변화를 조정하기 위해 청취자가 리모컨으로 볼률을 조절하는 불편함을 줄이기 위해 자동으로 음량 변화를 보정하는 것이 요구된다. 본 논문은 채널 변경에 따른 음량 변화와 Dynamic Range 가 너무 큰 오디오 신호에 대해 자동으로 음량을 보정함으로써 청취자가 볼륨을 조절하는 불편함을 줄이는 자동 음량 보정 알고리즘을 제안하였다.

  • PDF

모바일용 멀티미디어 재생기의 설계 및 구현

  • 양창모;박성주;이석필
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2008년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.272-273
    • /
    • 2008
  • 최근 네트워크 및 무선통신기술과 멀티미디어 서비스기술의 발달로 다양한 모바일용 멀티미디어 재생기가 널리 보급되고 있다. 특히 이러한 단말은 소형으로 휴대하기 편리하고 언제 어디서나 다양한 영상 및 음향을 편리하게 제공할 수 있다. 본 논문에서는 모바일용 멀티미디어 재생기를 효율적으로 설계하고 구현하는 방법을 제안한다. 본 논문에서 제안한 모바일용 멀티미디어 재생기의 하드웨어는 다양한 형태의 멀티미디어 데이터에 대한 처리와 이를 실제로 비디오, 오디오, 데이터 신호로 변환하며 사용자에게 전달하는 역할을 수행한다. 또한, 모바일용 멀티미디어 재생기의 소프트웨어인 통합 미디어 재생기는 확장성을 갖는 구조와 플랫폼 독립성을 지향하도록 설계되었으며, 다양한 형태로 입력되는 멀티미디어의 복호 및 디스플레이를 관리하는 역할을 수행한다.

  • PDF

독립 성분 분석을 이용한 지각 필터의 성능 향상에 관한 연구 (A Study on Enhancement of Perceptual Filter's performance using Independent Component Analysis)

  • 구교식;차형태
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2010년도 하계학술대회
    • /
    • pp.57-60
    • /
    • 2010
  • 본 논문에서는 잡음이 첨가된 오디오 신호로부터 잡음을 추정하고 이에 따른 지각 필터 적용을 통한 음질 개선 알고리즘을 제안한다. 기존의 지각 필터는 고정된 잡음을 사용하여 잡음이 가변적일 경우 그 성능이 저하되었으며 독립 성분 분석만을 사용하여 잡음을 제거할 경우 잡음이 완전히 분리되지 못하고 잔류하게 된다. 그러나 제안된 잡음 추정 알고리즘은 독립성분 분석을 이용하여 잡음 에너지를 획득하고 이를 지각 필터에 적용함으로써 전 대역의 잡음 에너지를 효과적으로 제거할 수 있게 된다. 기존의 독립성분분석만을 이용한 방법과의 비교를 위하여 SSNR 비교를 수행하였고 그 결과를 통해 성능 개선을 확인 할 수 있었다.

  • PDF

비균등 선형 마이크로폰 어레이를 활용한 합성곱 신경망 기반의 음원분리 (Convolutional Neural Network Based Source Separation Using a Non-uniform Linear Microphone Array)

  • 문정민;박인영;김홍국
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2017년도 추계학술대회
    • /
    • pp.44-45
    • /
    • 2017
  • 본 논문에서는 비균등 선형 마이크로폰 어레이를 활용한 convolutional neural network (CNN) 기반의 음원분리 방법을 제안한다. 우선, 주어진 어레이 배치에 따라 채널간의 시간차를 분석하고, 분석된 시간차에 따라 주파수별로 방사각과 넓이에 따라 입력 오디오 신호의 spectral magnitude를 예측한다. 그러고 나서, CNN 분류기로부터 최적의 방사각과 넓이를 선별하고 이를 통해 음원을 분리한다.

  • PDF

멀티미디어 사용자 인터페이스 기술

  • 오승준
    • 전자공학회지
    • /
    • 제22권4호
    • /
    • pp.51-63
    • /
    • 1995
  • 멀티미디어 사용자 인터페이스는 사용자의 동작을 통한 입력, 사용자에 대한 시스템의 응답, 사용자와 시스템 사이의 대화를 관리하고 운영하는 환경이다. 최근에 신호처리 기술, 인식 기술, 소프트웨어 기술, 인공지능 기술을 기반으로한 MMUI에 관한 연구활동이 많은 관심을 끌고 있다. 사용자가 시스템에 정보를 보다 자연스럽고 다양하게 제공하고 시스템으로부터 필요한 정보를 다양한 형태로 효율적으로 제공하기 위한 MMUI를 설계하기 위하여 분야의 경계선을 넘어 상호 동조하는 연구팀을 구성하여 활발히 진행되고 있다. MMUI개발자는 비디오나 오디오 입출력을 고려해야 하므로 이러한 매체들을 통합하는 문제와 시간에 따라 변하는 시스템을 위한 모델링을 하는 문제들을 대면하게 된다. MMUI개발자들이 대면하는 대표적인 문제는 매체 병합, 모델과 메타포(metaphor) 사용, 네비게이션(navigation),입출력 다루기, 동기화, 새로운 매체 개발이다. 그러므로 본 고에서는 멀티미디어 제품 및 서비스를 위한 MMUI기술과 그 연구방향을 살펴본다.

  • PDF

오디오 신호에 적용된 Generalized Patchwork Algorithm의 안전성 (Security of Generalized Patchwork Algorithm for Audio Signal)

  • 김기섭;김형중;아리나;양재수
    • 한국정보통신설비학회:학술대회논문집
    • /
    • 한국정보통신설비학회 2006년도 하계학술대회
    • /
    • pp.219-222
    • /
    • 2006
  • In this paper we present a cryptanalysis of the generalized patchwork algorithm under the assumption that the attacker possesses only a single copy of the watermarked audio. In the scheme, watermark is inserted by modifying randomly chosen DCT values in each block of the original audio. Towards the attack we first fit low degree polynomials (which minimize the mean square error) on the data available from each block of the watermarked content. Then we replace the corresponding DCT data of the at-tacked audio by the available data from the polynomials to construct an attacked audio. The technique nullifies the modification achieved during watermark embedding. Experimental results show that recovery of the watermark becomes difficult after the attack.

  • PDF

UHDTV와 디지털라디오방송을 위한 VHF대역과 700MHz대역 주파수의 활용 연구 (A Study On The Practical Using Of The Frequency For The UHDTV And Digital Radio Broadcasting In The VHF And 700MHz Band)

  • 박성규;채수현;박구만
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2013년도 추계학술대회
    • /
    • pp.24-27
    • /
    • 2013
  • 본 연구는 지상파TV의 디지털전환 완료 이후 아날로그 AM과 FM라디오의 디지털 전환과 새로운 UHDTV방송 도입을 위해 VHF 상위대역과 700MHz 대역에서의 효율적인 주파수 할당과 활용방안을 제시하고 있다. 아울러 방송은 UHD 영상과 디지털오디오 등 고품질 서비스도 중요하지만 무엇보다 수신이 잘되고 편리해야 하므로 강인한 신호 전송과 수신환경 개선 방안도 함께 제시하고자 한다. 특히 VHF 상 하위 대역과 AM/FM 라디오 대역 및 DTV 대역 그리고 700MHz 대역 등 방송주파수 전체 대역에서 UHDTV방송과 디지털라디오방송 환경을 구축하는데 서로 충돌 없는 합리적인 주파수 할당과 SFN 전송망 구축에 의한 효과적인 주파수 이용 방안을 제시하고 있다.

  • PDF