• 제목/요약/키워드: Audio Codec

검색결과 96건 처리시간 0.024초

Wireless LAN 환경에서 임베디드 SIP User Agent 구현 (An Implementation of Embedded SIP User Agent under Wireless LAN Area)

  • 박승환;이재흥
    • 한국정보통신학회논문지
    • /
    • 제9권3호
    • /
    • pp.493-497
    • /
    • 2005
  • 본 논문은 무선의 임베디드 시스템 환경에서, VoIP 시스템을 구성하는 프로토콜 요소 중의 하나인 SIP를 이용한 User Agent의 구현에 관한 연구이다. User Agent는 설정 블록과, 주변 장치를 제어하기 위한 디바이스 쓰래드 블록, SIP 메시지를 처리하기 위한 SIP 스택 블록으로 구성하였다. 디바이스 쓰래드는 RTP 쓰래드 블록과 사운드 카드 처리 블록으로 구성하였으며, SIP 스택은 프락시 이벤트를 처리하는 워커 쓰래드 블록과 SIP 메시지를 전송하여 처리하는 SIP 트랜시버 및 SIP 쓰래드 블록으로 구성하였다. 하드웨어 플랫폼은 Intel XScale PXA25S 프로세서 기반에 플래쉬 메모리, SDRAM, AC'97 오디오 코덱, 무선 랜카드와 연결된 PCMCIA 소켓이 내장된 보드를 구성하였으며, 오디오 입출력으로 마이크로폰과 헤드폰을 사용하였다. 본 연구의 실험을 위한 타겟 시스템 구성은 임베디드 리눅스 커널 2.4.19를 포팅하였다. 임베디드 시스템의 자원 효율을 높이고자, User Agent의 속성과 SIP 메소드의 기능을 최소화하였고, TCP를 배제하여, 주변 장치 제어를 최소화함으로써, 자원의 소비를 $12.9\%$ 절감할 수 있었다.

음악 특징점간의 유사도 측정을 이용한 동일음원 인식 방법 (Same music file recognition method by using similarity measurement among music feature data)

  • 성보경;정명범;고일주
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권3호
    • /
    • pp.99-106
    • /
    • 2008
  • 최근 다양한 분야에서(웹 포털, 유료 음원서비스 등) 디지털 음악의 검색이 사용되고 있다. 기존의 디지털 음악의 검색은 음악 데이터에 포함된 자체 메타 정보를 이용하여 이루어진다. 하지만 메타 정보가 다르게 작성되었거나 작성되지 않은 경우 정확한 검색은 어렵다. 요즘 이러한 문제의 보완 방안으로 음악자체를 이용하는 내용기반정보 검색 기법에 대한 연구가 이루어지고 있다. 본 논문에서는 음악의 파형에서 추출된 특징 정보간의 유사도 측정을 통하여 동일음원을 인식하는 방법에 대해 논하고자 한다. 디지털 음악의 특징 정보는 단순화시킨 MFCC (Mel Frequency Cepstral Coefficient)를 이용하여 음악의 파형으로부터 추출하였다. 디지털 음악간의 유사도는 Vision 및 Speech Recognition 분야에서 사용되던 DTW (Dynamic Time Warping) 기법을 활용하여 측정하였다. 제안된 동일 음원 인식 방법의 검증을 위한 같은 장르에서 무작위 추출된 1000곡에서 시행한 500번의 검색은 모두 성공했다. 검색에 사용된 500개의 디지털 오디오는 60개의 디지털음원을 압축방식과 비트율을 다르게 조합하여 만들었다. 실험의 결과로 DTW을 이용한 유사도 측정법이 동일음원을 인식할 수 있음을 증명하였다.

  • PDF

1Mbps 이하 전술통신망에서의 소프트웨어 방식 화상회의 품질향상 연구 (A Research on Quality Improvement of Software-based Video Teleconferencing on the Tactical Communication Networks Less Than 1Mbps)

  • 김권희
    • 한국통신학회논문지
    • /
    • 제37권1C호
    • /
    • pp.63-75
    • /
    • 2012
  • 본 논문은 1Mbps 이하의 전술통신망 환경에서 소프트웨어 방식의 화상회의 운용방안을 연구하였다. 전술통신망 환경은 대역폭이 제한될 뿐만 아니라 불안정한 네트워크 상태로 데이터 손실과 전송지연 현상이 빈번히 발생한다. 또한 전술통신망을 기반으로 하는 지상전술지휘통제체계가 대역폭 사용의 우선권을 갖고 있기 때문에 화상회의가 사용할 수 있는 대역폭은 더욱 제한될 수밖에 없다. 본 논문에서는 이와 같은 전술통신망의 제한사항을 분석하고, 전술통신망 기반의 소프트웨어 방식 화상회의 품질향상 방안과 이를 적용한 실제 운용실험 결과를 함께 제시하였다. 손실패킷에 대한 재전송기법과 데이터 용량을 줄이기 위한 영상크기 축소를 우선적으로 적용하였다. 화상회의 운용을 위해서는 사용자 대역폭 보장이 최선의 해결방안이나 제한된 대역폭의 전술통신망에서는 영상 데이터 압축률 조정, 전송되는 영상 프레임 수 조정, 음성코덱 변경, 음성보정 데이터 사용 등을 최적화하여 화상회의 품질을 향상시킬 수 있다.

딥러닝 기반 음향 신호 대역 확장 시스템 (Deep Learning based Raw Audio Signal Bandwidth Extension System)

  • 김윤수;석종원
    • 전기전자학회논문지
    • /
    • 제24권4호
    • /
    • pp.1122-1128
    • /
    • 2020
  • 대역 확장(Bandwidth Extension)이란 채널 용량 부족 혹은 이동통신 기기에 탑재된 코덱의 특성으로 인해 부호화 및 복호화 과정에서 대역 제한(band limited)되거나 손상된 협대역 신호(NB, Narrow Band)를 복원, 확장하여 광대역 신호(WB, Wide Band)로 전환 시켜주는 것을 의미한다. 대역 확장 연구는 주로 음성 신호 위주로 대역 복제(SBR, Spectral Band Replication), IGF(Intelligent Gap Filling)과 같이 고대역을 주파수 영역으로 변환하여 복잡한 특징 추출 과정을 거쳐 이를 바탕으로 사라지거나 손상된 고대역을 복원한다. 본 논문에서는 딥러닝 모델 중 오토인코더(Autoencoder)를 바탕으로 1차원 합성곱 신경망(CNN, Convolutional Neural Network)들의 잔차 연결을 활용하여 복잡한 사전 전처리 과정 없이 일정한 길이의 시간 영역 신호를 입력시켜 대역 확장 시킨 음향 신호를 출력하는 모델을 제안한다. 또한 음성 영역에 제한되지 않는 음악을 포함한 여러 종류의 음원을 포함하는 데이터셋에 훈련시켜도 손상된 고대역을 복원할 수 있음을 확인하였다.

MPEG-D USAC: 통합 음성 오디오 부호화 기술 (MPEG-D USAC: Unified Speech and Audio Coding Technology)

  • 이태진;강경옥;김환우
    • 한국음향학회지
    • /
    • 제28권7호
    • /
    • pp.589-598
    • /
    • 2009
  • 다양한 기능을 가지는 모바일 기기들이 하나로 융합되어 가는 방향으로 기술이 발전함에 따라, 음성 및 오디오 모두에 대해 우수한 음질을 제공하는 부호화 기술에 대한 요구사항이 증대되고 있다. 이와 같은 새로운 부호화 기술에 대한 요구사항에 따라, MPEG에서는 2007년 10월 82차 회의에서 CfP를 시작으로 USAC 표준화를 시작하였고, 2009년 4월 88차 회의에서 WD3까지 완성되었다. MPEG-D USAC 기술은 최신 음성 부호화기인 AMR-WB+와 최신 오디오 부호화기인 HE-AAC V2를 융합한 기술로 입력 신호의 특성에 따라 코어 대역 부호화로 AAC, ACELP, TCX 등 다양한 방법 중 하나를 선택하여 부호화를 수행하고, 고대역 부호화 기술로는 SBR, 스테레오 부호화 기술로는 MPEG-Surround를 이용한다. USAC 기술은 음성과 음악 신호 모두에 대해 모두 우수한 음질을 제공할 수 있으며, 모바일 기기로의 멀티미디어 콘텐츠 다운로드, 디지털 라디오, 모바일 TV 및 오디오 북등에서 응용이 가능하다.

A Fully Synthesizable Bluetooth Baseband Module for a System-on-a-Chip

  • Chun, Ik-Jae;Kim, Bo-Gwan;Park, In-Cheol
    • ETRI Journal
    • /
    • 제25권5호
    • /
    • pp.328-336
    • /
    • 2003
  • Bluetooth is a specification for short-range wireless communication using the 2.4 GHz ISM band. It emphasizes low complexity, low power, and low cost. This paper describes an area-efficient digital baseband module for wireless technology. For area-efficiency, we carefully consider hardware and software partitioning. We implement complex control tasks of the Bluetooth baseband layer protocols in software running on an embedded microcontroller. Hardware-efficient functions, such as low-level bitstream link control; host controller interfaces (HCIs), such as universal asynchronous receiver transmitter (UART) and universal serial bus (USB)interfaces; and audio Codec are performed by dedicated hardware blocks. Furthermore, we eliminate FIFOs for data buffering between hardware functional units. The design is done using fully synthesizable Verilog HDL to enhance the portability between process technologies so that our module can be easily integrated as an intellectual property core no system-on-a-chip (SoC) ASICs. A field programmable gate array (FPGA) prototype of this module was tested for functional verification and realtime operation of file and bitstream transfers between PCs. The module was fabricated in a $0.25-{\mu}m$ CMOS technology, the core size of which was only 2.79 $mm{\times}2.80mm$.

  • PDF

Smart 멀티 인코딩 영상 저장 및 방송 시스템 (Storing and Broadcast System of Smart Multi Encoding Image)

  • 김창수;김정우;정회경
    • 한국정보통신학회논문지
    • /
    • 제17권7호
    • /
    • pp.1633-1638
    • /
    • 2013
  • 휴대폰은 이제 단순한 통화 기능 이외에 PC와 함께 동영상 콘텐츠를 시청할 수 있는 효과적인 멀티미디어 기기로 발전하고 있다. 따라서 동영상 콘텐츠의 실효성은 스마트폰으로 스트리밍(Streaming) 할 수 있는지 여부와 목적한 내용을 효과적으로 전달 할 수 있는지 여부에 의해 결정된다. 여기서 목적한 내용을 효과적으로 전달 할 수 있는지 여부란 교재 영상과 발언자의 영상이 함께 제공되어야만 효과적인 내용 전달이 됨을 의미한다. 본 논문은 위 두 가지 요건을 충족하는 동영상 콘텐츠 인코딩(encoding) 시스템으로 멀티소스(Multi-Source)의 오디오-비디오를 입력받아 인터넷 상에 실시간 및 VOD 서비스 할 수 있는 비디오 통합 관리 시스템을 제안하였다.

UPnP 호환성 향상을 위한 휴대용 컨트롤 포인트의 구현 (Implementation of Portable Control Point for verifying compatibility of UPnP)

  • 박세호;박용석;김현식
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 춘계학술대회
    • /
    • pp.590-592
    • /
    • 2013
  • UPnP(Universal Plug & Play) A/V(오디오/비디오) 표준을 준수하는 기기들을 이용하여 제로 구성(zero-configuration)으로 멀티미디어 홈 네트워크를 쉽게 구축할 수 있다. 그러나 UPnP 인증을 받은 제품이라 할지라도 UPnP의 모든 기능이 구현되어있지 않거나 코덱 호환성이 확인되지 않기 때문에 구입 시 사용하고자 하는 제품들의 상호호환성 여부를 확인할 수 없는 문제점이 있다. 본 논문에서는 이러한 문제점을 해결하고자 사용하고자 하는 UPnP의 기능정보(capability)를 저장하고 관리하는 휴대용 컨트롤 포인트(control point)의 구현 방안을 제시한다. 휴대용 컨트롤 포인트를 통해 사용하고자 하는 기기와 호환성과 상호운용성이 가장 좋은 UPnP A/V 기기들을 찾을 수 있다.

  • PDF

유선망에서의 RTP/UDP/IP 헤더 압축 설계 (Design of RTP/UDP/IP Header Compression Protocol in Wired Networks)

  • 김민영;홍고르촐;신병철;이인성
    • 한국정보통신학회논문지
    • /
    • 제9권8호
    • /
    • pp.1696-1702
    • /
    • 2005
  • RTP(Real-Time Transport Protocol)는 실시간 데이터인 오디오/비디오나 IP 텔레포니, 멀티미디어 서비스 등을 위한 인터넷 표준 프로토콜이다. 20 ms 프레임 단위로 코팅하는 8kbps(또는 1K bytes/sec) 음성 코덱의 경우 패킷당 데이터 크기는 20바이트가 되며 RTP/UDP/IP 계층을 거치면서 각 계층의 헤더가 추가되어 전체 헤더 크기는 최소한 40 바이트나 되어 많은 부담이 된다. 이를 해결하기 위하여 point-to-point 상에서 여러가지 압축방법이 제시되었으며, 이 방법에서는 IP계층까지 헤더 압축을 하기 때문에 end-to-end 방식에서는 사용을 할 수 없다. 본 논문은 현재 라우터 기반의 유선망에 헤더 압축 기술을 적용할 수 있도록 기존에 설계된 헤더 압축기법을 수정하여 성능을 분석하였다.

스위치형 커패시터를 적용한 새로운 형태의 3차 직렬 접속형 시그마-델타 변조기의 설계 (Design of the New Third-Order Cascaded Sigma-Delta Modulator for Switched-Capacitor Application)

  • 류지열;노석호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2006년도 춘계종합학술대회
    • /
    • pp.906-909
    • /
    • 2006
  • 본 논문은 저 전압 및 저 왜곡 스위치형 커패시터 (switched-capacitor, SC)를 적용한 새로운 형태의 몸체효과 보상형 스위치 구조를 제안한다 제안된 회로는 저 전압 SC 회로를 위해서 rail-to-rail 스위칭을 허용하며 기존의 부트스트랩된 회로 (19dB) 보다 더 우수한 총 고조파 왜곡을 가진다. 설계된 2-1 캐스케이드 시그마 델타 변조기는 통신 송수신시스템내의 오디오 코덱을 위한 고해상도 아날로그-디지털변환을 수행한다. 1단 폴드형 캐스코드 연산증폭기 및 2-1 캐스케이드 시그마 델타 변조기는 0.25 마이크론 이중 폴리 3-금속 표준 CMOS 공정으로 제작되었으며, 2.7V에서 동작한다.

  • PDF