• 제목/요약/키워드: Voice codec

검색결과 76건 처리시간 0.028초

DSP 프로세서를 이용한 실시간 ANC 시스템 구현에 관한 연구 (Implementation of Real-Time Adaptive Noise Cancellation System Using DSP Processor)

  • 이영일;최홍섭
    • 대한음성학회지:말소리
    • /
    • 제52호
    • /
    • pp.121-132
    • /
    • 2004
  • This paper is aiming at real-time implementation of adaptive noise cancellation system using DSP processor. ACHARF algorithm, which guarantees stability and fast convergence by adaptive compensator, is used on this DSP system. For the experiments, TLV320AIC23 stereo CODEC of TI Inc. is used with TMS320C6413 DSP processor. Signals of primary input and reference input are obtained by two microphones. The primary input is the voice plus noise signal and the reference input is white noise or real noise. The experimental results show that ANC system using DSP processor with ACHARF is verified to be an effective speech enhancement method for various speech processing units.

  • PDF

4G 모바일 증감음성 서비스를 위한 코덱 기술 동향 (Trends of Codec Technology for 4G Mobile Enhanced Voice Service)

  • 이미숙;김도영;이병선
    • 전자통신동향분석
    • /
    • 제25권6호
    • /
    • pp.29-37
    • /
    • 2010
  • 본 논문에서는 무선망과 신호처리 기술의 발달과 1GHz급 이상의 고성능 모바일 장치의 등장에 따라 현재의 모바일 음성 서비스 품질과 확연히 차별화된 서비스를 제공하기 위해 3GPP에서 논의중인 EVS 코덱의 기술적 특성 및 최간 표준화 동향에 대해 기술한다. 3GPP에서는 지난 3월, 2년간의 논의를 거쳐 4G 모바일과 같은 EPS 시스템에서 차별화된 새로운 증감음성 품질의 서비스 제공이 필수적이라는 판단 하에 EVS 코덱 표준의 개발을 시작하였다. 현재 EVS 코덱 표준화를 위해 세부적인 가능과 성능 목표에 대해 협의를 진행중이며 표준의 완료 계획시점인 2012년 상반기경, 4G/LTE에서는 광대역 수준의 음성서비스에 비해 신호대역폭이 2배가 확장된 슈퍼와이드밴드급의 증감음성 서비스가 제공될 것으로 전망한다.

잡음 환경에서의 전송율 감소를 위한 G.723.1 VAD 성능개선에 관한 연구 (The Research of Reducing the Fixed Codebook Search Time of G.723.1 MP-MLQ)

  • 김정진;박영호;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 하계종합학술대회 논문집(4)
    • /
    • pp.98-101
    • /
    • 2000
  • On CELP type Vocoders G.723.1 6.3kbps/5.3kbps Dual Rate Speech Codec, which is developed for Internet Phone and videoconferencing, uses VAD(Voice Activity Detection)/CNG (Comfort Noise Generator) in order to reduce the bit rate in a silence period. In order to reduce the bit rate effectively in this paper, we first set the boundary condition of the energy threshold to prevent the consumption of unnecessary processing time, and use three decision rules to detect an active frame by energy, pitch gain and LSP distance. To evaluate the performance of the proposed algorithm we use silence-inserted speech data with 0, 5, 10, 20dB of SNR. As a result when SNR is over 5dB, the bit rate is reduced up to about 40% without speech degradation and the processing time is additionally decreased.

  • PDF

A Low Power Multi-Function Digital Audio SoC

  • Lim, Chae-Duck;Lee, Kyo-Sik
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2004년도 하계종합학술대회 논문집(2)
    • /
    • pp.399-402
    • /
    • 2004
  • This paper presents a system-on-chip prototype implementing a full integration for a portable digital audio system. The chip is composed of a audio processor block to implements audio decoding and voice compression or decompression software, a system control block including 8-bit MCU core and Memory Management Unit (MMU) a low power 16-bit ${\Sigma}{\Delta}$ CODEC, two DC-to-BC converter, and a flash memory controller. In order to support other audio algorithms except Mask ROM type's fixed codes, a novel 16-bit fixed-point DSP core with the program-download architecture is proposed. Funker, an efficient power management technique such as task-based clock management is implemented to reduce power consumption for portable application. The proposed chip has been fabricated with a 4 metal 0.25um CMOS technology and the chip area is about 7.1 mm ${\times}$ 7.1mm with 100mW power dissipation at 2.5V power supply.

  • PDF

VoIP 음성품질 개선을 위한 전송패킷의 크기와 코덱분석 (Analysis of transmission packet size and codec for enhancing the VoIP voice quality)

  • 김용석;박종안
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.639-642
    • /
    • 2006
  • 본 논문에서는 다양한 서비스가 운용되고 있는 인터넷 망에서 PCM 및 ADPCM으로 압축된 음성데이터를 전송할 경우에 발생하는 패킷 크기와 한계 지연시간의 변화가 수신측의 음질에 미치는 영향을 분석하였다. 이를 기반으로 주어진 한계 지연시간에 대하여 적절한 음질을 제공하기 위한 전송패킷의 크기에 대하여 분석하여 적절한 코덱 선택 방법을 제안하였다. 제안된 방법의 실험결과를 입증하기 위해 음질 평가인 MOS평가 방법을 사용했으며 측정방법으로는 서울을 중심으로 전국5개 지역 지점별 5회 측정 각 지점의 임의 번호를 서울 콜 센터로 Call Forwarding 설정 후 측정하고, VQT은 PAMS 알고리즘과 ADRA(Audio Direction Reference Audio)를 사용하여 측정한 결과 음성코덱의 데이터비와 Datagram size에 의해 음성 품질이 달라짐과 적절한 코덱 선택방법임을 확인하였다.

  • PDF

DSP를 이용한 가변어휘 음성인식기 구현에 관한 연구 (Implementation of Vocabulary- Independent Speech Recognizer Using a DSP)

  • 정익주
    • 음성과학
    • /
    • 제11권3호
    • /
    • pp.143-156
    • /
    • 2004
  • In this paper, we implemented a vocabulary-independent speech recognizer using the TMS320VC33 DSP. For this implementation, we had developed very small-sized recognition engine based on diphone sub-word unit, which is especially suited for embedded applications where the system resources are severely limited. The recognition accuracy of the developed recognizer with 1 mixture per state and 4 states per diphone is 94.5% when tested on frequently-used 2000 words set. The design of the hardware was focused on minimal use of parts, which results in reduced material cost. The finally developed hardware only includes a DSP, 512 Kword flash ROM and a voice codec. In porting the recognition engine to the DSP, we introduced several methods of using data and program memory efficiently and developed the versatile software protocol for host interface. Finally, we also made an evaluation board for testing the developed hardware recognition module.

  • PDF

VoIP 환경에서의 잡음제거를 위한 최적화된 위너 필터 (Optimized Wiener Filter for Noise Reduction in VoIP Environments)

  • 정상배;이성독;한민수
    • 대한음성학회지:말소리
    • /
    • 제64호
    • /
    • pp.105-119
    • /
    • 2007
  • Noise reduction technologies are indispensable to achieve acceptable speech quality in VoIP systems. This paper proposes a Wiener filter optimized to the estimated SNR of noisy speech for the noise reduction in VoIP environments. The proposed noise canceller is applied as a pre-processor before speech encoding. The performance of the proposed method is evaluated by the PESQ in various noisy conditions. In this paper, the proposed algorithm is applied to G.711, G.723.1, and G.729A which are all VoIP speech codecs. The PESQ results show that the performance of our proposed noise reduction scheme outperforms those of the noise suppression in the IS-127 EVRC and the ETSI standard for the advanced distributed speech recognition front-end.

  • PDF

확산스펙트럼 기술을 응용한 디지틀 코드없는 전화기 (Digital Cordless Phone using Spread Spectrum Technology)

  • 정영화
    • 정보와 통신
    • /
    • 제14권3호
    • /
    • pp.75-86
    • /
    • 1997
  • 현재 확산대역(Spread Spectrum) 사용을 위해 미국 FCC에서 허가한 band는 902-928 MHz, 2400-2483.5 MHz, 5725-5850 MHz ISM(Industrial Science Medical)이다. 본 연구에서는 902-928 MHz ISM band 에서 디지털 코드없는 전화기 시스템의 공용을 검토하였다. 본고는 디지털 코드없는 전화기 Base-Set(BS)과 2개의 Hand-set(HS)를 지원가능한 Feature & Capability, System Specification, 제품 시스템 디자인을 담고 있다.

  • PDF

인터넷 전화서비스의 음성 코덱 품질에 관한 연구 (A Study on a quality of Voice Codec for Internet Telephone Service)

  • 민경주;이종국;이재정;홍재환;남기동
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.1021-1024
    • /
    • 2007
  • 인터넷이 발달하고 VoIP 의 활성화로 인하여 사용자들은 인터넷 전화서비스의 통화품질에 대한 관심이 크게 증가하고 있다. 본 고에서는 인터넷 전화서비스의 단말에 사용하고 있는 음성 코덱의 품질 측정을 위해 IP 패킷 전송품질 파라미터(ITU-T Y.1540)들을 인가하면서 이들 파라미터들의 변화에 따른 E-Model(ITU-T G.107) 종합 음성품질(R 값)을 측정하여 인터넷전화 단말의 프로세싱 품질을 파악하고 종단간서비스에서 단말이 차지하는 부분을 분석하여 인터넷 전화서비스의 통화품질 개선 및 향후 단말의 인증기준 등에 활용하고자 한다.

  • PDF

$TMS320C6701^TM$을 이용한 2.4kbps EHSX 음성 부호화기의 실시간 구현 (Real-time implementation of the 2.4kbps EHSX Speech Coder Using a $TMS320C6701^TM$ DSPCore)

  • 양용호;이인성;권오주
    • 한국통신학회논문지
    • /
    • 제29권7C호
    • /
    • pp.962-970
    • /
    • 2004
  • 본 논문에서는 TI사의 부동소수점 DSP인 TMS320C6701$^{TM}$을 이용한 2.4kbps EHSX(Enhanced Harmonic Stochastic Excitation) 음성부호화기의 실시간 구현 방법에 대해서 논한다. EHSX는 4khz의 대역폭을 갖는 음성신호를 2.4kbps의 비트율을 갖는 압축 패킷으로 변환하는 부호화 방법으로, 유/무성음에 따라 하모닉(Harmonic) 여기 부호화 방법과 CELP 부호화 방법을 선택적으로 사용하는 구조를 갖는다. 본 논문에서는 이러한 EHSX의 실시간 구현을 위해 연산량의 큰 비중을 차지하는 CELP 분석의 코드북 검색부분과 일부 IIR 필터링 부분에 대한 고정소수점 변환 방법과, 부호화시 하모닉 검색 및 피치 검색방법에 대한 알고리즘 상 연산량 감소 방법, DSP의 구조를 고려한 코드를 배치방법 등 연산량을 감소시키기 위한 최적화 방법을 제시한다. 설계된 음성 부호화기는 PESQ(perceptual evaluation of speech quality) ITU-T Recommendation P.862를 이용한 음질 평가 결과로서 약MOS 3.28을 얻었으며, 실시간으로 압축 및 복원을 수행한다.