• 제목/요약/키워드: 음성코덱

검색결과 119건 처리시간 0.03초

인터넷 화상 전화용 음성 코텍을 위한 MPEG4-CELP 부호화기의 구현 (Implementation of MPEG4-CELP Vocoder for Speech Codec of Internet Video Phone)

  • 김병수;김동형;강경옥;홍진우;정재호
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.119-122
    • /
    • 2000
  • 인터넷이 일상생활에 다양하게 활용되면서 인터넷 채널을 통한 정보의 형태는 문자와 이미지 외에 음성, 오디오 신호 및 동영상 부분까지 확대되고 있다. 본 논문에서는 MPEG4-CELP를 인터넷 화상 통신의 음성 코덱용으로 사용하기 위한 최적화 기법 및 알고리듬의 개선을, DSP칩이 내장된 보드가 아닌 인터넷의 터미널로 사용되고 있는 펜티엄 프로세서를 장착한 PC에 초점을 맞추어 수행하였다. MPEG4-CELP VM C소스를 분석 및 프로파일(Profile)한 결과를 토대로 패라미터 추출을 위해 많은 연산을 수행하는 부호화기에 대해서 CPU상에 부하를 많이 주는 함수들을 제 1차 최적화 대상 함수들로 선정하고, CPU에 부하를 많이 주지는 않으나 호출되는 회수가 많은 함수를 2차 최적화 대상 함수로 선정해, C소스 레벨의 소프트웨어 파이프 라이닝(Software Pipelinging) 기법들을 적용하여 최적화를 수행하였다. 또한 1차 최적화 대상 함수의 경우에는 소프트웨어 파이프라이닝의 적용과 함께 연산량 감소를 위한 알고리듬 변형까지 수행하였다. 위의 과정을 거쳐 최적화 된 MPEG4-CELP는 펜티엄Ⅲ 450㎒ PC에서 음성을 부호화 하는데 원 VM소스에 비해 약 2배정도의 시간이 단축되는 것을 확인하였다.

  • PDF

DSP를 이용한 연속숫자 음성 인식기 구현 (The Implementation of Continuous Digit Recognition Using DSP)

  • 이성권;임영춘;서준배;정현열
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.93-96
    • /
    • 2004
  • 본 논문은 TMS320C5501 16bit DSP를 적용한 실시간 화자독립 연속 숫자인식기의 구현에 관해 서술한다. 하드웨어 모듈의 구성은 TMS320C5501 300MHz DSP, 코덱으로는 TLV320AIC1103, SDRAM, 외부장치와의 인터페이스를 위한 HPI, Uart, MIC, SPK Out 단자로 구성되었다. 음성인식 알고리즘은 HM-Net 방식을 사용하였고 고정소수점 연산처리 방식으로 C를 이용한 최적화 작업을 수행하였으며 스트리밍 방식의 인식 방법으로 실시간 처리가 가능하도록 구현하였다. 숫자 인식에 사용한 모델은 41음소에 기반한 트라이폰을 학습하였으며, 특징 파라미터로는 LPCMEL 20차를 사용하였다. 임베디드 시스템의 실시간 음성인식 시스템 구성에 중점을 두었으며 PC상에서의 성능과 비교해 볼때 본 DSP 상에서 500단어, 50문장의 인식을 평균 1.5초 전후로 인식하도록 하였으며 간단한 연결 단어 인식을 수행하는데 무리 없음을 보여준다. 특별히 한국어 연속숫자 부분에 중점을 두었고, 본 연구에서 구현된 연속 음성인식 시스템에 사용된 숫자 인식에서 음절 바이폰 모델에 대하여 $92.92\%$의 인식율을 얻을 수 있었다.

  • PDF

DSP56362를 이용한 G.723.1 음성코덱의 실시간 구현 (Real-time implementation of the G.723.1 voice coder using DSP56362)

  • 이재식;손용기;장태규;민병기
    • 음성과학
    • /
    • 제7권2호
    • /
    • pp.225-234
    • /
    • 2000
  • This paper describes the fixed-point DSP implementation of a CELP(Code-excited linear prediction)-based speech coder. The effective realization methodologies to maximize the utilization of the DSP's architectural features, specifically parallel movement and pipelining are also presented together with the implementation results targeted for the ITU-T standard G.723.1 using Motorola DSP56362. The operation of the implemented speech coder is verified using the test vectors offered by the standard as well as using the peripheral interface circuits designed for the coder's real-time operation.

  • PDF

인터넷을 이용한 웹 컨퍼런싱 시스템의 응용 (Web-conferencing System Application using Internet)

  • 이소영;박만곤
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 추계학술발표논문집
    • /
    • pp.377-381
    • /
    • 2000
  • 하루가 다르게 변하고 있는 디지털, 정보화 시대의 네트워크회된 컴퓨터 시스템과 초고속 통신망의 대중화와 함께 정보통신 기술이 급속도로 발달함에 따라 원격지 상호간에 단순히 문자나 음성만을 전송하던 방식에서 화상, 음성, 문자, 그래픽 등을 동시에 전송하는 비디오 컨퍼런싱에 대한 관심이 상당히 높아졌다. 비디오 컨퍼런싱은 음성과 동영상을 이용한 회의방식으로 화상, 음성, 문자, 그래픽 등의 동화상 정보를 최신 멀티미디어 기술을 기반으로 한 컴퓨터, 코덱, 비디오 능의 상비를 이용하여 압축한 후, 디지털 통신에 적합하게 변환하여 실시간 양방향으로 전송하는 첨단 회의 방식이다. 이러한 기존의 MCU 상비를 사용하던 고가의 룸형 비디오 컨퍼런싱을 탈피하여 최근, 일반 사용자들을 위해 단지 웹브라우저와 카메라, 마이크, 스피커만을 사용하여 실시간 회의가 가능한 웹을 이용한 웹 컨퍼런싱 개념이 많이 부각되고 있고 또한 대중화를 위해 한발 다가서고 있다. 본 논문에서는 이러한 웹 컨퍼런싱의 현 상황과 응용들에 대해서 알아보고자 한다.

  • PDF

RTOS 리눅스 환경에서의 Bluetooth-VoIP 통합 시스템 구현 (Implementation of Bluetooth-VoIP Integration System Based Embedded Linux)

  • 윤정미;조위덕;김대환;이상학;김용호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (중)
    • /
    • pp.1371-1374
    • /
    • 2002
  • 본 논문에서는 내장형 리눅스를 기반으로 무선 네트웍과 실시간 음성처리 VoIP 와의 연동시스템을 설계 구현한다. 설계 구현하는 시스템의 하드웨어 스펙은 Motorola-XPC860 프로세서를 기반으로 설계되었으며, 음성 코덱칩을 사용하여 실시간으로 음성데이터를 처리하도록 설계하였다. 또한 2.4GHz 무선 통신 규약인 Bluetooth 를 무선 네트웍 인터페이스로 사용하였다. 실시간 음성데이터의 효과적인 처리를 위하여 실시간 운영 체제인 RTLinux 를 사용하였으며, 무선 네트워크의 동시다중 서비스 지원을 위해 커널레벨의 문자 디바이스 형태로의 Bluetooth 인터페이스 구현에 대해 살펴보도록 하겠다.

  • PDF

계층구조의 분류를 통한 서포트벡터머신 기반의 음성/음악 분류기의 실용도 향상기법 (A Technique to Improve the Practicality of SVM-based Speech/Music Classifiers Through Hierarchical Classification)

  • 최석환;조용옥;조지우;임정수;이연우;이성로
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.1033-1034
    • /
    • 2012
  • 본 논문은 제한된 대역폭의 효율적인 활용을 위한 가변 전송률 코덱을 목표로 제안된 서포트벡터머신 기반의 음성/음악 분류기의 실용도를 높이기 위한 기법을 제안한다. 서포트벡터머신 기반의 음성/음악 분류기는 높은 분류능력을 가지고 있지만 많은 계산량을 요구하기 때문에 실시간으로 사용하기에는 부적합한 면이 있다. 따라서 계층적 분류를 통해 서포트벡터머신 기반의 음성/음악 분류기의 실용성을 향상시키는 기법을 제안한다.

IEEE 802.16e 시스템에서의 CNG 모드 AMR 음성 코덱을 위한 개선된 ErtPS 스케줄링 알고리즘 (Improved ErtPS Scheduling Algorithm for AMR Speech Codec with CNG Mode in IEEE 802.16e Systems)

  • 우현제;김주영;이미정
    • 정보처리학회논문지C
    • /
    • 제16C권5호
    • /
    • pp.661-668
    • /
    • 2009
  • IEEE 802.16e 시스템은 가변 비트율로 생성되는 묵음 삭제(Silence suppression) 지원 VoIP 트래픽 서비스의 QoS 제공을 위해, ErtPS(Extended real-time Polling Service) 상향링크 스케줄링 알고리즘을 제안하였다. VoIP 서비스는 묵음을 삭제할 경우에 사용자에게 연결상태라는 것을 알리기 위해, 수신자의 청각에 편안한 잡음을 재생시키는 CNG(Comfort Noise Generation) 모드를 지원해야 한다. CNG 모드의 비음성 구간에서는 음성 구간에 비해 긴 패킷 전송 간격에 따라 낮은 전송률로 데이터를 생성한다. 따라서, 주기적으로 데이터 패킷을 생성하는 서비스 플로우를 위해 설계된 ErtPS 알고리즘을 음성 구간과는 다른 주기로 데이터를 생성하는 비음성 구간에 적용할 경우, 상향 링크의 자원이 비효율적으로 사용된다. 이에 본 논문에서는 CNG 지원 VoIP 트래픽에 대한 비음성 구간에서의 효율적인 자원 활용을 위해,개선된 ErtPS 방안을 제안하였다. 제안 방안에서는 사용자가 기지국에게 자신의 음성 상태의 변화를 알리면, 기지국은 사용자의 각 음성 상태에 따라 해당 주기로 대역폭을 할당한다. 이를 위해, 제안 방안에서는 802.16e 시스템에서 주기적으로 채널의 품질정보를 기지국에 전달하기 위해 사용되는 상향 링크 부채널인 CQI(Cannel Quality Information) 채널을 활용하였다. OPNET 시뮬레이터를 사용하여 제안 방안의 성능을 평가해 보았으며, ErtPS와 비교하여 상향 링크의 대역폭 활용과 패킷 전송 지연 면에서 성능이 향상되었음을 확인하였다.

음성통신을 위한 잡음처리 기술

  • 신종원;장준혁;김남수
    • 정보와 통신
    • /
    • 제24권4호
    • /
    • pp.27-35
    • /
    • 2007
  • 음성 통신을 할 때 배경 잡음이 존재하게 되면 일반적으로 음질이 저하된다. 이것은 잡음 자체가 듣기 싫다거나 음성을 더 작게 들리게 만들기 때문이기도 하고 음성 코덱이 잡음이 섞이지 않은 깨끗한 음성에 최적화되어 있어서 잡음이 섞인 음성에 대한 코딩 효율이 떨어지기 때문이기도 하다. 이 논문에서는 잡음에 의한 음성 통신의 품질 저하를 막기 위한 방법으로서 음성 향상(speech enhancement) 기술과 음성 강화(speech reinforcement) 기술에 대해 소개한다. 음성 향상 기술이란 전송부의 마이크에서 녹음된 잡음과 음성이 섞인 입력 음성으로부터 깨끗한 음성을 추정하는 기술을 말한다. 음성 향상 기술은 상당히 오랜 기간 동안 연구되어 온 기술이며, 최근에는 각 파라미터의 분포에 의존하는 방법보다 확률 모델에 기반한 방법이 각광을 받고 있으며 인간의 청각 특성을 고려한 음성 향상 방법도 제안되고 있다. 음성 강화 기술이란 수신단에서 주변 잡음에 따라 전송되어 온 음성을 주파수별로 증폭하여 더 잘 들리도록 만드는 기술이다. 음성 향상이 내 주위의 잡음이 상대방에게 들리는 음성에 미치는 영향 혹은 상대방 주변의 잡음이 나에게 들리는 소리에 미치는 영향을 줄여주는 기술이라면 음성 강화는 내 주위의 잡음이 나에게 들리는 음성에 미치는 영향을 상쇄해 주는 기술이다. 이 경우 주변 잡음은 어떤 전자 시스템도 거치지 않고 귀로 직접 들어오기 때문에 잡음 자체를 줄여 주는 것은 힘들고 전송되어 온 음성을 적절히 증폭 혹은 변형함으로써 귀에 들리는 음질 또는 명료성을 개선하게 된다. 이 논문에서는 통계 모델을 기반으로 한 음성 향상 기법과 인간의 청각 특성을 고려한 음성 향상 기법, 그리고 음성 강화 기법에 대해 설명한다.을 시도한 결과 안정적이고 반복 가능한 급성 심부전 모델을 얻을 수 있었다. bench scale실험결과와 같이 AOC는 배수관망에서의 박테리아 증식과 크게 상관관계를 갖고 있는 것으로 밝혀졌다.)', 'have a headache (2.10±0.79)', 'poor memory (2.09±0.83)', 'no appetite (1.99±0.85)', As for the correlation between iron parameter and clinical symptoms related to anemia, the hematocrit rate was negatively correlated with 'get a cold easily', 'pale face', 'feeling blue', 'difficult digestion' (p<0.05). The level of iron was negatively correlated with 'tired out easily', 'get a cold easily' (p<0.05) and TS (%) were negatively correlated with 'tired out easily (p<0.05)', 'get a cold easily (p<0.01). Our study resulted that the prevalence of a iron deficiency of a middle school girl is very high, therefore the guidelines for iron supplementation and nutritional education to improve their iron status should be provided.한 질소제거를 N-balance로부터

TMS320C6701 DSP용 MPEG-4 오디오 HVXC 부호기의 최적화 라이브러리 개발 (Library Optimization of the MPEG-4 Audio HVXC Coder using TMS320C6701 DSP)

  • 나훈;이지웅;강경옥;임영권;홍진우;정대권
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1999년도 학술대회
    • /
    • pp.197-200
    • /
    • 1999
  • MPEG-4 오디오 부호기의 일부인 HVXC(Harmonic and Vector excitation Coding) 부호기는 음성의 무성음 구간에서는 CELP 코덱, 유성음 구간에서는 MBE 코덱을 이용하여 부호화하는 구조로서, 많은 연산량을 필요로 하여 범용DSP를 이용한 실시간 구현의 장애요소로 작용한다. 본 논문에서는 TMS320C6701 DSP를 이용하여 많은 연산 시간을 요하는 함수들에 대한 C언어 및 어셈블리 레벨의 최적화를 수행하여 HVXC 함수들의 실행시간을 단축하고 이를 라이브러리화 하여 실시간 구현에 이용가능 하도록 하였다.

  • PDF

TMS320C6413 DSP프로세서를 이용한 적응 음질개선 시스템의 구현에 관한 연구 (Implementation of adaptive speech enhancement system using TMS320C6413 DSP processor)

  • 이영일;이순려;신윤기;최홍섭
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.101-104
    • /
    • 2004
  • 본 논문에서는 보상기를 채용하여 안정성을 확보한 적응순환필터인 ACHARF(Adaptive Compensated Hyperstable Adaptive Recursive Filter)를 사용하여 잡음제거를 통한 음성의 음질개선을 DSP 프로세서를 통하여 구현하였다. 실험에서는 TI사의 최신 DSP 프로세서인 TMS320C6413와 스테레오 오디오 코덱인 TLV320AIC23을 탑재한 Evaluation board를 사용하였다. 2개의 입력마이크를 이용하여 음성신호와 기준 잡음신호를 별도로 수집하여 알고리즘을 수행하였으며, 실험 결과로 음질개선 효과를 확인할 수 있었다. 본 연구를 통해서 시스템의 성능개선의 핵심은 입력으로 들어오는 음성신호와의 상관도가 가능한 적은 잡음신호를 수집하는 방법이라 생각되며 앞으로 이에 대한 연구가 필요하겠다.

  • PDF