• 제목/요약/키워드: 음성코덱

검색결과 119건 처리시간 0.03초

초광대역 음성통화 서비스를 위한 압축 기술 및 표준화 (Speech Codec Standardization for Super-wideband Communication)

  • 오은미
    • 방송과미디어
    • /
    • 제19권1호
    • /
    • pp.48-55
    • /
    • 2014
  • 오디오 신호 압축 기술 관점에서 최근 모바일 통신 시장의 가장 큰 변화 중에 하나는 광대역 음성 코덱인 AMR-WB가 HD voice 또는 VoLTE(Voice over Long Term Evolution) 서비스에 사용된다는 것이다. 모바일 방송 및 음악 재생뿐만 아니라, 통화에서도 다양한 신호를 고음질로 압축해야 하는 필요성이 대두되어 3GPP에서 EVS(Enhanced Voice Service) Codec이 표준화 진행 중이다. 본 논문에서는 실감 통화를 위해 초광대역 신호까지 압축하는 음성 통화 코덱 기술 및 3GPP표준화 현황을 소개한다. 3GPP 표준 기수에서 정의한 디자인 및 성능 요구사항과 더불어 이전 음성 압축기술과의 차이점 등을 논의한다. 또한, 향후 표준화 계획 및 시장 전망에 대해서 논의한다.

EVS 코덱에서 보청기를 위한 RNN 기반의 음성/음악 분류 성능 향상 (Improvement of Speech/Music Classification Based on RNN in EVS Codec for Hearing Aids)

  • 강상익;이상민
    • 재활복지공학회논문지
    • /
    • 제11권2호
    • /
    • pp.143-146
    • /
    • 2017
  • 본 논문에서는 recurrent neural network (RNN)을 이용하여 보청기 시스템을 위한 기존의 3GPP enhanced voice services (EVS) 코덱의 음성/음악 분류 성능을 향상시키는 방법을 제시한다. 구체적으로, EVS의 음성/음악 분류 알고리즘에서 사용된 특징벡터만을 사용하여 효과적으로 RNN을 구성한 분류기법을 제시한다. 다양한 음악장르 및 잡음 환경에 대해 시스템의 성능을 평가한 결과 RNN을 이용하였을 때 기존의 EVS의 방법보다 우수한 음성/음악 분류 성능을 보였다.

MPEG4/MP3 코덱을 이용한 IPv6 멀티캐스트 기반 고품질 화상회의 응용 개발 (Development of an IPv6 Multicast based High quality Video Conferencing Tool using MPEG4 and MP3 codec)

  • 조호식;유태완;최양희;인민교;이승윤;김형준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (3)
    • /
    • pp.595-597
    • /
    • 2002
  • IPv4 주소 공간의 부족으로 IPv6라는 새로운 해결책이 등장하였으나 아직은 널리 보급되지 못하고 6BONE과 같은 실험망에서만 사용되고 있는 실정이다. 그러나 IPv6는 가까운 미래에 IPv4를 대체할 차세대 인터넷 기술이며 본 논문은 이러한 배경에서 IPv6 멀티캐스트 환경에서 동작하는 화상회의 툴을 소개한다. 이 툴은 화상에는 MPEG4 코덱을 적용하고 음성에는 MP3 코덱을 적용하여 사용자당 1Mbps이하의 대역폭에서 고품질의 화상회의를 가능하도록 한다. 본 논문에서는 화상회의 응용의 전체적인 구조와 DirectShow 기술을 사용한 화상과 음성 정보의 압축과 스트리밍에 대해서 중점적으로 설명한다.

  • PDF

심층 신뢰 신경망을 이용한 오푸스 코덱 기반 인공 음성 대역 확장 기술 (Artificial speech bandwidth extension technique based on opus codec using deep belief network)

  • 최윤상;이아성;강상원
    • 한국음향학회지
    • /
    • 제36권1호
    • /
    • pp.70-77
    • /
    • 2017
  • 대역폭 확장 기술은 300 ~ 3,400 Hz 대역의 협대역 음성 신호를 50 ~ 7,000 Hz 대역의 광대역 음성신호로 확장하여 음질, 명료도, 그리고 자연성을 높이는 기술이다. 본 논문에서는 협대역 음성 정보를 이용하여 광대역 음성신호를 추정하는 인공 대역폭 확장 기술을 설계하여, 오푸스(Opus) 오디오 복호화기에 내장시킴으로써, 대역폭 확장 모듈에서의 LPC(Linear Prediction Coding) 분석 및 LSF(Line Spectral Frequencies) 해석과 관련된 계산량을 감소시켰고 알고리즘 지연도 줄였다. 이를 위해 현재 다양한 분야에 적용되고 있는 딥 러닝 기술 중 하나인 심층 신뢰 신경망(Deep Belief Network, DBN) 방식을 스펙트럼 포락선 확장에 도입하여 전통적인 코드북 매핑법보다 더 좋은 품질의 스펙트럼을 만들 수 있었다.

ARM926EJ-S 프로세서 코어를 이용한 G.729.1의 실시간 구현 (Real-Time Implementation of the G.729.1 Using ARM926EJ-S Processor Core)

  • 소운섭;김대영
    • 한국통신학회논문지
    • /
    • 제33권8C호
    • /
    • pp.575-582
    • /
    • 2008
  • 본 논문에서는 ITU-T의 SG15에서 채택된 G.729.1 광대역 음성 코덱을 ARM926EJ-S(R) 프로세서 코어에 적용하기 위해 기본연산자 및 산술기능 함수를 포함한 G.729.1 코덱 프로그램 일부를 어셈블리어로 변환하여 실시간으로 동작하도록 구현한 절차 및 결과를 기술하였다. G.729.1은 $8{\sim}32kbps$의 가변 전송률을 갖는 ITU-T 표준 광대역 음성 코덱이며, 입력신호는 8kHz 또는 16 kHz로 샘플링 되어 샘플 당 16 비트로 양자화된 PCM 신호를 입력받는다. 이 코덱은 앞서 표준화된 G.729 및 0.729A와 상호 호환이 가능하며 음질 향상을 위해 기존의 협대역($300{\sim}3,400Hz$)에 비해 대역폭을 광대역($50{\sim}7,000Hz$)으로 확장한 버전이다. 실시간으로 구현된 G.729.1 광대역 음성 코덱은 32kbps에서 인코더와 디코더 부분이 각각 약 31.2 MCPS 및 22.8 MCPS의 복잡도를 가지며, 실제 임베디드 시스템에서의 실행 시간은 인코더와 디코더 평균 6.75ms와 4.76ms로 총 11.5ms가 걸렸다. 또한 이 코덱은 ITU-T에서 제공하는 모든 테스트 벡터에 대해 비트 단위로 정확하게 시험하여 통과하였으며, 실제 인터넷 전화기에 적용한 실시간 음성통화에서 정상적으로 동작하였다.

WCDMA 순방향링크에서 AMR 음성 코덱 모드 할당에 대한 성능 비교 (Analytical Performance Comparisons of AMR Codec Mode Allocations on the Downlink in a WCDMA system)

  • 정성환;김태현;홍정완;이창훈
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회/대한산업공학회 2005년도 춘계공동학술대회 발표논문
    • /
    • pp.230-237
    • /
    • 2005
  • WCDMA방식에서 채택한 AMR(Adaptive Multirate) 음성 코덱은 4.75kbps에서 12.2kbps까지 8개의 가변 출력률을 가진다. 기지국제어시스템(Radio Network Controller)은 무선망 상황에 따라 AMR 출력 모드를 가변적으로 조정해 줌으로써 높은 사용자 QoS와 효율적인 시스템 성능을 얻을 수 있다. 본 연구에서는 순방향 WCDMA 채널에서 세 가지의 AMR 출력 모드 할당 방식을 제안하고, 음성 사용자가 경험하는 QoS 만족도를 시스템 성능 척도로하여 제안된 방식들을비교 할 수 있는 분석적 방법을 제시한다. 실험 예제를 통해서 시스템 부하에 따른 시스템 성능 척도의 변화를 도시함으로써 최적의 AMR 모드 할당 방식을 결정하는 기준을 제시한다.

  • PDF

실시간 리눅스 기반의 VoIP 게이트웨이 시스템 구현 (Implementation of VoIP Gateway on Real-Time Linux)

  • 류홍석;정용진;민상원;정광모
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (3)
    • /
    • pp.679-681
    • /
    • 2002
  • VoIP(Voice over Internet Protocol)는 일반 전화망이 아닌 인터넷 망을 통해 실시간 데이터인 음성을 전송하는 방식으로 음성 통신비용의 절감 효과와 다양한 서비스로 인한 부가 가치를 통해 개인, 기업, 기간 통신 사업자들에게 큰 이득을 가져다 줄 수 있다. 이러한 추세에 발맞추어 본 논문에서는 RTLinux 기 반에서 VoIP 게이트웨이를 구현함으로서 실시간 처리를 요하는 시스템의 개발기간 단축과 시스템 성능 향상을 목적으로 시스템을 구현하였다. RTLinux는 기존 리눅스 커널 위에서 동작하며, 또한 하드리얼타임을 제공하여 리눅스가 가지고 있던 실시간 처리 문제를 극복할 수 있다. 구현한 시스템은 end-to-end 간에 코덱 (G.723.1)을 전송한 후 프레임간 Delay와 Jitter, loss를 측정하여 기존 리눅스와 RTLinux간의 시스템 성능을 비교 테스트하였으며, 그 결과 기존 리눅스에 비교하여 RTLinux 기반의 게이트웨이가 코덱이 제한하는 시간 안에 음성 전송을 처리함으로서 실시 간 처리를 요하는 시스템 개발에 적절한 솔루션임을 확인하였다.

  • PDF

인터넷 전화서비스의 음성 코덱 품질에 관한 연구 (A Study on a quality of Voice Codec for Internet Telephone Service)

  • 민경주;이종국;이재정;홍재환;남기동
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.1021-1024
    • /
    • 2007
  • 인터넷이 발달하고 VoIP 의 활성화로 인하여 사용자들은 인터넷 전화서비스의 통화품질에 대한 관심이 크게 증가하고 있다. 본 고에서는 인터넷 전화서비스의 단말에 사용하고 있는 음성 코덱의 품질 측정을 위해 IP 패킷 전송품질 파라미터(ITU-T Y.1540)들을 인가하면서 이들 파라미터들의 변화에 따른 E-Model(ITU-T G.107) 종합 음성품질(R 값)을 측정하여 인터넷전화 단말의 프로세싱 품질을 파악하고 종단간서비스에서 단말이 차지하는 부분을 분석하여 인터넷 전화서비스의 통화품질 개선 및 향후 단말의 인증기준 등에 활용하고자 한다.

리눅스 기반 실시간 처리 VoIP 단말기 시스템의 설계 및 구현 (A Design and Implementation of the Real-Time VoIP Terminal System Based on Linux)

  • 이명근;이상정;서정민;임재용
    • 정보처리학회논문지A
    • /
    • 제8A권4호
    • /
    • pp.345-352
    • /
    • 2001
  • 본 논문에서는 리눅스를 기반으로 실시간 음성 처리 VoIP 단말기를 설계 구현한다. 설계 구현하는 하드웨어 시스템은 i486 프로세서를 기반으로 설계되며, 음성 코덱칩을 사용하여 실시간으로 음성 데이터를 처리한다. 또한 실시간 음성 데이터를 관리하고 처리하기 위해 리눅스 기반 실시간 처리 운영 체제인 RTLinux를 포팅하여 실시간 음성처리 모듈을 구현한다. 음성처리에 사용한 음성처리 모듈은 ITU-T 표준 음성 코덱인 G.723.1 사용하여 30ms 내에 24바이트로 인코딩/디코딩된 음성 데이터를 전송하도록 하고, 음성 전달의 QoS를 보장해 주기 위해서 리눅스에 실시간 음성처리 디바이스 드라이버를 설계 구현한다. 설계 구현하는 시스템의 테스트 및 타당성 검증을 위해 음성채팅 응용 프로그램을 단말기에 구현하여 통화품질을 시험한다.

  • PDF