• 제목/요약/키워드: 음성압축

검색결과 218건 처리시간 0.034초

SIP기반의 VoIP시스템에서 RTP를 이용한 Voice 처리 모듈의 개발 (Design of Voice processing module Using RTP in VoIP system)

  • 윤원동;백은경;박일규;최양희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (A)
    • /
    • pp.292-294
    • /
    • 2001
  • VoIP(Voice over IP) system은 현재 크게 2가지 형태로 진행되어가고 있다. 첫 번째는 H.323을 이용한 방법이고, 두 번째는 SIP(Session Initiation Protocol)를 이용한 방법이다. H.323은 실제 데이터를 전송하기전 호처리에 많은 signaling이 이루어지는 관계로 SIP보다 많은 RTT(Round Trip Time)를 소모하게 된다. 따라서 매우 복잡하고, LAN환경을 바탕으로 만들어서 확장성면에서도 여러 문제점을 가지고 있다. 그래서 본 논문은 호처리는 SIP를 이용하고, 실제 음성전송은 RTP(Real-Time Transport Protocol)와 RTCP(RTP Control Protocol)를 이용하는 시스템 구현을 제시한다. RTP는 실시간 특성을 가지는 데이터에 대해서 종단간 전송 서비스를 제공해주는 프로토콜로, 어떠한 인코딩에도 적합한 프레임워크를 제공한다. 그런데, RTP는 완전한 하나의 프로토콜이 되기 위해서는 RTP와 페이로드 포맷이 함께 제공되어야 하므로, 구현시스템은 음성신호를 PCM(Pulse Code Modulation), ADPCM(Adaptive Differential PCM)등의 여러 압축기술을 이용하여 파일을 생성하여 실시간으로 RTP와 RTCP를 이용하여 전송하는 방법을 제시한다.

인터넷폰의 QoS를 위한 적응적인 버퍼관리 방식 (Adaptive Buffer Management Method for Quality of Service of Internet Telephony)

  • 류태욱;이정훈;강성호;엄기환
    • 한국정보통신학회논문지
    • /
    • 제6권3호
    • /
    • pp.386-392
    • /
    • 2002
  • 인터넷전화(Internet telephony)는 network를 통하여 음성데이터를 주고받는 응용프로그램으로 좋은 음질의 제공은 필수적이다. 그러나 음성데이터가 네트워크를 통하여 전송이 되면서 전송지연과 지연 편차 등의 Jitter현상에 영향을 받아 음질의 저하를 유발하므로 수신측에서는 적절한 jitter buffer를 제공해야만 한다. 본 논문에서는 인터넷전화에서 보다 양질의 음성을 제공하기 위하여 단말기 입장에서 버퍼관리 알고리즘을 제안한다. 제안한 알고리즘은 현재 단말기에서 사용하고 있는 압축알고리즘의 종류와 수신된 데이터만을 근거 자료로 수신데이터의 변화에 적응적으로 반응하면서 음질을 향상할 수 있는 버퍼관리 알고리즘이다. 제안한 알고리즘의 유용성을 확인하기 위하여 다양한 네트워크 상황에서 기존의 알고리즘과 네트워크 상황판단의 성능을 비교한다.

발산거리 기반의 신경망에 의한 가우시안 확률 밀도 함수의 군집화 (Guassian pdfs Clustering Using a Divergence Measure-based Neural Network)

  • 박동철;권오현
    • 한국통신학회논문지
    • /
    • 제29권5C호
    • /
    • pp.627-631
    • /
    • 2004
  • 음성인식 모델상의 GPDFs(Gaussian Probability Density Functions)을 효율적으로 군집화 할 수 있는 알고리즘이 제안되었다. 제안된 알고리즘은 데이터 사이의 거리 척도로 발산 거리를 사용하는 새로운 형태의 CNN(Centroid Neural Network)으로, 제한된 자원을 가지는 H/W환경의 음성인식에서 메모리 사용량을 축소하는 응용에 대한 실험 결과, 음성인식 모델인 CDHMM(Continuous Density Hidden Markov Model)에서 기존의 Dk-means(Divergence-based k-means)알고리즘을 이용한 방법과 비교하여 인식 성능의 유지와 함께 약 31.3%의 GPDFs를 더 축소할 수 있었고, 군집화 알고리즘을 적용하지 자은 전체 GPDFs를 사용한 경우와 비교해서 인식 성능의 유지와 함께 약 61.8%의 GPDFs를 압축할 수 있었으며, SNR 10㏈ 잡음 데이터에 대한 성능평가에서도 인식 성능이 유지될 수 있었다.

가우시안 코드북을 갖는 다중대역 비균일 음성 표본화법 (On a Multiband Nonuniform Samping Technique with a Gaussian Noise Codebook for Speech Coding)

  • 정형교;배명진
    • 한국음향학회지
    • /
    • 제16권6호
    • /
    • pp.110-114
    • /
    • 1997
  • 잡음 음성신호에 비균일 표본화 부호화법을 적용하면, PCM 균일표본화의 전송율 정도로 데이타 전송율이 높아진다. 이러한 문제점을 해결하기 위해 비균일 표본화법을 성분분리된 음성신호에 적용하는 방법으로서 다중대역 비균일 파형부호화(MNWC)법을 제안하였었다. 그렇지만, 고대역의 성분에 대해 가우시안 잡음의 평균레벨로 단순하게 모델링 하였기 때문에, 비균일 표본화법에 비해 음질의 열화가 초래되었었다. 따라서 본 논문에서는 이러한 단점을 극복하기 위해 고대역의 성분을 중심주파수가 서로 다른 16가지의 가우시안 잡음으로 모델링하였다. 이렇게 하였을 때, 제안된 방법은 MOS평가가 평균 3.16 정도로 고음질을 유지하면서도 기존의 비균일 표본화법에 비해 1.5배 정도의 압축 율을 얻을 수 있었다.

  • PDF

UMTS망의 AAL2에서 Timer_CU에 따른 다중화 이득 성능분석 (Performance Analysis of Multiplexing Gain over Timer_CU in AAL2 on UMTS Network)

  • 이현진;김재현
    • 대한전자공학회논문지TC
    • /
    • 제41권8호
    • /
    • pp.35-43
    • /
    • 2004
  • AAL2 전송 방식은 3G WCDMA 망에서 Node-B와 RNC사이에서 음성 및 데이터 트래픽을 전송하는데 사용되고 있다. AAL2의 성능을 분석하기 위하여 이산 마코프 체인 모델을 이용하여 음성 트래픽의 압축밀도와 대역이득을 분석하였으며, 시뮬레이션을 통하여 이 결과를 검증하였다. 또한 집선기에서 AAL2 다중화기의 성능을 세부적으로 분석하였다. 분석에 의하여 Node-B에서의 최적의 Timer_CU를 결정하기 위한 근거를 제안하였으며, 대역이득의 측면에서 집선기에서의 부가적인 AAL2 다중화기의 이점이 매우 작다는 것을 확인하였다. 또한 Node-B와 Iub인터페이스의 집선기에서 AAL2를 사용했을 때 데이터 트래픽의 경우 음성 트래픽에 비하여 그 이점이 매우 작다는 것을 알 수 있었다.

다수이용자를 지원하는 인터넷방송을 위한 신뢰적인 영상 및 음성 전송방법에 관한 연구 (A Study on the Reliable Transport Mechanism for delivering realtime video and audio data in Internet Broadcasting Applications)

  • 김용회;이현태;오용선
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2001년도 춘계종합학술대회
    • /
    • pp.378-382
    • /
    • 2001
  • 인터넷 방송 등의 서비스를 제공하는 서버 시스템 등에서 사용자 수가 증가함에 따라 서비스 질이 저하된다거나 네트워크의 폭주로 인하여 실시간성 상실 및 데이터 손실이 발생할 수 있다. 또한. 인터넷 방송 등과 같이 네트워크를 통해서 압축 부호화된 영상이나 음성 데이터를 전송하는 경우, 일반적인 multicast 방식으로는 신뢰성 있는 데이터 전송을 보장할 수 없다는 문제점이 있다. 이를 극복하기 위하여 사용자 수의 증가에 대하여 서버가 크게 영향을 받지 않도록 하는 방법과, 다양한 사용자의 네트워크 상황을 고려하는 지능적인 데이터 송신 기술이 요구된다. 본 논문에서는 다수 이용자를 지원하는 인터넷 방송과 같은 응용에서 신뢰성있는 실시간 영상 및 음성 데이터 전달을 위하여, reliable multicast를 사용하여 전송 오류가 없도록 하고, 네트워크 환경에 따른 사용자별 adaptive encoding을 통해 다양한 네트워크 환경에 동적으로 적응하여 서비스의 질을 향상시키며, 비슷한 접속 속도의 사용자들을 그룹화하여 사용자 수의 증가에 대한 서버의 부하를 줄이는 서버 구현 방법을 제안한다.

  • PDF

인터넷폰의 QoS를 위한 적응적인 버퍼관리 방식 (Adaptive Buffer Management Method for QoS of Internet Telephony)

  • 류태욱;이현관;이용구;김주웅;엄기환
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2002년도 춘계종합학술대회
    • /
    • pp.384-387
    • /
    • 2002
  • 인터넷전화(Internet telephony)는 network를 통하여 음성데이터를 주고받는 응용프로그램으로 좋은 음질의 제공은 필수적이다. 그러나 음성데이터가 네트워크를 통하여 전송이 되면서 전송지연과 지연 편차등의 Jitter현상에 영향을 받아 음질의 저하를 유발하므로 수신측에서는 적절한 jitter buffer를 제공해야만 한다. 본 논문에서는 인터넷전화에서 보다 양질의 음성을 제공하기 위하여 단말기 입장에서 버퍼관리 알고리즘을 제안한다. 제안한 알고리즘은 현재 단말기에서 사용하고 있는 압축알고리즘의 종류와 수신된 데이터만을 근거 자료로 수신데이터의 변화에 적응적으로 반응하면서 음질을 향상할 수 있는 버퍼관리 알고리즘이다. 제안한 알고리즘의 유용성을 확인하기 위하여 다양한 네트워크 상황에서 기존의 알고리즘과 네트워크 상황판단의 성능을 비교한다.

  • PDF

인터넷상의 음성 패킷손실과 명료도 분석 (Analysis of the Percentage Articulation and Voice Packet Loss over the Internet)

  • 고대식;박준석
    • 한국통신학회논문지
    • /
    • 제23권8호
    • /
    • pp.2090-2095
    • /
    • 1998
  • 본 논문에서는 한국내 인터넷상의 음성패킷손실을 측정하였고 패킷손실의 변화에 따른 명료도를 분석하였다. RTP를 기반으로 하는 실시간 전송프로토콜과 통화품질 평가법을 고찰하였으며 실험을 위하여 GSM과 RTP/UDP/IP를 이용한 실시간 음성통신 시스템을 구현하였다. 명료도 평가를 위하여 선택된 음절목록은 GSM에 의하여 실시간 코딩 및 압축되었으며 각 패킷은 패킷손실의 복원과 손실률 측정을 위하여 시퀀스번호를 갖고 있다. 한국내 인터넷 상의 7개 라우팅을 거친 전송 실험결과, 트래픽량에 따라 1.6%에서부터 22.5%까지의 패킷손실을 나타내었으며 시퀀스번호 재배열과 FEC 알고리즘을 통한 손실패킷의 복원률은 9%에서 35%까지 나타났고 패킷손실의 변화에 따른 단음절명료도와 2음절 이해도 평가결과는 표 4와 같다.

  • PDF

8kbps에 있어서 ACFBD-MPC에 관한 연구 (A Study on ACFBD-MPC in 8kbps)

  • 이시우
    • 한국산학기술학회논문지
    • /
    • 제17권7호
    • /
    • pp.49-53
    • /
    • 2016
  • 최근 무선네트워크의 효율을 높이기 위하여 신호압축 방식의 사용이 증가되고 있다. 특히, MPC 시스템은 비트율을 줄이기 위하여 피치추출 방법과 유성음과 무성음의 음원을 사용하였다. 일반적으로, 유성음원과 무성음원을 사용하는 MPC 시스템에 있어서, 같은 프레임 안에 모음과 무성자음이 있는 경우에 재생 음성파형에 일그러짐이 나타난다. 이것은 대표구간의 멀티펄스를 피치구간마다 복원하는 과정에서 재생 음성파형이 정규화 되는 것이 원인으로 작용한다. 본 논문에서는 재생 음성파형의 일그러짐을 제어하기 위하여 피치구간 마다 멀티펄스의 진폭을 보정하고, 특정 주파수를 이용하는 ACFBD-MPC(Amplitude Compensation Frequency Band Division-Multi Pulse Coding)를 제안하였다. 실험은 남자와 여자음성에서 각각 16개의 문장을 사용하였으며, 음성신호는 10kHz 12bit로 A/D 변환하였다. 또한 8kbps의 부호화 조건에서 ACFBD-MPC 시스템을 구현하고, ACFBD-MPC의 SNR를 평가하였다. 그 결과 ACFBD-MPC의 남자 음성에서 14.2dB, 여자 음성에서 13.6dB 임을 확인할 수 있었으며, ACFBD-MPC가 기존의 MPC에 비하여 남자음성에서 1dB, 여자음성에서 0.9dB 개선되는 것을 알 수 있었다. 이 방법은 셀룰러폰이나 스마트폰과 같이 낮은 비트율의 음원을 사용하여 음성신호를 부호화하는 방식에 활용할 수 있을 것으로 기대된다.

TeakLite DSP를 이용한 적응형 다중 비트율 광대역 (AMR-WB) 음성부호화기의 실시간 구현 (Real-time Implementation of AMR-WB Speech Codec Using TeakLite DSP)

  • 정희범;김경수;한민수;변경진
    • 한국음향학회지
    • /
    • 제23권3호
    • /
    • pp.262-267
    • /
    • 2004
  • 적응형 다중 비트율 광대역 (AMR-WB) 음성부호화기는 50∼7000 Hz의 오디오 신호를 압축/복원하는 3GPP의 가장 최근의 음성 부호화 표준으로써 23.85 kbit/s에서 6.60 kbit/s까지 9가지의 다중 비트율을 가지고 있다. 본 논문에서는 16비트 고정 소수점형 TeakLite DSP를 이용하여 AMR WB 음성부호화기를 실시간 구현한 결과에 대해 기술하였다. 구현된 AMR-WB 보코더는 가장 높은 비트율인 23.85 kbit/s모드에서 52.2 MIPS의 복잡도를 가지고 있으며, 사용된 프로그램 메모리는 약 17.9 kwords 이고, 데이터 RAM 메모리는 11.8 kwords, 데이터 ROM 메모리는 약 10.1 kwords 이다. 구현된 AMR-WB 프로그램은 3GPP의 표준시험 벡터 23개를 9개 모드에 대해 비트 단위로 일치시켜 검증을 완료하고, 실시간 보드 시험에서도 오디오 신호의 입출력이 왜곡되지 않고 실시간 지연없이 안정적으로 동작하는 것을 확인하였다.