• Title/Summary/Keyword: 음성 전송 성능

Search Result 337, Processing Time 0.025 seconds

Performance Analysis of Speech Recognition in Communication Systems using Speech Coder (음성 압축기를 사용한 통신 시스템에서의 음성 인식 성능 분석)

  • Han Sang-Wook;Jung Heui Suck;Park Hochong
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.179-182
    • /
    • 2002
  • 본 논문에서는 음성 압축기를 사용하는 디지털 이동통신 환경에서 한글 음성 인식기의 성능을 분석하기 위하여 다양한 표준 음성 압축기를 이용하여 음성 압축기의 구조, 전송률, 전송 채널의 에러율에 대한 성능을 측정하여 비교하였다. 동일한 구조의 음성 압축기에 대하여 전송률의 증가에 따라 음성 인식률이 증가하지만, 음성 압축기의 구조에 따라 동일 전송률에서도 많은 성능 차이가 발생하는 것을 확인하였다. 특히 IS-127 EVRC의 인식 성능이 매우 떨어지는 것을 알 수 있고, EVRC의 잡음 제거기와 가변 전송률에 의하여 음성 인식 성능이 저하되는 것을 확인하였다. 이를 통하여 청취 음질과 음성 인식 성능 사이의 상관 관계가 높지 않는 것을 알 수 있다. 모든 음성 압축기에 대하여 채널 에러율과 음성 인식기의 성능은 매우 밀접한 관계가 있음을 확인하였고, 평균적으로 채널 에러율 $1.0\%$에서 인식률이 $0.6\%$ 감소하고, 에러 $5.0\%$에서 인식률이 $1.8\%$ 감소한다.

  • PDF

Transmission Performance of VoIP Traffics on Underwater MANET (수중 MANET에서 VoIP 트래픽의 전송 성능)

  • Kim, Young-Dong
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.11 no.12
    • /
    • pp.1187-1192
    • /
    • 2016
  • Performance analysis results are limited to of network level, because network level transmission parameters are used for performance measure and analysis of network design, construction and operation on underwater MANET, With this way of performance analysis based on network level, it is not easy to analyze transmission performance related with user level transmission quality. In this paper, transmission performance focused on application traffic be required by user is investigated to supplement weakness of performance analysis based on network level. Voice traffic, which is expected to be increasingly used on underwater MANET, is considered as application service, Some conditions for underwater MANET will be proposed to support transmission quality, MOS, CCR and EED, etc.. A computer simulation based on NS-2 is used for performance measure, voice traffic is generated as VoIP specification.

An Imporvement of DTMF Tone Transmission Based on Dual Mode G.723.1 Vocoder (이중 모드 G.723.1 음성부호화기에 의한 DTMF 톤 전송성능 개선)

  • 허호영
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06e
    • /
    • pp.415.1-418
    • /
    • 1998
  • G.723.1은 부호화 방식은 제한된 계산량으로 낮은 전송율에서 음성을 가장 잘 표현할 수 있도록 최적화되어 있어서, 음성주파수 대역에 있는 DTMF톤의 경우 왜곡이 발생되어 전송성능이 떨어지는 문제점이 있다. 본 논문에서는 DTMF톤의 투명한 전송을 위해 LSP 계수를 이용한 톤 신호 검출에 기반을 둔 음성모드와 톤모드의 이중모드를 가지는 변형된 G.723.1 음성부호화 방식을 제안한다. 제안된 방식에서 음성모드 부호화기는 기존의 방식과 동일하며, 톤모드의 경우 부호화 단계에서 spectral smoothing 및 피치주기 검출 방식 등을 수정함으로써 수신단의 변경없이 DTMF톤의 전송왜곡을 개선시킨다. 본 논문에서는 컴퓨터 모의실험을 통해 제안된 방법이 DTMF 전송성능을 개선시킴을 확인하였다.

  • PDF

Joint CDMA/PRMA의 성능향상 기법에 관한 연구

  • 국광호;이강원;박정우;강석열
    • Proceedings of the Korea Society for Simulation Conference
    • /
    • 2001.05a
    • /
    • pp.134-134
    • /
    • 2001
  • 이동통신 망을 통한 멀티미디어 통신의 수요 급증으로, 차세대 이동통신 시스템에서는 패킷 교환에 기초한 망 구조가 사용될 것으로 예측된다. VOD(Voice Activity Detector)를 갖는 음성 단말은 데이터를 발생시키는 talk spurt(평균이 t$_1$인 지수분포를 따름)와 데이터를 발생시키지 않는 silence period(평균이 t$_2$인 지수분포를 따름)의 두가지 상태를 갖는 마코프 체인으로 모델링된다. Goodman at. al.은 음성 단말들이 talk spurt동안만 데이터를 전송하게 함으로써 더 많은 가입자들을 수용할 수 있는 PRMA(Packet Reservation Multiple Access) 기법을 제안되었다. PRMA 방식에서는 시간 축이 슬롯들로 구성되며 여러개의 슬롯들로 프레임이 형성된다. Silence period 상태에 있던 음성 단말은 talk spurt 상태가 되면 talk spurt의 첫 번째 데이터를 하나의 슬롯을 통해 전송하게 된다. 이때 단말들은 각 슬롯에서 데이터를 전송할 수 있는 확률을 나타내는 채널 접근 확률(channel access probability)에 의해 데이터를 전송하게 되며 전송에 성공하면 슬롯을 예약함으로서 다음 프레임부터는 동일한 위치의 슬롯을 통해 데이터들을 전송하게 된다. DS/CDMA(Direct Sequence/code Division Multiple Access)는 이동통신 단말의 수용 용량상의 이점, 소프트 핸드오버 능력, 보다 용이하게 셀 계획을 세울 수 있는 점 등에 의해 차세대 이동통신 망에서 채택될 예정이다. CDMA 시스템은 간섭(interference)에 의해 용량이 제한을 받게 되며, MAI(Multiple Access Interference)가 시스템의 성능에 많은 영향을 미치게 된다. Brand, et. al.은 간섭의 분산을 줄이기 위해 PRMA 개념을 DS/CDMA 환경으로 확장한 Joint CDMA/PRMA 프로토콜을 제안하였다. 이때 각 슬롯에서의 데이터 전송확률을 그 슬롯에서 예약상태에 있는 음성 단말의 수에 의존하게 하는 방식을 사용하였으며 데이터 전송확률을 나타내는 채널 접근 확률들을 시뮬레이션을 통해 유도하였다. 한편 음성 단말에게는 실시간 서비스를 제공해 주어야 하는 대신 데이터 단말에게는 실시간 서비스를 제공해 주지 않아도 되므로, 트래픽이 많을 때에는 음성 단말의 데이터 전송에 우선권을 주는 것이 바람직하다. 이를 위해서 Brand, et. al.은 채널 접근 확률을 각 슬롯의 트래픽 상태에 따라 적응적으로 산출하는 기법을 제안하였다. 본 연구에서는 Joint CDMA/PRMA의 성능이 채널 접근 함수의 효율성에 많이 의존하게 되므로 보다 효율적인 채널 접근 확률을 구하는 방법을 제안한다. 즉 채널 액세스 확률을 각 슬롯에서 예약상태에 있는 음성 단말의 수뿐만 아니라 각 슬롯에서 예약을 하려고 하는 단말의 수에 기초하여 산출하는 방법을 제안하고 이의 성능을 분석하였다. 시뮬레이션에 의해 새로 제안된 채널 허용 확률을 산출하는 방식의 성능을 비교한 결과 기존에 제안된 방법들보다 상당한 성능의 향상을 볼 수 있었다.

  • PDF

Implementation of an Efficient Voice Transmission System in Bluetooth Network Rnvironments (블루투스 네트워크 환경에서의 효율적인 음성전송 시스템 구현)

  • Kim, Myung-Jong;Park, Ji-Hun;Kim, Hong-Kook
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2008.02a
    • /
    • pp.125-128
    • /
    • 2008
  • IPTV의 상용화에 맞추어 사용자와 TV간의 정보 교환에 의한 대화형 서비스들이 제공되고 있으며, 특히 음성인식 기술은 이러한 서비스를 실현하기 위한 중요한 기술 중의 하나로 대두되고 있다. TV에서의 음성인식 수행을 위해서는 가정환경과 같은 제한된 공간에서 효율적으로 사용자의 음성을 TV에 전송할 수 있는 근거리 무선통신 수단이 필요하게 된다. 특히, 리모트 컨트롤러와 같은 저전력 시스템 환경에서 구현이 가능해야 한다. 따라서 이러한 제한된 조건에서 최적의 성능을 갖는 음성 전송 시스템 개발이 요구되고 있다. 본 논문에서는 블루투스 환경 하에서 음성인식을 위해 필요한 음성전송 시스템을 실시간 구현한다. 효율적인 음성전송을 위해 G.711을 기본 코덱으로 사용하며, 음성전송 시 발생하는 패킷손실에 따른 음성 품질 저하를 줄이기 위해 G.711 패킷손실 은닉 알고리즘을 음성전송 시스템에 적용한다. 특히 G.711 패킷 손실 은닉 알고리즘 수행을 위해 블루투스 프로토콜 스택application layer에 RTP 프로토콜을 적용하여 패킷 손실 여부를 확인하고, 패킷 손실 발생 시 패킷손실 은닉 알고리즘을 통해 음성의 품질 저하를 줄인다. 구현된 시스템의 성능을 평가한 결과, G.711 패킷 손실 알고리즘을 적용하여 2~10%의 패킷손실 환경에서 14.7%의 음질개선을 얻을 수 있었다.

  • PDF

Trends of Low Bit-Rate Speech Coding (낮은 전송률 음성 부호화 연구 동향)

  • 강홍구
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1995.06a
    • /
    • pp.27-30
    • /
    • 1995
  • 음성 신호를 압축한 후, 주관적 왜곡 없이 복원하기 위한 부호화 연구는 대역 제한된 채널에 적용하기 위해 전송률을 더욱 낮추기 위한 연구 분야와 전송률은 높더라도 복잡도 및 성능 면에서 효과적인 연구 분야로 나눌 수 있다. 본 논문에서는 기존 시스템의 절반에 해당하는 전송률에서도 비슷한 성능을 유지함으로써 디지털 셀룰라 표준화안으로의 가능성이 가장 높은 음성 부호화 방법들에 대해 비교 설명하고, 전송률을 좀 더 낮추기 위해 진행되고 있는 새로운 연구 경햐에 대해 고찰한다. 또한, 전송률은 높더라도 기존 방법에 비해 복잡도는 매우 낮은 부호화기에 대한 설명을 통해 향후 연구 방향에 대해 언급하고자 한다.

  • PDF

Delay characteristics of speech packets in virtual cellular network(VCN) (가상 셀룰라 망(VCN)에서의 음성 패킷 지연 특성)

  • 정명순;김화종
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.23 no.9A
    • /
    • pp.2305-2312
    • /
    • 1998
  • This paper analyzed the delay characteristics of speech packets in virtual cellular network(VCN). The probability distribution of packet delay is obtained using the markov chain model when periodic speech packets are transmitted by slotted-ALOHA protocol. The effects of probility of capture and retransmission policy on the performance were also analyzed. At first, the probability cumulative function of packet delay is calculated from the probability of capture as a function of location of mobile terminal. In order to investigate the effects of backoff delay, we defined a parameter NPr, where N is the period (frame size) of the speech packets and Pr is the retransmission probability for each speech packet. We also obtained the 1% outage delay for various frame size N.

  • PDF

Voice Packet Processing Scheme for Voice Quality and Bandwidth Efficiency in VoIP (VoIP의 음성품질/대역효율 개선을 위한 음성패킷 처리)

  • Kim, Jae-Won;Sohn, Dong-Chul
    • Journal of Korea Multimedia Society
    • /
    • v.7 no.7
    • /
    • pp.896-904
    • /
    • 2004
  • In this paper, We present an efficient variable rate speech coder for spectral efficiency and packet processing technique for packet loss compensation of a voice codec with 10msec frame in VoIP service. Through disconnecting the users from the spectral resource during silence interval of about 60% period, a variable rate voice coder based on a voice activity detection(VAD) can increase spectral gain by two times. The performance of the method was analyzed by variation of detected voice activity factor and degraded speech frame ratio under various background noise level, and compared those of G.729B of ITU-T 8kbps standard speech codec. A method to compensate lost packets utilized addition of recovery data to a main stream and error concealment scheme for speech quality enhancement, the performance is verified by reconstructed speech quality. The proposed scheme can achieve spectral gain by two times or enhance speech quality by 3dB through reserved bandwidth of VAD. Therefore, the proposed method can enhance a spectral efficiency or speech quality of VoIP.

  • PDF

A Study on the Performance Evaluation for the Integrated Voice/Data Transmission with FDDI (FDDI 음성/데이타 집적 전송에서의 성능 분석에 관한 연구)

  • 홍성식;박호균;이재광;류황빈
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.17 no.3
    • /
    • pp.277-287
    • /
    • 1992
  • In this paper, we study the performance eualuations of the FDDI Network, by mathmeticlal analysis and simulation, in which the Integrated Voice/Data transmission system with voice traffic in synchronous mode and data traffic inasynchronous mode.For the mean waiting times of Voice/Data packet, we use two-state of Marcov models for voice traffic with talkspurt and silenci state, and the data traffic would traffic would transmit at the silence state of voice traffic. By the mean wating times, we analyze the relations between synchronous and asynchronous mode. As a result, using Sync/Async mode with voice and data, voice was not under influnece of data traffic. and in the same time,data can be tanaxmitted in a short waiting time, too.

  • PDF

A Study on the USAC Transport Mechanism for Digital Audio Broadcasting Plus (USAC 의 DAB+ 전송 방안에 관한 연구)

  • Yang, Kyutae;Beack, Seungkwon;Lee, Bongho;Lim, Hyoungsoo
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2015.07a
    • /
    • pp.28-31
    • /
    • 2015
  • 본 논문에서는 음성 및 음악 모두에 대해 최고의 품질을 제공하는 최신 오디오 코덱인 USAC 을 DAB+에 적용하기 위한 전송 방안을 제안한다. 기존 DAB+는 AAC+ v2 로 불리는 HE-AAC v2 (High Efficiency Advanced Audio Coding version 2) 오디오 코덱을 사용하였다. 하지만 AAC+ v2 는 낮은 데이터 전송률에서 음악에서는 좋은 품질을 제공하나 음성에서는 상대적으로 품질이 떨어지는 단점이 있다. 반면 USAC 은 낮은 데이터 전송률에서 음악 및 음성에 모두 좋은 품질과 높은 압축 성능을 제공할 수 있는 최신 오디오 코덱 기술이다. USAC 의 성능을 최대한 보장하기 위해서는 DAB+와 달리 VBR 을 적용하는 효과적이다. 따라서 본 논문에서는 USAC VBR 스트림을 DAB+에 전송하는 방안을 제안한다. 제안된 전송 방안을 적용할 경우 최적의 음악 및 음성 품질을 효율적으로 제공할 수가 있다.

  • PDF