• Title/Summary/Keyword: 음성 품질

Search Result 507, Processing Time 0.028 seconds

A Study on Improving the Quality of VoIP Security Software through GS(Good Software) Service (GS(Good Software) 기반의 성능 시험 서비스를 통한 인터넷 전화(VoIP) 보안 소프트웨어의 품질 향상 사례 연구)

  • Kim, Ki-Du;Shin, Seok-Kyoo;Kim, Young-Chul
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.04a
    • /
    • pp.1398-1400
    • /
    • 2011
  • 2000년 초에 PC간 인터넷을 통한 음성통화를 시작으로 최근에는 스마트폰의 전용 애플리케이션까지 VoIP 기반의 음성통화 서비스가 발전해왔다. 이에 따라, VoIP를 통한 외부 공격 및 침입에 대한 사례가 발생되고 이를 해결하기 위한 보안 소프트웨어들이 나오기 시작하였다. 일반적으로 VoIP기반의 소프트웨어에 대한 품질 기준은 사용자의 통화품질이 최우선 이었다. 하지만, GS시험.인증 과정을 통해 VoIP 보안 소프트웨어가 통화품질에는 직접적인 영향을 미치지는 않지만 전체 운영 시스템에 미치는 영향을 확인하고, 시험 중 발생한 문제에 대한 해결 방안 제시를 통해 VoIP의 품질을 향상시킬 수 있었다.

Design of Voice Activity Detection Algorithm for Variable Rate Speech Coders (가변전송률 음성부호화기 적용을 위한 음성활성도 측정 알고리즘 설계)

  • 김재원
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.26 no.9A
    • /
    • pp.1451-1458
    • /
    • 2001
  • 디지털 이동통신 시스템에서 가장 빈번하게 발생하는 음성 서비스의 궁극적인 목표는 양호한 음성 품질과 높은 주파수 효율의 제공에 있다. 음성은 묵음 구간에 의하여 구분되어진 짧고 간헐적인 음성 에너지의 반복으로 표현 가능하며 실제 음성 통화중 활성 음성이 존재하는 구간은 약 40%, 나머지 60% 구간은 묵음 또는 상대방의 음성을 듣는 구간이다. 이 묵음 구간을 효율적으로 활용함에 의해 시스템의 스펙트럼 이득을 얻을 수 있다. 본 논문에서는 디지털 이동통신 시스템과 같이 다양하게 변화하는 주변 잡음 환경에서도 강건하게 동작 가능하여 10msec 프레임 크기를 갖는 음성부호화기에 적용 가능한 음성 활성도 측정 방안을 설계하였다. 설계된 알고리즘은 음성에너지, 스펙트럼 분포, 영교차율, 그리고 LPC 잔여신호의 Peakiness 측정값을 이용하였다.

  • PDF

An acoustic study of feeling information extracting method (음성을 이용한 감정 정보 추출 방법)

  • Lee, Yeon-Soo;Park, Young-B.
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.10 no.1
    • /
    • pp.51-55
    • /
    • 2010
  • Tele-marketing service has been provided through voice media in a several places such as modern call centers. In modern call centers, they are trying to measure their service quality, and one of the measuring method is a extracting speaker's feeling information in their voice. In this study, it is proposed to analyze speaker's voice in order to extract their feeling information. For this purpose, a person's feeling is categorized by analyzing several types of signal parameters in the voice signal. A person's feeling can be categorized in four different states: joy, sorrow, excitement, and normality. In a normal condition, excited or angry state can be major factor of service quality. In this paper, it is proposed to select a conversation with problems by extracting the speaker's feeling information based on pitches and amplitudes of voice.

Implementation of a High-Quality Audio Collaboration System Over IP Networks (IP 네트워크 기반 고품질 오디오 협업 시스템)

  • Kang, Jin-Ah;Kim, Hong-Kook
    • 한국HCI학회:학술대회논문집
    • /
    • 2008.02a
    • /
    • pp.218-223
    • /
    • 2008
  • In this paper, we implement several methods to improve an audio collaboration system over IP networks, and then evaluate the performance of the implemented methods. In general, speech and audio quality degrades depending on the characteristics of IP networks such as jitter and packet loss. In order to reduce this quality degradation, we propose a lower bit rate audio delivery scheme using the MPEG-2 AAC (Advanced Audio Coding) audio codec in a viewpoint that a packet loss rate could be reduced by a smaller packet size. In addition, iLBC (Internet Low-Bitrate Codec) and the G.711 packet loss concealment algorithm defined by IEFT and ITU-T, respectively, are applied to a audio collaboration system. RAT (Robust-Audio Tool)[7] is used as a baseline platform for the implementation of the proposed methods. It is shown from the implementation that the implemented MPEG-2 AAC audio codec with a bitrate of 256 kbit/s performs as similar as the uncompressed audio quality with a bitrate of 512 kbit/s, and that iLBC and the G.711 packet loss concealment algorithm can improve speech quality when a packet loss rate is 2~10%.

  • PDF

Voice Packet Playout Scheduling for High Quality Voice Communication Based on Wide Band VoIP (광대역 VoIP 기반 고품질 음성통화를 위한 음성패킷 재생 스케줄링 방식)

  • Choi, Hong-Jae;Kim, Hyoung-Gook
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2012.05a
    • /
    • pp.353-354
    • /
    • 2012
  • 광대역 VoIP 네트워크 환경에서는 불안정한 네트워크 환경으로 인해 음성패킷이 불규칙적으로 수신되어 음성데이터의 재생이 원활하지 못하다. 이러한 문제점을 해결하기 위해 본 논문에서는 네트워크 상태에 따라 원활하게 음성패킷을 재생시키는 스케줄링 방식을 제안한다. 제안하는 방식은 수신단에 도착한 패킷 헤더정보를 이용해 네트워크 지터를 추정하고, 추정된 지터와 지터버퍼와 음성프레임버퍼에 존재하는 패킷수 및 음성프레임 개수, 음성클래스정보에 따라 음성프레임의 길이를 변화시켜 재생시킴으로써 수신단의 버퍼링 지연을 줄이고 출력신호의 음성왜곡을 최소화한다. 제안하는 스케줄링 방식의 성능측정을 위해 버퍼링 지연과 PESQ를 기존 음성패킷 재생 스케줄링 방식과 비교한다.

  • PDF

Efficient Codebook Search Method for AMR Wideband Speech Codec (광대역 AMR 음성 압축기를 위한 효율적인 코드북 검색 방법)

  • 김윤희;박호종
    • The Journal of the Acoustical Society of Korea
    • /
    • v.22 no.4
    • /
    • pp.308-314
    • /
    • 2003
  • Wideband speech communications with 7㎑ bandwidth can provide high-quality speech services that are almost impossible with current narrow-band speech communications with 3.4 ㎑ bandwidth, and AMR wideband codec was recently developed for these services. The performance of AMR wideband codec is excellent due to its wideband information and partially to ACELP structure, but it requires high computational complexity especially in codebook search. In this paper, to solve this problem, an efficient codebook search method for AMR wideband codec is proposed. The proposed method first determines the coarse initial codevector, then improves the performance of codevector by replacing a poor pulse in codevector with better one iteratively. Simulations show that AMR wideband codec with proposed codebook search method has higher performance with much less computational cost than conventional AMR wideband codec.

Text-to-speech with linear spectrogram prediction for quality and speed improvement (음질 및 속도 향상을 위한 선형 스펙트로그램 활용 Text-to-speech)

  • Yoon, Hyebin
    • Phonetics and Speech Sciences
    • /
    • v.13 no.3
    • /
    • pp.71-78
    • /
    • 2021
  • Most neural-network-based speech synthesis models utilize neural vocoders to convert mel-scaled spectrograms into high-quality, human-like voices. However, neural vocoders combined with mel-scaled spectrogram prediction models demand considerable computer memory and time during the training phase and are subject to slow inference speeds in an environment where GPU is not used. This problem does not arise in linear spectrogram prediction models, as they do not use neural vocoders, but these models suffer from low voice quality. As a solution, this paper proposes a Tacotron 2 and Transformer-based linear spectrogram prediction model that produces high-quality speech and does not use neural vocoders. Experiments suggest that this model can serve as the foundation of a high-quality text-to-speech model with fast inference speed.

Digital Speech Communication Simulator (디지털 통신시스템의 음성 전달 Simulator 개발)

  • Choi Younchang;Cha Sungho;Park Hochong
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.63-66
    • /
    • 2000
  • 고품질의 디지털 이동 통신 서비스를 제공하기 위해서는 다양한 통신 상황 및 통신 경로에 대한 음질의 검증이 필요하다. 그러나 다양한 환경에서의 음질 측정을 위하여 실제 통신 시스템 환경을 구축하는 것은 시간과 비용이 많이 드는 문제점을 가진다. 이러한 문제점들을 해결하기 위하여 본 논문에서는 디지털 이동 통신시스템의 End-to-End 음성 전달 과정 전체를 Software로 Simulation하는 Simulator를 개발하였으며. 이를 통하여 통신 환경과 경로에 따른 통신 시스템의 통화 품질을 매우 간단하게 측정할 수 있다.

  • PDF

Systematic Quality Assurance Activity for TDX-10 ISDN Switching System (TDX-10 ISDN 시스템의 시험 및 평가분석 체계화에 따른 품질보증 활동)

  • Lee, Haeryong;Jeong, Taegwon
    • Journal of Korean Society for Quality Management
    • /
    • v.23 no.1
    • /
    • pp.127-141
    • /
    • 1995
  • 대용량 ISDN(Integrated Services Digital Network)용 전전자 교환기 TDX-10 연구개발 사업의 궁극적 목적은 미래 통신망이 요구하는 다양한 음성 및 비음성 정보통신 서비스를 제공하고 정보의 교환, 가공, 축적 및 처리에 고도의 융통성을 부여할 수 있는 국내표준 전전자 교환기를 개발하여 통신투자의 경제적 통신운영기술 자립화를 달성하는데 있다. 현재 대용량 전전자 교환기인 TDX-10 ISDN의 상용화 단계의 마무리 업무가 진행중이며, 통신서비스의 다양화, 광대역화, 고속화를 위한 광대역통신망의 주축이 되는 ATM교환기가 개발중에 있다. 본 고에서는 TDX-10 ISDN 시스템개발단계에서 구현된 시스템 시험수행 과정 및 평가작업을 토대로한 체계적이며 전략적인 품질보증 활동에 관해 기술하였으며, 신뢰성 있는 시험결과를 도출할 수 있는 다양한 시험관리 기법과 그 결과를 분석하고 차후 시험 및 보완작업을 위한 제반 활동체계가 소개된다.

  • PDF

The Criterion of Speech Quality Measurement for VoIP (VoIP를 위한 음질 평가 기준 연구)

  • Cho A Seo;Park Sang Wook;Park Young Chul;Youn Dae Hee
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.221-224
    • /
    • 2002
  • VoIP 음성 통신 시스템에서 통화를 할 때, 네트워크 상황이 나빠짐에 따라 시간 지연, 패킷 손실, 지터 등의 QoS 파라미터에 의한 영향이 발생하므로 통화 품질이 떨어지게 된다 통화 품질을 개선하기 위해서는 통화 품질과 QoS 파라미터와의 관계를 명확히 파악하고 그에 대한 개선 방법을 연구해야 한다. 따라서 본 논문에서는 통화 품질과 QoS 파라미터와의 상관관계를 회귀 분석을 통해 도출해 내었다. 제시된 음질 평가 기준은 QoS 파라미터만을 가지고 음질을 예측하기 때문에 계산량이 매우 적으며, 음질 평가 수행 중에 음성 통신 시스템에 거의 영향을 미치지 않는다는 장점을 가지고 있다.

  • PDF