• Title/Summary/Keyword: 음성 특성

Search Result 1,834, Processing Time 0.026 seconds

On Realizing the Predictor for the Waveform Coding of Speech Signals by using the Dual First Order Autocorrelation (쌍 1차 자기상관관계를 이용한 음성 파형부호화용 예측기의 구현 -쌍 1차 차분값과 시그마-델타 기법을 적용 -)

  • 이미숙;배명진;이주헌
    • The Journal of the Acoustical Society of Korea
    • /
    • v.11 no.1E
    • /
    • pp.23-29
    • /
    • 1992
  • 음성파형은 인근 표본값들 사이에 높은 상관관계를 나타낸다. 음성신호의 상관관계를 증가시키 기 위한 한 방법으로는 부호화하기 전에 입력신호를 단순히 적분시키는 방법이다. 이 적분된 rqkt들은 수신기에서 일반 미분기에 의해 제거될 수 있다. 이렇게 하면 음성신호의 저역주파수가 강조되고 인근 표본값의 자기 상관관계가 증가된다. 이런 과정을 시그마-델타 기법이라 한다. 이 논문에서는 그러한 시 그마-델타의 특성을 사용하는 예측기를 새로이 제안한다. 즉, 부호화하기 전에 입력신호를 적분하고 인 근한 과거 및 미래의 두 표본을 사용하여 적분된 현재표본을 예측한다. 제안된 예측기는 CCITT-권고 형 ADPCM의 평균 예측이득보다 8.65db 높게 얻어졌다.

  • PDF

Design and implementation of Voice Transmission System using Open Source Hardware and Event based Non-Blocking I/O Algorithm (오픈소스 하드웨어와 이벤트 기반 논 블로킹 I/O 알고리즘을 활용한 음성송출 시스템 설계 및 구현)

  • Kim, HyungWoo;Lee, Hyun Dong
    • Smart Media Journal
    • /
    • v.9 no.3
    • /
    • pp.116-121
    • /
    • 2020
  • Digital Information Display and KIOSK have a problem that initial introduction cost and maintenance cost due to the development cost of dedicated contents and installation cost are high due to the characteristics of the product. In order to solve these problems, We designed and implemented of voice transmission system using Open Source Hardware and Event based Non-Blocking I/O Algorithm.

Improving Noise Performance of CS-ACELP Coder by Energy Matching Method (에너지정합방법을 이용한 CS-ACELP 음성부호화기의 잡음특성 개선)

  • 이행우;박기영;김종교
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.26 no.8B
    • /
    • pp.1070-1077
    • /
    • 2001
  • 본 논문은 여러 배경잡음에서 높은 성능을 나타내는 8 kbps CS-ACELP 부호화기의 음질개선방법에 관한 것이다. 파형정합방법을 이용하는 기존의 CELP 부호화기가 순수한 음성신호에 대해서는 우수한 음질을 제공하지만, 배경잡음에 대해서는 큰 음질저하를 가져온다. 따라서 본 논문에서는 음성신호뿐만 아니라 이러한 배경잡음에 대해서도 우수한 음질을 달성하는 에너지정합방법을 소개한다. 이 방법은 부가적인 비트를 요구하지 않으면서 효과적으로 음질을 개선한다. 실험 결과, 객관적 평가에서는 MSEGSNR이 0.01∼1.1dB 증가하였고, 주관적 평가에서는 MOS 점수가 평균 0.2, 최대 0.5점까지 증가하는 것으로 나타났다. 따라서 PPS 알고리즘을 적용한 부호화기의 음질이 최대 12%까지 향상되는 것으로 확인되었다.

  • PDF

Design and Implementation of the Multi-Point Chatting Program (MPEG4를 이용한 다자간 멀티미디어 채팅 프로그램 설계 및 구현)

  • 이봉하;윤교철;김영만
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10c
    • /
    • pp.766-768
    • /
    • 2001
  • 본 논문에서는 MPEG4 표준에 의거한 멀티미디어 응용프로그램인 다자간 채팅 프로그램을 설계 구현하였다. 다자간 멀티미디어 채팅 프로그램의 영상모듈과 음성모듈은 데이터 성격상 큰 차이를 가지고 있어서 별개의 정보처리 및 전송 모델을 적용하여 설계, 구현하였다. 영상모듈은 분산처리 모델을 적용하여 실제 채팅 시에는 영상 정보를 멀티캐스트로 클라이언트간 직접 통신을 하도록 하였다. 멀티캐스트 방식은 송신자 측에서 여러 수신자 측에게 한 번에 메시지가 전송되도록 하여, 데이터의 중복전송으로 인한 네트워크 자원의 낭비를 최소화할 수 있게 된다. 반면 음성모듈은 Client-Server 모델을 적용하여 설계, 구현하였다. 음성처리 서버는 영상처리 서버와 달리 서버에서 각 클라이언트의 음성정보들을 합성하는 mixing작업을 수행하여 그 결과를 각 클라이언트로 전송하게 된다. 즉, 각 데이터 특성에 적합한 정보모델을 사용하여 다자간 채팅 프로그램을 설계, 구현하였다.

  • PDF

A Comparison & Analysis About Router's Queueing Mechanism for UDP Voice Traffic in MPLS network (MPLS 망에서 UDP 음성트래픽을 제공하기 위한 라우터의 큐잉 방식에 관한 비교분석)

  • Kwon, Gi-Bum;Chong, Il-Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.10b
    • /
    • pp.1629-1632
    • /
    • 2000
  • 인터넷 트래픽의 폭발적인 증가로 인해 라우터에서 목적지로 포워딩 해야 할 트래픽의 양도 함께 증가하게 되었다. 그와 같은 트래픽들 중에 최근에 급격히 증가하고 있는 음성트래픽의 주를 이루는 것이 바로 인터넷 전화로 발생되는 트래픽들이다. 본 논문에서는 인터넷 전화시 발생하는 음성트래픽의 특성에 대해 살펴보고, 라우터에서 트래픽 폭주시 이를 제어하는 큐잉 방식을 비교분석하고, MNS(MPLS Network Simulation)툴을 이용하여 코어망을 MPLS 네트워크로 구성한 후 UDP 음성트래픽을 생성하여 각 라우터(LSR: Label Switch Router)의 버퍼에서 요구되어지는 폭주제어기법들에 대해 시뮬레이션을 하여 그것을 통해 얻은 결과를 바탕으로 실제 인터넷 전화 시스템의 통화품질에 적절하게 대처할 수 있는 큐잉 기법을 고찰한다.

  • PDF

A Study on the Performance Improvement of Connected Digit Telephone Speech Recognition (연속 숫자음 전화음성의 인식 성능 향상에 관한 연구)

  • Kim Min Sung;Jung Sung Yun;Son Jong Mok;Bae Keun Sung
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.143-146
    • /
    • 2002
  • 전화음성의 경우 전화 회선의 채널 대역폭 제한과 통화로 형성시 달라지는 채널의 특성으로 인하여 마이크 음성에 비하여 인식 성능이 많이 저하된다. 본 연구에서는 연속 숫자음 전화음성의 인식율 향상을 위해 채널 왜곡 보상 기법들을 적용하고, HTK 기반의 인식 실험을 통해 보상 기법에 따른 인식 성능을 비교하였다. 채널 왜곡 보상 기법으로 CMN, RASTA, RTCN 등을 적용하고, 각 보상 기법에 따라 HMM의 state 수, mixture 수를 바꾸어 가며 인식 실험한 결과를 제시한다.

  • PDF

Speaker Indexing using Vowel Based Speaker Identification Model (모음 기반 하자 식별 모델을 이용한 화자 인덱싱)

  • Kum Ji Soo;Park Chan Ho;Lee Hyon Soo
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.151-154
    • /
    • 2002
  • 본 논문에서는 음성 데이터에서 동일한 화자의 음성 구간을 찾아내는 화자 인덱싱(Speaker Indexing) 기술 중 사전 화자 모델링 과정을 통한 인덱싱 방법을 제안하고 실험하였다. 제안한 인덱싱 방법은 문장 독립(Text Independent) 화자 식별(Speaker Identification)에 사용할 수 있는 모음(Vowel)에 대해 특징 파라미터를 추출하고, 이를 바탕으로 화자별 모델을 구성하였다. 인덱싱은 음성 구간에서 모음의 위치를 검출하고, 구성한 화자 모델과의 거리 계산을 통하여 가장 가까운 모델을 식별된 결과로 한다. 그리고 식별된 결과는 화자 구간 변화와 음성 데이터의 특성을 바탕으로 필터링 과정을 거쳐 최종적인 인덱싱 결과를 얻는다. 화자 인덱싱 실험 대상으로 방송 뉴스를 녹음하여 10명의 화자 모델을 구성하였고, 인덱싱 실험을 수행한 결과 $91.8\%$의 화자 인덱싱 성능을 얻었다.

  • PDF

Review of Standard Sound Quality Assessment Methods for the Transmitted and Processed Sounds (음질 평가법의 표준과 연구 동향 - 전송 처리음 분야)

  • Oh, Wongeun
    • The Journal of the Acoustical Society of Korea
    • /
    • v.32 no.3
    • /
    • pp.214-226
    • /
    • 2013
  • Assessing the quality of audio signals is an important consideration in making high quality sounds and various methods have been developed. This paper provides a general framework of sound quality and a technical overview of the international standard methods which are described in ITU-T, ITU-R, IEC and ANSI Recommendations in the speech intelligibility, speech quality, and audio quality areas. In addition, some recent findings and future works are included.

On the Development of a Continuous Speech Recognition System using Continuous Hidden Markov Model for Korean Language (연속분포 HMM을 이용한 한국어 연속 음성 인식 시스템 개발)

  • Kim, Do-Yeong;Park, Yong-Kyu;Kwon, Oh-Wook;Un, Chong-Kwan
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.101-110
    • /
    • 1993
  • 본 논문에서는 연속분포 hidden Markov 모델을 이용한 화자독립 연속 음성 인식 시스템에 관해 기술한다. 연속분포 모델은 평균과 분산 벡터로 구성되며 음성신호를 직접 모델링하여 양자화 왜곡이 없어진다. 특징벡터는 filter bank 계수 및 그 1, 2차 미분계수를 사용하여 음성신호의 동적 특성을 반영하였다. Segmental K-means 알고리즘을 이용하여 학습하였으며, 연속어 인식에서 가장 문제가 되는 조음화 현상으로 인한 인식률 저하를 막기 위해 앞뒤의 음소를 고려해 주는 triphone을 인식단위로 사용하였다. Search 알고리즘으로는 시간 면에서 효율이 좋은 one-pass search 알고리즘을 사용하였다. 성능 평가를 위한 화자 독립 인식 실험에서 문법이 없을 경우 83%, finite state network율 적용한 경우에는 94%의 인식률을 나타내었다.

  • PDF

A Study on the Reduction of LSP Transformation Time by Adjustment of Search Band (검색구간 조절에 의한 LSP 변환시간 감소에 관한 연구)

  • Min, So-Yeon;Bae, Myung-Jin
    • Proceedings of the KAIS Fall Conference
    • /
    • 2006.11a
    • /
    • pp.208-211
    • /
    • 2006
  • 일정한 스펙트럼 민감도와 낮은 스펙트럼 왜곡을 보이고 선형 보간이 용이하다는 장점을 갖는 LSP 파라미터는 음성코덱(codec)이나 인식기에서 음성신호를 분석하여 전송형이나 저장형 파라미터로 변환되어, 주로 저전송률 음성부호화기에 사용된다. 그러나 LPC 계수를 LSP로 변환하는 방법이 복잡하여 계산시간이 많이 소요된다는 단점이 있다. 기존의 LSP 변환 방법 중 음성 부호화기에서 주로 사용하는 real root 방법은 근을 구하기 위해 주파수 영역을 순차적으로 검색하기 때문에 계산시간이 많이 소요되는 단점을 갖는다. 본 논문에서 제안하는 알고리즘은 LSP 분포 특성에 따라 검색구간의 순서와 검색간격을 달리하며, 제1 포만트와 제2 포만트의 연관성을 고려하여 검색구간을 조절한다. 기존의 real root 방법과 제안한 방법을 비교한 결과 검색시간이 평균 48.13% 단축되었다.

  • PDF