• Title/Summary/Keyword: 음성압축

Search Result 218, Processing Time 0.028 seconds

인터넷을 통한 멀티미디어 의료 정보 전달

  • 김경섭;윤태호;송철규
    • 전기의세계
    • /
    • v.53 no.4
    • /
    • pp.59-61
    • /
    • 2004
  • 컴퓨터 기술의 발전과 데이터 압축 및 전송 기술의 발달로 인하여, 인터넷을 통하여 실시간으로 전송된 음성, 비디오, 생체 신호, 문자, 처방, 의료 영상 등으로 이루어진 멀티미디어 의료 정보가 임상 진료, 의학 연구 및 교육에 활용되고 있다.(중략)

  • PDF

Syllable Recognition of HMM using Segment Dimension Compression (세그먼트 차원압축을 이용한 HMM의 음절인식)

  • Kim, Joo-Sung;Lee, Yang-Woo;Hur, Kang-In;Ahn, Jum-Young
    • The Journal of the Acoustical Society of Korea
    • /
    • v.15 no.2
    • /
    • pp.40-48
    • /
    • 1996
  • In this paper, a 40 dimensional segment vector with 4 frame and 7 frame width in every monosyllable interval was compressed into a 10, 14, 20 dimensional vector using K-L expansion and neural networks, and these was used to speech recognition feature parameter for CHMM. And we also compared them with CHMM added as feature parameter to the discrete duration time, the regression coefficients and the mixture distribution. In recognition test at 100 monosyllable, recognition rates of CHMM +${\bigtriangleup}$MCEP, CHMM +MIX and CHMM +DD respectively improve 1.4%, 2.36% and 2.78% over 85.19% of CHMM. And those using vector compressed by K-L expansion are less than MCEP + ${\bigtriangleup}$MCEP but those using K-L + MCEP, K-L + ${\bigtriangleup}$MCEP are almost same. Neural networks reflect more the speech dynamic variety than K-L expansion because they use the sigmoid function for the non-linear transform. Recognition rates using vector compressed by neural networks are higher than those using of K-L expansion and other methods.

  • PDF

A Preprocessing Approach to Improving the Quality of the Music Produced by the EVRC (EVRC 코덱으로 재생하는 음악의 품질을 개선하기 위한 전처리 기법)

  • 남영한;하태균;전윤호;김재수;박섭형
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.28 no.5C
    • /
    • pp.476-485
    • /
    • 2003
  • This paper proposers a preprocessing approach to improving the quality of the music produced by the EVRC(enhanced variable rate codec) which is one of the CDMA(Code Division Multiple Access) voice codecs. Since the EVRC is optimized only for speech signals, it can deteriorate the quality of the music passed through it. One of the problems with the EVRC-coded music is time-clipping, which usually occurs when subsequent frames are encoded at Rate l/8. Since the EVRC determines the bit rate for an input frame based on the long-term prediction gain, we increase the long-term prediction gain in order for the most of the frames to be encoded at Rate 1 or Rate 1/2. Experimental results show that the approach works well on music signals and the number of time-clipped frames is considerably reduced.

Analysis of transmission packet size and codec for enhancing the VoIP voice quality (VoIP 음성품질 개선을 위한 전송패킷의 크기와 코덱분석)

  • Kim Yong-Seok;Park Jong-An
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.05a
    • /
    • pp.639-642
    • /
    • 2006
  • 본 논문에서는 다양한 서비스가 운용되고 있는 인터넷 망에서 PCM 및 ADPCM으로 압축된 음성데이터를 전송할 경우에 발생하는 패킷 크기와 한계 지연시간의 변화가 수신측의 음질에 미치는 영향을 분석하였다. 이를 기반으로 주어진 한계 지연시간에 대하여 적절한 음질을 제공하기 위한 전송패킷의 크기에 대하여 분석하여 적절한 코덱 선택 방법을 제안하였다. 제안된 방법의 실험결과를 입증하기 위해 음질 평가인 MOS평가 방법을 사용했으며 측정방법으로는 서울을 중심으로 전국5개 지역 지점별 5회 측정 각 지점의 임의 번호를 서울 콜 센터로 Call Forwarding 설정 후 측정하고, VQT은 PAMS 알고리즘과 ADRA(Audio Direction Reference Audio)를 사용하여 측정한 결과 음성코덱의 데이터비와 Datagram size에 의해 음성 품질이 달라짐과 적절한 코덱 선택방법임을 확인하였다.

  • PDF

Quantization on Wideband Speech Codec for Next Generation Packet Phone (차세대 패킷 전화용 광대역 음성 부호화기의 양자화에 대한 연구)

  • Kim Youngvo;Jeong Byounghak;Park Hochong
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.81-84
    • /
    • 2004
  • 패킷망을 통한 음성 통신이 발달됨에 따라 패킷 스위칭 채널 환경에서 계층적 구조를 가지는 광대역 음성 부호화기의 개발에 대한 요구가 늘어나고 있다. 본 논문에서는 이러한 차세대 패킷 전화용 광대역 음성 부호화기의 상위 대역에 대해서 효율적인 양자화 방법을 제안한다. 먼저 전체 프레임을 다수의 짧은 부프레임으로 구분하고, 각각의 부프레임에 MLT(Modulated Lapped Transform)변환을 적용하여 주파수 영역으로 변환하여 2차원 구조의 데이터 행렬을 생성한다. 이러한 2차원 구조의 데이터를 크기와 부호로 분리하고, 크기는 2차원 DCT를 사용하여 시간과 주파수 영역에서의 신호 압축을 동시에 얻을 수 있게 하였다. 이와 같은 새로운 구조를 활용하여 기존의 방법보다 Energy Compaction 효과를 높이고 양자화 성능을 향상시킬 수 있었다. 또한 Core Layer의 부호화된 파라미터를 상위 대역의 양자화에 이용함으로써 그 성능을 향상시킬 수 있는 방법을 제안한다.

  • PDF

Design and Implementation of RISC Processor for Speech Coding (음성부호 처리에 적합한 RISC 프로세서의 설계 및 구현)

  • Kim, Jin;Lee, Jun-Yong
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10c
    • /
    • pp.18-20
    • /
    • 2000
  • 디지털 음성통신을 위한 빠르고 쉬운 내장 프로세서(Embedded processor)가 요구되어짐에 따라 음성신호 압축 복원 알고리즘인 ADPCM과 LD-CELP의 구현에 가장 빈번히 사용되는 연산의 특성을 조사하였다. ARM6 processor core의 기본 구성요소들과 명령어집합을 기반으로 하여 음성부호화 알고리즘의 연산의 특성을 효율적으로 처리하기 위한 명령어와 구조를 추가한 범용 프로세서의 구조를 제안하고 VHDL로 기술하여 동작을 검증하였다. ARM6의 ALU logic에 leading zero count를 위한 회로를 추가하였고 opcode를 변경하였으며, LPC 계수 연산을 위해 제안된 MAC을 도입하여 효율적인 구현이 가능하도록 설계하였다.

  • PDF

A Study on the USAC Transport Mechanism for Digital Audio Broadcasting Plus (USAC 의 DAB+ 전송 방안에 관한 연구)

  • Yang, Kyutae;Beack, Seungkwon;Lee, Bongho;Lim, Hyoungsoo
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2015.07a
    • /
    • pp.28-31
    • /
    • 2015
  • 본 논문에서는 음성 및 음악 모두에 대해 최고의 품질을 제공하는 최신 오디오 코덱인 USAC 을 DAB+에 적용하기 위한 전송 방안을 제안한다. 기존 DAB+는 AAC+ v2 로 불리는 HE-AAC v2 (High Efficiency Advanced Audio Coding version 2) 오디오 코덱을 사용하였다. 하지만 AAC+ v2 는 낮은 데이터 전송률에서 음악에서는 좋은 품질을 제공하나 음성에서는 상대적으로 품질이 떨어지는 단점이 있다. 반면 USAC 은 낮은 데이터 전송률에서 음악 및 음성에 모두 좋은 품질과 높은 압축 성능을 제공할 수 있는 최신 오디오 코덱 기술이다. USAC 의 성능을 최대한 보장하기 위해서는 DAB+와 달리 VBR 을 적용하는 효과적이다. 따라서 본 논문에서는 USAC VBR 스트림을 DAB+에 전송하는 방안을 제안한다. 제안된 전송 방안을 적용할 경우 최적의 음악 및 음성 품질을 효율적으로 제공할 수가 있다.

  • PDF

Web-conferencing System Application using Internet (인터넷을 이용한 웹 컨퍼런싱 시스템의 응용)

  • 이소영;박만곤
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2000.11a
    • /
    • pp.377-381
    • /
    • 2000
  • 하루가 다르게 변하고 있는 디지털, 정보화 시대의 네트워크회된 컴퓨터 시스템과 초고속 통신망의 대중화와 함께 정보통신 기술이 급속도로 발달함에 따라 원격지 상호간에 단순히 문자나 음성만을 전송하던 방식에서 화상, 음성, 문자, 그래픽 등을 동시에 전송하는 비디오 컨퍼런싱에 대한 관심이 상당히 높아졌다. 비디오 컨퍼런싱은 음성과 동영상을 이용한 회의방식으로 화상, 음성, 문자, 그래픽 등의 동화상 정보를 최신 멀티미디어 기술을 기반으로 한 컴퓨터, 코덱, 비디오 능의 상비를 이용하여 압축한 후, 디지털 통신에 적합하게 변환하여 실시간 양방향으로 전송하는 첨단 회의 방식이다. 이러한 기존의 MCU 상비를 사용하던 고가의 룸형 비디오 컨퍼런싱을 탈피하여 최근, 일반 사용자들을 위해 단지 웹브라우저와 카메라, 마이크, 스피커만을 사용하여 실시간 회의가 가능한 웹을 이용한 웹 컨퍼런싱 개념이 많이 부각되고 있고 또한 대중화를 위해 한발 다가서고 있다. 본 논문에서는 이러한 웹 컨퍼런싱의 현 상황과 응용들에 대해서 알아보고자 한다.

  • PDF