Search | Korea Science

Design of Multi Rate Wideband Speech Coder Using the AMR(Adaptive Multi-Rate) Coder (AMR 부호화기와 결합된 다전송률 광대역 음성부호화기 설계)

김은주;이호창;이인성
- Proceedings of the IEEK Conference
- /
- 2000.09a
- /
- pp.755-758
- /
- 2000
본 논문에서는 AMR(Adaptive Multi-Rate)를 이용하여 광대역 음성부호화기를 설계하였다. 16kHz로 샘플링 된 입력 신호를 QMF 필터에 의해 두 개의 대역으로 나누어, 각각 decimation하여 두 개의 8kHz 샘플링 신호로 변환시킨 후 저대역(0Hz-3400Hz)의 신호와 고대역(3400Hz -7000Hz)의 신호로 나누어 각각 부호화한다. 나누어진 두 개의 협대역 음성신호는 AMR(Adaptive Multi-Rate)과 ATC(Adaptive Transform Coding)을 사용하여 각각 부호화되어 전송된다. 두 대역으로부터 부호화된 정보는 20.2kbps에서 12.75kbps까지의 전송률을 갖고, 수신단에서는 각 대역을 AMR과ATC방법으로 역부호화하여 음성신호를 합성한다. 설계된 광대역 음성부호화기의 성능을 평가하기 위해 ITU-T의 표준안인 G.722를 포함하여 MOS 시험을 하였다.
PDF

Design of Multi Rate Wideband Speech Coder Using the AMR(Adaptive Multi-Rate) Coder (AMR 부호화기와 결합된 다전송률 광대역 음성부호화기 설계)

김은주;이인성
- The Journal of Korean Institute of Communications and Information Sciences
- /
- v.26 no.5B
- /
- pp.632-638
- /
- 2001
본 논문에서는 AMR(Adaptive Multi-Rate)를 이용하여 광대역 음성부호화기를 설계하였다. 16kHz로 샘플링된 입력 신호를 QMF 필터에 의해 두 개의 대역으로 나누어, 각각 decimation하여 두 개의 8kHz 샘플링 신호로 변환시킨 후 저대역(0Hz-3400Hz)의 신호와 고대역(3400Hz∼7000Hz)의 신호로 나누어 각각 부호화한다. 나누어진 두 개의 협대역 음성신호는 AMR(Adaptive Multi-Rate)과 ATC(Adaptive Transform Coding)을 사용하여 각각 부호화되어 전송된다. 두 대역으로부터 부호화된 정보는 20.2kbps에서 12.75kbps까지의 전송률을 갖고, 수신단에서는 각 대역을 AMR과 ATC 방법으로 역부호화하여 음성신호를 합성한다. 설계된 광대역 음성부호화기의 성능을 평가하기 위해 ITU-T의 표준안인 G.722를 포함하여 MOS 시험을 하였다.
PDF

A Study on Performance of Voice Activity Detector in Vocoder (이동통신부호화기에서의 음성 활동 검출 장치 성능에 관한 연구)

Lim, Ji-Sun
- Proceedings of the KAIS Fall Conference
- /
- 2010.05a
- /
- pp.241-244
- /
- 2010
ITU-T에서 인터넷 폰과 화상회의에 사용하기 위하여 개발된 G.723.1 음성 부호화기는 잡음 구간에서의 전송률을 낮추기 위한 방법으로 VAD(Voice Activity Detector)와 CNG(Comfort Noise Generator)를 사용하고 있다. 여기서 VAD는 최종적으로 현재 프레임의 에너지 레벨을 비교하여 음성의 활동 유무를 판정하고 있다. 하지만 G.723.1 VAD에서는 보다 안정적인 판정을 위해 음성 활동 구간 사이에 삽입되어 있는 묵음 구간에 대해서는 거의 대부분 음성이 활동하는 영역으로 판정을 하고 있다. 본 논문에서는 묵음 구간에 대해 보다 정확한 판정을 통하여 기존의 방법에 비해 전송율을 더욱 감소시킬 수 있는 방법을 제안한다. 실험에서는 묵음구간을 길게 조절한 문장을 사용하여 측정한 결과 약 50% 정도의 전송율을 감소시킬 수 있었으며, MOS 테스트 결과, 음질의 열하는 발생하지 않았다.
PDF

Research of Improving the Performance of Voice Activity Detector in Vocoder (음성부호화기에서의 VAD 성능 향상 연구)

Min, So-Yeon;Lee, Kwang-Hyoung;Bae, Myung-Jin
- Proceedings of the KAIS Fall Conference
- /
- 2007.11a
- /
- pp.194-197
- /
- 2007
.ITU-T 국제 표준화 기구에서 인터넷 폰과 화상회의를 목적으로 개발된 G.723.1 음성 부호화기는 잡음구간에서의 전송률을 낮추기 위한 방법으로 VAD(Voice Activity Detector)와 CNG(Comfort Noise Generator)를 사용하고 있다. 이중 VAD는 최종적으로 현재 프레임의 에너지 레벨을 비교하여 음성의 활동 유무를 판정하고 있다. 하지만 G.723.1 VAD에서는 보다 안정적인 판정을 위해 음성 활동 구간 사이에 삽입되어 있는 묵음 구간에 대해서는 거의 대부분 음성이 활동하는 영역으로 판정을 하고 있다. 따라서 본 논문에서는 묵음 구간에 대해 보다 정확한 판정을 통하여 기존의 방법에 비해 전송율을 더욱 감소시킬 수 있는 방법을 제안한다. 실험에서는 묵음구간을 길게 조절한 문장을 사용하여 측정한 결과, 약 47% 정도의 전송율을 감소시킬 수 있었으며, MOS test 결과, 음질의 열하는 거의 발생하지 않았다.
PDF

An Analysis and modeling of Mobile If network for the services of Mobility in SIP (SIP 기반의 VoIP Network 환경에서의 이동성 지원을 위한 Mobile IP적용 및 성능평가)

Eom, Ki-Bok;Yoe, Hyun
- Proceedings of the Korean Institute of Information and Commucation Sciences Conference
- /
- 2002.11a
- /
- pp.283-287
- /
- 2002
VoIP는 음성을 패킷 형태로 통합하여 real time으로 전송하는 기술이다. 최근 VoIP(Voice Internet Protocol)은 음성과 데이터를 통합하는 핵심 기술로 발전하고 있다. VoIP 구현을 위해 현재 가장 많이 사용되는 시그널링 프로토콜들은 H.323, SIP, MGCP, MEGACO 등이 있으며 현재 ITU-T의 H.323 프로토콜을 중심으로 서비스가 진행되고 있지만 많은 기능성과 확장성을 지닌 IETF의 SIP 프로토콜이 보편화될 것으로 예상된다. 본 논문에서는 이동 사용자를 고려하여 VoIP와 Mobile IP를 결합하여 성능 평가를 하였다. Mobile IP는 Mobie host가 인터넷상에서 임의의 위치에 접속하더라도 자신의 고유 주소로 전송되는 패킷을 수신 할 수 있도록 IP 프로토콜을 확장한 기술이다. 이러한 요구를 반영하기 위하여 본 논문에서는 이동 음성 서비스를 위한 H.323/SIP기반 Mobile IP 네트워크를 모델링 한 후 성능평가를 실시하였다.
PDF

An Effective Transmission for Vice Traffic in UWB Mobile Ad Hoc Network (UWB 전술망에서의 효과적인 음성 데이터 전송)

Kim, Jong-Hwan;Koo, Myung-Hyun;Lee, Hyunseok;Shin, Jeong-Ho
- The Journal of Korean Institute of Communications and Information Sciences
- /
- v.38B no.4
- /
- pp.279-290
- /
- 2013
In this paper, we propose a transmission scheme of MAC protocol that enables secure voice communications by exploiting the wide spectrum and low signal strength characteristics of the ultra wide band technology. In addition, it also supports high level of terminal mobility by deploying mobile ad hoc network schemes. While most of existing UWB MAC protocols are operated as a synchronous mode, the proposed scheme operates in an asynchronous mode for supporting high mobility and sends voice packets without RTS/CTS control packets for efficient voice traffic transmission without retransmission. With simulation program, we prove that the proposed scheme satisfies the required voice quality and packet delivery time.
https://doi.org/10.7840/kics.2013.38B.4.279 인용 PDF KSCI

Design of a Statistical Model Based Voice Activity Detector (통계적 모델에 근거한 음성 검출기의 설계)

손종서
- Proceedings of the Acoustical Society of Korea Conference
- /
- 1998.08a
- /
- pp.465-469
- /
- 1998
가변 전송율 음성 부호화기를 위한 음성 검출기를 통계적 모델을 적용하여 설계한다. 제안된 음성 검출기는 음성 파라미터를 decision-directed 방식으로 추정함으로써 LRT를 이용하여 동작 특성이 우수한 판정 규칙을 유도한다. 또한 음성 발생 사건들을 1차의 Markov process 로 모델링 함으로써 과거의 관찰들을 현재 프레임의 음성 검출 과정에서 고려할 수 있는 행오버 알고리즘을 개발한다. 개발된 음성 검출기는 고려된 실험환경에서 ITU-T 표준인 G.729 Annex B 음성 검출기보다 맹 우수한 성능을 나타내었다.
PDF

A Speech Emotion Recognition System for Audience Response Collection (관객 반응정보 수집을 위한 음성신호 기반 감정인식 시스템)

Kang, Jin Ah;Kim, Hong Kook
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2013.06a
- /
- pp.56-57
- /
- 2013
본 논문에서는 연극공연을 관람하는 관객의 반응정보를 수집하기 위하여, 청각센서를 통해 관객의 음성을 획득하고 획득된 음성에 대한 감정을 예측하여 관객 반응정보 관리시스템에 전송하는 음성신호 기반 감정인식 시스템을 구현한다. 이를 위해, 관객용 헤드셋 마이크와 다채널 녹음장치를 이용하여 관객음성을 획득하는 인터페이스와 음성신호의 특징벡터를 추출하여 SVM (support vector machine) 분류기에 의해 감정을 예측하는 시스템을 구현하고, 이를 관객 반응정보 수집 시스템에 적용한다. 실험결과, 구현된 시스템은 6가지 감정음성 데이터를 활용한 성능평가에서 62.5%의 인식률을 보였고, 실제 연극공연 환경에서 획득된 관객음성과 감정인식 결과를 관객 반응정보 수집 시스템에 전송함을 확인하였다.
PDF

A MAC Protocol for Voice/Data Integrated Services Using R_ALOHA Scheme In Wideband Wireless Networks (광대역 무선망에서 R_ALOHA 기법을 적용한 음성/데이타 통합 서비스 UC 프로토콜)

임인택
- Journal of the Korea Institute of Information and Communication Engineering
- /
- v.3 no.1
- /
- pp.155-162
- /
- 1999
In this paper, an R_ALOHA_CDMA protocol is proposed for voice and data integrated services in the hybrid TDMA/CDMA wireless networks. In the hybrid TDMA/CDMA systems, the backward logical channels are composed of time slots with multiple spreading codes per slot. In the proposed protocol, a voice terminal can reserve a spreading code to transmit voice packets during a talkspurt. On the other hand, whenever a data terminal generates a packet, it transmits the packet through one of the available spreading codes. Throughout the results, it is shown that the system capacity increases in proportion to the number of spreading codes.
PDF

Enhanced Adjustment Strategy of Masking Threshold for Speech Signals in Low Bit-Rate Audio Coding (저전송률 오디오 부호화에서 음성 신호의 성능 개선을 위한 마스킹 임계값 적응기법 향상)

Lee, Chang-Heon;Kang, Hong-Goo
- The Journal of the Acoustical Society of Korea
- /
- v.29 no.1
- /
- pp.62-68
- /
- 2010
This paper proposes a new masking threshold adjustment strategy to improve the performance for speech signals in low bit-rate audio coding. After determining formant regions, the masking threshold is adjusted by using the energy ratio of each sub-band to the average energy of each formant. More quantization noises are added to the bands that have relatively large energy, but less distortion is allowed in spectral valley regions by allocating more bits, which reflects the concept of perceptual weighting widely used in speech coding. From the results of objective speech quality measure, we verified that the proposed method improves quality for the speech input signals compared to the conventional one.
https://doi.org/10.7776/ASK.2010.29.1.062 인용 PDF KSCI

Search Result 337, Processing Time 0.032 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)