통합 검색 | Korea Science

TMS320C6201을 이용한 적응 다중 전송율을 갖는 광대역 음성부호화기의 실시간 구현 (Real-Time Implementation of Wideband Adaptive Multi Rate (AMR-WB) Speech Codec Using TMS32OC6201)

이승원;배건성
- 한국통신학회논문지
- /
- 제29권9C호
- /
- pp.1337-1344
- /
- 2004
본 논문에서는 적응 다중 전송율을 갖는 광대역 음성부호화기인 AMR-WB 의 알고리즘을 분석하고, TI사의 고정소수점 DSP인 TMS320C6201를 이용한 실시간 구현 결과를 제시한다. AMR-WB 음성부호화기는 두 가지 대 역으로 분리된 신호가 독립적으로 부호화되며, 저대역 신호는 ACELP 방식으로、 고대역 신호는 잡음 여기신호와 선형예측 합성필터를 사용하는 방식으로 각각 합성된다. 구현된 AMR-WB 음성부호화기는 프로그램 메모리와 데이터 메모리가 각각 218 kbytes, 92kbytes의 크기를 가지며 , 한 프레임인 20 ms를 처리하는데 평균 920,267 정도의 클릭 수가 사용되어 약 5.75 ms의 시간이 소요 되였다. 또한, DSP로 구현한 AMR-WB 음성부호화기의 결과와 PC에서 시뮬레이션 한 결과가 서로 일치함을 확인하였다.
PDF KSCI

테라헤르츠 펄스의 발생 및 그 응용 (Terahertz Pulse Generation and Its Applications)

손주혁
- 한국광학회:학술대회논문집
- /
- 한국광학회 2000년도 제11회 정기총회 및 00년 동계학술발표회 논문집
- /
- pp.20-21
- /
- 2000
헤르츠가 최초로 무선통신의 가능성을 보인 이후 인류는 수 킬로헤르츠 (kHz)의 주파수를 이용하기 시작하여 메가헤르츠 (MHz) 대역에서 라디오, 텔레비젼, 음성 통신 등의 엄청난 기술적 발전으로 문명에 기여해 왔다. 이 MHz 대역이 포화하기 시작하자 더 높은 주파수의 기술을 연구하여 개인 휴대통신, 위성통신 등에 기가헤르츠 (GHz) 대역을 활용하였다. 반면에 빛이라 불리는 매우 높은 주파수의 전자기파는 뢴트겐이 X-ray를 투시 촬영기에 이용한 이래 광통신 등이 발명되어 가시광선에서 적외선까지 더 낮은 주파수 쪽으로 발전·활용되어 왔다. 이러한 광파와 마이크로 전자기파 사이의 테라헤르츠 (THz)주파수 대역 (또는 원적외선 영역 혹은 T-ray라 불림)은 많은 잠재적인 응용분야에도 불구하고 용이한 신호원의 부재로 기초적인 연구도 미비한 상태이다 (그림1 참조). (중략)
PDF

열악한 환경에 강인한 화자인증을 위한 위상 기반 특징 추출 기법 (A Phase-related Feature Extraction Method for Robust Speaker Verification)

권철홍
- 한국정보통신학회논문지
- /
- 제14권3호
- /
- pp.613-620
- /
- 2010
화자인증 시스템은 훈련 환경과 인식 환경이 다른 경우 인식 성능이 크게 저하된다. 이러한 훈련과 인식 환경의 불일치는 다양한 잡음과 상이한 채널 환경 때문이다. 본 논문은 화자인증 시스템의 강인성 개선을 위하여 음성신호의 위상에 기반한 특정 추출 기법을 제안한다. 이 방법은 음성신호의 위상으로부터 순시 주파수를 계산하여 대역별로 순시 주파수를 모두 모아 구한 히스토그램으로부터 특징 계수를 추출한다. 이 특징 파라미터를 적용한 결과 조 용한 환경뿐만 아니라 잡음환경 그리고 채널 왜곡 환경에서도 화자인증 시스템의 성능이 개선됨을 알 수 있다.
https://doi.org/10.6109/jkiice.2010.14.3.613 인용 PDF KSCI

G.729.1 광대역 멀티코덱 표준 기술 동향 (The Trend of G.729.1 Wideband Multi-codec Technology)

김현우;성종모;이미숙;김도영;정해원
- 전자통신동향분석
- /
- 제21권6호통권102호
- /
- pp.77-85
- /
- 2006
2006년 5월 고품질 인터넷 전화(VoIP) 서비스에 사용할 수 있는 가변대역 광대역 음성 코덱 기술이 ITU-T SG16 회의에서 국제 표준으로 확정되었다. ITU-T에서 표준화된 G.729.1 코덱은 국내 IPR이 포함된 최초 음성 코덱 분야의 표준이다. 이 코덱은 인터넷 전화 서비스에서 가장 널리 사용되는 G.729를 기반으로 8-32kbps 범위 내에서 임베디드 형태로 비트열 계층을 쌓아가는 구조로 협대역 신호(300-3400Hz)부터 광대역 신호(50-7000Hz)를 압축, 복원한다. 이 기술은 기존의 인터넷 전화에서 사용하고 있는 코덱의 낮은 품질, 대역폭 확장, 품질 제어가 곤란한 단점을 개선하여 인터넷전화 서비스 시장을 활성화 할 것으로 기대된다.
https://doi.org/10.22648/ETRI.2006.J.210608 인용 PDF

저전송률 코드여기 선형 예측 부호화기를 위한 선택적 대역 하모닉 모델 기반 여기신호 개선 알고리즘 (Excitation Enhancement Based on a Selective-Band Harmonic Model for Low-Bit-Rate Code-Excited Linear Prediction Coders)

이미숙;김홍국;최승호;김도영
- 음성과학
- /
- 제11권2호
- /
- pp.259-269
- /
- 2004
In this paper, we propose a new excitation enhancement technique to improve the speech quality of low bit-rate code-excited linear prediction (CELP) coders. The proposed technique is based on a harmonic model and it is employed only in the decoding process of speech coders without any additional bits. We develop the procedure of harmonic model parameter estimation and harmonic generation, and apply this technique to a current state-of-the-art low bit rate speech coder, ITU-T G.729 Annex D. Also, its performance is measured by using the ITU-T P.862 PESQ score and compared to those of the phase dispersion filter and the long-term postfilter applied to the decoded excitation. It is shown that the proposed excitation enhancement technique can improve the quality of decoded speech and provide better quality for male speech than other techniques.
PDF

가중치를 부여한 QPSK/PCM 음성신호의 소거대역 설정에 의한 신호수신 (Weighted QPSK/PCM Speech Signal Detection with the Erasure Zone)

안승춘;이문호
- 대한전기학회:학술대회논문집
- /
- 대한전기학회 1988년도 전기.전자공학 학술대회 논문집
- /
- pp.179-182
- /
- 1988
Since the bits in any encoded PCM word are of different importance to the bit positions, in order to improve the signal to noise ratio the technique that the encoded signal bits are weighted for the QPSK transmission system, is presented. Also the erasure zone is established at the detector, such that if the output falls into the erasure zone, the regenerated sample is replaced by interpolation. Two weighting methods are shown here. One is the method that the same weighting profile is used to Q and I dimension in QPSK signal constellations. The other is diferent weighting to Q and I dimension. The gains of this new technique in overall signal s/n compared to conventional QPSK transmission system were 5 db and 2db, respectively.
PDF

혼합여기모델을 이용한 대역 확장된 음성신호의 음질 개선 (Quality Improvement of Bandwidth Extended Speech Using Mixed Excitation Model)

최무열;김형순
- 대한음성학회지:말소리
- /
- 제52호
- /
- pp.133-144
- /
- 2004
The quality of narrowband speech can be enhanced by the bandwidth extension technology. This paper proposes a mixed excitation and an energy compensation method based on Gaussian Mixture Model (GMM). First, we employ the mixed excitation model having both periodic and aperiodic characteristics in frequency domain. We use a filter bank to extract the periodicity features from the filtered signals and model them based on GMM to estimate the mixed excitation. Second, we separate the acoustic space into the voiced and unvoiced parts of speech to compensate for the energy difference between narrowband speech and reconstructed highband, or lowband speech, more accurately. Objective and subjective evaluations show that the quality of wideband speech reconstructed by the proposed method is superior to that by the conventional bandwidth extension method.
PDF

전화선 채널이 화자확인 시스템의 성능에 미치는 영향 (The Effect of the Telephone Channel to the Performance of the Speaker Verification System)

조태현;김유진;이재영;정재호
- 한국음향학회지
- /
- 제18권5호
- /
- pp.12-20
- /
- 1999
본 논문에서는 깨끗한 환경에서 녹음된 음성데이터와 채널환경에서 수집된 음성데이터의 화자확인 성능을 비교하였다. 채널데이터의 화자확인 성능을 향상시키기 위하여 채널환경에 강인한 특징 파라메타 및 전처리에 대해 연구하였다. 실험을 위한 음성 DB는 어구지시(text-prompted) 시스템을 고려하여 두 자리의 한국어 숫자음으로 구성하였다. 적용한 음성 특징은 LPCC(Linear Predictive Cepstral Coefficient), MFCC(Mel Frequency Cepstral Coefficient), PLP(Perceptually Linear Prediction), LSP(Line Spectrum Pair)이며, 채널 잡음을 제거하기 위한 전처리 과정으로는 음성신호에 대한 필터링을 적용하였다. 추출된 특징으로부터 채널의 영향을 제거 또는 보상하기 위해 cepstral weighting, CMS(Cepstral Mean Subtraction), RASTA(RelAtive SpecTrAl)를 적용하였다. 또한 각각의 특징 및 처리 방법에 대한 음성인식 성능을 제시함으로써 화자확인에서의 성능과 음성인식에서의 성능을 비교하였다. 적용한 음성 특징 및 처리 방법들에 대한 성능 평가를 위해 HTK(HMM Tool Kit) 2.0을 이용하였다. 남자, 여자 화자별로 임계값을 다르게 주는 방법으로 깨끗한 음성데이터와 채널 데이터에 대한 EER(Equal Error Rate)을 구하여 비교하였다. 실험결과 전처리 과정에서 대역통과 필터(150～3800Hz)를 적용하여 저대역 및 고대역의 채널 잡음을 제거하고, 이 신호로부터 MFCC를 추출하였을 때 EER 측면에서의 화자확인 성능이 가장 좋게 나타났다.
PDF

특정 대역 에너지를 이용한 한국어 기본 수자 음성의 백동 인식에 관한 연구 (A Study on the Automatic Recognition of Korean Basic Spoken Digit Using Energy of Special Bandwidth)

한희;김순협;박규태
- 대한전자공학회논문지
- /
- 제19권3호
- /
- pp.5-12
- /
- 1982
기본 모음의 분석을 위한 특징 파라미터로 특정 대역의 에너지의 비를 이용하는 방법을 사용하여 이 파라미터와 영통과률(zero crossing rate;ZCR) 그리고 에너지 파라미터의 논리 조합으로 한국어 기본산자 음성의 인식을 시도하였다. 본 실험을 위해서 음성 신호는 차단 주파수 10KHz의 저역 여파기로 여파되었고 20KHz의 표본화율로 표본화 되어 IBM 370으로 시뮬레이션 되었다. 본 시뮬레이션에서는 리메쯔 교환 알고리즘[l3].[14]에 의해 61차, 120차, 25차, 25차 등 4개의 FIR 디지탈 여파기를 설계하여 사용하였다. 실험 결과 3인의 화자에 대해서 92%의 인식률을 얻었다.
PDF

멀티미디어 콘텐츠를 위한 다이얼로그 명료도 향상 알고리즘 (Dialog Enhancement Algorithm for Multimedia Contents)

지유나;박영철
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2016년도 하계학술대회
- /
- pp.86-89
- /
- 2016
본 논문에서는 멀티미디어 콘텐츠의 명료도를 향상시켜 사용자가 주변 환경과 관계없이 안정적인 볼륨에서 오디오 청취를 할 수 있는 다이얼로그 명료도 향상 알고리즘을 제안한다. 최근 모바일 기기들의 발달로 다양한 환경에서 영화, TV 또는 동영상 등의 멀티미디어 콘텐츠를 즐기는 일이 늘어나고 있다. 이러한 경우 시청자는 주변 환경에 따라 영상의 오디오 볼륨을 조절하게 되는데 주변 소음에 비하여 과하게 증폭된 볼륨은 주변에 피해를 끼치거나 고막에 손상을 일으킬 수 있으며 반대로 주변에 비해 너무 작은 오디오 볼륨은 시청을 어렵게 한다는 단점이 있다. 본 논문에서는 수신단에서 멀티미디어 콘텐츠의 오디오 신호로부터 다이얼로그 성분을 검출하여 음성 명료도 향상 알고리즘을 적용시켜 동일한 볼륨에서도 음성의 명료도를 높이는 알고리즘을 제안한다. 본 알고리즘은 다이얼로그를 검출하여 단순히 증폭 시키는 기존 기술들과 달리 전체 에너지는 유지하면서 명료도에 중요한 영향을 미치는 주파수 대역에 에너지를 집중시키는 에너지 재분배 방식을 이용해 동일한 볼륨에서도 더 높은 음성 명료도를 기대할 수 있다. 컴퓨터 시뮬레이션을 통해 본 논문에서 제안한 알고리즘이 명료도에 중요한 영향을 미치는 주파수대역을 적절히 증폭시킴을 확인할 수 있었다.
PDF

검색결과 146건 처리시간 0.029초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)