통합 검색 | Korea Science

광대역 음성부호화기를 위한 백터-스칼라 LSP 파라미터 양자화기 설계 (Design of the Vector-Scalar Quantizer of LSP Parameters for Wideband Speech Coder)

신재현;이인성;지덕구;윤병식;최송인
- 대한전자공학회논문지SP
- /
- 제40권4호
- /
- pp.286-291
- /
- 2003
본 논문에서는 광대역 음성 부호화기를 위한 VQ-SQ 구조의 LSP(Line Spectral Pairs) 파라미터 양자화기를 설계하였다. 16차 LPC(Linear Prediction Coefficients) 계수를 사용하며, 양자화 특성이 좋고 합성필터의 안정성의 조건을 검사하기 쉬운 LSP 파라미터로 변환/sup ［2］/하여 양자화 한다. 설계된 VQ-SQ 양자화기는 첫 번째 단에서 2단 SVQ(Split VQ)로 각각 8차씩 양자화한 뒤, 두 번째 단에서 순서화 특성(OP Ordering Property)을 적용한 SQ를 사용하여 잔여신호(Residual Signal)를 양자화하는 구조로 되어있다. VQ-SQ결합 양자화기의 전체적인 성능개선을 위해 백터 양자화기에서 하나의 최적 벡터를 찾지 않고 5개의 후보백터를 가지고 스칼라 양자화를 수행한 후, 전체적으로 본래의 LSP 파라미터에 가장 가까운 벡터 양자화기 인덱스와 스칼라 양자화기의 인덱스를 결정한다. 순서화 특성을 고려하여 설계된 적응 VQ-SQ 양자화기는 LSP 파라미터에 총 35비트를 할당하여 광대역 명료도(Wideband Transparency)인 평균 1.6㏈ 이하의 스펙트럼 왜곡(SD : Spectral Distortion)과 4%미만의 3㏈가 넘는 프레임의 비율/sup ［1］/을 만족하였으며, 기존의 VQ-SQ 양자화기보다 2-3비트를 절약할 수 있었다.
PDF KSCI

이미지 분할 여부에 따른 VQ-VAE 모델의 적대적 예제 복원 성능 비교 (Comparison of Adversarial Example Restoration Performance of VQ-VAE Model with or without Image Segmentation)

김태욱;현승민;홍정희
- 융합신호처리학회논문지
- /
- 제23권4호
- /
- pp.194-199
- /
- 2022
다양하고 복잡한 영상 데이터 기반의 산업에서 높은 정확도와 활용성을 위해 고품질의 데이터를 위한 전처리가 요구된다. 하지만 기존 이미지 또는 영상 데이터와 노이즈를 결합해 기업에 큰 위험을 초래할 수 있는 오염된 적대적 예제가 유입될 시 기업의 신뢰도 및 보안성, 완전한 결과물 확보를 위해 손상되기 이전으로의 복원이 필요하다. 이를 위한 대비책으로 기존에는 Defense-GAN을 사용하여 복원을 진행하였지만, 긴 학습 시간과 복원물의 낮은 품질 등의 단점이 존재하였다. 이를 개선하기 위해 본 논문에서는 VQ-VAE 모델을 사용함과 더불어 이미지 분할 여부에 따라 FGSM을 통해 만든 적대적 예제를 이용하는 방법을 제안한다. 먼저, 생성된 예제를 일반 분류기로 분류한다. 다음으로 분할 전의 데이터를 사전 학습된 VQ-VAE 모델에 전달하여 복원한 후 분류기로 분류한다. 마지막으로 4등분으로 분할된 데이터를 4-split-VQ-VAE 모델에 전달하여 복원한 조각을 합친 뒤 분류기에 넣는다. 최종적으로 복원된 결과와 정확도를 비교한 후 분할 여부에 따른 2가지 모델의 결합 순서에 따라 성능을 분석한다.
https://doi.org/10.23087/jkicsp.2022.23.4.002 인용 PDF KSCI

JPEG2000에서 저 전송 부호화를 위한 비주얼 양자화기 설계 (Design of Visual Quantizer for very low Bit-rate Coding on JPEG2000)

김동혁;전준현
- 대한전자공학회논문지SP
- /
- 제47권4호
- /
- pp.69-78
- /
- 2010
대역분할 부호화방식의 표준인 비가역 9/7 JPEG2000의 경우 0.15bpp 이하에서 양자화 손실로 배경과 에지 부분에서 급격한 화질 왜곡이 발생하는 문제점을 갖고 있다. 본 논문에서는 이러한 문제를 해결하기 위해 고주파대역들의 L-pdf(Laplace probability density function) 통계특성을 이용한 VQ(Visual Quantizer)를 제안하였다. 제안된 VQ는 재생영상의 화질왜곡을 최소화하기 위한 비주얼파라메타와 효율적인 비트율 감축을 위한 가중치 파라메타를 각각 사용하여 설계되었다. 실험결과 제안된 VQ는 0.15bpp이하에서도 재생영상의 시각적 손실을 최소화하면서 재생영상의 화질왜곡 기준척도인 MSE(Mean-Squared Error)도 최소화 할 수 있었다.
PDF KSCI

대역 선택 구조와 선택적 벡터 양자화를 이용한 개선된 웨이브릿 변화형 CELP 보호화기 (Enhanced Wavelet Transform-based CELP Coder with Band Selection and Selective VQ)

장동일;조영권;안수길
- The Journal of the Acoustical Society of Korea
- /
- 제14권1E호
- /
- pp.46-55
- /
- 1995
본 논문에서는 대역선택 웨이브릿 변환 CELP 보호화기라 명명한 4.8 kbps 전송률의 새로운 웨이브릿 변화형 CELP 부호화기를 구현하였다. 제안된 알고리듬에서는 이산 웨이브릿 주파수 대역에 대한 대역 선택과 선택적 벡터 양자화 기법을 사용하였다. 이러한 대역 선택 및 선택적 벡터 양자화 구조는 구분형 VQ 구조를 이용하여 구현하였다. 제안한 알고리즘은 계산량 및 저장용량을 크게 줄이면서도, 기존의 불규칙 잡음 코드북 검색 구조에 비해 0.5에서 1 dB 가량 개선된 segmental SNR을 갖는다. 많은 실험 결과를 통해 확인한 결과, 제안된 대역 선택 웨이브릿 변환 CELP 부호화기는 기존의 CELP 구조나 웨이브릿 변환 구조에 비해서 실제 응용에 훨씬 적합함을 확인하였다.
PDF

VQ Codebook Index Interpolation Method for Frame Erasure Recovery of CELP Coders in VoIP

Lim Jeongseok;Yang Hae Yong;Lee Kyung Hoon;Park Sang Kyu
- 한국통신학회논문지
- /
- 제30권9C호
- /
- pp.877-886
- /
- 2005
Various frame recovery algorithms have been suggested to overcome the communication quality degradation problem due to Internet-typical impairments on Voice over IP(VoIP) communications. In this paper, we propose a new receiver-based recovery method which is able to enhance recovered speech quality with almost free computational cost and without an additional increment of delay and bandwidth consumption. Most conventional recovery algorithms try to recover the lost or erroneous speech frames by reconstructing missing coefficients or speech signal during speech decoding process. Thus they eventually need to modify the decoder software. The proposed frame recovery algorithm tries to reconstruct the missing frame itself, and does not require the computational burden of modifying the decoder. In the proposed scheme, the Vector Quantization(VQ) codebook indices of the erased frame are directly estimated by referring the pre-computed VQ Codebook Index Interpolation Tables(VCIIT) using the VQ indices from the adjacent(previous and next) frames. We applied the proposed scheme to the ITU-T G.723.1 speech coder and found that it improved reconstructed speech quality and outperforms conventional G.723.1 loss recovery algorithm. Moreover, the suggested simple scheme can be easily applicable to practical VoIP systems because it requires a very small amount of additional computational cost and memory space.
PDF KSCI

백터 양자화의 고속 부호화 알고리즘 (Fast VQ Encoding Algorithm)

채종길;황금찬
- 한국통신학회논문지
- /
- 제19권4호
- /
- pp.685-690
- /
- 1994
벡터 양자화의 부호화에서 입력벡터에 가장 잘 정합되는 코드벡터를 탐색하는 과정에서 발생하는 계산의 복잡도는 코드북의 크기에 비례하여 지수직으로 증가하고 실질적으로 응용을 제한한다. 본 논문에서는 정합 가능성이 없는 코드벡터에 대한 왜곡의 계산을 제거하기 위한 조건의 시작 벡터로서 참조 벡터를 사용하는 단순, 고속의 효율적인 벡터 양자화의 부호화 알고리즘을 제안하였다. 이는 입력벡터에 정합 기능성을 갖는 참조 벡터를 선택하고 코드 벡터에 대한 왜곡의 계산을 제거하기 위한 조건을 결합하는 것이다. 제한된 방법은 전탐색 벡터 양자화에 비하여 단지 10~15%의 수학적 연산을 필요로 한다. 그리고 덧셈과 비교 연산의 수는 크게 줄어들지 않지만 곱셈은 벡터 양자화의 여러 고속부호화 방법의 70~80%까지 들었다.
PDF

백터양자화가의 구조적 코더 찾기 (STRUCTURED CODEWORD SEARCH FOR VECTOR QUANTIZATION)

우홍체
- 한국지능시스템학회:학술대회논문집
- /
- 한국퍼지및지능시스템학회 2000년도 추계학술대회 학술발표 논문집
- /
- pp.467-470
- /
- 2000
Vector quantization (VQ) is widely used in many high-quality and high-rate data compression applications such as speech coding, audio coding, image coding and video coding. When the size of a VQ codebook is large, the computational complexity for the full codeword search method is a significant problem for many applications. A number of complexity reduction algorithms have been proposed and investigated using such properties of the codebook as the triangle inequality. This paper proposes a new structured VQ search algorithm that is based on a multi-stage structure for searching for the best codeword. Even using only two stages, a significant complexity reduction can be obtained without any loss of quality.
PDF

비선형 집단화와 완화기법을 이용한 VQ/HMM에 관한 연구 (A Study on VQ/HMM using Nonlinear Clustering and Smoothing Method)

정희석
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
- /
- pp.95-98
- /
- 1998
본 논문에서는 이산적인 HMM(Hidden Markov Model)을 이용한 고립단어 인식 시스템에서 입력특징 벡터의 변별력을 향상시키기 위해 수정된 집단화 알고리듬을 제안하므로써 K-means나 LBG 알고리듬을 이용한 기존의 HMM에 비해 2.16%의 인식율을 향상시켰다. 또한 HMM학습과정에서 불충분한 학습데이타로 인해 발생되는 인식율저하의 문제를 해소하기 위해 개선된 smoothing 기법을 제안하므로써 화자독립 실험에서 3.07%의 인식율을 향상시켰다. 본 논문에서 제안한 두가지 알고리듬을 모두 적용하여 최종적으로 실험한 VQ/HMM에서는 기존의 방식에 비해 화자독립 인식실험 결과 평균 인식율이 4.66% 개선되었다.
PDF

개선된 부호책 갱신 방법을 이용한 VQ 학습 알고리즘 (VQ Design Algorithm Using Modified Codebook Updating Method)

백성준;최용진;이주헌;성굉모
- 한국음향학회지
- /
- 제17권4호
- /
- pp.72-75
- /
- 1998
본 논문에서는 기존에 제시된 수정된 K-평균 방법을 이용한 VQ 학습 알고리즘을 분석하고, 보다 개선된 성능을 보이는 학습 알고리즘을 제안한다. 수정된 K-평균 학습 알고 리즘은 자기 집단에 속하는 데이터의 중심을 데이터의 중심을 새로운 코드워드로 삼는 것이 아니라 현재 코드워드와 새로 구한 집단의 중심을 연결한 선상에서 새로 구한 중심 너머의 일정한 점을 새로운 코드워드로 선택하는 방식이다. 본 논문에서는 이렇게 구한 새로운 코 드워드가 어떠한 조건을 만족할 때 알고리즘이 반복적 감소의 성질을 가지는지 살펴보고, 그 조건을 만족시키는 영역 중 기존의 방식보다 더 좋은 성능을 보이는 코드워드 선택법을 제시함으로써 개선된 학습 알고리즘을 제안한다.
PDF

코우드북의 절충탐색에 의한 벡터양자화 (Vector Quantization by N-ary Search of a Codebook)

이창영
- 음성과학
- /
- 제8권3호
- /
- pp.143-148
- /
- 2001
We propose a new scheme for VQ codebook search. The procedure is in between the binary-tree-search and full-search and thus might be called N-ary search of a codebook. Through the experiment performed on 7200 frames spoken by 25 speakers, we confirmed that the best codewords as good as by the full-search were obtained at moderate time consumption comparable to the binary-tree-search. In application to speech recognition by HMM/VQ with Bakis model, where appearance of a specific codeword is essential in the parameter training phase, the method proposed here is expected to provide an efficient training procedure.
PDF

검색결과 252건 처리시간 0.023초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)