• 제목/요약/키워드: Coefficients vector

검색결과 336건 처리시간 0.021초

적응적인 확장된 코드북을 이용한 분할 벡터 양자화기 구조의 ISF 양자화기 개선 (A Method For Improvement Of Split Vector Quantization Of The ISF Parameters Using Adaptive Extended Codebook)

  • 임종하;정규혁;홍기봉;이인성
    • 한국음향학회지
    • /
    • 제30권1호
    • /
    • pp.1-8
    • /
    • 2011
  • 본 논문에서는 ISF 계수의 순서화 성질을 이용하여 분할구조 벡터양자화기의 단점을 보완하여 ISF 계수 양자화의 성능을 높이는 알고리듬을 제안하고, 이를 이용한 광대역 음성 부호화기용 ISF 계수 양자화기를 설계한다. 16차 이상의 광대역 코덱의 ISF 계수는 계산량과 메모리 사용을 줄이기 위해서 분할구조의 벡터 양자화기를 사용한다. 분할구조 양자화기는 ISF 계수간의 상관도를 충분히 활용하지 못하는 단점이 발생한다. 제안하는 알고리듬은 이러한 단점을 극복하기 위하여 ISF 계수의 순서화 성질을 이용한다. ISF 계수의 순서화 성질을 이용하여 각 서브벡터의 불필요한 코드북 (Codebook Redundancy)을 검색할 수 있다. 이러한 불필요한 코드북은 ISF 계수의 순서화 성질, ISF 계수 예측과정과 기존 코드북의 보간법 (Interpolation)을 통해 적응적인 확장된 코드북으로 교체되어 양자화기의 성능을 향상시킨다. 제안된 알고리듬은 기존의 분할구조 양자화기에서 사용되지 못했던 17 %가량의 불필요한 코드북 인덱스를 적응적인 확장된 코드북에 할당하여, 표준화된 코덱인 AMR-WB의 ISF 계수 양자화기에 비해서 주파수 왜곡 관점에서 약 2 bit 가량의 이득을 보는 결과를 얻었다.

실업률 변동구조의 분석과 전환점 진단 (An Analysis for the Structural Variation in the Unemployment Rate and the Test for the Turning Point)

  • 김태호;황성혜;이영훈
    • 응용통계연구
    • /
    • 제18권2호
    • /
    • pp.253-269
    • /
    • 2005
  • 회귀모형의 기본가정은 추정된 계수들이 표본 내의 모든 관측값에 대해 일정하다는 것이다. 그러나 자료의 구조적 변화로 인해 모형의 추정계수 중 최소한 일부는 상이한 부분집합으로 전체 표본을 분할해야 하는 경우가 현실적으로는 흔히 존재한다. 본 연구에서는 두 회귀모형 계수들간의 동일성을 검정하는 방법을 확대${\cdot}$일반화하여 자료의 분할시점을 탐색하는 검정절차와 결합시킨 후 이를 최근 가장 큰 사회적 문제가 되고 있는 실업률의 구조변화 발생 여부와 시점을 판별하는 실증분석에 적용시켜 보았다.

음성신호 기반의 성별인식을 위한 Support Vector Machines의 적용 (Voice-Based Gender Identification Employing Support Vector Machines)

  • 이계환;강상익;김덕환;장준혁
    • 한국음향학회지
    • /
    • 제26권2호
    • /
    • pp.75-79
    • /
    • 2007
  • 본 논문은 SVM(Support Vector Machines)을 이용한 음성신호 기반의 효과적인 성별인식 시스템을 제안한다. 분별적 이진(binary) 패턴 분류기인 SVM은 특징 공간에서 비선형 경계를 찾아 분류하는 방법으로 우수한 성능을 보인다고 알려져 있다. 연구에서는 기존의 성별인식에서 널리 쓰이고 있는 MFCC(Mel Frequency Cepstral Coefficients)를 사용하여 SVM과 기존의 GMM(Gaussian Mixture Model) 알고리즘의 성별인식 성능을 비교하였고, 특히, 보다 향상된 SVM의 성별인식을 위해 MFCC와 Pitch를 이용한 결합 특징 벡터를 적용하였다. 실험결과 MFCC 파라미터를 사용했을 때 제안된 SVM이 GMM보다 우수한 성별인식 성능을 보였고, 제안된 결합 특징 벡터를 사용 했을 때 우수한 성능을 보였다.

하천유역의 유사량의 비교연구 (Comparison of Sediment Yield by IUSG and Tank Model in River Basin)

  • 이영화
    • 한국환경과학회지
    • /
    • 제18권1호
    • /
    • pp.1-7
    • /
    • 2009
  • In this study a sediment yield is compared by IUSG, IUSG with Kalman filter, tank model and tank model with Kalman filter separately. The IUSG is the distribution of sediment from an instantaneous burst of rainfall producing one unit of runoff. The IUSG, defined as a product of the sediment concentration distribution (SCD) and the instantaneous unit hydrograph (IUH), is known to depend on the characteristics of the effective rainfall. In the IUSG with Kalman filter, the state vector of the watershed sediment yield system is constituted by the IUSG. The initial values of the state vector are assumed as the average of the IUSG values and the initial sediment yield estimated from the average IUSG. A tank model consisting of three tanks was developed for prediction of sediment yield. The sediment yield of each tank was computed by multiplying the total sediment yield by the sediment yield coefficients; the yield was obtained by the product of the runoff of each tank and the sediment concentration in the tank. A tank model with Kalman filter is developed for prediction of sediment yield. The state vector of the system model represents the parameters of the tank model. The initial values of the state vector were estimated by trial and error.

Speech Query Recognition for Tamil Language Using Wavelet and Wavelet Packets

  • Iswarya, P.;Radha, V.
    • Journal of Information Processing Systems
    • /
    • 제13권5호
    • /
    • pp.1135-1148
    • /
    • 2017
  • Speech recognition is one of the fascinating fields in the area of Computer science. Accuracy of speech recognition system may reduce due to the presence of noise present in speech signal. Therefore noise removal is an essential step in Automatic Speech Recognition (ASR) system and this paper proposes a new technique called combined thresholding for noise removal. Feature extraction is process of converting acoustic signal into most valuable set of parameters. This paper also concentrates on improving Mel Frequency Cepstral Coefficients (MFCC) features by introducing Discrete Wavelet Packet Transform (DWPT) in the place of Discrete Fourier Transformation (DFT) block to provide an efficient signal analysis. The feature vector is varied in size, for choosing the correct length of feature vector Self Organizing Map (SOM) is used. As a single classifier does not provide enough accuracy, so this research proposes an Ensemble Support Vector Machine (ESVM) classifier where the fixed length feature vector from SOM is given as input, termed as ESVM_SOM. The experimental results showed that the proposed methods provide better results than the existing methods.

디지털 영상의 픽셀값 경사도에 의한 미디언 필터링 포렌식 판정 (Forensic Decision of Median Filtering by Pixel Value's Gradients of Digital Image)

  • 이강현
    • 전자공학회논문지
    • /
    • 제52권6호
    • /
    • pp.79-84
    • /
    • 2015
  • 디지털 영상의 배포에서, 위 변조자에 의해 영상이 변조되는 심각한 문제가 있다. 이러한 문제를 해결하기 위하여, 본 논문에서는 영상의 픽셀값 경사도에 따른 특징벡터를 이용한 미디언 필터링 영상 포렌식 판정 알고리즘을 제안한다. 제안된 알고리즘에서, 원영상의 픽셀값 경사도로부터 자기회귀 계수를 1~6차까지의 6 Dim.을 계산한다. 그리고 경사도를 Poisson 방정식의 해에 의한 재구성 영상과 원영상과의 차영상으로 부터, 4 Dim. (평균값, 최대값 그리고 최대값의 좌표 i,j)의 특징벡터를 추출한다. 2 종류의 특징벡터는 10 Dim.으로 조합되어 변조된 영상의 미디언 필터링 (Median Filtering: MF) 검출기의 SVM (Support Vector Machine) 분류를 위한 학습에 사용된다. 제안된 미디언 필터링 검출 알고리즘은 동일 10 Dim. 특징벡터의 MFR (Median Filter Residual) 스킴과 비교하여 원영상, 평균필터링 ($3{\times}3$) 영상 그리고 JPEG (QF=90) 영상에서는 성능이 우수하며, Gaussian 필터링 ($3{\times}3$) 영상에서는 성능이 다소 낮지만, 성능평가 전체항목에서 민감도 (Sensitivity; TP: True Positive rate)와 1-특이도 (1-Specificity; FP: False Positive rate)의 AUC (Area Under Curve)가 모두 1에 수렴하여 'Excellent (A)' 등급임을 확인하였다.

Statistical Speech Feature Selection for Emotion Recognition

  • Kwon Oh-Wook;Chan Kwokleung;Lee Te-Won
    • The Journal of the Acoustical Society of Korea
    • /
    • 제24권4E호
    • /
    • pp.144-151
    • /
    • 2005
  • We evaluate the performance of emotion recognition via speech signals when a plain speaker talks to an entertainment robot. For each frame of a speech utterance, we extract the frame-based features: pitch, energy, formant, band energies, mel frequency cepstral coefficients (MFCCs), and velocity/acceleration of pitch and MFCCs. For discriminative classifiers, a fixed-length utterance-based feature vector is computed from the statistics of the frame-based features. Using a speaker-independent database, we evaluate the performance of two promising classifiers: support vector machine (SVM) and hidden Markov model (HMM). For angry/bored/happy/neutral/sad emotion classification, the SVM and HMM classifiers yield $42.3\%\;and\;40.8\%$ accuracy, respectively. We show that the accuracy is significant compared to the performance by foreign human listeners.

Vector Quantization for Medical Image Compression Based on DCT and Fuzzy C-Means

  • Supot, Sookpotharom;Nopparat, Rantsaena;Surapan, Airphaiboon;Manas, Sangworasil
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -1
    • /
    • pp.285-288
    • /
    • 2002
  • Compression of magnetic resonance images (MRI) has proved to be more difficult than other medical imaging modalities. In an average sized hospital, many tora bytes of digital imaging data (MRI) are generated every year, almost all of which has to be kept. The medical image compression is currently being performed by using different algorithms. In this paper, Fuzzy C-Means (FCM) algorithm is used for the Vector Quantization (VQ). First, a digital image is divided into subblocks of fixed size, which consists of 4${\times}$4 blocks of pixels. By performing 2-D Discrete Cosine Transform (DCT), we select six DCT coefficients to form the feature vector. And using FCM algorithm in constructing the VQ codebook. By doing so, the algorithm can make good time quality, and reduce the processing time while constructing the VQ codebook.

  • PDF

Design of Subband Codecs Using Optimized Vector Quantizer

  • Jee, Innho
    • The Journal of the Acoustical Society of Korea
    • /
    • 제15권2E호
    • /
    • pp.33-38
    • /
    • 1996
  • This paper provides an approach for representing an optimum vector quantizer by a scalar nonlinear gain-plus-additive noise model. The validity and accuracy of this analytic model is confirmed by comparing the calcuated model quantization errors with actual simulation of the optimum Linde-Buzo-Gray(LBG) vector quantizer. Using this model we frm MSE measure of an M-band filter bank codec in terms of the equivalent scalar quantizatin model and find the optimum FIR filter coefficients for each channel in the M-band structure for a given bit rate, given filter length, and given input signal correlation model. Specific design examples are worked out for 4-tap filters in the two-band paraunitary case. These theoretical results are confirmed by extensive Monte Carlo simulation.

  • PDF

계층적 피라미드 구조와 DCT 영역에서의 분류 벡터 양지기를 이용한 점진적 영상전송 (Progressive Image Transmission Using Hierarchical Pyramid Structure and Classified Vector Quantizer in DCT Domain)

  • 박섭형;이상욱
    • 대한전자공학회논문지
    • /
    • 제26권8호
    • /
    • pp.1227-1237
    • /
    • 1989
  • In this paper, we propose a lossless progressive image transmission scheme using hierarchical pyramid structure and classified vector quantizer in DCT domain. By adopting DCT to the hierarchical pyramid signals, we can reduce the spatial redundance. Moreover, the DCT coefficients can be encoded efficiently by using classified vector quantizer in DCT domain. The classifier is simply based on the variance of a subblock. Also, the mirror set of training set of images can improve the robustness of codebooks. Progressive image transmission can be achieved through following processes: from top to bottom level of planes in a pyramid, and from high to low AC variance class in a plane. Some simulation results with real images show that the proposed coding scheme yields a good performance at below 0.3 bpp and an excellent result at 0.409 bpp. The proposed coding scheme is well suited for lossless progressive image transmission as well as image data compression.

  • PDF