• 제목/요약/키워드: 벡터 양자화

검색결과 318건 처리시간 0.023초

벡터 양자화를 이용한 한국어 억양 곡선 생성 (Generation of Korean Intonation using Vector Quantization)

  • 안혜선;김형순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.209-212
    • /
    • 2001
  • 본 논문에서는 text-to-speech 시스템에서 사용할 억양 모델을 위해 벡터 양자화(vector quantization) 방식을 이용한다. 어절 경계강도(break index)는 세단계로 분류하였고, CART(Classification And Regression Tree)를 사용하여 어절 경계강도의 예측 규칙을 생성하였다. 예측된 어절 경계강도를 바탕으로 운율구를 예측하였으며 운율구는 다섯 개의 억양 패턴으로 분류하였다. 하나의 운율구는 정점(peak)의 시간축, 주파수축 값과 이를 기준으로 한 앞, 뒤 기울기를 추출하여 네 개의 파라미터로 단순화하였다. 운율구에 대해서 먼저 운율구가 문장의 끝일 경우와 아닐 경우로 분류하고, 억양 패턴 다섯 개로 분류하여. 모두 10개의 운율구 set으로 나누었다. 그리고 네 개의 파라미터를 가지고 있는 운율구의 억양 패턴을 벡터 양자화 방식을 이용하여 분류(clusteing)하였다 운율의 변화가 두드러지는 조사와 어미는 12 point의 기본주파수 값을 추출하고 벡터 양자화하였다. 운율구와 조사 어미의 codebook index는 문장에 대한 특징 변수 값을 추출하고 CART를 사용하여 예측하였다. 합성할 때에는 입력 tort에 대해서 운율구의 억양 파라미터를 추정한 다음, 조사와 어미의 12 point 기본주파수 값을 추정하여 전체 억양 곡선을 생성하였고 본 연구실에서 제작한 음성합성기를 통해 합성하였다.

  • PDF

효율적인 가변차원 하모닉 크기 양자화기법 (Efficient Variable Dimension Quantization of Harmonic Magnitude)

  • 신경진;이인성
    • 한국음향학회지
    • /
    • 제20권7호
    • /
    • pp.47-54
    • /
    • 2001
  • 본 논문은 스펙트럴 크기 파라미터들에 대한 효율적인 가변 차원 양자화 기법을 제안한다. 특히, 하모닉 부호화 기에서의 스펙트럴 크기값 계수들은 가변차원이기 때문에 가변 차원의 양자화를 필요로 한다. 따라서, 본 논문에서는 스펙트럴 크기값 계수들에 대해 가변 이산 코사인 변환(DCT: Discrete Cosine Transform) 및 가변 차원에 적합한 훈련구조를 가지는 비정방형 변환 벡터 양자화 (NSTVQ: Nonsquare Transform Vector Quantization)를 홀수/짝수 구조 및 분할(Split) 구조 그리고 다단계(Multi-stage) 구조 등과 결합시킨 효율적인 양자화 기법을 제안한다. 제안된 양자화 기법의 성능평가는 스펙트럴의 크기값에 대한 주파수 왜곡(SD: Spectral Distortion) 값을 사용하였으며, 다단계 비정방형 변환 벡터 양자화(MSNSTVQ: Multi-Stage Nonsquare Transform Vector Quantization)가 가장 좋은 성능을 나타내었다.

  • PDF

G.723기반의 음성인식을 위한 변별적인 음성 특징 벡터 선정 (Discriminative Feature Selection for G.723-based Speech Recognition)

  • 이규환;정민화
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.387-389
    • /
    • 2000
  • 정보 통신 분야의 발달로 사람들의 전화 사용이 늘어나고 또한 전화기에 여러 가지 멀티미디어 기능들이 추가되면서 음성 인식의 필요성이 점차 증가하고 있다. 그러나 현재의 기술로는 음성 인식의 성능이 사람들의 기대치를 만족시키지 못하고 있다. 본 연구에서는 G.723을 이용한 네트워크 상에서 음성 인식 시간을 줄이고 같은 차수에서 더 좋은 음성 인식 성능을 얻을 수 있는 방법에 대해 연구하였다. 일반적인 보코더는 채널을 통과시킬 때 왜곡을 최소화 하기 위해 양지화할 때 안정적이라고 알려져 있는 LSP 파라메터를 양자화하여 전송한다. 전송된 양자화된 LSP 파라메터는 복호화기를 통과하게 되는데 본 연구에서는 양자화된 LSP 파라메터를 음성인식에 직접 이용하여 음성 합성한 후 음성 특징 파라메터를 추출하는 시간을 줄일 수 있고 음성 합성시 왜곡을 미연에 방지할 수 있다. 본 연구에서는 변별적인 기준에 의해 특징 벡터 요소들을 순서화를 이용하여 음성 특징 벡터의 차수를 동적으로 조절할 수 있는 방법을 G.723에 적용시켜 보았다. 순서화 된 음성 특징 요소들 중에서 인식 목적에 적절한 차수를 선정하며 차수를 줄이면서도 음성인식 성능은 유지 또는 향상시킬 수 있음을 확인하였다. 특히 네트워크 통신망에서도 음성인식 성능을 향상시킬 수 있음을 확인하였고, 기존의 합성음에서 음성인식을 하는 방법보다 시간도 크게 단축할 수 있었다.

  • PDF

다중비트율 트리구조 벡터 양자화를 이용한 영상의 대역분할 부호화 (Subband Image Coding using Multirate Tree-Structured Vector Quantization)

  • 이광기;이완주;김대관;최일상;박규태
    • 한국통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.895-906
    • /
    • 1993
  • 본 논문에서는 영상의 대역분할 부호화를 위한 다중비트율 트리구조 벡터양자화를 제안하였다. 영상의 대역분할은 원영상을 특정 대역과 방향성을 갖는 대역성분들로 분리하므로, 대역분할을 거친 각 대역성분을 학습영상으로 사용하여 다중비트율 트리구조 벡터양자화기를 설계하였다. 대역분할을 거친 각 대역성분에 대한 최적비트할당은 원하는 비트율과 왜곡을 갖는 다중 비트율 트리구조 벡터양자화기의 전정서브트리를 선택하는 문제로 귀착된다.

  • PDF

레일리 감쇄 채널에서 최적 직교 진폭 변조 신호 전송을 고려한 벡터 양자화 (Vector Quantization for Optimum Quadrature Amplitude Modulated Signals in Rayleigh Fading Channel)

  • 배진수;한종기;박애경
    • 한국통신학회논문지
    • /
    • 제27권6B호
    • /
    • pp.610-615
    • /
    • 2002
  • 이 논문에서는 변조된 신호 공간에서 신호 벡터에 적당한 부호를 부여하는 벡터 양자화기를 쓰는 레일리 감쇄채널을 위한 통신 시스템을 다루었다. 변조된 신호공간을 효율적으로 분할함으로써, 변조 신호 파형의 왜곡이 최소화되도록 벡터 양자화 부호화 시스템을 최적화하였다. 모의실험을 통해 최적화된 직교 진폭 변조기가 전체 통신시스템의 성능을 더 좋게함을 보였다.

조건부 엔트로피 제한 벡터 양자화를 이용한 영상 부호화 (Image Coding using Conditional Entropy Constrained Vector Quantization)

  • 이승준;서용창;이충웅
    • 전자공학회논문지B
    • /
    • 제31B권11호
    • /
    • pp.88-96
    • /
    • 1994
  • 벡터 양자화를 이용하여 영상신호를 압축하는 경우, 원 영상을 복원하기 위하여 복호기쪽에 어야 하는 인덱스들 사이에는 높은 상관성이 존재하며, 이러한 높은 상관성을 인덱스의 부호화에 이용하면 보다 높은 부호화 효율을 얻을 수 있다. 본 논문에서는, 각 인덱스들을 이전 인덱스의 값에 따라 적응적으로 부호화하는 조건부 엔트로피 부호화를 도입하고, 이 경우 벡터 양자기를 최적화하는 방법을 제안한다. 즉, 조건부 엔트로피 부호화를 도입하는 경우 각 입력벡터당 평균 비트수는 조건부 엔트로피에 근접한다는 사실을 유용하여, 조건부 엔트로피를 제한한 상태에서 평균 왜곡을 최소화 하도록 VQ 부호책을 구성함으로써 최적화 과정이 이루어진다. 또한, 이와 같이 각 입력벡터의 양자화 결과가 다음 입력벡터의 인덱스를 부호화하는데 영향을 미치는 경우, 장시간(long term)의 관점에서 최적인 인덱스열을 찾기 위해 우리는 비터비 탐색 방법을 도입한다. 영상 모의 실험을 통해, 제안하는 방법이, 구획간의 상관성을 이용하지 않는 기존의 엔트로피 제한 벡터 양자기에 비해 같은 비트율에서 약 1.0~3.0 dB 높은 PSNR을 나타냄을 알 수 있었다.

  • PDF

퍼지 벡터 양자화를 위한 대규모 병렬 알고리즘 (A Massively Parallel Algorithm for Fuzzy Vector Quantization)

  • ;김철홍;김종면
    • 정보처리학회논문지A
    • /
    • 제16A권6호
    • /
    • pp.411-418
    • /
    • 2009
  • 퍼지 클러스터링 기반 벡터 양자화 알고리즘은 퍼지 클러스터링 분석이 벡터 양자화 프로세스 초기단계에서 초기화에 덜 민감하게 하기 때 문에 데이터 압축 분야에서 널리 사용되어 왔다. 하지만, 퍼지 클러스터링 처리는 훈련 벡터 공간에 포함된 불확실한 양적 공식의 복잡한 프레 임워크 때문에 상당한 계산량이 요구된다. 이러한 상당한 계산량 부하를 극복하기위해 본 논문은 4,096 프로세싱 엘리먼트로 구성된 어레이 아 키텍처를 이용하여 퍼지 벡터 양자화 알고리즘의 병렬 구현을 제안한다. 제안하는 병렬 구현은 4,096 프로세싱 엘리먼트를 이용하여 클러스터 링 프로세스 동안 효과적인 벡터 할당 정책을 적용함으로써 계산적으로 효율적인 솔루션을 제공한다. 모의실험 결과, 제안한 병렬 구현은 기존 의 다른 어레이 아키텍처를 이용한 구현보다 성능 및 효율 측면에서 상당한 향상을 보였다. 또한동일한 130nm 기술에서 제안한 병렬 구현은 오늘날의 ARM이나 TI DSP 프로세서를 이용한 구현과 비교하여 약 1000배의 성능 향상 및 100배의 에너지 효율 향상을 보였다. 이 결과들은 향상된 성능 및 에너지효율에서 제안한 병렬 구현의 잠재가능성을 입증한다.

동적 주소 사상을 이용한 벡터 양자화 (Vector Quantization Using a Dynamic Address Mapping)

  • 배성호;서대화;박길흠
    • 한국정보처리학회논문지
    • /
    • 제3권5호
    • /
    • pp.1307-1316
    • /
    • 1996
  • 본 논문에서는 인접블록들간의 높은 상관성을 이용한 동적 주소 사상에 의한 벡터 양자화 방법을 제안했다. 제안한 방법에서는 부호화할 입력블록에 대한 벡터 양자화의 주소를 사이드 메치 오차를 이용하여 재정렬된 부호책에서의 새로운 주소로 사상하는 주소 변환 함수를 저의하여 비트율을 효율적으로 감소하였다. 이러한 방법은 주소 변환 함수에 의한 새로운 주소가 주소 문턱값 이하인 낮은 주소로 사상된 경우에는 새롭게 사상된 주소를 부호화하고, 그렇지 않은 경우에는 재정립 되지않은 부호벡터 주소를 부호화하는 방법이다. 실험을 통하여, 제안한 방법에서의 복원영상의 화질은 일반적인 벡터 양자화 방법에서의 복원영상의 화질과 동일하고 비트율은 약 45∼50% 감소함을 확인하였다.

  • PDF

블록 제한 트렐리스 부호화 양자화 기법을 이용한 협대역 음성 부호화기용 LPC 계수 양자화기 설계 (Designing a Quantizer of LPC Parameters for the Narrowband Speech Coder using Block-Constrained Trellis Coded Quantization)

  • 전자경;박상국;강상원
    • 한국통신학회논문지
    • /
    • 제32권3C호
    • /
    • pp.234-240
    • /
    • 2007
  • 본 논문에서는 기존의 트렐리스 부호화 양자화 기법을 이용, 변형하여 저 복잡도 블록 제한 격자 부호화 양자화 기법 (Block-Constrained Trellis Coded Quantization, 이하 BC-TCQ)을 제안하곤 이를 이용한 협대역 음성 부호화기용 예측 BC-TCQ를 설계하였다. 트렐리스 부호화 양자화 기법은 일종의 벡터 양자화 방식으로 부호화에 요구되는 벡터 코드북을 트렐리스 구조에 기반한 스칼라 코드북으로 구성함으로써 VQ와 비교 할 만한 성능을 보일 뿐 아니라 복잡도가 훨씬 작은 특성을 보인다. 본 논문에서 제안한 예측 BC-TCQ는 프레임당 26비트에서 IS-641 음성 부호화기보다 평균 SD가 0.4107dB 향상되었으며, 더하기 연산이 64.54%, 곱하기 연산이 76.93%, 비교 연산이 2.35% 감소하였다.

분산 음성 인식 시스템을 위한 특징 계수 양자화 방식 설계 (Design of a Quantization Algorithm of the Speech Feature Parameters for the Distributed Speech Recognition)

  • 이준석;윤병식;강상원
    • 한국음향학회지
    • /
    • 제24권4호
    • /
    • pp.217-223
    • /
    • 2005
  • 본 논문에서는 분산 음성 인식 시스템에서 사용되는 멜켑스트럼 계수를 양자화 하기 위하여 예측 구조를 갖는 BC-TCQ 양자화기를 제안하였다. 분산 음성 인식 시스템을 위한 효율적인 멜켑스트럼 계수 양자화기를 설계하기 위하여, 인접 프레임간의 높은 상관도를 이용한 1차 AR 예측 필터를 적용하였다. 그리고 예측 필터에 의해서 구해지는 예측 에러 벡터는 BC-TCQ를 사용하여 양자화를 수행하였다. 본 연구에서 제안된 예측 BC-TCQ멜켑스트럼 계수 양자화기는 분산 음성 인식 시스템을 위해 ETSI 규격에서 사용되는 split VQ 멜켑스트럼 계수 양자화 방식보다 cepstral distortion (CD) 측면에서 훨씬 좋은 성능을 보이며, 인코딩 연산 복잡도 및 메모리 요구량에서도 더 유리하다.