• 제목/요약/키워드: 벡터 양자화

검색결과 318건 처리시간 0.031초

신경 회로망 벡터 양자화를 이용한 움직임 탐색 영역의 예측 (Motion Search Region Prediction using Neural Network Vector Quantization)

  • 유대현;김재창
    • 전자공학회논문지B
    • /
    • 제33B권1호
    • /
    • pp.161-169
    • /
    • 1996
  • 본 논문에서는 동영상 압축의 핵심 기술인 움직임 벡터 추정에 있어서 신경 회로망을 이용한 벡터 양자화에 의해 탐색 영역을 예측하는 방법을 제안한다. 훈련영상을 입력으로 하여 전역 탐색법 등에 의하여 구해진 움직임 벡터를 이용하여 움직임 벡터 코드 북을 생성하고 이를 예측 탐색 점으로 이용한다. 움직임 벡터 코드 북을 생성하기 위해서 병렬 처리 특성과 다양한 학습 알고리즘을 갖는 신경 회로망을 이용하였다. 제안된 방법은 움직임 벡터들의 높은 공간적 상관성을 이용하게 되고 결과적으로 적은 탐색 점으로 움직임 벡터를 추정할 수 있으므로 계산량을 줄일 수 있을 뿐 아니라 움직임 벡터를 표현하기 위해 소요되는 비트 수도 크게 줄일 수 있다. 모의 실험을 통하여 제안된 방식이 기존의 고속 블록 매칭 알고리즘보다 우수함을 보였다.

  • PDF

문맥 독립 화자인식을 위한 공간 분할 벡터 양자기 설계 (A Classified Space VQ Design for Text-Independent Speaker Recognition)

  • 임동철;이행세
    • 정보처리학회논문지B
    • /
    • 제10B권6호
    • /
    • pp.673-680
    • /
    • 2003
  • 이 논문은 문맥 독립 화자인식에 사용될 벡터 양자기의 설계법 개선에 관한 연구이다. 구체적으로 벡터 양자기 코드북 생성 과정에서 특징 벡터 공간을 분할하여, 양자기 설계 시 학습에 필요한 계산 복잡도를 획기적으로 줄이는 방법을 제안한다. 제안된 공간 분할 벡터 양자기 설계법은 저자가 제안한 문맥 종속 화자인식을 위한 준비반복 벡터 양자기 설계법의 벡터 공간에 대한 일반화이다. 공간 분할 벡터 양자기 설계법은 종래의 설계법이 코드북 생성에 반복적 학습 설계를 사용한다는 것과 대조를 이룬다. 또한 공간 분할 벡터 양자기 설계법의 특징은 다음과 같다. 첫째, 이 설계법은 특징 벡터 공간을 분할한 공간 분할 군집을 이용함으로써 반복 학습을 하지 않는다. 둘째, 설계된 각 양자 영역은 공간 분할 군집의 양자 영역을 원용하며, 양자점은 각각의 통계 분포에 대해 최적점으로 설정된다. 셋째, 공간 분할 군집은 특징 벡터 집합에 대해 표본 벡터 생성법(CSVQ1, 2), 특징 벡터 공간에 대해 균일 초격자 구조 생성법(CSYQ3)으로 형성하였다. 수치 실험은 화자 10명이 발성한 50개의 문장에 대해 문맥 독립 화자인식 실험으로 수행되었다. 특징계수는 12차 멜켑스트럼 벡터를 사용하였고 각각의 공간 분할 코드북 생성법에 대해 코드북 크기를 32부터 128까지 변화시키면서 기존의 벡터 양자기 인식법과 비교하였다. 제안된 방법은 표본 벡터 생성법을 사용한 경우 인식률 100%로 기존의 방법과 같은 결과를 보였다. 따라서 제안된 공간 분할 벡터 양자기 설계법은 설계에 필요한 계산량이 획기적으로 줄면서 인식률은 보존되어 문맥 독립 화자 인식에 새로운 대안이 되며 또한 특징 벡터 공간을 설정할 수 있는 다양한 응용에 적용이 가능할 것으로 사료된다.

퍼지 양자화를 이용한 초저전송률 동영상 부호기의 율제어 (Rate Control of Very Low Bit-Rate Video Coder using Fuzzy Quantization)

  • 양근호
    • 융합신호처리학회논문지
    • /
    • 제5권2호
    • /
    • pp.91-95
    • /
    • 2004
  • 본 연구에서는 H.263 부호기에서 양자화 변수의 추정을 위한 퍼지 제어기를 제안한다. 퍼지화 방법으로는 Mamdani법을 이용하였으며, 비퍼지화는 무게 중심법을 이용한다. 퍼지 입력변수로는 영상의 분산값, 엔트로피 및 현재의 움직임 벡터와 이전 영상의 움직임 벡터를 이용한다. 분산값과 엔트로피는 공간영역 특징을 반영하며, 움직임 벡터는 시간영역의 특징을 반영한다. 시각적인 특성에 적합하게 퍼지변수를 결정하며 퍼지 소속함수를 유도하여, 퍼지 규칙의 수를 줄이도록 FAM bank를 설계한다. 퍼지 양자화를 실제 동영상 압축에 적용함으로써 복원영상의 화질 특성이 향상되고, 율제어가 효과적으로 이루어지는 결과를 얻을 수 있음을 보인다.

  • PDF

고음질의 음성합성을 위한 퍼지벡터양자화의 퍼지니스 파라메타선정에 관한 연구 (A Study on Fuzziness Parameter Selection in Fuzzy Vector Quantization for High Quality Speech Synthesis)

  • 이진이
    • 한국지능시스템학회논문지
    • /
    • 제8권2호
    • /
    • pp.60-69
    • /
    • 1998
  • 본 눈문에서는 퍼지 벡터양자호를 이용하여 음성을 합성하는 방법을 제시하고,원음에 가까운 합성음을 얻기 위하여 퍼지벡터양자화의 성능을 최적화 하는 Fuzziness갑의 선정방법을 연구한다. 퍼지벡터 양자화를 이용하여 음성을 합성할때, 분석단에서는 입력 음성패턴과 코드북의 음성패턴의 유사도를 나타내는 퍼지 소속함수값을 출력하고, 합성단에서는 분석단에서 얻은 퍼지소속 함수값, fuzziness값, 그리고 FCM(Fuzzy-C-Means) 연산식을 이용하여 음성을 합성한다. 시뮬레이션을 통하여 벡터양자화에 의해 합성된 음성과 퍼지 벡터양자화에 의해 합성된 음성을 코드북의 크기에 따라 비교한 결과, 퍼지벡터양자화를 이용한 음성합성의 성능이 코드북 크기가 절반으로 줄어도 벡터양자화에 의한 성능과 거의 같음을 알수 있다. 이것은 VQ(Vecotr Quantiz-ation)에 의한 음성합성 결과와 같은 성능을 얻기 위해서 퍼지 VQ를 사용하면, 코드북 저장을 위한 메모리의 크기를 절반으로 줄일 수 있음을 의미한다. 그리고 SQNR을 최대로 하는 퍼지 벡터양자화를 얻기 위한 최적 Fuzziness값은 음성분석 프레임의 분산값이 크면 작게 선정해야 하고, 작으면 크게 선정 해야함을 밝혔다. 또한 합성음들을 주파수 영역의 스펙트로그램에서 비교한 결과 포만트 주파수와 피치주파수에서 퍼지 VQ에 의한 합성음이 VQ에 의한 것보다 원 음성에 더 가까움을 알 수 있었다.

  • PDF

광대역 음성 부호화기용 선 스펙트럼 주파수 계수 양자화기 설계 (Design of the LSF Parameter Quantizer for the Wideband Speech Codec)

  • 지상현;강상원;윤병식
    • 한국음향학회지
    • /
    • 제20권4호
    • /
    • pp.29-34
    • /
    • 2001
  • 본 논문에서는 고품질 음성 서비스를 가능하게 하는 광대역 음성 부호화기의 선 스펙트럼 주파수 (line spectral frequency: ISF) 계수 양자화기를 설계하였다. 광대역 음성 부호화기를 위한 효율적인 LSF 계수 양자화기를 설계하기 위하여, 인접 프레임간의 상관도를 이용하였으며, 각 해당 프레임의 ISF 계수에 대한 양자화를 인접 프레임간 상관도가 높은 프레임과 상관도가 낮은 프레임으로 나누어 독립적으로 수행하였다. 인접 프레임간 상관도가 높은 프레임의 LSF계수 양자화를 위하여 예측 피라미드형 벡터 양자화기 (predictive pyramid vector quantizer: PPVQ)를 사용하여 양자화하였고, 상관도가 낮은 프레임의 LSF 계수는 피라미드형 벡터 양자화기 (PVQ)를 사용하여 양자화 하였다. PPVQ에서 예측기로 1차 AR 예측기를 사용하였다. 광대역 음성 부호화기를 위해 본 논문에서 설계된 UF 계수양자화기를 평균스펙트럼 왜곡(spectral distortion: SD) 성능 관점에서 실험한 결과, LSF계수 양자화에 할당된 비트가 프레임당 40비트일 때, 평균 SD값이 1 dB 내외이고, 2 dB 이상 및 4 dB 이상 outlier가 각각 3.87%및 0.01%인 transparent한 성능을 얻을 수 있었다.

  • PDF

주축의 연속적 분할을 통한 고속 벡터 양자화 코드북 설계 (Fast VQ Codebook Design by Sucessively Bisectioning of Principle Axis)

  • 강대성;서석배;김대진
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권4호
    • /
    • pp.422-431
    • /
    • 2000
  • 본 논문에서는 주성분 해석 기법에 기반한 새로운 벡터 양자화 코드북 설계 방법을 제안한다. 주성분 해석 알고리즘은 입력 영상벡터를 더 작은 차원의 특징 벡터로 변환시키는데 사용되며, 변환된 영역에서 특징 벡터의 군집을 최적으로 결정된 분할 초평면을 이용하여 두 군집으로 분할하는 과정을 반복 함으로써 코드북을 생성한다. 본 논문에서는 연산 시간이 오래 걸리는 최적 분할 초평면 탐색을 (1) 분할 초평면은 특징 벡터의 주축에 수직이며, (2) 좌우측 부군집의 오차의 균형점과 일치하며, (3) 좌우측 부군집의 오차를 점진적으로 조정함으로서 연산 수행 시간을 크게 단축시켰다. 제안한 주축 연속 분할은 분할전후의 오차의 감축이 가장 큰 군집에 대해, 전체 군집의 오차가 설정한 수준보다 작을 때까지 연속적으로 수행된다. 실험 결과 제안한 주성분 해석 기반 벡터 양자화 방법은 SOFM을 이용한 방법보다 수행시간이 빠르며 K-mean 알고리즘을 이용한 방법보다 복원 성능이 뛰어남을 볼 수 있다.

  • PDF

신경망을 이용한 저비트율 영상코딩 (Low Sit Rate Image Coding using Neural Network)

  • 정연길;최승규;배철수
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2001년도 추계종합학술대회
    • /
    • pp.579-582
    • /
    • 2001
  • 벡터변형은 벡터 양자화(VQ)와 부호화를 통합한 새로운 방법이다. 최근까지 부호화에 적용된 코드북 생성은 LBG 알고리즘이었으나 신경회로망을 기반으로 한 자기생성 특성맵(SOFM: Self Organizing Feature Map)의 장점을 이용하면 시스템의 성능을 개선할 수 있다는 점에 착안하였다. 본 논문에서는 SOFM 알고리즘을 적용한 VTC(Vector Transformation coding)코드북 생성과 LBG 알고리즘의 부호화률에 대한 결과를 비교하여 분석하였다. 벡터 양자화의 문제점은 계산의 복잡성과 코드북 생성에 있으므로 본 연구에서는 이 문제의 해결을 위해 신경망 접근법을 제안한다.

  • PDF

PVQ를 이용한 RPE 구동 시퀀스 양자화 연구 (A Study on Excitation Sequence Quantization in RPE Speech Coding)

  • 강상원
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.164-167
    • /
    • 1995
  • RPE 음성부호화기에서 합성 필터로 인한 구동벡터 양자화잡음의 증폭효과를 분석하고 regular pulse 시퀀스의 양자화로 인한 성능감쇄를 줄이기 위해 pyramid vector 양자화방식을 도입하였다. 제안된 방식의 성능평가는 구동시퀀스 양자화를 위해 adaptive PCM을 이용하는 GSM 표준 RPE 방식과의 객관적 및 주관적 성능비교를 통해 수행하였다.T JDSMDQLRY 결과 제안된 방식은 대략 1dB의 SNR 및 segmental SNR 값 증가를 가져왔고, 또한 비공식 청취시험결과 명료도의 증가를 느낄 수 있었다.

  • PDF

웨이브릿 변환과 선택적 예측 벡터 양자화를 이용한 인공위성 화상데이터의 부호화 (Satellite Image Data Coding Using Wavelet Transform and Selectively Predictive Vector Quantization)

  • 반성원;김병주;김경규;정원식;김영춘;신용달;김건일
    • 전자공학회논문지S
    • /
    • 제36S권4호
    • /
    • pp.38-44
    • /
    • 1999
  • 본 논문에서는 웨이브릿 변환과 선택적 예측 벡터양자화를 이용한 인공위성 화상데이타 부호화 방법을 제안하였다. 이 방법에서는 대역내 중복성을 제거하기 위하여 각각의 대역을 웨이브릿 변환하고, 대역간 중복성을 제거하기 위해 에측하는 대역으로부터 생성된 임계치 지도를 이용하여 선택적 예측 벡터양자화를 행한다. 따라서 이 방법은 대역내 및 대역간 중복성을 효과적으로 제거하기 때문에 부호화 효율을 향상시킨다. 이 방법을 실제 Landsat TM 인공위성 화상데이타에 실험한 결과 기존의 방법에 비하여 부호화 효율이 향상됨을 확인하였다.

  • PDF