• 제목/요약/키워드: 학습벡터 양자화

검색결과 47건 처리시간 0.03초

아이겐공간에서 벡터 양자기를 이용한 얼굴인식 (Face Recognition using Vector Quantizer in Eigenspace)

  • 임동철;이행세;최태영
    • 대한전자공학회논문지SP
    • /
    • 제41권5호
    • /
    • pp.185-192
    • /
    • 2004
  • 본 논문은 얼굴의 아이겐공간에서 벡터 양자화 기법을 이용한 얼굴 인식을 제안한다. 아이겐페이스 방법의 문제점은 하나의 아이겐페이스로 얼굴의 다양한 변이를 표현하기에 부족하다는데 있다. 이러한 약점을 극복하기위해 제안된 방법은 아이겐페이스 공간에서 얼굴의 변이를 벡터 양자화 기법으로 군집화한다. 벡터 양자기는 학습과정을 통해 각 사람의 아이겐 페이스 집합을 양자화된 대표점들로 표현한다. 그리고 인식 과정을 통해 벡터 양자기는 얼굴 데이터 베이스에 저장된 대표점들과 입력된 얼굴 특징벡터와의 양자화 오차를 최소로 하는 대표점을 찾는다. 실험은 Faces94 데이터베이스에서 600장의 얼굴을 가지고 수행하였다. 실험 결과 기존의 아이겐페이스 방법은 최소 64개의 오인식을 하였고 제안된 방법은 코드북의 크기를 4개로 하였을 때 최소 20개의 오인식을 보였다. 결론적으로 제안된 방법은 얼굴의 변이를 수용하여 인식률을 향상시키는 효과적인 방법으로 사료된다.

다중비트율 트리구조 벡터 양자화를 이용한 영상의 대역분할 부호화 (Subband Image Coding using Multirate Tree-Structured Vector Quantization)

  • 이광기;이완주;김대관;최일상;박규태
    • 한국통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.895-906
    • /
    • 1993
  • 본 논문에서는 영상의 대역분할 부호화를 위한 다중비트율 트리구조 벡터양자화를 제안하였다. 영상의 대역분할은 원영상을 특정 대역과 방향성을 갖는 대역성분들로 분리하므로, 대역분할을 거친 각 대역성분을 학습영상으로 사용하여 다중비트율 트리구조 벡터양자화기를 설계하였다. 대역분할을 거친 각 대역성분에 대한 최적비트할당은 원하는 비트율과 왜곡을 갖는 다중 비트율 트리구조 벡터양자화기의 전정서브트리를 선택하는 문제로 귀착된다.

  • PDF

순환신경망과 벡터 양자화를 이용한 비정상 소나 신호 탐지 (Abnormal sonar signal detection using recurrent neural network and vector quantization)

  • 이기배;고건혁;이종현
    • 한국음향학회지
    • /
    • 제42권6호
    • /
    • pp.500-510
    • /
    • 2023
  • 수동소나 신호에는 정상신호와 비정상 신호가 같이 존재하는 경우가 대부분이다. 정상신호와 혼재된 비정상 신호는 주로 정상신호만을 학습하는 오토인코더를 이용하여 탐지된다. 하지만 기존의 오토인코더는 혼재된 신호로부터 왜곡된 정상신호를 복원하므로 부정확한 탐지를 수행할 수 있다. 이러한 한계를 개선하고자, 본 논문에서는 순환신경망과 벡터 양자화 기반의 비정상 신호 탐지 모델을 제안한다. 제안된 모델은 학습된 잠재벡터들을 대표하는 코드 북을 생성하고, 제안된 코드벡터의 탐색을 통해 보다 정확하게 비정상 신호를 탐지한다. 공개된 수중 음향 데이터를 이용한 실험에서 제안된 기법이 적용된 오토인코더와 변이형 오토인코더는 기존 모델에 비해 최소 2.4 % 향상된 탐지 성능과 최소 9.2 % 높은 비정상 신호 추출 성능을 보였다.

비음수 행렬 분해와 학습 벡터 양자화를 이용한 얼굴 인식 (Face Recognition using Non-negative Matrix Factorization and Learning Vector Quantization)

  • 진동한;강현철
    • 전자공학회논문지
    • /
    • 제54권3호
    • /
    • pp.55-62
    • /
    • 2017
  • 비음수 행렬 분해 기법(non-negative matrix factorization)은 대표적인 부분 영역 기반 표현 기법의 하나로 영상의 부분적인 특징을 나타내는 기저 벡터의 선형 조합으로 영상을 표현하는 기법이다. 본 논문에서는 여러 가지 비음수 행렬 분해 기법을 이용하여 얼굴 영상을 표현하고, 추출된 특징을 기반으로 학습 벡터 양자화를 이용하여 얼굴 인식을 수행하였다. 추출된 각 기법의 기저 벡터를 비교하여 각 기법의 특징을 분석하였다. 또한 NMF 기법들의 인식율 검증을 통해 비음수 행렬 기법의 얼굴 인식에 대한 활용 가능성을 확인하였다.

신경 회로망 벡터 양자화를 이용한 움직임 탐색 영역의 예측 (Motion Search Region Prediction using Neural Network Vector Quantization)

  • 유대현;김재창
    • 전자공학회논문지B
    • /
    • 제33B권1호
    • /
    • pp.161-169
    • /
    • 1996
  • 본 논문에서는 동영상 압축의 핵심 기술인 움직임 벡터 추정에 있어서 신경 회로망을 이용한 벡터 양자화에 의해 탐색 영역을 예측하는 방법을 제안한다. 훈련영상을 입력으로 하여 전역 탐색법 등에 의하여 구해진 움직임 벡터를 이용하여 움직임 벡터 코드 북을 생성하고 이를 예측 탐색 점으로 이용한다. 움직임 벡터 코드 북을 생성하기 위해서 병렬 처리 특성과 다양한 학습 알고리즘을 갖는 신경 회로망을 이용하였다. 제안된 방법은 움직임 벡터들의 높은 공간적 상관성을 이용하게 되고 결과적으로 적은 탐색 점으로 움직임 벡터를 추정할 수 있으므로 계산량을 줄일 수 있을 뿐 아니라 움직임 벡터를 표현하기 위해 소요되는 비트 수도 크게 줄일 수 있다. 모의 실험을 통하여 제안된 방식이 기존의 고속 블록 매칭 알고리즘보다 우수함을 보였다.

  • PDF

예측오차 열의 중복성 제거에 의한 비트율 개선 (Improvement of Bit Rate by Removing the Repeated Sequences of Prediction Errors)

  • 김형철;조제황
    • 한국음향학회지
    • /
    • 제17권8호
    • /
    • pp.68-72
    • /
    • 1998
  • 본 논문에서는 기존의 DPCM에 의한 압축방법보다 더 낮은 비트율을 갖는 압축방 법을 제안한다. 각 화소의 예측오차 값은 DPCM방법에 의해 양자화되고, 양자화된 예측오차 의 열은 예측오차의 학습된 열로 구성된 코드북과 비교된다. 비교과정은 벡터양자화 방법과 동일하고, 그 결과 코드북의 주소를 생성한다. 제안된 방법은 DPCM과 동일한 복원 영상의 화질을 보이지만, 더 낮은 비트율을 얻을 수 있다.

  • PDF

임베디드 시스템에서의 양자화 기계학습을 위한 효율적인 양자화 오차보상에 관한 연구 (Study on the Effective Compensation of Quantization Error for Machine Learning in an Embedded System)

  • 석진욱
    • 방송공학회논문지
    • /
    • 제25권2호
    • /
    • pp.157-165
    • /
    • 2020
  • 본 논문에서는 임베디드 시스템에서의 양자화 기계학습을 수행할 경우 발생하는 양자화 오차를 효과적으로 보상하기 위한 방법론을 제안한다. 경사 도함수(Gradient)를 사용하는 기계학습이나 비선형 신호처리 알고리즘에서 양자화 오차는 경사 도함수의 조기 소산(Early Vanishing Gradient)을 야기하여 전체적인 알고리즘의 성능 하락을 가져온다. 이를 보상하기 위하여 경사 도함수의 최대 성분에 대하여 직교하는 방향의 보상 탐색 벡터를 유도하여 양자화 오차로 인한 성능 하락을 보상하도록 한다. 또한, 기존의 고정 학습률 대신, 내부 순환(Inner Loop) 없는 비선형 최적화 알고리즘에 기반한 적응형 학습률 결정 알고리즘을 제안한다. 실험 결과 제안한 방식의 알고리즘을 로젠블록 함수를 통한 비선형 최적화 문제에 적용할 시 양자화 오차로 인한 성능 하락을 최소화시킬 수 있음을 확인하였다.

연속음성 인식기를 위한 벡터양자화기 기반의 화자정규화 (Vector Quantizer Based Speaker Normalization for Continuos Speech Recognition)

  • 신옥근
    • 한국음향학회지
    • /
    • 제23권8호
    • /
    • pp.583-589
    • /
    • 2004
  • 포만트 등의 음향학적인 정보를 이용하지 않는 연속음성인식 (CSR)을 위한 벡터 양자화기 기반의 화자 정규화 방법을 제안한다. 이 방법은 앞서 제안한 간단한 숫자음 인식기를 위한 화자정규화 방법을 개선한 것으로, 코드북의 크기를 증가시켜 가면서 벡터양자화기를 반복적으로 학습시킴으로써 정규화된 코드북을 구한 다음, 치를 이용하여 시험용화자의 워핑계수를 추정한다. 코드북 생성과 워핑계수 추정을 위해 모음 음소의 집합과 자음과 모음을 포함한 모든 음소의 집합 등 두 가지 음소집합을 이용i,겨 실험하였으며, 추정한 워핑계수에 상응하는 구간선형 워핑함수를 이용하여 인식기의 학습과 시험에 사용될 특징벡터를 워핑하였다. TIMIT 코퍼스와 HTK toolkit을 이용한 음소인식 실험을 수행하여 제안하는 방법의 성능을 조사한 결과, 포만트를 이용한 워핑 방법과 비슷한 성능을 가짐을 확인하였다.

소속 학습벡터 수를 고려한 초기 코드북 생성 알고리즘 (Initial codebook generation algorithm considering the number of member training vectors)

  • 김형철;조제황
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.259-262
    • /
    • 2002
  • 벡터양자화에서 주어진 학습벡터를 가장 잘 대표할 수 있는 코드벡터의 집합인 코드북을 구하는 것은 가장 중요한 문제이다. 이러한 코드북을 구하는 알고리즘 중에서 가장 대표적인 방법은 K-means 알고리즘으로 그 성능이 초기 코드북에 크게 의존한다는 문제점을 가지고 있어 여러 가지 초기 코드북을 설계하는 알고리즘이 제안되어 왔다. 본 논문에서는 splitting 방법을 이용한 수정된 초기 코드북 생성 알고리즘을 제안하고자 한다. 제안된 방법에서는 기존외 splitting 방법을 적용하여 초기 코드북을 생성하되, 미소분리 과정 시 학습벡터의 수렴 빈도가 가장 낮은 코드벡터를 제거하고 수렴 빈도가 가장 높은 코드벡터를 미소분리 하여 수렴 빈도가 가장 낮은 코드벡터와 대체해가며 초기 코드북을 설계 한다. 제안된 방법의 적용온 기존 방법에서 MSE(mean square error)의 감소율이 가장 작은 미소분리 과정에서 시작하여 원하는 코드북 크기를 얻을 때까지 반복한다. 제안된 방법으로 생성된 초기 코드북을 사용하여 K-means 알고리즘을 수행한 결과 기존의 splitting 방법으로 생성된 초기 코드북을 사용한 경우보다 코드북의 성능이 향상되었다.

  • PDF

수정 퍼지 경쟁 학습 네트워크를 이용한 이미지 코딩 응용 (Application to the Image Coding by the Modified Fuzzy Competitive Learning Network)

  • 이범로;정진현
    • 한국정보처리학회논문지
    • /
    • 제5권7호
    • /
    • pp.1933-1942
    • /
    • 1998
  • 분류 벡터 양자화(classified vector quantization: CVQ)〔2의 부코드북을 설계함에 있어서, 경쟁 학습 네트워크〔5〕-〔7〕 는 소속도의 이분법적 표현으로 상당한 소속도를 가지는 벡터들이 학습 과정에 무시되는 경향을 가진다. 이를 개선하기 위해 제안된 퍼지 경쟁 학습 네트워크〔8〕는 각 클러스터가 연속적인 소속도를 가진다는 개념을 도입하여 이와 같은 문제들을 해결했다. 그러나 퍼지 경쟁 학습 네트워크를 CVQ에 적용할 경우, 각 부코드북의 크기를 시행착오로 결정해야 하는 문제점을 여전히 가지고 있으며, 이러한 문제점들의 개선을 위하여 본 논문에서는 수정 퍼지 경쟁 학습 네트워크(modified fuzzy competitive learning network)를 제안한다. 수정 퍼지 경쟁 학습 네트워크는 퍼지 학습 네트워크가 가지는 이 분법적 소속도를 연속적인 소속도로 확장하여, 학습 과정중에 나타날 수 있는 지역 최소점 도달을 억제하였다.

  • PDF