• 제목/요약/키워드: VQ

검색결과 252건 처리시간 0.033초

중요 웨이브렛 계수 검출에 의한 임베디드 영상 부호화 기법 (An Embedded Image Coding Scheme by Detecting Significant Wavelet Coefficients)

  • 박정호;최재호;곽훈성
    • 전자공학회논문지S
    • /
    • 제36S권8호
    • /
    • pp.48-54
    • /
    • 1999
  • 본 논문에서는 웨이브렛 영역에서 임베디드 영상 부호화를 위한 새로운 알고리즘을 제안하였다. 이 방식은 Shapiro가 제안한 알고리즘을 에지 검출, 계층적 트리 및 분류벡터 양자화 기법등과 결합하여 이를 확장한 형태이다. 일반적으로 영상에서의 에지는 시각적으로 중요한 요소이며, 기존의 많은 문헌에서 이러한 에지 정보가 웨이브렛 변환 영역에서의 중요계수와 관련이 있음을 보여주었다. 본 논문에서는 이러한 특성을 이용하여 웨이브렛 트리에서 그의 하위 계층을 조사하지 않고도 중요계수를 쉽게 검출하는 알고리즘을 제안하였다. 이러한 중요계수에 대하여 계층적 트리를 구성하였고 트리의 부호화를 위하여 분류벡터 양자화가 적용되었다. 실험결과 제안한 부호화기는 기존의 방식에 비하여 특히 낮은 비트율에서도 좋은 결과를 나타냄을 확인하였으며 전기적 전송이 요구되는 분야에 응용될 수 있을 것으로 기대된다.

  • PDF

쌍직교 웨이브렛 변환과 가변 블럭 윤곽선 추출에 의한 영상 데이타 압축 (Image Data Compression Using Biorthgnal Wavelet Transform and Variable Block Size Edges Extraction)

  • 김기옥;김재공
    • 한국통신학회논문지
    • /
    • 제19권7호
    • /
    • pp.1203-1212
    • /
    • 1994
  • 본 논문에서는 쌍직교 웨이브렛 변환으로 영상을 다해상도 분해하고 중간 및 고주파 대역을 가변 블록분할하여 벡터 양자화하는 방법을 제안한다. 먼저 원 영상을 쌍직교 웨이브렛 변환하고 중간 주파수 대역을 퀘드트리 구조로 분할하여 윤곽선을 형성하고 있는 웨이브렛 계수를 추출한다. 중간 주파수 데역의 윤관선은 고주파 대역에 그대로 적용한다. 따라서 고주파 대역의 퀘드트리 분할에 필요한 부가 정보를 줄인다. 이같이 분할된 부블럭은 각 스케일과 방향에서 설계된 코드북으로 벡터 양자화한다. 시뮬레이션 결과로부터 제안된 방법은 중간 및 고주파 대역을 일정 크기로 나누어 벡터 양자화하는 방법 보다 약 20(%)의 비트 감축이 가능하였고 복원 영상의 블록 효과 및 예지 열화의 감소를 나타내었다.

  • PDF

확률적 방법을 이용한 음성 개성 변환 (Voice Personality Transformation Using a Probabilistic Method)

  • 이기승
    • 한국음향학회지
    • /
    • 제24권3호
    • /
    • pp.150-159
    • /
    • 2005
  • 본 논문에서는 임의의 음성을 특정 화자가 발성한 것처럼 들리도록 변환하는 음성 개성 변환 알고리즘에 대해 연구하였다. 제안된 기법은 화자의 음성을 LPC 켑스트럼, 피치, 발성 속도를 사용하여 표현하였으며 각각에 대한 변환 규칙을 생성하여 변환을 수행하였다. LPC 켑스트럼은 혼합 가우시안 모델을 이용한 확률적으로 모델링하고, 두 화자간의 대응관계를 조건 확률로 나타내었다. 확률적인 모델링에 필요한 각종 파라메터들을 얻기 위해 최대 가능도 기법이 사용되었으며, 변환 LPC 켑스트럼은 최소 자승 오차 방법에 근거하여 얻어지도록 하였다. 운율 변환을 위한 변수로 본 논문에서는 피치와 발성 속도를 사용하였으며, 두 음성간의 평균값 비율을 사용하여 운율 변환을 수행하였다. 제안된 기법은 기존 벡터 양자화 기반의 기법과 비교에서, 객관적인 척도로 사용한 평균 켑스트럼 거리 감소율, 가능도 증가율 면에서 우수한 성능을 나타내었다. 주관적인 테스트에서도 기존의 방법과 유사한 인식율을 얻었으며 특히 완만하게 변화하는 스펙트럼 궤적에 따른 고음질이 얻어짐을 확인할 수 있었다.

DCT 맵과 이진 트리 구조 벡터 양자화기를 이용한 영상 부호화 (Image Coding Using DCT Map and Binary Tree-structured Vector Quantizer)

  • 조성환;김응성
    • 한국정보처리학회논문지
    • /
    • 제1권1호
    • /
    • pp.81-91
    • /
    • 1994
  • 벡터 양자화기를 이용하여 영상의 부호화기를 설계하는데 있어서 2차원 이산여현 변환(2D-Discrete Cosine Transform)에 근거한 DCT 맵(map)과 새로운 부호책(codebook) 설계로서 알고리듬을 제안한다. 영상을 작은 부블럭으로 나누고 2차원 이산여현변환 으로 대부분의 정보를 포함하는 부분, 즉 부호화하기 어려운 부분과 부호화하기 쉬운 적은 정보를 포함하는 영역으로 나누어 맵을 만들고 이 맵에 따라 영상의 중요한 특징 들을 2차원 이산여현변환으로 추출한다. 부호책은 트리 구조에 근거한 2진 트리로 두 영역을 따로 학습세트로 나눔으로서 만들어 진다. 2진 트리의 중간 노드에서 각 학 습 벡터는 그 노드에서의 문턱 값과 비교하여 두개의 아래 노드중 하나에 속하게 된다. 국제 표준화상인 Lenna와 Boat 영상에 대하여 본 알고리듬으로 영상을 부호화했을 때 PNN과 CVQ 알고리듬에 비하여 수행 시간을 줄이고, PNN 알고리듬보다는 각각 약0.45 dB과 0.33 dB만큼, CVQ 알고리듬보다 각각 약 0.05 dB과 0.1 dB만큼 더 좋은 영상의 화질을 얻을 수 있었다.

  • PDF

MLT 여기신호를 이용한 광대역 음성 부호화기 설계 (Design of Wideband Speech Coder Using the MLT Residual Signal)

  • 오연선;신재현;이인성
    • 한국음향학회지
    • /
    • 제24권5호
    • /
    • pp.248-254
    • /
    • 2005
  • 본 논문에서는 대역분할 광대역 음성 부호화기의 구조와 음질 향상을 위한 새로운 고대역 구조를 제안한다. 대역분할 방식에 의해 광대역 음성은 저대역 ($O\~4kHz$) 음성과 고대역 ($4\~8kHz$) 음성으로 나뉘어 지고 각각 G.729E와 MLT(Modulated Lapped Transform) 여기모델을 적용하여 서로 독립된 방식으로 부호화한다. 4kbps의 낮은 전송률로 부호화되는 고대역에서는 MLT 여기모델을 효율적으로 이용하기 위하여 유 무성음을 구별하였고 유성음에 대해서는 저대역 피치주기를 이용한 MLT peak picking 방법을 적용하였다. 즉, MLT 변환된 여기신호는 주기적인 피크를 갖는 주기신호로 나타나며 이때의 피크값을 추출하여 양자화하여 전송한다. 무성음에 대해서는 에너지 값에 따라 비트를 달리 적용하고, 선형예측 스펙트럴 응답이 가중된 MLT 벡터 양자화 방법을 적용하였다. 제안된 15.8kbps 광대역 음성 부호화기의 성능평가는 주관적인 음질평가로 선호도 테스트를 수행하였다.

다층회귀신경예측 모델 및 HMM 를 이용한 임베디드 음성인식 시스템 개발에 관한 연구 (A Study on Development of Embedded System for Speech Recognition using Multi-layer Recurrent Neural Prediction Models & HMM)

  • 김정훈;장원일;김영탁;이상배
    • 한국지능시스템학회논문지
    • /
    • 제14권3호
    • /
    • pp.273-278
    • /
    • 2004
  • 본 논문은 주인식기로 흔히 사용되는 HMM 인식 알고리즘을 보완하기 위한 방법으로 회귀신경회로망(Recurrent neural networks : RNN)을 적용하였다. 이 회귀신경회로망 중에서 실 시간적으로 동작이 가능하게 한 방법인 다층회귀신경예측 모델 (Multi-layer Recurrent Neural Prediction Model : MRNPM)을 사용하여 학습 및 인식기로 구현하였으며, HMM과 MRNPM 을 이용하여 Hybrid형태의 주 인식기로 설계하였다. 설계된 음성 인식 알고리즘을 잘 구별되지 않는 한국어 숫자음(13개 단어)에 대해 화자 독립형으로 인식률 테스트 한 결과 기존의 HMM인식기 보다 5%정도의 인식률 향상이 나타났다. 이 결과를 이용하여 실제 DSP(TMS320C6711) 환경 내에서 최적(인식) 코드만을 추출하여 임베디드 음성 인식 시스템을 구현하였다. 마찬가지로 임베디드 시스템의 구현 결과도 기존 단독 HMM 인식시스템보다 향상된 인식시스템을 구현할 수 있게 되었다.

정규화신뢰도 기반 가변어휘 고립단어 인식기의 거절기능 성능 분석 (Rejection Performance Analysis in Vocabulary Independent Speech Recognition Based on Normalized Confidence Measure)

  • 최승호
    • 한국음향학회지
    • /
    • 제25권2호
    • /
    • pp.96-100
    • /
    • 2006
  • 고립단어 인식기의 오 인식 단어를 거절하기 위한 방법으로 정규화 신뢰도가 제안되어 논문 [1-2]에서 성공적으로 적용된 바 있다. 그러나 정규화 신뢰도의 성능 측정을 위해 고정된 단어 셌을 대상으로 실험을 하였다. 본 논문에서는 정규화 신뢰도를 가변어휘 음성인식 영역에 적용하여 신뢰도의 거절성능을 밝히고 특히, 벡터양자화기를 이용하여 미 출현 트라이 폰의 문제를 극복하는 방법을 제안한다. 이때 정규화 신뢰도는 트라이 폰 신뢰도들의 통계적 특징(평균과 표준편차)을 사용한다. 가변어휘 인식실험 결과음소 단위의 정규화방법이 트라이 폰 기반 정규화방법에 비하여 우수한 성능을 보였으며 이러한 결과는 논문 [1-2]의 결과와는 상이한 것으로 트라이 폰 기반 정규화 방법이 미 출현 트라이 폰에 대하여 강인하지 못하다는 점을 시사하고 있다. 따라서 정규화 신뢰도가 음소 또는 트라이 폰에 상관없이 기준 신뢰도인 RLTC 신뢰도 [3]에 비하여 우수한 성능을 보였으며 가변어휘 인식에서도 동작함을 확인 할 수 있었다.

임베디드 직렬 다중 생체 인식 시스템 개발에 관한 연구 (A Study on the Development of Embedded Serial Multi-modal Biometrics Recognition System)

  • 김정훈;권순량
    • 한국지능시스템학회논문지
    • /
    • 제16권1호
    • /
    • pp.49-54
    • /
    • 2006
  • 현재의 지문 인식 시스템은 지문 패턴의 복제와 지문 특징점의 해킹이라는 불안한 요소가 잠재되어 있어, 시스템 오동작의 주요 원인이 되기도 한다. 이에 본 논문에서는 신체의 일부인 지문을 주 핵심 인식기로 사용하고, 여기에 최근 널리 이용 되고 있는 화자 인증을 이용하여 직렬 형태의 다중 생체인식 시스템을 구현하였다. 구현된 시스템은 다중생체인식시스템으로 먼저 음성에 대한 인증과정이 성공하면 지문에 대한 인식과정을 수행하는 구조로 되어있다. 또한 효율적인 실시간 인증 처리를 위해 기존의 음성 인식 알고리즘 중에서 화자 종속형인 DTW(Dynamic Time Waning) 알고리즘을 사용하였으며, 지문 인식 알고리즘으로는 계산량을 고려하여 인공지능 기법인 KSOM(Kohonen Self-Organizing feature Map) 알고리즘을 적용하였다. 본 논문에서 구현한 다중생체 인식시스템을 실험한 결과 지문과 음성을 각각 이용한 단일인식시스템보다 본인거부율은 $2\~7\%$정도 떨어졌지만, 인식시스템에서 가장 중요한 요소인 타인수락율은 전혀 발생하지 않음을 확인하였다. 아울러 인식테스트 시간 또한 기존의 단일 생체 인식 시스템과 차이가 거의 없었으며, 인식에 걸린 시간은 평균 1.5초 정도였다. 이에 구현된 다중 생체 인의 시스템은 여러 가지 실험 결과 단일 인식 시스템보다 더 효율적인 보안 시스템임을 증명하였다.

웨이브릿 영역에서 다분광 화상데이터의 효율적인 압축 알고리듬 (Efficiency Algorithm of Multispectral Image Compression in Wavelet Domain)

  • 반성원;석정엽;김병주;박경남;김영춘;장종국;이건일
    • 대한전자공학회논문지SP
    • /
    • 제38권4호
    • /
    • pp.362-370
    • /
    • 2001
  • 본 논문에서는 웨이브릿 영역에서의 영역 분류와 대역간 예측 및 선택적 벡터 양자화를 이용한 다분광 화상테이타 압축 기법을 제안하였다. 이 방법에서는 각 대역을 웨이브릿 변환 후, 각 대역의 기저밴드의 대역별 특성을 이용하여 영역 분류를 행하였다. 그리고, 다른 대역과 해상도가 동일하고 공간적 분산이 작으며 분광적 상관성이 큰 기준대역 (reference channel)을 결정한 뒤, 이를 영역별 스칼라 및 분류별 가변 벡터 양자화를 행하여 부호화 하였다. 또한 기준대역과의 대역간 상관성이 큰 대역들에 대해서는 영역별 대역간 예측을 행한 후, 활동도가 높은 블록에 대해서만 선택적 벡터 양자화로 부호화를 행하였다. 이때, 활동도가 높은 블록들의 위치정보는 기준대역으로부터 얻어지는 임계치 지도 (threshold map; THMAP)를 이용하였다. 즉, 제안한 방법에서는 각 대역에 대해 웨이브릿 영역에서의 영역 분류 후 영역별 대역간 예측을 행함으로써 다분광 화상데이타에 존재하는 대역간 중복성을 제거하고 선택적 벡터 양자화를 행함으로써 대역내 중복성을 효과적으로 제거하여 압축효율을 향상시킨다. 실제 원격 센싱된 인공위성 화상데이타에 대한 실험을 통하여 제안한 기법의 부호화 효율이 기존의 기법에 비하여 우수함을 확인하였다.

  • PDF

벡터양자화된 부대역 코덱에서 최적필터의 구현 (The Design of Optimal Filters in Vector-Quantized Subband Codecs)

  • 지인호
    • 한국음향학회지
    • /
    • 제19권1호
    • /
    • pp.97-102
    • /
    • 2000
  • 부대역 코딩은 데이터의 압축을 위해 신호의 주파수를 부대역 필터로 통과시켜 서로 상관이 없는 주파수대역으로 분할하여 각 대역의 신호의 에너지에 적합한 비트 할당을 사용하여 인코딩한다. 실제로 부대역 신호의 코딩은 PCM, DPCM이 사용되는 데 고압축의 전송속도를 얻기 위해서 벡터양자기를 사용하였다. 대부분의 연구자들은 부호화기의 오차에만 주안점을 두고 전체 필터대역의 회복오차와 이 오차가 필터대역에 의존되는 것에는 연구가 진행되지 않았다. 본 논문은 벡터양자기를 사용한 부대역 코덱의 분석과 최적구현의 새로운 접근방법을 제공하여 준다. 본 논문에서는 부대역 코덱에서 벡터양자기의 코드 북의 크기와 벡터크기 그리고 대역필터계수에 의존되는 전체 시스템의 회복오차인 Mean Squared reconstruction Error(MSE)를 계산하였다. 본 논문에서는 각 대역의 구조에서 이 MSE로 양자화를 모델링하고 주어진 전송속도, 필터길이, 입력신호 상관모델의 함수인 이 MSE를 최소화하는 최적의 Finite Impulse Response(FIR) 필터를 구현하였다. 최적구현의 예로 2-채널의 paraunitary 필터뱅크의 4-tap 필터계수를 구하였다. 이 paraunitary 최적의 필터 계수들을 Monte Carlo 모의시험을 사용하여 구하였다. 이 논문은 벡터양자기를 사용한 부대역 코덱의 분석방법을 제공하여 주어서 그 활용도가 기대된다.

  • PDF