• 제목/요약/키워드: Codebook

검색결과 346건 처리시간 0.03초

HMM을 이용한 보행자 인식 (HMM-Based Human Gait Recognition)

  • 신봉기;석흥일
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권5호
    • /
    • pp.499-507
    • /
    • 2006
  • 최근, 사람을 인식하는데 있어 걸음걸이가 기존에 사용되어 오던 많은 생체인식을 보완할 만한 것으로 등장하였다. 본 연구는 보행자 실루엣의 동적 특징과 은닉 마르코프 모델(HMM)을 이용한 보행자 인식 방법을 제안한다. 보행자의 보행 모델은 무한 순환 구조의 HMM 두 가지를 사용하였다. 하나는 자기 조직화 지도(SOM)를 벡터 양자화기로 하는 이산 HMM방식이고, 다른 하나는 주성분 분석(PCA) 공간으로 변환된 특징 벡터를 이용하는 연속 HMM방식이다. 실험 결과 HMM이 몇 가지 변수의 조정에 대해 일관성 있는 성능 변화를 보이며 최고 88.1%의 인식률을 기록하였다. 또한 기존 연구 결과와 비교하여 볼 때 특징과 제안 구조의 모델은 보행자 인식에 충분한 적용 가능성이 있으며, 나아가 걸음걸이가 생체 인식으로 이용되기에 좋은 지표가 될 수 있을 것으로 판단된다.

다중 신경망을 이용한 영상 분류기에 관한 연구 (A Study on an Image Classifier using Multi-Neural Networks)

  • 박수봉;박종안
    • 한국음향학회지
    • /
    • 제14권1호
    • /
    • pp.13-21
    • /
    • 1995
  • 본 논문에서는 신경망 학습에 의한 영상분류 알고리즘을 개선하였으며, 이것은 입력패턴 생성부와 분류을 위한 역전파 알고리즘에 의한 광역신경망으로 구성된다. 입력패턴을 위한 특징값으로는 자기조직화 형상지도 학습에 의해 얻은 코드북 데이타를 특징벡터로 이용한다. 이것은 입력벡터로서 원영상에 충실하면서 입력 뉴런수를 감소시킨다. 분류기에 사용된 광역망 알고리즘은 가중치와 유니트 오프셋 제어가 가능하도록 역전파 알고리즘에 제어부와 어드레스 메모리부를 삽입하였다. 실험결과 이들 분류기는 학습시 국소최소점에 빠지지 않게 되며, 대규모 신경망을 구현하고자 할 때 망구조를 간단히 할 수 있다. 또한 이것은 동작속도를 크게 개선할 수 있다.

  • PDF

SC-FDMA 시스템에서 동 이득 전송 기법의 성능분석 (Performance Analysis of Equal Gain Transmission Technique for SC-FDMA System)

  • 김영주;이신
    • 대한전자공학회논문지TC
    • /
    • 제46권9호
    • /
    • pp.1-7
    • /
    • 2009
  • LIT (long-term evolution) 상향링크 송신부는 소형, 저가 단말기를 구현하기 위해 낮은 PAPR을 유지하는 SC-FDMA 변조 방식을 채택하였다. 최근 LIT-A 상향링크에서는 SC-FDMA 변조방식에 MIMO 기법 중 하나인 코드북을 이용한 preceding을 적용하는 것을 논의하고 있다. 본 논문에서는 SC-FDMA에 다양한 precoding을 적용하면 PAPR이 증가할 수 있음을 보인다. 따라서 비선형 전력 증폭기를 송신부에 고려한 채널 모델에서 선부호화를 적용하면 링크레벨 성능이 감소하게 된다. 그러나 동 이득 전송 기법을 채택하면 성능 감소가 거의 없으므로, 비선형 증폭기를 고려한 성능은 다른 기법보다 매우 우수하다 컴퓨터 시뮬레이션 결과도 이러한 성능을 보여준다.

백터 양자화의 고속 부호화 알고리즘 (Fast VQ Encoding Algorithm)

  • 채종길;황금찬
    • 한국통신학회논문지
    • /
    • 제19권4호
    • /
    • pp.685-690
    • /
    • 1994
  • 벡터 양자화의 부호화에서 입력벡터에 가장 잘 정합되는 코드벡터를 탐색하는 과정에서 발생하는 계산의 복잡도는 코드북의 크기에 비례하여 지수직으로 증가하고 실질적으로 응용을 제한한다. 본 논문에서는 정합 가능성이 없는 코드벡터에 대한 왜곡의 계산을 제거하기 위한 조건의 시작 벡터로서 참조 벡터를 사용하는 단순, 고속의 효율적인 벡터 양자화의 부호화 알고리즘을 제안하였다. 이는 입력벡터에 정합 기능성을 갖는 참조 벡터를 선택하고 코드 벡터에 대한 왜곡의 계산을 제거하기 위한 조건을 결합하는 것이다. 제한된 방법은 전탐색 벡터 양자화에 비하여 단지 10~15%의 수학적 연산을 필요로 한다. 그리고 덧셈과 비교 연산의 수는 크게 줄어들지 않지만 곱셈은 벡터 양자화의 여러 고속부호화 방법의 70~80%까지 들었다.

  • PDF

웨이블렛 변환을 이용한 음성에서의 감정 추출 및 인식 기법 (Emotion Recognition Method from Speech Signal Using the Wavelet Transform)

  • 고현주;이대종;박장환;전명근
    • 한국지능시스템학회논문지
    • /
    • 제14권2호
    • /
    • pp.150-155
    • /
    • 2004
  • 본 논문에서는 사람의 음성속에 내포된 6가지 기본 감정(기쁨, 슬픔, 화남, 놀람, 공포, 혐오)의 특징을 추출하고 인식하고자 한다. 제안한 감정인식 알고리즘은 웨이블렛 필터뱅크를 이용하여 각각의 감정별 코드북을 만들고, 인식단계에서 필터뱅크별 감정을 확인한 후 최종적으로 다중의사결정기법에 의해 감정을 인식하는 구조로 이루어져 있다. 이와 같은 웨이블렛 필터뱅크와 다중의사 결정기법에 기반을 둔 알고리즘의 유용성을 보이기 위해 실험에 사용된 음성은 20명의 화자로부터 6가지의 감정을 대상으로 각각 3번씩 발음한 감정음성을 녹음하여 총 360개의 데이터베이스로 구성하고 실험하였다. 이와 같이 제안한 알고리즘은 기존의 연구에 비해 5% 이상 향상된 인식률을 보였다.

벡터양자화를 위한 FNNPDS 인코더의 VLSI 설계 (VLSI design of a FNNPDS encoder for vector quantization)

  • 김형철;심정보;조제황
    • 대한전자공학회논문지SD
    • /
    • 제42권2호
    • /
    • pp.83-88
    • /
    • 2005
  • 벡터양자화에서 고속 인코딩에 사용되는 기존 방법인 PDS(partial distance search)와 FNNS(fast nearest neighbor search)를 결합한 FNNPDS(fast nearest neighbor partial distance search)를 VISI로 구현하기 위한 설계 방법을 제안하고, 모의실험을 통해 FNNPDS가 다른 방법에 비해 보다 고속화가 이루어짐을 입증한다. 모의실험 방법은 임의의 입력벡터에 대해 최단거리 부호벡터를 찾는 타이밍도를 고찰하고, Lena와 Peppers 영상에 대한 입력벡터당 평균 클럭 사이클을 비교한다. 모의실험 결과에 의하면 FNNPDS의 클럭 사이클 수는 다른 방법들보다 $79.2\%\~11.7\%$ 감소되었다.

벡터 양자화를 위한 고속 탐색 알고리듬에 관한 연구 (A Study on the Fast Search Algorithm for Vector Quantization)

  • 지상현;김용석;이남일;강상원
    • 한국음향학회지
    • /
    • 제22권4호
    • /
    • pp.293-298
    • /
    • 2003
  • 본 논문에서는 NNVQ (nearest neighbor vector quantization)를 위한 고속탐색 알고리듬을 제안하였다. 제안된 알고리듬은 입력 벡터 내 지정된 요소의 부호화 왜곡을 임계값과 비교해서 최적 코드워드가 될 가능성이 없는 코드워드를 탐색 대상 코드워드에서 제외함으로써 코드북 탐색의 범위를 줄인다. 이를 통해 기존의 풀서치(full-search) 알고리듬과 동일한 SD(spectral distortion) 성능을 얻으면서 부호화 과정에서의 처리시간과 복잡도를 감소시킨다. 제안된 알고리듬을 Gauss-Markov 소스에 대해 설계된 일반적인 벡터 양자화기와 3GPP에서 표준화된 AMR (adaptive multi-rate) 음성 코덱의 LSP 양자화기에 각각 적용하여 실험하였다. 실험결과 제안된 알고리듬은 SD 성능감쇄 없이 탐색 대상 범위를 감소시킴으로써 부호화시 복잡도를 50%이상 줄일 수 있었다.

가우시안 코드북을 갖는 다중대역 비균일 음성 표본화법 (On a Multiband Nonuniform Samping Technique with a Gaussian Noise Codebook for Speech Coding)

  • 정형교;배명진
    • 한국음향학회지
    • /
    • 제16권6호
    • /
    • pp.110-114
    • /
    • 1997
  • 잡음 음성신호에 비균일 표본화 부호화법을 적용하면, PCM 균일표본화의 전송율 정도로 데이타 전송율이 높아진다. 이러한 문제점을 해결하기 위해 비균일 표본화법을 성분분리된 음성신호에 적용하는 방법으로서 다중대역 비균일 파형부호화(MNWC)법을 제안하였었다. 그렇지만, 고대역의 성분에 대해 가우시안 잡음의 평균레벨로 단순하게 모델링 하였기 때문에, 비균일 표본화법에 비해 음질의 열화가 초래되었었다. 따라서 본 논문에서는 이러한 단점을 극복하기 위해 고대역의 성분을 중심주파수가 서로 다른 16가지의 가우시안 잡음으로 모델링하였다. 이렇게 하였을 때, 제안된 방법은 MOS평가가 평균 3.16 정도로 고음질을 유지하면서도 기존의 비균일 표본화법에 비해 1.5배 정도의 압축 율을 얻을 수 있었다.

  • PDF

Proposed Efficient Architectures and Design Choices in SoPC System for Speech Recognition

  • Trang, Hoang;Hoang, Tran Van
    • 전기전자학회논문지
    • /
    • 제17권3호
    • /
    • pp.241-247
    • /
    • 2013
  • This paper presents the design of a System on Programmable Chip (SoPC) based on Field Programmable Gate Array (FPGA) for speech recognition in which Mel-Frequency Cepstral Coefficients (MFCC) for speech feature extraction and Vector Quantization for recognition are used. The implementing process of the speech recognition system undergoes the following steps: feature extraction, training codebook, recognition. In the first step of feature extraction, the input voice data will be transformed into spectral components and extracted to get the main features by using MFCC algorithm. In the recognition step, the obtained spectral features from the first step will be processed and compared with the trained components. The Vector Quantization (VQ) is applied in this step. In our experiment, Altera's DE2 board with Cyclone II FPGA is used to implement the recognition system which can recognize 64 words. The execution speed of the blocks in the speech recognition system is surveyed by calculating the number of clock cycles while executing each block. The recognition accuracies are also measured in different parameters of the system. These results in execution speed and recognition accuracy could help the designer to choose the best configurations in speech recognition on SoPC.

벡터 양자화기를 사용한 최적의 부대역 필터 뱅크 구현에 관한 연구 (A Study on Optimum Subband Filter Bank Design Using Vector Quantizer)

  • 지인호
    • 한국인터넷방송통신학회논문지
    • /
    • 제17권1호
    • /
    • pp.107-113
    • /
    • 2017
  • 이 논문은 벡터 양자기가 포함된 부대역 코덱의 분석과 설계에서 벡터 양자기를 모델링하는 새로운 방법을 제시해준다. 우리는 각 코드북의 시작점들의 수(N), 각 코드워드의 길이(k), 필터 대역 계수들에 의존하는 부대역 코덱 시스템의 입력과 출력의 평균자승 회복 오차(MSE)를 계산한다. 본 논문은 확률밀도함수로 최적화된 벡터양자기가 존재하는 최적의 M밴드 필터 뱅크 구조는 등가의 스칼라 양자기의 변수들의 적절한 선택으로 구현될 수 있음을 보였다. 특정한 구현 예를 두 개의 다른 필터뱅크 구조인 Paraunitary 필터 뱅크와 Biorthogonal 필터 뱅크를 2채널 경우에 개발하였다. 이 이론적인 결과들은 확장의 Monte Carlo 시뮬레이션으로 확인되었다.