• 제목/요약/키워드: Shift Invariance

검색결과 32건 처리시간 0.05초

신경회로망을 이용한 연속음성중 키워드(keyword)인식에 관한 연구

  • 최관선;한민홍
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 1993년도 춘계공동학술대회 발표논문 및 초록집; 계명대학교, 대구; 30 Apr.-1 May 1993
    • /
    • pp.275-281
    • /
    • 1993
  • 본 발표에서는 신경회로망을 이용하여 연속음성중에서 키워드를 인식하는 방법을 설명한다. 연속음성에서 파형소편 및 음절을 식별하는 휴리스틱 알고리즘을 개발하였고, 연속음성을 음절단위로 파형소편 스펙트럼분석(선형예측법)으로 특성치를 추출하였다. 음절의 특성치는 코호넨 신경회로망을 통하여 학습을 시켰으며, 연속음성중 키워드인식은 먼저 음절을 인식하여 단어를 찾고, 인식된 단어가 키워드와 일치하는가를 확인한다. 본 연구의 의의는 파형소편 및 음절식별 알고리즘을 통하여, 크기불변성(Scaling invariance), 시간불변성(Time warping 및 Time-shift invariance), 중복성제거의 문제점을 해결하였고, 신경회로망의 학습을 통하여 화자독립적인 연속음성인식시스템 구축의 기반을 확립한데 있다. 본 음성인식모델은 학교구내 전화번호 안내시스템으로 활용단계에 있으며 전화번호뿐만아니라 주소안내시스템으로도 활용될 예정이다. 또한 자동차 운전보조시스템 및 주행안내시스템의 음성명령에 응용될 수 있는데, 예로 음성명령은 "핸들 좌로 20도", "시청까지 주행", "시청 지도안내"등이 될 수 있다. 현재 자동차 운전보조시스템은 컴퓨터 화면상 모의동작시스템으로 운영되고 있다. 본 음성인식모델은 화자종속시 90%이상, 화자독립시 70%의 인식결과를 보였다.시 90%이상, 화자독립시 70%의 인식결과를 보였다.

  • PDF

연속음성중 키워드(Keyword) 인식을 위한 Binary Clustering Network (Binary clustering network for recognition of keywords in continuous speech)

  • 최관선;한민홍
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 1993년도 한국자동제어학술회의논문집(국내학술편); Seoul National University, Seoul; 20-22 Oct. 1993
    • /
    • pp.870-876
    • /
    • 1993
  • This paper presents a binary clustering network (BCN) and a heuristic algorithm to detect pitch for recognition of keywords in continuous speech. In order to classify nonlinear patterns, BCN separates patterns into binary clusters hierarchically and links same patterns at root level by using the supervised learning and the unsupervised learning. BCN has many desirable properties such as flexibility of dynamic structure, high classification accuracy, short learning time, and short recall time. Pitch Detection algorithm is a heuristic model that can solve the difficulties such as scaling invariance, time warping, time-shift invariance, and redundance. This recognition algorithm has shown recognition rates as high as 95% for speaker-dependent as well as multispeaker-dependent tests.

  • PDF

웨이블렛 기반 영상 잡음제거를 위한 천이 불변 uHMT 추정 (Shift-Invariant uHMT Estimation for Wavelet-based Image Denoising)

  • 윤근수;정원용
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2001년도 하계 학술대회 논문집(KISPS SUMMER CONFERENCE 2001
    • /
    • pp.221-224
    • /
    • 2001
  • 본 논문은 웨이블렛 기반 영상 잡음제거를 위한 천이 불변 uHMT(universal hidden Markov tree) 추정을 제안한다. 제안된 추정은 영상의 크기와 스케일의 수에 독립적이고 어떤 학습도 필요하지 않는 단지 9개의 고정된 파라메터를 가지며 DWT(Discrete Wavelet Transform)의 천이 불변성 결핍에 의해 발생하는 가시적인 artifacts를 제거한다. 실험 결과, 제안된 추정은 기존의 웨이블렛 기반 잡음제거 방법들 보다 PSNR로 0.5-ldB 개선되었으며 수행 속도 측면에서 Ο(nlog n)를 제공한다.

  • PDF

이동성(shift ability)을 이용한 윈도우 웨이블릿 스테레오 정합 (Windowed Wavelet Stereo Matching Using Shift ability)

  • 신재민;이호근;하영호
    • 한국통신학회논문지
    • /
    • 제28권1C호
    • /
    • pp.56-63
    • /
    • 2003
  • 본 논문에서는 스테레오 정합을 위한 특징으로 웨이블릿의 이동성(shift ability)을 이용한 윈도우 웨이블릿 기반 스테레오 정합방법을 제안하였다. 기존의 정합방법에서 사용된 전 영상에 대한 웨이블릿 분해는 웨이블릿의 이동성 유지가 이루어지지 않아서 정합 정확도가 떨어진다. 그래서 웨이블릿의 이동성을 신뢰성 있는 정합정보로 사용하기 위해 윈도우로 전체 파형의 일부를 표본화하고 웨이블릿 분해를 수행하여 기준신호와 이동된 신호의 부대역 정보 사이의 상관도(cross-correlation)를 정합정보로 이용하였다. 대역별 상관도는 얻어진 4개의 부대역의 대역별 가중치가 고려되어 계산된다. 제안한 방법은 주파수 대역별 계층적인 정합과 양방향 정합과정을 통해 영상의 경계부분, 동일한 형태의 반복, 잡음(white noise)등이 포함된 영상에서의 오정합을 줄일 수 있었으며 특징정보가 부족한 부분에서의 정합도 개선할 수 있었다.

ARMA스펙트럼 추정을 위한 ELS FTF 알고리즘 (ELS FTF algorithm fot ARMA spectral estimation)

  • 이철희;장영수;남현도;양홍석
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 1989년도 한국자동제어학술회의논문집; Seoul, Korea; 27-28 Oct. 1989
    • /
    • pp.427-430
    • /
    • 1989
  • For on-line ARMA spectral estimation, the fast transversal filter algorithm of extended least squares method(ETS FTF) is presented. The projection operator, a key tool for geometric approach, is used in the derivation of the algorithm. ELS FTF is a fast time update recursion which is based on the fact that the correlation matrix of ARMA model satisfies the shift invariance property in each block, and thus it takes 10N+31 MADPR.

  • PDF

DFT를 이용한 Face Detection (DFT integration for Face Detection)

  • 한석민;최진영
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2006년도 심포지엄 논문집 정보 및 제어부문
    • /
    • pp.117-119
    • /
    • 2006
  • In this work, we suggest another method to localize DFT in spatial domain. This enables DFT algorithm to be used for local pattern matching. Once calculated, it costs same load to calculate localized DFT regardless of the size or the position of local region In spatial domain. We applied this method to face detection problem and got the results which prove the utility of our method.

  • PDF

평판 집적 광학계를 이용한 분수차 상관기 구현 (Planar integrated optics for performing fractional correlation operation)

  • 박선택;김필수;오차환;송석호
    • 한국광학회지
    • /
    • 제8권2호
    • /
    • pp.154-160
    • /
    • 1997
  • 푸리에 변환의 일반형인 분수차 푸리에 변환(fractional Fourier transform : FRT)을 근간으로 하는 분수차 상관기는 입력패턴의 위치나 모양에 따라 상관결과치가 변하는 공간 가변 특성을 갖는다. 이러한 특성을 갖는 분수차 상관기를 푸리에 변환을 이용하는 기존의 상관기와 비교하였고, 분수차에 따른 상관결과치의 변화를 분석하였다. 정확한 분수차 상관함수의 계산을 위하여 광학부품들의 정렬에 있어서 고도의 정확도와 안정도를 갖는 평판 집적 광학계를 구성하였으며, 실험결과와 계산결과를 비교함으로써 평판 집적 광학계에 의한 분수차 상관기의 구현이 매우 정확히 수행될 수 있음을 검증하였다.

  • PDF

Fourier 변환된 얼굴의 진폭스펙트럼의 karhunen-loeve 근사 방법에 기초한 변위불변적 얼굴인식 (Shift-invariant face recognition based on the karhunen-loeve approximationof amplitude spectra of fourier-transformed faces)

  • 심영미;장주석;김종규
    • 전자공학회논문지C
    • /
    • 제35C권3호
    • /
    • pp.97-107
    • /
    • 1998
  • In face recognition based on the Karhunen-Loeve approximation, amplitudespectra of Fourier transformed facial images were used. We found taht the use of amplitude spetra gives not only the shift-invariance property but also some improvment of recognition rate. This is because the distance between the varing faces of a person compared with that between the different persons perfomed computer experiments on face recognitio with varing facial images obtained from total 55 male and 25 females. We confirmed that the use of amplitude spectra of Fourier-trnsformed facial imagesgives better recognition rate for avariety of varying facial images including shifted ones than the use of direct facial images does.

  • PDF

비분리 고밀도 이산 웨이브렛 변환을 이용한 디지털 영상처리 (Digital Image Processing Using Non-separable High Density Discrete Wavelet Transformation)

  • 신종홍
    • 디지털산업정보학회논문지
    • /
    • 제9권1호
    • /
    • pp.165-176
    • /
    • 2013
  • This paper introduces the high density discrete wavelet transform using quincunx sampling, which is a discrete wavelet transformation that combines the high density discrete transformation and non-separable processing method, each of which has its own characteristics and advantages. The high density discrete wavelet transformation is one that expands an N point signal to M transform coefficients with M > N. The high density discrete wavelet transformation is a new set of dyadic wavelet transformation with two generators. The construction provides a higher sampling in both time and frequency. This new transform is approximately shift-invariant and has intermediate scales. In two dimensions, this transform outperforms the standard discrete wavelet transformation in terms of shift-invariant. Although the transformation utilizes more wavelets, sampling rates are high costs and some lack a dominant spatial orientation, which prevents them from being able to isolate those directions. A solution to this problem is a non separable method. The quincunx lattice is a non-separable sampling method in image processing. It treats the different directions more homogeneously than the separable two dimensional schemes. Proposed wavelet transformation can generate sub-images of multiple degrees rotated versions. Therefore, This method services good performance in image processing fields.

3중 밀도 이산 웨이브렛 변환을 이용한 디지털 영상처리 기법 (The Digital Image Processing Method Using Triple-Density Discrete Wavelet Transformation)

  • 신종홍
    • 디지털산업정보학회논문지
    • /
    • 제8권3호
    • /
    • pp.133-145
    • /
    • 2012
  • This paper describes the high density discrete wavelet transformation which is one that expands an N point signal to M transform coefficients with M > N. The double-density discrete wavelet transform is one of the high density discrete wavelet transformation. This transformation employs one scaling function and two distinct wavelets, which are designed to be offset from one another by one half. And it is nearly shift-invariant. Similarly, triple-density discrete wavelet transformation is a new set of dyadic wavelet transformation with two generators. The construction provides a higher sampling in both time and frequency. Specifically, the spectrum of the first wavelet is concentrated halfway between the spectrum of the second wavelet and the spectrum of its dilated version. In addition, the second wavelet is translated by half-integers rather than whole-integers in the frame construction. This arrangement leads to high density wavelet transformation. But this new transform is approximately shift-invariant and has intermediate scales. In two dimensions, this transform outperforms the standard and double-density discrete wavelet transformation in terms of multiple directions. Resultingly, the proposed wavelet transformation services good performance in image and video processing fields.