• 제목/요약/키워드: Subband feature

검색결과 42건 처리시간 0.024초

Presentation-Oriented Key-Frames Coding Based on Fractals

  • Atzori, Luigi;Giusto, Daniele D.;Murroni, Maurizio
    • ETRI Journal
    • /
    • 제27권6호
    • /
    • pp.713-724
    • /
    • 2005
  • This paper focuses on the problem of key-frames coding and proposes a new promising approach based on the use of fractals. The summary, made of a set of key-frames selected from a full-length video sequence, is coded by using a 3D fractal scheme. This allows the video presentation tool to expand the video sequence in a "natural" way by using the property of the fractals to reproduce the signal at several resolutions. This feature represents an important novelty of this work with respect to the alternative approaches, which mainly focus on the compression ratio without taking into account the presentation aspect of the video summary. In devising the coding scheme, we have taken care of the computational complexity inherent in fractal coding. Accordingly, the key-frames are first wavelet transformed, and the fractal coding is then applied to each subband to reduce the search range. Experimental results show the effectiveness of the proposed approach.

  • PDF

Low Power DSP Implementation of 3D Sound Localization

  • Sakamoto, Noriaki;Kobayashi, Wataru;Onoye, Takao;Shirakawa, Isao
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 ITC-CSCC -1
    • /
    • pp.253-256
    • /
    • 2000
  • This paper describes a DSP implementation of a real-time 3D sound localization algorithm with the use of a low power embedded DSP. A distinctive feature of this implementation is that the audible frequency band is divided into three, in accordance with the sound reflection and diffraction phenomena through different media from a certain sound source to human ears, and then in each subband a specific implementation procedure of the 3D sound localization is devised so as to operate real-time at a low frequency of 50MHz on a 16bit fixed-point DSP. Thus out DSP implementation can provide a listener with 3D sound effects through a headphone at low cost and low power consumption.

  • PDF

퍼지적분을 이용한 웨이블릿 기반의 3차원 얼굴 인식 (Wavelet based Fuzzy Integral System for 3D Face Recognition)

  • 이영학;심재창
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권10호
    • /
    • pp.616-626
    • /
    • 2008
  • 깊이 값에 따른 얼굴의 형상은 사람의 특징을 나타내는 중요한 요소 중의 하나로서 각 사람마다 다른 모양을 가지고 있으며, 얼굴 영상으로부터 분리한 주파수 성분은 동일한 얼굴에 대하여 또 다른 중요한 하나의 얼굴 특징으로 볼 수 있다. 본 논문은 3차원 얼굴 영상으로부터 등고선 값에 의해 추출된 영역에 대하여 각 영역별로 주파수 분리를 하여 특징을 추출한 후 이 주파수에 대한 퍼지적분을 적용한 얼굴 인식 알고리즘을 제안한다. 먼저 객체와 배경을 분리하여 얼굴을 추출한 후 얼굴에서 가장 두드러진 형태인 코끝을 찾고, 회전에 대해 정규화를 실시한다. 얼굴의 등고선 영역은 코끝을 기준으로 깊이 값에 따라 영역이 추출되며 사람마다 서로 다른 형상 특징을 가진다. 등고선에 따라 획득된 3차원 얼굴 영상으로부터 이산 웨이블릿 변환을 이용하여 4가지의 주파수 성분을 추출하여 특징정보로 사용한다. 각각의 웨이블릿 주파수 성분을 추출한 등고선 영역에 대해 차원의 감소를 위하여 고유얼굴 추출과 특징 공간상에서 클래스간의 분리를 최대화시키기 위해 선형판별분석 알고리즘을 이용하여 유사도를 비교하였다. 클래스간의 분별 정보를 등고선 영역과 각 영역의 주파수 영역에 대해 퍼지적분 방법을 사용하여 인식률을 향상 시켰으며, 깊이 혼합 방식의 경우는 98.6%의 인식률을 나타내었다. 제안된 방법이 다른 알고리즘보다 인식률이 향상되었다.

잡음환경에서 Teager 에너지와 음성부재확률 기반의 음성향상 알고리즘 (Speech Enhancement Algorithm Based on Teager Energy and Speech Absence Probability in Noisy Environments)

  • 박윤식;안홍섭;이상민
    • 대한전자공학회논문지SP
    • /
    • 제49권3호
    • /
    • pp.81-88
    • /
    • 2012
  • 본 논문에서는 다양한 잡음환경에서 효과적인 잡음 제거 (NS, noise suppression)를 위한 새로운 음성향상 (speech enhancement) 알고리즘을 제안한다. 제안된 방법에서는 음성향상 알고리즘에서 잡음전력 갱신을 위한 음성검출 (VAD, voice activity detection)의 피쳐 (feature) 파라미터로서 오염된 음성신호를 기반으로 주파수 밴드 별로 도출되는 기존의 지역 음성부재확률 (LSAP, local speech absecne probability) 대신 오염된 음성신호의 Teager energy (TE)를 적용한 LSAP를 적용한다. 또한 적용된 TE operator의 성능을 개선하기 위하여 프레임 단위로 도출되는 전역 음성부재확률 (GSAP, global SAP)을 TE의 가중치 파라미터로서 적용한다. 제안된 알고리즘은 기존의 방법과 객관적인 실험을 통해 비교 평가한 결과 다양한 배경잡음 환경에서 향상된 성능을 보였다.

웨이블렛을 이용한 영상 및 제어 신호의 전송에 관한 연구 (A Study on the Transmission of Image Data and Control Signal Using Wavelet)

  • 이미선;곽재혁;성하경;이종배;임준홍
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2003년도 학술회의 논문집 정보 및 제어부문 A
    • /
    • pp.207-210
    • /
    • 2003
  • In this paper, we have implemented the DVR system which is controlled far away, and added a function of TCP/IP Network for image data and control signal transmission, the DVR system has the advantage of easy to search and of no loss in stored quality. The continuously declining price of the hard drive presents the opportunity for the DVR system to displace the analog system. Also, with spread of the internet the needs of PC based the DVR system increase. Therefore, we have implemented DVR system within a function of network. When obtained image through the PTZ camera is transmitted to digital form, very large space of storage is required, hence image compression is essential. We use JPEG2000 for compression of image. JPEG2000 adopt DWT by means of transform. DWT concentrates important information of image on subband and has feature of multi-resolution. It is effective in order to express image. Thus JPEG2000 is suitable for image compression in DVR system. The significance of this paper is to design the DVR system which is controlled through TCP/IP network and to implement transmission of image compression using JPEG2000.

  • PDF

얼굴표정과 음성을 이용한 감정인식 (An Emotion Recognition Method using Facial Expression and Speech Signal)

  • 고현주;이대종;전명근
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권6호
    • /
    • pp.799-807
    • /
    • 2004
  • 본 논문에서는 사람의 얼굴표정과 음성 속에 담긴 6개의 기본감정(기쁨, 슬픔, 화남, 놀람, 혐오, 공포)에 대한 특징을 추출하고 인식하고자 한다. 이를 위해 얼굴표정을 이용한 감정인식에서는 이산 웨이블렛 기반 다해상도 분석을 이용하여 선형판별분석기법으로 특징을 추출하고 최소 거리 분류 방법을 이용하여 감정을 인식한다. 음성에서의 감정인식은 웨이블렛 필터뱅크를 이용하여 독립적인 감정을 확인한 후 다중의사 결정 기법에 외해 감정인식을 한다. 최종적으로 얼굴 표정에서의 감정인식과 음성에서의 감정인식을 융합하는 단계로 퍼지 소속함수를 이용하며, 각 감정에 대하여 소속도로 표현된 매칭 감은 얼굴에서의 감정과 음성에서의 감정별로 더하고 그중 가장 큰 값을 인식 대상의 감정으로 선정한다.

펴지 군집화 알고리즘 기반의 웨이블릿 변환을 이용한 3차원 얼굴 인식 (3D Face Recognition using Wavelet Transform Based on Fuzzy Clustering Algorithm)

  • 이영학
    • 한국멀티미디어학회논문지
    • /
    • 제11권11호
    • /
    • pp.1501-1514
    • /
    • 2008
  • 깊이 값에 따른 얼굴의 형상은 사람의 특징을 나타내는 중요한 요소 중의 하나로서 각 사람마다 다른 모양을 가지고 있다. 다른 형상을 가진 얼굴 영상으로부터 분리한 주파수 성분은 동일 얼굴에 대한 또 다른 중요 특징 성분의 하나가 될 수 있다. 본 논문은 3차원 얼굴 영상에서 등고선 값을 따라 추출된 영역에 대하여 각 영역별로 주파수 분리를 이용하여 특징을 추출한다. 그리고 이 주파수에 대한 수정된 퍼지 군집화를 적용한 얼굴 인식 알고리즘을 제안한다. 먼저 객체와 배경을 분리하여 얼굴을 추출한 후 얼굴에서 가장 두드러진 형태인 코끝을 찾는다. 이를 이용하여 회전된 얼굴에 대해 정규화를 실시한다. 얼굴의 등고선 영역은 코끝을 기준으로 깊이 값에 따라 영역이 추출되며 이는 사람마다 서로 다른 형상 특징을 가진다. 등고선에 따라 획득된 3차원 얼굴 영상으로부터 이산 웨이블릿 변환을 이용하여 4가지의 주파수 성분을 추출하여 특징정보로 사용한다. 각각의 웨이블릿 주파수 성분을 추출한 등고선 영역에 대해 차원의 감소를 위하여 고유얼굴 추출과 특징 공간상에서 클래스간의 분리를 최대화시키기 위해 선형 판별 분석 알고리즘을 이용하여 유사도를 비교하였다. 본 논문에서는 클래스간의 분별 정보를 향상시키고자 각각의 등고선 영역과 각 영역의 주파수별로 수정된 퍼지 군집화 알고리즘을 적용하여 인식률을 향상 시켰으며, 코끝으로부터 깊이 값이 60인 영역의 경우 98.3%의 인식률을 나타내었다.

  • PDF

음성의 특징 단계에 독립 요소 해석 기법의 효율적 적용을 통한 잡음 음성 인식 (Independent Component Analysis on a Subband Domain for Robust Speech Recognition)

  • 박형민;정호영;이태원;이수영
    • 전자공학회논문지CI
    • /
    • 제37권6호
    • /
    • pp.22-31
    • /
    • 2000
  • 본 논문에서는 잡음이 섞인 음성 신호로부터 특징을 추출하는 과정에서 잡음의 영향이 배제된 음성의 특징을 추출하는 방법을 제안한다. 이 방법은 여러 개의 마이크로폰으로 녹음된 잡음 음성 신호에 독립 요소해석 (Independent Component Analysis) 기법을 사용한 암묵 신호 분리를 적용하여 잡음 성분을 제거하게 된다. 또한, 새로운 스펙트럼 분석법을 제안하여 음성 인식을 위한 특징에 가까운 단계에서 독립 요소 해석 기법을 효율적으로 적용할 수 있도록 한다. 이 스펙트럼 분석법은 기존의 대역 에너지 계산 방법을 수정하여 하나의 대역을 몇 개의 영역으로 구분하고 그 영역내의 Fast Fourier Transform (FFT) 포인트 값들의 평균을 먼저 구한 후 대역 에너지를 계산하게 된다. 음성과 잡음에 대한 대역 에너지의 표본 분산을 사용한 해석과 인식 실험을 통해 이 스펙트럼 분석법이 잡음에 둔감한 방법임을 보였다. 또, 실세계에서 녹음된 잡음 음성 신호에 대해 새로운 스펙트럼 분석법에 독립 요소 해석 기법을 적용한 방법은 인식 성능을 크게 향상시켰으며, 특히 낮은 신호 대 잡음비에 대하여 효과적이었다. 이 방법은 음성 인식을 위한 특징 단계에 독립 요소 해석 기법을 효율적으로 적용 가능할 수 있도록 하는 방안을 제시한다.

  • PDF

비가시성과 유사도 증가를 통한 강인한 패턴 워터마킹 방법 (A Robust Pattern Watermarking Method by Invisibility and Similarity Improvement)

  • 이경훈;김용훈;이태홍
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권10호
    • /
    • pp.938-943
    • /
    • 2003
  • 본 논문에서는 Tikhonov-Miller 처리를 이용하여 다양한 공격에 대해서 워터마킹의 강인성을 향상시키는 방법을 제안한다. 시각적으로 판별할 수 있는 패턴 워터마크를 웨이브릿 변환 영역에서 수평(LH2), 수직(HL2), 대각(HH2) 성분의 부대역에 임계치를 기준으로 가중치를 달리 부여하여 삽입한다. 또한 인간 시각 시스템의 특징을 이용하여 워터마크를 삽입한다. 삽입한 워터마크는 보안성과 높은 추출율을 위해 무작위로 섞었다. 그런 다음 섞어 짜 맞추기(Interlace)를 했다. 제안한 방법의 강인성과 유사성 향상을 입증하기 위해 명암, 크기 변화, 필터링, 잘라내기, 히스토그램 평활화, 손실압축(JPEG, gif)과 같은 영상처리를 하였다. 실험 결과 제안한 방법은 비가시성을 고려하여 강인하게 워터마크를 삽입할 수 있고 여러 공격에 대해서 더욱 높은 상관 계수로 추출할 수 있었다.

웨이블릿 변환의 특성을 이용한 얼굴 인식 성능 개선 (Performance Improvement of the Face Recognition Using the Properties of Wavelet Transform)

  • 박경준;서석용;고형화
    • 한국항행학회논문지
    • /
    • 제17권6호
    • /
    • pp.726-735
    • /
    • 2013
  • 본 논문에서는 웨이블릿 변환의 특성을 이용한 얼굴인식 방법을 제안하여 인식성능 향상에 관한 연구를 진행하였다. 사용한 이산 웨이블릿 변환은 모웨이블릿의 특징과 비슷한 Daubechies D4 필터이다. 웨이블릿 변환영역 중 LL 대역의 데이터만을 이용할 경우 원본 데이터에 비하여 크기가 줄어들게 되어 인식과정의 속도와 메모리 사용량을 줄일 수 있게 된다. 또한 2차원 데이터의 변형없이 손실을 줄여 인식률을 향상시키기 위하여 2차원 LDA 방법을 적용하였다. 그리고 여기서 얻은 특징벡터를 이용하여 SVM을 수행하도록 하였다. 실험은 Matlab 프로그램을 통하여 ORL 얼굴 데이터베이스와 Yale 얼굴 데이터베이스를 이용하여 실험을 하였고 기존의 방법들과 인식률과 수행시간을 비교를 함으로써 제안한 방법의 우수성을 입증하였다.