• 제목/요약/키워드: 프레임 분류

검색결과 547건 처리시간 0.035초

프레임간 차영상 블록의 적응분류에 의한 영상시퀀스 압축 (Image Sequence Compression based on Adaptive Classification of Interframe Difference Image Blocks)

  • 안철준;공성곤
    • 한국지능시스템학회논문지
    • /
    • 제8권6호
    • /
    • pp.122-128
    • /
    • 1998
  • 이 논문에서는 영상시퀀스의 프레임간 차영상 블록을 영상활동도의 크기 및 분포에 따라 적응적으로 분류함으로써 영상시퀀스를 압축하는 기법을 제안한다. 활동도의 크기에 의한 분류에서는 차영상 블록에 포함되어 있는 물체의 에지부분에 해당하는 활동블록과 비활동 블록으로 분류하고, 활동도의 분포에 의한 분류에서도 활동블록들을 이산 코사인변환계수의 분포정도를 특징으로 하여 수직, 수평, 저활동 블록으로 분류한다. 대표적인 분류결과를 이용하여 RBFN 신경망을 학습시켜 프레임간 차영상 블록들의 비선형적인 분류 특성을 얻었다. 시뮬레이션 결과 RBFN을 이용한 차영상 블록의 분류가 영상활동도의 정렬방법이나 다층퍼셉트론 신경망(MLP)에 비해 영상시퀀스의 압축성능이 향상되었다.

  • PDF

심도카메라 기반의 실시간 얼굴 나이 인식 시스템 설계 (A Design of Real-time Facial Age Recognition System based on Depth-Camera)

  • 고기남;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.655-657
    • /
    • 2012
  • 본 논문에서는 심도(Depth) 카메라로부터 실시간 획득한 RGBD 데이터에서 심도 정보 기반의 AAM(Active Appearance Models)과 나이 인식 알고리즘[1]을 통해 4 개의 AG(Age Group)으로 분류하는 실시간 얼굴 나이 인식 시스템(Real-time Facial Age Recognition System)을 설계한다. 기존의 AAM 을 이용한 실시간 얼굴 특징 추출은 평균 약 4.17%의 프레임 손실율을 보였으나, 심도 정보를 활용한 AAM 은 평균 약 0.43%의 프레임 손실율만을 보였다[5]. 본 논문에서는 심도 정보를 활용한 AAM과 병렬 처리 방법인 CUDA 를 결합하여 나이 특징을 추출하고, 실시간 시스템에 적용 가능하도록 나이 인식 알고리즘을 개선하여 실시간 나이 인식 시스템을 설계한다. 설계된 시스템은 1)머리 위치 추적, 2)얼굴 인식 및 특징점 추출, 3)나이 특징 추출, 4) 나이 특징 분석, 5) 나이 분류의 5 가지 단계를 통해 최종적으로 4 개의 AG 로 분류한다.

표정 HMM과 사후 확률을 이용한 얼굴 표정 인식 프레임워크 (A Recognition Framework for Facial Expression by Expression HMM and Posterior Probability)

  • 김진옥
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제11권3호
    • /
    • pp.284-291
    • /
    • 2005
  • 본 연구에서는 학습한 표정 패턴을 기반으로 비디오에서 사람의 얼굴을 검출하고 표정을 분석하여 분류하는 프레임워크를 제안한다. 제안 프레임워크는 얼굴 표정을 인식하는데 있어 공간적 정보 외시간에 따라 변하는 표정의 패턴을 표현하기 위해 표정 특성을 공간적으로 분석한 PCA와 시공간적으로 분석한 Hidden Markov Model(HMM) 기반의 표정 HMM을 이용한다. 표정의 공간적 특징 추출은 시간적 분석 과정과 밀접하게 연관되어 있기 때문에 다양하게 변화하는 표정을 검출하여 추적하고 분류하는데 HMM의 시공간적 접근 방식을 적용하면 효과적이기 때문이다. 제안 인식 프레임워크는 현재의 시각적 관측치와 이전 시각적 결과간의 사후 확률 방법에 의해 완성된다. 결과적으로 제안 프레임워크는 대표적인 6개 표정뿐만 아니라 표정의 정도가 약한 프레임에 대해서도 정확하고 강건한 표정 인식 결과를 보인다. 제안 프레임 워크를 이용하면 표정 인식, HCI, 키프레임 추출과 같은 응용 분야 구현에 효과적이다

유성/무성/묵음 분류기와 주파수 스펙트럼을 이용한 음소 경계 검출 (Phoneme Segmentation Using Voice/Unvoiced/Silence Classifier and Spectral Information)

  • 이상래;한현배;한민수
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 1호
    • /
    • pp.86-91
    • /
    • 1999
  • 본 논문에서는 유성/무성/묵음 분류기와 주파수 스펙트럼 비교를 통하여 음소 경계 검출기를 구현하였다. 음소경계 검출은 음성 인식, 합성 및 분석 둥의 분야에서 매우 중요하다 유성/무성/묵음 분류기를 이용하여 유성음으로 판별되는 구간은 스펙트럼 비교를 통하여 음소 단위로 세분하였고 무성음으로 판별되는 구간은 한국어의 음성 특성을 고려하여 하나의 음소 단위로 간주하였다. 유성음 구간에 대한 스펙트럼 비교는 수정된 Itakura-Saito distance measure 와 Euclidean MFCC(Mel Frequency Cepstrum Coeffcients) distance measure를 사용하였고 비교 프레임은한 프레임을 건너 윈 경우가 가장 결과가 좋았다. 최종적으로 평균 음소 길이 정보를 이용하여 음소의 경계로 검출된 구간을 더 세분하거나 통합하였다. 유성/무성/묵음 분류기의 경우는 사무실에서 녹음한 고립단어에 대하여 $94.247\%$의 정확도를 보였고 음소 경계 검출의 경우는 $72.8\%$의 정확도를 보였다.

  • PDF

음성 진폭분포로 신경망을 구동한 유-무-묵음 분류 (A Neural Networks Approach to Voiced-Unvoice-Silence Classification Incorporating Amplitude Distribution)

  • 이인섭;최정아;배명진;안수길
    • 한국음향학회지
    • /
    • 제9권6호
    • /
    • pp.15-21
    • /
    • 1990
  • 유-무-묵음 분류 과정은 음성분석시에 아주 중요한 문제중의 하나이다. 음성에너지, ZCR, 자기 상관계수, LPC 계수, 예측에러 에너지등을 퍼래미터로 사용하여 지금까지 많은 분류기법이 제안되어져 왔다. 이런기법들은 기본적으로 퍼래미터를 추출해야 하고, 이 때문에 많은 계산량이 요구되고, 이들 퍼 래미터는 음성 본래의 정보들의 대부분을 상실하게 된다. 이 때문에 각 프레임의 진폭분포를 사용하는 새로운 앨고리즘을 제안하였다. 첫째로 V-U-S 영역은 개별 진폭분포형태를 가지기 때문에 주어진 프레 임에서 진폭분포를 구한다. 그런 다음에는 신경망을 통해 분류를 하게 된다. 신경망은 문덕값을 별도로 선정할 필요없고, 배경잡음에 강력하며, 또한 실시간 처리에 적합하다.

  • PDF

퍼지 분류기를 이용한 비전 기반 열차 위치 및 움직임 추정 (Vision-Based Train Position and Movement Estimation Using a Fuzzy Classifier)

  • 송재원;안태기;이대호
    • 디지털융복합연구
    • /
    • 제10권1호
    • /
    • pp.365-369
    • /
    • 2012
  • 본 논문에서는 열차 선로 모니터링을 위한 열차의 위치 및 이동을 추정하는 비전 기반 기법을 제안한다. 퍼지 분류기를 이용하여 열차의 상태를 판별하며, 프레임 차와 배경 감산을 각각 열차의 움직임과 존재를 판결하기 위해서 사용하고, 퍼지 분류기의 언어 변수로 사용된다. 실험 결과에서 제안하는 기법은 열차의 위치와 움직임을 정확히 추정하는 것을 볼 수 있다. 그러므로 제안하는 기법은 군중 밀도를 추정하거나 안전 감시를 수행하는 열차 모니터링 시스템에 활용될 수 있을 것이다.

예측형과 분류형 신경망을 이용한 한국어 숫자음 인식 (Recognition of Korean Isolated Digits Using Classification and Prediction Neural Networks)

  • 한학용;김주성;고시영;허강인;안점영
    • 한국통신학회논문지
    • /
    • 제24권12B호
    • /
    • pp.2447-2454
    • /
    • 1999
  • 본 논문은 기존 분류형 신경망의 인식성능을 향상시키기 위하여 프레임 정규화와 비선형 사후확률 추정법(N-APPEM)을 제안하고 한국어 숫자음에 대하여 예측형과 분류형 신경망으로 인식성능을 평가하였다. 실험결과 예측형 신경망에서 최고 98.0%의 인식률을 얻었다. 예측형 신경망은 네트워크가 입력패턴의 카테고리 수만큼 마련되는 복잡한 네트워크를 가지는 반면에 분류형 신경망은 단일 네트워크로 구성되며 프레임 정규화와 비선형 사후확률 추정법으로 85.5%까지 인식률을 향상시킬 수 있었으며 이는 기존의 방법보다 인식률이 12.0% 향상된 것이다.

  • PDF

내용기반 비디오 요약을 위한 효율적인 얼굴 객체 검출 (An Efficient Face Region Detection for Content-based Video Summarization)

  • 김종성;이순탁;백중환
    • 한국통신학회논문지
    • /
    • 제30권7C호
    • /
    • pp.675-686
    • /
    • 2005
  • 본 논문에서는 효율적인 얼굴 영역 검출 기법을 제안하고 얼굴 객체 검출을 통해 인물 기반의 비디오 시스템을 제공한다. 비디오 분할을 위해 비디오 시퀀스로부터 장면 전환점을 검출하고 분할된 장면들로부터 대표 프레임을 선정한다. 대표 프레임은 인접 프레임 간 변화량이 가장 적은 프레임으로 선정하였으며 추출된 대표 프레임에 대해서 얼굴 영역 검출 알고리즘을 적용하여 등장인물을 포함하는 프레임들을 정보로 제공한다. 얼굴영역 검출을 위해 피부색의 통계적 특성을 이용한 Bayes 분류기를 이용한다. 피부색 검출 결과 영상으로부터 수직 및 수평 투영 기법을 이용하여 영상 분할을 수행하고 후보군들을 생성한다. 생성된 후보군 중 오검출 영역을 최소화하기 위해서 이진 분류 나무(CART)를 이용하여 분류기를 생성한다. 특징 값으로는 SGLD(spatial gray level dependence) 매트릭스로부터 Inertial, Inverse Difference, Correlation 등의 질감 정보를 이용하여 최적의 이진 분류 나무를 생성한다. 실험 결과 제안된 얼굴 영역 검출 알고리즘은 복잡하고 다양한 배경에서도 우수한 성능을 보였으며, 얼굴 객체를 포함하는 프레임들을 비디오 정보로 제공한다. 제안하는 시스템은 향후 화자 인식 기법을 이용하여 등장인물 기반의 비디오 분석 및 에 활용될 수 있을 것이다.

GIS 기반의 위치기반서비스 프레임워크 연구 (A Study on the Service Framework for LBS based on GIS)

  • 진희채;김도현
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 한국공간정보시스템학회 2004년도 국내 LBS 기술개발 및 표준화 동향세미나
    • /
    • pp.45-59
    • /
    • 2004
  • GIS가 일반 사용자에게 보급되기 시작하면서 이동 GIS를 활용한 다양한 서비스와 위치 기반서비스들이 등장하고 활용되고 있다. 본 논문에서는 GIS 기반의 위치기반서비스에 대한 일반적인 서비스 프레임워크를 제시하고 서비스가 수행되는 모형을 살펴본다. 또한 이를 통하여 각각의 소요 기술을 파악하고 연구 진행 중인 다양한 기술의 활용방안에 대하여 살펴보도록 한다. 연구내용으로는 먼저 전통적인 GIS를 바탕으로 하는 GIS 기반의 위치기반서비스 구조를 발굴하여 일반적인 서비스 프레임워크로 작성한다. 서비스 프레임워크에서는 전통 GIS와 위치기반서비스의 서비스 수행관계, 인터페이스 관계 등을 표현하여 일반화하도록 하고, 이를 기반으로 한 서비스 운영형태를 제시한다. 그리고 서비스 프레임워크에 포함된 관련 분야의 기술 분류를 수행한다. 기술 분류는 위치기반서비스와 GIS를 바탕으로 주요 요구기술을 도출하여 이를 기능별로 구분하여 표준화 기술을 분류한다. 이들 기술은 각각의 기술발전 과정에 따라 다양한 과정으로 발전하게 되고 이에 따라서 서비스의 모양도 다양한 형태로 발전할 것으로 보인다. 마지막으로 이를 종합한 기술 로드맵을 제시하여 표준화 및 향후 발전방안을 제시하게 된다. 이를 바탕으로 GIS에 기반한 위치기반서비스의 일반화된 서비스 모형을 제시할 수 있고, 필요한 기술의 발굴, 기술발전에 따른 다양한 서비스의 예측이 가능할 것으로 보이며 GIS 서비스의 일반화에 크게 기여할 것으로 보인다.

  • PDF

계층적 분류기를 이용한 실시간 얼굴 검출 및 추적 (Real-time face detection and tracking using hierarchical classifier)

  • 김수희;양창호;이배호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (상)
    • /
    • pp.497-500
    • /
    • 2003
  • 본 논문은 계층적 분류기를 제안하여 실시간으로 얼굴 영역을 검출하고, PT(pan-tilt) 카메라를 통해 동적으로 얼굴을 추적할 수 있는 강인한 추적 알고리즘을 구현하고자 한다. 제안된 알고리즘은 분류기 학습, 실시간 얼굴 영역 검출, 추적의 세 단계로 구성된다. 분류기 학습은 AdaBoost 알고리즘을 이용하여, 독특한 얼굴 특징을 추출하는 계층적 분류기를 생성한다. 계층적 분류기는 높은 정확도를 가진 분류기들이 단계적으로 결합됨으로써 우수한 검출 성능으로 수행된다. 실시간 얼굴 영역 검출은 생성된 계층적 분류기를 통해, 빠르고 효율적으로 얼굴 영역을 찾아낸다. 추적은 PT 카메라를 통해 동적으로 검출 영역을 확장시키며, 이전 단계에서 추출된 얼굴 영역의 위치 정보를 이용하여 수행한다. 제안된 알고리즘은 계산의 효율성과 검출 성능을 동시에 증가시키며, 얼굴 검출 수행은 2초당 약 15프레임을 실시간으로 처리한다.

  • PDF