• 제목/요약/키워드: Motion Descriptor

검색결과 38건 처리시간 0.032초

손동작 인식에 의한 컴퓨터 비전 인터페이스 설계 (Design of Computer Vision Interface by Recognizing Hand Motion)

  • 윤진현;이종호
    • 전자공학회논문지CI
    • /
    • 제47권3호
    • /
    • pp.1-10
    • /
    • 2010
  • 손동작을 통한 입력방법은 컴퓨터와 디지털 기기의 발전에 따라 요구되는 새로운 HCI(Human-Computer Interaction) 방법으로써 그 가능성을 가지고 있으며 이에 대한 다양한 시도가 있었다. 본 논문에서는 컴퓨터 비전을 기반으로 단일 카메라를 사용하는 손 영역 검출 및 추적방법을 제시하고 이에 의한 컴퓨터 인터페이스를 제안한다. 기존에 많이 쓰이는 피부색 매치 방법에 추가하여 형태 정보를 더함으로써 손 영역 검출능력을 향상 시켰다. 이러한 형태 정보를 추출하는 방법으로써 주요 방향 에지 기술자라는 방법을 제안하였고 이는 강력하여 학습 시간 없이 한 가지 손 모델만을 사용하여 손 영역 검출을 할 수 있다. 또한 손 영역 검출과 추적하는 방법을 나누어 추적할 때는 회전에 대한 자유도를 높이도록 설계 하였다. 위 방법을 이용하여 3차원 공간에 그려지는 필기체 숫자 인식에 적용해 보았으며 분류 방법으로 DNAC 알고리즘을 사용하였다. 결과적으로 손 영역 검출은 82%의 검출률을 보였고 필기체 숫자 인식은 90%의 인식률을 보였다.

Hand Gesture Recognition using Optical Flow Field Segmentation and Boundary Complexity Comparison based on Hidden Markov Models

  • Park, Sang-Yun;Lee, Eung-Joo
    • 한국멀티미디어학회논문지
    • /
    • 제14권4호
    • /
    • pp.504-516
    • /
    • 2011
  • In this paper, we will present a method to detect human hand and recognize hand gesture. For detecting the hand region, we use the feature of human skin color and hand feature (with boundary complexity) to detect the hand region from the input image; and use algorithm of optical flow to track the hand movement. Hand gesture recognition is composed of two parts: 1. Posture recognition and 2. Motion recognition, for describing the hand posture feature, we employ the Fourier descriptor method because it's rotation invariant. And we employ PCA method to extract the feature among gesture frames sequences. The HMM method will finally be used to recognize these feature to make a final decision of a hand gesture. Through the experiment, we can see that our proposed method can achieve 99% recognition rate at environment with simple background and no face region together, and reduce to 89.5% at the environment with complex background and with face region. These results can illustrate that the proposed algorithm can be applied as a production.

비-파라미터 기반의 움직임 분류를 통한 비디오 검색 기법 (Video retrieval method using non-parametric based motion classification)

  • 김낙우;최종수
    • 대한전자공학회논문지SP
    • /
    • 제43권2호
    • /
    • pp.1-11
    • /
    • 2006
  • 본 논문에서는 샷(shot) 기반 비디오 색인 구조에서 비-파라미터(non-parametric) 기반의 움직임 분류를 통한 비디오 영상 검색 기법을 제안한다. 본 논문에서 제안하는 비디오 검색 시스템은 장면 전환 기법을 통해 얻은 샷 단위의 짧은 비디오로부터 대표 프레임과 움직임 정보를 취득한 후, 이를 통해 시각적 특징과 움직임 특징을 추출하여 유사도를 비교함으로써 시-공간적 특징을 이용한 실시간 검색이 가능하도록 구현되었다. 비-파라미터 기반의 움직임 특징의 추출은 MPEG 압축 스트림으로부터 정규화된 움직임 벡터계(界)를 추출한 후, 각각의 정규화된 움직임 벡터를 여러 개의 각도 빈(bin)으로 양자화하고 이의 평균과 분산, 방향 등을 고려함으로써 효과적으로 이루어진다. 대표 프레임에서의 시각 특징 검출을 위해서는 에지 기반의 공간 기술자를 이용하였다. 실험 결과는 영상 색인 및 검색에 있어서 제안된 시스템이 매우 효과적임을 잘 나타내고 있다. 데이터베이스 내 영상의 색인을 위해서는 R*-tree 구조를 이용한다.

압축 영역에서의 양방향 예측 구조를 이용한 움직임 흐름 분석 (Motion Flow Analysis using Bi-directional Prediction-Independent Framework in MPEG Compressed Domain)

  • 김낙우;김태용;최종수
    • 대한전자공학회논문지SP
    • /
    • 제41권5호
    • /
    • pp.13-22
    • /
    • 2004
  • 비디오 시퀀스는 일반적으로 다양한 움직임을 가지는 객체들로 구성되어 있기 때문에, 움직임 특징은 비디오 검색 등에서 매우 중요한 역할을 한다. 본 논문에서는 MPEG 압축 영상에서의 움직임 벡터를 비디오 영상의 움직임 표현 서술자로 활용하는 새로운 방법이 제안된다. 즉, 압축 영상에서의 다양한 움직임 벡터를 프레임이나 매크로블록 예측 구조에 관계없이 단일 움직임 방향만을 갖도록 하여, 이것을 해당 영상의 서술자로 활용한다. 이를 위하여, 본 논문에서는 양방향 예측 구조를 이용한 벡터 재해석 기법을 제안한다. 보통, 압축 영역에서의 각 프레임 움직임 해석 시, 움직임 벡터가 없는 I 프레임과 그 외 프레임들의 직접 비교는 불가능하지만, 제안 기법은 1, B, p 프레임 등의 모든 프레임에서 동등하게 벡터 해석을 할 수 있게 한다. 제안된 알고리즘은 압축 영상의 전체 복원과정 없이 매크로 블록 영역 상에서 처리함으로써 시간 손실을 줄이고 있으며, 실험 결과는 제안된 방법의 높은 성능을 잘 나타내어 주고 있다.

주문형 게임 서비스를 위한 장면 기술자 기반 고속 게임 부호화기 (Fast Game Encoder Based on Scene Descriptor for Gaming-on-Demand Service)

  • 전찬웅;조현호;심동규
    • 한국멀티미디어학회논문지
    • /
    • 제14권7호
    • /
    • pp.849-857
    • /
    • 2011
  • 주문형 게임 서비스는 서버에서 실행하는 게임을 동영상 부호화하여 클라이언트에 전송하고, 클라이언트에서 비디오 복호화를 통해 게임을 즐길 수 있게 해 준다. 다수의 사용자가 네트워크상에서 실시간 게임 서비스를 즐기기 위해서는 초고속 게임 인코더가 필요하다. 본 논문에서 제안한 방법은 장면 기술자를 정의하고, 이를 게임 영상을 부호화하는 부호화기에 부가적인 정보로 입력함으로써 움직임 예측, 율 왜곡 최적화와 같은 복잡도가 높은 부호화 과정을 생략하여 부호화기를 고속화한다. 장면 기술자를 움직임 벡터로 사용하고, 장면 기술자를 이용하여 매크로블록 모드를 결정해 부호화기를 고속화한다. 제안하는 방법의 성능 평가를 위해 H.264/AVC의 오픈 소프트웨어인 x264와 비교한 결과, x264에 어셈블리 코드가 포함되지 않은 경우에 대해서 약 192%의 부호화 속도 향상을 확인하였고, x264에서 일부 모듈에 대해서 어셈블리 최적화를 반영한 결과에 대해서는 86%의 부호화 속도가 향상되는 것을 확인할 수 있었다. 부호화기의 고속화 결과 60 FPS의 부호화 속도를 넘어 주문형 게임을 실시간으로 수행할 수 있게 되었다.

Improvement of Accuracy for Human Action Recognition by Histogram of Changing Points and Average Speed Descriptors

  • Vu, Thi Ly;Do, Trung Dung;Jin, Cheng-Bin;Li, Shengzhe;Nguyen, Van Huan;Kim, Hakil;Lee, Chongho
    • Journal of Computing Science and Engineering
    • /
    • 제9권1호
    • /
    • pp.29-38
    • /
    • 2015
  • Human action recognition has become an important research topic in computer vision area recently due to many applications in the real world, such as video surveillance, video retrieval, video analysis, and human-computer interaction. The goal of this paper is to evaluate descriptors which have recently been used in action recognition, namely Histogram of Oriented Gradient (HOG) and Histogram of Optical Flow (HOF). This paper also proposes new descriptors to represent the change of points within each part of a human body, caused by actions named as Histogram of Changing Points (HCP) and so-called Average Speed (AS) which measures the average speed of actions. The descriptors are combined to build a strong descriptor to represent human actions by modeling the information about appearance, local motion, and changes on each part of the body, as well as motion speed. The effectiveness of these new descriptors is evaluated in the experiments on KTH and Hollywood datasets.

비디오 행동 인식을 위하여 다중 판별 결과 융합을 통한 성능 개선에 관한 연구 (A Study for Improved Human Action Recognition using Multi-classifiers)

  • 김세민;노용만
    • 방송공학회논문지
    • /
    • 제19권2호
    • /
    • pp.166-173
    • /
    • 2014
  • 최근 다양한 방송 및 영상 분야에서 사람의 행동을 인식하여는 연구들이 많이 이루어지고 있다. 영상은 다양한 형태를 가질 수 있기 때문에 제약된 환경에서 유용한 템플릿 방법들보다 특징점에 기반한 연구들이 실제 사용자 환경에서 더욱 관심을 받고 있다. 특징점 기반의 연구들은 영상에서 움직임이 발생하는 지점들을 찾아내어 이를 3차원 패치들로 생성한다. 이를 이용하여 영상의 움직임을 히스토그램에 기반한 descriptor(서술자)로 표현하고 학습기반의 판별기로 최종적으로 영상내에 존재하는 행동들을 인식하였다. 그러나 단일 판별기로는 다양한 행동을 인식하기에 어려움이 있다. 따라서 이러한 문제를 개선하기 위하여 최근에 다중 판별기를 활용한 연구들이 영상 판별 및 물체 검출 영역에서 사용되고 있다. 따라서 본 논문에서는 행동 인식을 위하여 support vector machine과 sparse representation을 이용한 decision-level fusion 방법을 제안하고자 한다. 제안된 논문의 방법은 영상에서 특징점 기반의 descriptor를 추출하고 이를 각각의 판별기를 통하여 판별 결과들을 획득한다. 이 후 학습단계에서 획득된 가중치를 활용하여 각 결과들을 융합하여 최종 결과를 도출하였다. 본 논문에 실험에서 제안된 방법은 기존의 융합 방법보다 높은 행동 인식 성능을 보여 주었다.

장면 전환 기법을 이용한 동영상 검색 시스템 설계 (Design of Moving Picture Retrieval System using Scene Change Technique)

  • 김장희;강대성
    • 대한전자공학회논문지SP
    • /
    • 제44권3호
    • /
    • pp.8-15
    • /
    • 2007
  • 최근 멀티미디어 데이터를 효율적으로 전송, 저장 관리 및 검색하는 기술이 중요한 핵심 기술로 대두되고 있다. 그 중에서 멀티미디어 정보 검색의 경우 사용자가 원하는 정보를 표현할 수 있는 사용자 인터페이스 기술과 원하는 정보를 사용자에게 신속하고 정확하게 보여주는 기술의 필요성이 증대하고 있다. 본 논문에서는 MPEG으로 압축된 영상 정보에서 장면의 전환점인 컷을 효과적으로 검출하여 동영상을 분할하는 기법을 제안한다. 컷 검출(Cut detection)은 MPEG 비디오 시퀀스에서 동영상을 분할하는 가장 기본적이면서 중요한 기초 작업이며, 비디오 색인 및 검색을 위한 첫 번째 단계이다. 기존의 방법들은 프레임간을 비교하기 때문에 물체의 빠른 움직임이나 카메라의 움직임, 후레쉬의 섬광 등 화면 변화에 따라 오검출이 생기는 단점이 있다. 제안하는 컷 검출 기법은 먼저 입력영상을 DCT의 DC를 이용하여 샷을 검출한다. 이렇게 검출된 샷으로 데이터베이스를 구성하고, MPEG-7의 시각 기술자 중 HMMD 컬러 모델과 에지 히스토그램을 사용하여 영상에서 특징을 추출하였다. 그리고 제안하는 매칭 기법에 따라 단계별 검색을 수행하였다. 이 실험을 통해서 기존 방법들보다 높은 검색률을 보이는 개선된 동영상 분할 시스템을 설계하였다.

이동 객체 좌표의 시간적 히스토그램 기반 행동패턴 분석 및 검색 디스크립터 설계 (Behavior Pattern Analysis and Design of Retrieval Descriptor based on Temporal Histogram of Moving Object Coordinates)

  • 이재광;이규원
    • 한국정보통신학회논문지
    • /
    • 제21권4호
    • /
    • pp.811-819
    • /
    • 2017
  • 이동 객체 정보로 이루어진 디스크립터 및 시간적 히스토그램 기반 움직임 패턴 분석 알고리즘을 제안한다. 이동객체의 검출, 추적 및 분석을 위하여 배경으로부터 이동객체를 분리하는 배경학습을 수행한다. 무게중심의 좌표연관성을 이용하여 객체를 식별한 후 객체별로 추적한다. 시간적 히스토그램은 객체의 무게중심의 위치와 시간 정보를 이용해 움직임 특징 패턴을 정의한 것으로서 시간적 히스토그램으로부터 각 객체의 좌표정보와 비교하여 움직임특징 및 행동정보를 파악한다. 검출된 각 객체의 시작프레임, 종료프레임, 위치 등 행동정보를 연결리스트에 저장하여 관리한다. 저장된 정보들을 바탕으로 디스크립터를 작성하고 비디오 검색 알고리즘을 설계한다. 다양한 객체 이동 비디오에 대한 검색 실험을 통해 기존 방법보다 높은 검색 정확도를 보임을 확인하였다.

최인접 거리 비율 정합을 이용한 영상 특징점 선택 방법 (Image Feature Point Selection Method Using Nearest Neighbor Distance Ratio Matching)

  • 이준우;정재협;강종욱;나상일;정동석
    • 전자공학회논문지
    • /
    • 제49권12호
    • /
    • pp.124-130
    • /
    • 2012
  • 본 논문에서는 현재 진행 중인 MPEG(Motion Picture Experts Group, ISO/IEC JTC1 SC29 WG11)의 표준화 작업 중 CDVS(Compact Descriptor for Visual Search)의 CE-7(Core Experiment)인 특징점 선택에 대한 방법을 제안한다. 서술자의 경량화를 위해서는 영상으로부터 추출된 많은 수의 특징점들 중에서 영상 정합에 사용될 중요한 특징점들을 선택해야 한다. 본 논문에서는 최 인접 거리 비율 정합(Nearest Neighbor distance ratio matching) 방법에 의해 영상 정합 단계에서 사용되지 않고 버려지는 특징점들을 미리 추출 단에서 제거하는 방법 제안하였다. 제안된 방법을 통하여 적은 비트 전송률을 요하는 시스템에서 특징점의 낭비를 피할 수 있고 결과적으로 추가적인 특징점을 사용할 수 있으므로 전체적인 성능 향상을 얻을 수 있었다. 제안된 알고리즘을 통하여 Pair-wise 정합 실험에서 기존의 Test Model 대비 최고 2.3%의 성공율(True positive rate)의 향상을 보였다.