• 제목/요약/키워드: Object Recognition Region

검색결과 136건 처리시간 0.037초

양방향 필터 기반 Mean-Shift 기법을 이용한 강인한 얼굴추적 (Bilateral Filtering-based Mean-Shift for Robust Face Tracking)

  • 최완용;이윤형;정문호
    • 한국전자통신학회논문지
    • /
    • 제8권9호
    • /
    • pp.1319-1324
    • /
    • 2013
  • Mean-Shift 알고리즘은 목표모델과 후보영상 사이의 컬러분포의 유사도를 이용하는 국부적 탐색기법으로서, 그 기법의 단순성 및 안정성 면에서 뛰어나 얼굴추적에 많이 이용되고 있다. 그러나 컬러분포를 이용한 얼굴추적은 목표모델과 유사한 컬러분포를 갖는 객체나 배경의 영향에 취약하다. 또한 얼굴 추적에서 결정되는 얼굴영역은 얼굴인식 혹은 얼굴방향 등을 계산할 때 중요한 단서가 되는데, 완전히 다른 컬러분포를 갖는 객체의 가려짐으로 얼굴영역의 크기나 위치가 변동될 위험이 있다. 대체로 거리정보는 얼굴과 배경의 구분에 효율적이고 컬러정보는 객체 구분에 유리하다는 가정으로부터, 본 논문에서는 이러한 문제를 해결하기 위해 거리 정보와 컬러 정보를 함께 이용하는 양방향 필터를 고안하고, 이것을 Mean-Shift 알고리즘에 활용하였다. 일련의 실험을 통해 성공적인 실험결과를 얻었다.

Bottle Label Segmentation Based on Multiple Gradient Information

  • Chen, Yanjuan;Park, Sang-Cheol;Na, In-Seop;Kim, Soo-Hyung;Lee, Myung-Eun
    • International Journal of Contents
    • /
    • 제7권4호
    • /
    • pp.24-29
    • /
    • 2011
  • In this paper, we propose a method to segment the bottle label in images taken by mobile phones using multi-gradient approaches. In order to segment the label region of interest-object, the saliency map method and Hough Transformation method are first applied to the original images to obtain the candidate region. The saliency map is used to detect the most salient area based on three kinds of features (color, orientation and illumination features). The Hough Transformation is a technique to isolated features of a particular shape within an image. Therefore, we utilize it to find the left and right border of the bottle. Next, we segment the label based on the gradient information obtained from the structure tensor method and edge method. The experimental results have shown that the proposed method is able to accurately segment the labels as the first step of product label recognition system.

물체 인식을 위한 영역 특징과 특징점 정보의 상호 보완 방법 (Mutual Complemental Method between Region and Point Information for Object Recognition)

  • 유동진;방희범;이상훈;서일홍
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2008년도 심포지엄 논문집 정보 및 제어부문
    • /
    • pp.168-169
    • /
    • 2008
  • 물체 인식에 사용되는 특징 벡터로 영역과 점이 있다. 우리는 영역 특징을 기반으로 하는 물체 인식 알고리즘과 특징점 정보를 기반으로 하는 물체 인식 알고리즘이 상호 보완될 수 있도록 하는 방범을 소개한다. 우리가 제안한 방법에서는 두 가지 알고리즘의 중간 결과가 상호 보완되게 함으로써, 물체 인식의 성능을 향상시키고자 하였다. 또한 두 가지의 물체 인식 알고리즘을 병렬 처리될 수 있도록 함으로써, 사용자로 하여금 신속하게 인식 결과를 확인할 수 있도록 하였다.

  • PDF

360 도 ERP 영상에서 행동 인식 모델 성능 향상을 위한 전처리 기법 (Preprocessing Methods for Action Recognition Model in 360-degree ERP Video)

  • 박은수;유재성;김승환;류은석
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 추계학술대회
    • /
    • pp.252-255
    • /
    • 2019
  • 본 논문에서 Equirectangular projection(ERP) 영상을 행동 인식 모델에 입력하기전 제안하는 전처리를 통하여 성능을 향상시키는 것을 보인다. ERP 영상의 특성상 행동 인식을 하는데 불필요한 영역이 일반적인 2D 카메라로 촬영한 영상보다 많다. 또한 행동 인식은 사람이 Object of Interest(OOI)이다. 따라서 객체 인식모델로 인간 객체를 인식한 후 Region of Interest(ROI)를 추출하여 불필요한 영역을 없애고, 왜곡 또한 줄어든다. 본 논문에서 제안하는 기법으로 전처리 후 CNN-LSTM 모델로 성능을 테스트했다. 제안하는 방법으로 전처리를 한 데이터와 하지 않은 데이터로 행동 인식을 한 정확도로 비교하였으며 제안하는 기법으로 전처리 한 데이터로 행동 인식을 한 경우 데이터의 특성에 따라 다르지만, 최대 61%까지 성능향상을 보였다.

  • PDF

Detection and Recognition of Illegally Parked Vehicles Based on an Adaptive Gaussian Mixture Model and a Seed Fill Algorithm

  • Sarker, Md. Mostafa Kamal;Weihua, Cai;Song, Moon Kyou
    • Journal of information and communication convergence engineering
    • /
    • 제13권3호
    • /
    • pp.197-204
    • /
    • 2015
  • In this paper, we present an algorithm for the detection of illegally parked vehicles based on a combination of some image processing algorithms. A digital camera is fixed in the illegal parking region to capture the video frames. An adaptive Gaussian mixture model (GMM) is used for background subtraction in a complex environment to identify the regions of moving objects in our test video. Stationary objects are detected by using the pixel-level features in time sequences. A stationary vehicle is detected by using the local features of the object, and thus, information about illegally parked vehicles is successfully obtained. An automatic alarm system can be utilized according to the different regulations of different illegal parking regions. The results of this study obtained using a test video sequence of a real-time traffic scene show that the proposed method is effective.

NETLA를 이용한 이진 신경회로망의 최적합성 (Optimal Synthesis of Binary Neural Network using NETLA)

  • 정종원;성상규;지석준;최우진;이준탁
    • 한국마린엔지니어링학회:학술대회논문집
    • /
    • 한국마린엔지니어링학회 2002년도 춘계학술대회논문집
    • /
    • pp.273-277
    • /
    • 2002
  • This paper describes an optimal synthesis method of binary neural network(BNN) for an approximation problem of a circular region and synthetic image having four class using a newly proposed learning algorithm. Our object is to minimize the number of connections and neurons in hidden layer by using a Newly Expanded and Truncated Learning Algorithm(NETLA) based on the multilayer BNN. The synthesis method in the NETLA is based on the extension principle of Expanded and Truncated Learning (ETL) learning algorithm using the multilayer perceptron and is based on Expanded Sum of Product (ESP) as one of the boolean expression techniques. The number of the required neurons in hidden layer can be reduced and fasted for learning pattern recognition.. The superiority of this NETLA to other algorithms was proved by simulation.

  • PDF

실시간 영상 안정화를 위한 키프레임과 관심영역 선정 (Adaptive Keyframe and ROI selection for Real-time Video Stabilization)

  • 배주한;황영배;최병호;전재열
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 추계학술대회
    • /
    • pp.288-291
    • /
    • 2011
  • Video stabilization is an important image enhancement widely used in surveillance system in order to improve recognition performance. Most previous methods calculate inter-frame homography to estimate global motion. These methods are relatively slow and suffer from significant depth variations or multiple moving object. In this paper, we propose a fast and practical approach for video stabilization that selects the most reliable key frame as a reference frame to a current frame. We use optical flow to estimate global motion within an adaptively selected region of interest in static camera environment. Optimal global motion is found by probabilistic voting in the space of optical flow. Experiments show that our method can perform real-time video stabilization validated by stabilized images and remarkable reduction of mean color difference between stabilized frames.

  • PDF

딥러닝 기반의 돌출 객체 검출을 위한 Saliency Attention 방법 (Saliency Attention Method for Salient Object Detection Based on Deep Learning)

  • 김회준;이상훈;한현호;김진수
    • 한국융합학회논문지
    • /
    • 제11권12호
    • /
    • pp.39-47
    • /
    • 2020
  • 본 논문에서는 이미지에서 돌출되는 객체를 검출하기 위해 Saliency Attention을 이용한 딥러닝 기반의 검출 방법을 제안하였다. 돌출 객체 검출은 사람의 시선이 집중되는 물체를 배경으로부터 분리시키는 것이며, 이미지에서 관련성이 높은 부분을 결정한다. 객체 추적 및 검출, 인식 등의 다양한 분야에서 유용하게 사용된다. 기존의 딥러닝 기반 방법들은 대부분 오토인코더 구조로, 특징을 압축 및 추출하는 인코더와 추출된 특징을 복원 및 확장하는 디코더에서 많은 특징 손실이 발생한다. 이러한 손실로 돌출 객체 영역에 손실이 발생하거나 배경을 객체로 검출하는 문제가 있다. 제안하는 방법은 오토인코더 구조에서 특징 손실을 감소시키고 배경 영역을 억제하기 위해 Saliency Attention을 제안하였다. ELU 활성화 함수를 이용해 특징 값의 영향력을 결정하며 각각 정규화된 음수 및 양수 영역의 특징값에 Attention을 진행하였다. 제안하는 Attention 기법을 통해 배경 영역을 억제하며 돌출 객체 영역을 강조하였다. 실험 결과에서는 제안하는 방법이 기존 방법과 비교하여 향상된 검출 결과를 보였다.

스테레오 카메라를 이용한 이동객체의 실시간 추적과 거리 측정 시스템 (Real-time moving object tracking and distance measurement system using stereo camera)

  • 이동석;이동욱;김수동;김태준;유지상
    • 방송공학회논문지
    • /
    • 제14권3호
    • /
    • pp.366-377
    • /
    • 2009
  • 본 논문에서는 스테레오 카메라로부터 획득된 좌우 영상을 이용하여 3차원 공간좌표(x, y, z)를 획득하고, 이를 이용하여 제어되는 가상공간을 통하여 사용자에게 현실감을 제공하는 실시간 시스템을 구현한다. 일반적으로 관심영역의 변이를 추정할 때 관심영역내의 모든 화소(pixel)의 변이를 추정하지만, 제안한 시스템에서는 관심영역의 2차원 중심좌표(x, y)만을 변이추정에 사용하여 실시간으로 변이를 추정한다. 추정된 변이로부터 깊이정보(depth)를 구하여 관심영역의 3차원 공간좌표를 획득한다. 시스템은 손을 관심영역으로 설정하여 실시간으로 손의 움직임 정보를 획득하고, 가상공간(virtual space)에 적용하여 사용자가 가상공간을 조작할 수 있도록 한다. 실험을 통해 제안하는 실시간 시스템이 150cm 거리(distance) 내에서의 깊이측정 시 0.68cm의 평균오차를 가지고 손동작 인식률은 90%이상 보이는 것을 검증하였다.

기계 학습 알고리즘을 이용한 효과적인 대상 영역 분할 (Effective Detection of Target Region Using a Machine Learning Algorithm)

  • 장석우;이경주;정명희
    • 한국산학기술학회논문지
    • /
    • 제19권5호
    • /
    • pp.697-704
    • /
    • 2018
  • 다양한 종류의 컬러 영상 콘텐츠에 포함되어 있는 사람의 얼굴 영역은 다른 사람들과 특정인을 구별해 줄 수 있는 개인의 정보에 해당하므로, 입력된 컬러 영상으로부터 가려지지 않은 사람의 얼굴 영역들을 정확하게 검출하는 작업은 매우 중요하다. 본 논문에서는 입력되는 컬러 영상으로부터 기계 학습 알고리즘 중의 하나인 딥러닝 알고리즘을 이용하여 사람의 얼굴 영역을 정확하게 검출하는 방법을 제안한다. 본 논문에서 제안된 방법에서는 먼저 RGB 색상 모델로 입력되는 영상을 $YC_bC_r$ 색상 모델로 변경한 다음, 기 학습된 타원형의 피부 색상 분포 모델을 활용하여 다른 영역들은 제거하고 사람의 피부 영역만을 먼저 분할한다. 그런 다음, CNN 모델 기반의 딥러닝 알고리즘을 적용하여 이전 단계에서 검출된 피부 영역 내에서 사람의 얼굴 영역을 강인하게 검출한다. 실험 결과에서는 제안된 방법이 입력되는 다양한 컬러 영상으로부터 사람의 얼굴 영역들을 기존의 방법에 비해 보다 효율적으로 분할한다는 것을 보여준다. 본 논문에서 제안된 얼굴 영역 검출 방법은 영상 보안, 물체 인식 및 추적, 얼굴 인식 등과 같은 멀티미디어 및 형태 인식과 관련된 실제적인 응용 분야에서 매우 유용하게 활용될 것으로 기대된다.