• 제목/요약/키워드: Image Feature Vector

검색결과 499건 처리시간 0.026초

조명 변화에 안정적인 손 형태 인지 기술 (A Robust Hand Recognition Method to Variations in Lighting)

  • 최유주;이제성;유효선;이정원;조위덕
    • 정보처리학회논문지B
    • /
    • 제15B권1호
    • /
    • pp.25-36
    • /
    • 2008
  • 본 논문은 조명의 변화가 심한 영상에서 손 형태를 안정적으로 인지하는 기법에 관한 것이다. 제안한 방법은 HSI 색상공간에서 색상(Hue) 및 색상 기울기(Hue-Gradient)를 기반으로 정의된 배경모델을 구축하고, 실시간으로 입력되는 영상과의 배경차분(background subtraction)기법을 이용하여 배경과 손을 구분한다. 추출된 손의 영역으로부터 18가지의 특징요소를 추출하고 이를 기반으로 다중클래스 SVM(Support Vector Machine) 학습 기법을 사용하여 손의 형태를 인지한다. 제안 기법은 색상 기울기를 배경 차분에 적용함으로써, 조명 환경이 배경 모델의 조명과 다르게 급격한 변화가 이루어졌을 때도 안정적으로 손의 윤곽정보를 추출할 수 있도록 하였다. 또한, 실시간 처리를 저해하는 복잡한 손의 특성정보 대신, OBB의 크기에 대하여 정규화된 두 개의 고유값과 객체 기반 바운딩 박스(OBB)를 구성하는 16개 세부 영역에서의 손 윤곽픽셀의 개수를 손의 특성정보로 사용하였다. 본 논문에서는 급격한 조명 변화 상황에서 기존 RGB 색상요소를 기반으로 하는 배경차분법과 색상을 기반으로 하는 배경차분법, 본 논문에서 제안하는 색상 기울기 기반 배경 차분법의 결과를 비교함으로써 제안 기법의 안정성을 입증하였다. 6명의 실험대상자의 1부터 9까지의 수지화 2700개의 영상으로부터 손 특성 정보를 추출하고 이에 대하여 훈련을 통한 학습 모델을 생성하였다. 학습모델을 기반으로 실험자 6인의 손 형태 1620개의 데이터에 대하여 인지 실험을 실시하여 92.6%에 이르는 손 형태 인식 성공률을 얻었다.

빌보드 스윕 스테레오 시차정합 알고리즘을 이용한 차량 검출 및 추적 (Vehicle Detection and Tracking using Billboard Sweep Stereo Matching Algorithm)

  • 박민우;원광희;정순기
    • 한국멀티미디어학회논문지
    • /
    • 제16권6호
    • /
    • pp.764-781
    • /
    • 2013
  • 본 논문에서는 시차영상 생성과 레이블링(labeling)을 동시에 수행하는 빌보드 스윕 스테레오 시차정합 알고리즘을 적용하고, 두 단계로 구성된 복합 가설생성(hypothesis generation) 단계를 적용함으로서 거짓알림(false alarm)을 줄이고, 차량 검출의 정확도를 높이는 방법을 제안한다. 먼저 차량의 정면에 장착된 두 대의 카메라를 이용하여 영상을 획득하고, 이 영상을 사용하여 빌보드 스윕 스테레오 시차정합 알고리즘을 수행하여 지면과 배경이 제거된 장애물(obstacle)만이 존재하는 특수한 형태의 시차영상을 생성한다. 이렇게 생성된 지면과 배경이 제거된 레이블링된 시차영상을 이용하여 차량 검출 및 추적을 수행한다. 차량 검출 및 추적단계는 크게 세 단계로 나눠진다. 첫 번째 단계는 학습 단계로서 학습데이터로부터 Gabor필터를 사용해서 특징점을 추출하고, 추출된 특징점을 학습한 뒤 서포트 벡터머신 분류기를 생성하는 단계이다. 두 번째 단계는 스테레오 카메라의 영상 중 주 카메라의 영상으로부터 에지 정보를 추출하고, 지면과 배경이 제거된 시차 영상으로부터 얻어진 시차정보를 이용해서 차량이 존재하는 후보영역을 뽑은 뒤 서포트 벡터머신 분류기를 사용하여 차량을 검출하는 단계이다. 마지막 단계는 차량 추적단계로서 검출이 완료된 차량들은 다음 프레임에서 템플릿 매칭을 수행하여 추적한다. 이는 추적에 성공할 경우 다음 프레임의 차량 검출시 후보영역에서 배제함으로서 전체적인 차량 검출 성능을 향상시킨다.

인공 신경망 기반의 지문 영상 복원 알고리즘 (An Algorithm of Fingerprint Image Restoration Based on an Artificial Neural Network)

  • 장석우;이사무엘;김계영
    • 한국산학기술학회논문지
    • /
    • 제21권8호
    • /
    • pp.530-536
    • /
    • 2020
  • 일반적인 지문 인식기에서 이용되는 미뉴셔 특징은 표현 공격에는 강건하지만 오 정합률이 상대적으로 높다는 약점이 있다. 따라서 미뉴셔 특징은 스켈리톤 영상과 함께 이용되는 경향이 있다. 보통 지문의 미뉴셔 특징에 대한 보안 취약성 연구는 많이 진행되어 있으나 스켈리톤에 대한 취약성 연구는 미약한 형편이므로 본 연구에서는 스켈리톤에 대한 표현 공격의 취약성을 분석하고자 한다. 이를 위해, 본 연구에서는 지문의 스켈리톤으로부터 학습 알고리즘을 사용해 원래의 지문을 복구하는 방법을 제시한다. 본 논문에서 제시된 방법은 기존의 Pix2Pix 모델에 잠재 벡터를 추가한 새로운 학습 모델인 Pix2Pix을 제안하여, 보다 자연스러운 지문을 생성한다. 본 논문의 실험 결과에서는 제시된 학습 알고리즘을 이용해 원래의 지문을 복원한 다음, 복원된 지문을 지문 인식기에 입력시켜 높은 인식률을 달성하였다. 그러므로 본 연구는 스켈리톤을 함께 이용하는 지문 인식기는 표현 공격에 취약함을 검증하였다. 본 논문에서 제시된 접근방법은 지문 인식 및 복원, 비디오 보안, 생체 인식 등과 연관된 많은 실제적인 응용 분야에서 유용하게 사용될 것으로 기대된다.

계층적 군집화 기반 Re-ID를 활용한 객체별 행동 및 표정 검출용 영상 분석 시스템 (Video Analysis System for Action and Emotion Detection by Object with Hierarchical Clustering based Re-ID)

  • 이상현;양성훈;오승진;강진범
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.89-106
    • /
    • 2022
  • 최근 영상 데이터의 급증으로 이를 효과적으로 처리하기 위해 객체 탐지 및 추적, 행동 인식, 표정 인식, 재식별(Re-ID)과 같은 다양한 컴퓨터비전 기술에 대한 수요도 급증했다. 그러나 객체 탐지 및 추적 기술은 객체의 영상 촬영 장소 이탈과 재등장, 오클루전(Occlusion) 등과 같이 성능을 저하시키는 많은 어려움을 안고 있다. 이에 따라 객체 탐지 및 추적 모델을 근간으로 하는 행동 및 표정 인식 모델 또한 객체별 데이터 추출에 난항을 겪는다. 또한 다양한 모델을 활용한 딥러닝 아키텍처는 병목과 최적화 부족으로 성능 저하를 겪는다. 본 연구에서는 YOLOv5기반 DeepSORT 객체추적 모델, SlowFast 기반 행동 인식 모델, Torchreid 기반 재식별 모델, 그리고 AWS Rekognition의 표정 인식 모델을 활용한 영상 분석 시스템에 단일 연결 계층적 군집화(Single-linkage Hierarchical Clustering)를 활용한 재식별(Re-ID) 기법과 GPU의 메모리 스루풋(Throughput)을 극대화하는 처리 기법을 적용한 행동 및 표정 검출용 영상 분석 시스템을 제안한다. 본 연구에서 제안한 시스템은 간단한 메트릭을 사용하는 재식별 모델의 성능보다 높은 정확도와 실시간에 가까운 처리 성능을 가지며, 객체의 영상 촬영 장소 이탈과 재등장, 오클루전 등에 의한 추적 실패를 방지하고 영상 내 객체별 행동 및 표정 인식 결과를 동일 객체에 지속적으로 연동하여 영상을 효율적으로 분석할 수 있다.

컬러 프린터 영상의 모폴로지 특징과 지도 학습 모델 분류기를 활용한 위변조 지폐 판별 알고리즘 (Counterfeit Money Detection Algorithm based on Morphological Features of Color Printed Images and Supervised Learning Model Classifier)

  • 우귀희;이해연
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권12호
    • /
    • pp.889-898
    • /
    • 2013
  • 고성능 영상 장비의 대중화와 강력한 이미지 편집 소프트웨어의 출현으로 인해 지폐 및 유가 증권 등을 고품질로 위변조가 가능해졌다. 특히 컬러 레이저 프린터의 범용화로 인하여 화폐 위변조 범죄는 급격히 증가하고 있지만, 일반인이 이를 판별하는 비율은 낮은 수준이며 판별 기기도 고가이다. 본 연구에서는 범용 스캐너와 컴퓨터 시스템을 활용하여 화폐의 위변조를 탐지하기 위한 알고리즘을 제안하였다. 먼저 지폐의 인쇄방식과 다른 컬러 프린터의 인쇄 특징을 계산하기 위하여 모폴로지 기술과 명암도 동시 발생 행렬을 활용하였다. 그 후 계산된 특징들을 지도학습 모델 분류기에 적용하여 훈련을 시켰다. 이렇게 훈련된 분류기에 판별을 위한 지폐를 입력하고 위변조 여부에 대한 분석을 수행한다. 제안한 알고리즘의 성능을 분석하기 위하여 위변조 지폐의 판별률과 인쇄에 사용한 프린터의 판별률로 나누어 평가를 하였다. 또한 기존의 컬러 프린터 판별에 사용되었던 위너필터를 사용한 기술과 비교를 수행하였다. 그 결과 제안한 알고리즘이 위변조 지폐 식별에 있어서 91.92%, 위변조기기의 식별에 있어서 94.5% 이상 정확도를 보여 기존 컬러 프린터의 특징 추출 방법을 활용한 것보다 우수한 것으로 나타났다.

영역별 수직 투영 히스토그램 매칭 및 선형 회귀모델 기반의 차량 운행 영상의 안정화 기술 개발 (Regional Projection Histogram Matching and Linear Regression based Video Stabilization for a Moving Vehicle)

  • 허유정;최민국;이현규;이상철
    • 방송공학회논문지
    • /
    • 제19권6호
    • /
    • pp.798-809
    • /
    • 2014
  • 본 논문에서는 블랙박스 혹은 운전석에 장착된 카메라로부터 얻어진 차량 영상에 대한 영역별 수직 투영 히스토그램 매칭 및 선형 회귀분석 모델을 활용한 강건한 차량 운행 동영상의 안정화 기법을 제안한다. 동영상 안정화 기법은 영상의 흔들림 보정 뿐 아니라 동영상 내 강건한 특징점 추적 및 매칭을 위한 이전의 전처리 과정으로 활용된다. 일반적으로 촬영 과정에서 많은 떨림이 포함될 수 있는 야외 CCTV 영상이나 손으로 들고 촬영된 동영상에 대한 흔들림 보정 등에 적용되고 있으나 영상 내 특징점이 지속적으로 변하고 영상의 변화 정도가 매우 심한 차량 운행 동영상에서는 적용된 사례가 드물다. 본 연구에서는 일반적인 비디오 안정화 기술이 적용되기 어려운 차량 운행 동영상에 대하여 흔들림 보정을 위한 동영상 안정화 기법을 제안한다. 제안된 기법은 입력 영상에 대한 영역별 수직 투영 히스토그램 매칭을 수행하고 선형 회귀모델을 통해 영상에 나타나는 수직 및 회전 이동 변환을 선형 근사하여 시간 영역상에서의 입력 영상에 대한 안정화를 수행한다. 제안 방법의 검증을 위해 블랙박스로 촬영된 동영상에 동영상 안정화 기술을 적용하였으며, 운행 중 불규칙한 노면으로 인한 영상의 흔들림이 효과적으로 제거되는 것을 확인할 수 있었다.

적응 휴리스틱 분할 알고리즘을 이용한 실시간 차량 번호판 인식 시스템 (Real-Time Vehicle License Plate Recognition System Using Adaptive Heuristic Segmentation Algorithm)

  • 진문용;박종빈;이동석;박동선
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권9호
    • /
    • pp.361-368
    • /
    • 2014
  • 차량 번호판 인식 시스템은 복잡한 교통환경의 효율적 관리를 위해 발전되어 현재 많은 곳에 사용되고 있다. 그러나 조명, 잡음, 배경변화, 번호판 훼손 등 환경변화에 큰 영향을 받기 때문에 제한된 환경에서만 동작하며, 실시간으로 사용하기 어렵다. 본 논문에서는 조명변화와 잡음에 강건하며 빠른 번호판 인식을 위한 휴리스틱 분할 알고리즘 및 이를 이용한 실시간 번호판 인식 시스템을 제안한다. 첫 번째 단계는 Haar-like 특징과 Adaboost를 이용하여 번호판을 검출한다. 이 방법은 적분영상을 이용하며 케스케이드 구조로 구성되어 있어 빠른 검출이 가능하다. 두 번째 단계에서 적응 히스토그램 평활화 방법과 노이즈를 경감시키는 바이레터럴 필터를 이용하여 번호판의 종류를 결정한 후, 번호판 종류에 따라 적분영상을 이용한 적응 이진화, 픽셀 프로젝션, 사전지식 등을 기반으로 빠르고 정확한 문자 분할을 한다. 세번째 단계에서는 HOG와 신경망 알고리즘을 이용하여 숫자를 인식하고, SVM을 이용해 한글을 인식한다. 실험결과는 번호판검출에 94.29%의 검출률, 2.94%의 오경보율을 보이며, 문자분할에서는 검출률 97.23%, 2.94%의 오경보율을 보였다. 문자인식에서 평균 인식률은 98.38%이다. 평균 운용시간은 140ms으로 빠르고 강인한 실시간 시스템을 만들 수 있다.

피부색과 무게중심 프로필을 이용한 손동작 인식 알고리즘 (Hand Motion Recognition Algorithm Using Skin Color and Center of Gravity Profile)

  • 박영민
    • 문화기술의 융합
    • /
    • 제7권2호
    • /
    • pp.411-417
    • /
    • 2021
  • 인간과 컴퓨터의 상호작용을 연구하는 분야를 HCI(Human-computer interaction)라고 한다. 이 분야는 인간과 컴퓨터 간에 서로 소통하면서 정보를 인식하는 방법에 대해 연구하는 학문 분야이다. 본 연구는 사람과의 상호작용을 위한 손동작 인식에 대한 연구로써 기존 인식방법의 문제점을 살펴보고 인식률을 개선하기 위한 알고리즘을 제시한다. 사람의 손 모양이 포함된 영상을 대상으로 피부색 정보를 바탕으로 손 영역을 추출하고, 주성분 분석을 이용하여 무게중심 프로필을 계산한다. 이렇게 얻은 정보를 미리 정의된 형상들과 비교하여 손동작을 인식률을 높이는 방법을 제안하였다. 기존의 무게중심 프로필은 회전으로 인한 손의 변형에 대해 잘못된 손동작 인식을 결과를 보여주었으나, 본 연구에서는 무게중심 프로필을 이용하고 모든 윤곽선의 점들과 무게중심 사이의 거리가 가장 긴 점을 시작점으로 하여 무게중심 프로필을 다시 개선함으로써 강건한 알고리즘을 제시하였다. 손동작 인식을 위하여 센서가 부착된 장갑이나 특별한 마커를 사용하지 않으며, 별도의 청색 스크린을 설치하지도 않는다. 이 결과에 대해 가장 가까운 거리의 특징벡터를 찾아 잘못된 인식을 해결하고, 적당한 경계치를 구하여 성공과 실패를 구분한다.

다중 레이블 분류의 정확도 향상을 위한 스킵 연결 오토인코더 기반 레이블 임베딩 방법론 (Label Embedding for Improving Classification Accuracy UsingAutoEncoderwithSkip-Connections)

  • 김무성;김남규
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.175-197
    • /
    • 2021
  • 최근 딥 러닝 기술의 발전으로 뉴스, 블로그 등 다양한 문서에 포함된 텍스트 분석에 딥 러닝 기술을 활용하는 연구가 활발하게 수행되고 있다. 다양한 텍스트 분석 응용 가운데, 텍스트 분류는 학계와 업계에서 가장 많이 활용되는 대표적인 기술이다. 텍스트 분류의 활용 예로는 정답 레이블이 하나만 존재하는 이진 클래스 분류와 다중 클래스 분류, 그리고 정답 레이블이 여러 개 존재하는 다중 레이블 분류 등이 있다. 특히, 다중 레이블 분류는 여러 개의 정답 레이블이 존재한다는 특성 때문에 일반적인 분류와는 상이한 학습 방법이 요구된다. 또한, 다중 레이블 분류 문제는 레이블과 클래스의 개수가 증가할수록 예측의 난이도가 상승한다는 측면에서 데이터 과학 분야의 난제로 여겨지고 있다. 따라서 이를 해결하기 위해 다수의 레이블을 압축한 후 압축된 레이블을 예측하고, 예측된 압축 레이블을 원래 레이블로 복원하는 레이블 임베딩이 많이 활용되고 있다. 대표적으로 딥 러닝 모델인 오토인코더 기반 레이블 임베딩이 이러한 목적으로 사용되고 있지만, 이러한 기법은 클래스의 수가 무수히 많은 고차원 레이블 공간을 저차원 잠재 레이블 공간으로 압축할 때 많은 정보 손실을 야기한다는 한계가 있다. 이에 본 연구에서는 오토인코더의 인코더와 디코더 각각에 스킵 연결을 추가하여, 고차원 레이블 공간의 압축 과정에서 정보 손실을 최소화할 수 있는 레이블 임베딩 방법을 제안한다. 또한 학술연구정보서비스인 'RISS'에서 수집한 학술논문 4,675건에 대해 각 논문의 초록으로부터 해당 논문의 다중 키워드를 예측하는 실험을 수행한 결과, 제안 방법론이 기존의 일반 오토인코더 기반 레이블 임베딩 기법에 비해 정확도, 정밀도, 재현율, 그리고 F1 점수 등 모든 측면에서 우수한 성능을 나타냄을 확인하였다.