• 제목/요약/키워드: Feature detector

검색결과 191건 처리시간 0.02초

Improved image alignment algorithm based on projective invariant for aerial video stabilization

  • Yi, Meng;Guo, Bao-Long;Yan, Chun-Man
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제8권9호
    • /
    • pp.3177-3195
    • /
    • 2014
  • In many moving object detection problems of an aerial video, accurate and robust stabilization is of critical importance. In this paper, a novel accurate image alignment algorithm for aerial electronic image stabilization (EIS) is described. The feature points are first selected using optimal derivative filters based Harris detector, which can improve differentiation accuracy and obtain the precise coordinates of feature points. Then we choose the Delaunay Triangulation edges to find the matching pairs between feature points in overlapping images. The most "useful" matching points that belong to the background are used to find the global transformation parameters using the projective invariant. Finally, intentional motion of the camera is accumulated for correction by Sage-Husa adaptive filtering. Experiment results illustrate that the proposed algorithm is applied to the aerial captured video sequences with various dynamic scenes for performance demonstrations.

회전에 견고한 DCT 기반 영상 검색 (DCT-Based Images Retrieval for Rotated Images)

  • 김남이;송주환;유강수
    • 한국콘텐츠학회논문지
    • /
    • 제11권4호
    • /
    • pp.67-73
    • /
    • 2011
  • 일반적인 영상 검색의 경우 질의 영상과 같은 영상 또는 최대한 유사한 영상을 결과로써 보여주게 되는데 회전 영상의 경우에는 일반적인 영상 검색 방법들의 성능이 현저하게 떨어지는 경향이 있다. 이에 따라 본 논문에서는 회전 영상에 대해서도 검색 성능이 우수하도록 하기 위해 질의 영상과 DB 영상에 대해 Harris Corner Detector 알고리즘을 통해 특징점을 구하고, 그 특징점을 토대로 Principal Components Analysis 알고리즘을 이용해 물체의 주축을 구하여 회전 불변 상태의 영상으로 전환한다. 제안한 기법은 Wang의 원본 1000장의 영상과 $30^{\circ}$, $45^{\circ}$, $90^{\circ}$, $135^{\circ}$, $180^{\circ}$로 회전된 총 6000 장의 지름이 256 크기인 자연 영상을 가지고 실험한 결과, 기존의 기법과 비교하였을 때 회전 영상에 대해서도 우수한 검색 성능을 보였다.

Multi-scale face detector using anchor free method

  • Lee, Dong-Ryeol;Kim, Yoon
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권7호
    • /
    • pp.47-55
    • /
    • 2020
  • 본 논문에서는 앵커 프리 방법을 이용한 FCN(Fully Convolutional Network)기반의 1단계 다중 크기 얼굴 검출기를 제안한다. 최근 대부분의 연구들은 사전 정의된 앵커를 사용하여 얼굴이 있을 만한 위치를 예측한다. 그러나 사전 정의 앵커를 이용함으로써 학습 시 하이퍼 파라미터의 설정과 추가적인 계산이 필요하다. 제안하는 방법의 핵심 아이디어는 앵커 프리 방법을 사용하여 하이퍼 파라미터를 없애고 여러 개의 특징 맵을 사용함으로써 클래스 내 불균형 문제를 완화하는 것이다. 이 방법들은 다음과 같은 효과가 있다. 첫째로 사전정의 앵커를 없앰으로써 앵커와 관련된 하이퍼 파라미터와 추가적인 계산을 피한다. 둘째로 클래스 내 불균형을 완화하기 위해 여러개의 특징 맵으로부터 얼굴을 예측한다. 정량적 평가를 통해 제안하는 방법에 따른 검출 성능을 평가 및 분석한다. FDDB(Face Detection Dataset & Benchmark) 데이터 셋의 실험 결과에서 제안하는 방법이 효과가 있음을 증명했다.

이동형 패럴랙스 배리어 모바일 3D 디스플레이를 위한 강인한 시청자 시역 위치 추정 알고리즘 (Robust Viewpoint Estimation Algorithm for Moving Parallax Barrier Mobile 3D Display)

  • 김기석;조재수;엄기문
    • 방송공학회논문지
    • /
    • 제17권5호
    • /
    • pp.817-826
    • /
    • 2012
  • 본 논문에서는 이동형 패럴랙스 배리어 방식의 모바일 3D 디스플레이를 위해 급격한 조명 변화에도 강인한 시청자 시역위치 추정 알고리즘을 제안한다. 기존의 비올라-존스 검출기와 옵티컬-플로우를 선형 결합한 시역 위치 추정 알고리즘[1]은 급격하게 조명이 변하는 경우 잘못된 시역 위치를 추정하는 문제가 있음을 확인하였고, 특히 이러한 급격한 조명의 변화 문제는 모바일 환경에서 흔히 발생하는 환경조건이다. 그리고 어두운 공간에서 3D 디스플레이를 시청하는 경우 디스플레이 조명이 시청자의 얼굴에 비치기 때문에 조명 변화가 매우 크게 발생할 수 있다. 급격한 조명의 변화에 대한 문제점을 해결하기 위해 본 논문에서는 매 프레임마다 정확하게 옵티컬-플로우 얼굴 검출기의 정확도를 판단할 수 있는 방법을 새롭게 제안하고, 다양한 실험을 통해 그 효과를 검증한다. 조명의 변화등에 의해 옵티컬-플로우가 잘못된 추적 결과를 출력하는 경우, 기존의 두 알고리즘(비올라-존스 얼굴검출기+옵티컬-플로우 특징점 추적기)을 선별적으로 선택함으로써 강인한 얼굴검출 및 추적이 이루어지도록 하고, 다양한 실험 결과를 통해 그 효과를 검증한다.

얼굴 특징을 이용한 얼굴영역 검출에 관한 연구 (A study on face area detection using face features)

  • 박병준;김완태;김현식
    • 한국정보전자통신기술학회논문지
    • /
    • 제13권3호
    • /
    • pp.206-211
    • /
    • 2020
  • 얼굴검출 과정은 영상 모니터링에서 매우 중요한 과정이며 생체 인식 기술의 한 종류이다. 검출과정은 변수가 많고 복잡하여 하드웨어가 발전하고 있는 근래에 와서 소프트웨어적인 발전이 이루어지고 있다. CCTV를 이용하는 분야 중 얼굴 검출 기술은 얼굴을 분석하기 이전에 실행되는 과정으로 영상에서 얼굴이 있는 곳을 찾아내는 기술이다. 사람의 얼굴은 조명이나 피부 색, 방향과 각도, 표정 등 여러 가지 환경적 조건에 따라 민감한 반응을 하기 때문에, 얼굴 검출에 관한 연구는 많은 어려움이 있다. 얼굴 검출 기술의 활용성과 중요성은 시간이 지날수록 각광받고 있으나, 얼굴 검출 이전에 선행되어야 하는 얼굴 영역 검출 기술에 대해서는 간과하는 측면이 많다. 본 논문의 시스템은 AdaBoost detector에서 검출 못하는 기울어진 얼굴을 검출할 수 있어 다른 사물의 검출도 같은 기술을 사용할 수 있을 것이다.

Corroded and loosened bolt detection of steel bolted joints based on improved you only look once network and line segment detector

  • Youhao Ni;Jianxiao Mao;Hao Wang;Yuguang Fu;Zhuo Xi
    • Smart Structures and Systems
    • /
    • 제32권1호
    • /
    • pp.23-35
    • /
    • 2023
  • Steel bolted joint is an important part of steel structure, and its damage directly affects the bearing capacity and durability of steel structure. Currently, the existing research mainly focuses on the identification of corroded bolts and corroded bolts respectively, and there are few studies on multiple states. A detection framework of corroded and loosened bolts is proposed in this study, and the innovations can be summarized as follows: (i) Vision Transformer (ViT) is introduced to replace the third and fourth C3 module of you-only-look-once version 5s (YOLOv5s) algorithm, which increases the attention weights of feature channels and the feature extraction capability. (ii) Three states of the steel bolts are considered, including corroded bolt, bolt missing and clean bolt. (iii) Line segment detector (LSD) is introduced for bolt rotation angle calculation, which realizes bolt looseness detection. The improved YOLOv5s model was validated on the dataset, and the mean average precision (mAP) was increased from 0.902 to 0.952. In terms of a lab-scale joint, the performance of the LSD algorithm and the Hough transform was compared from different perspective angles. The error value of bolt loosening angle of the LSD algorithm is controlled within 1.09%, less than 8.91% of the Hough transform. Furthermore, the proposed framework was applied to fullscale joints of a steel bridge in China. Synthetic images of loosened bolts were successfully identified and the multiple states were well detected. Therefore, the proposed framework can be alternative of monitoring steel bolted joints for management department.

통합된 시스템에서의 얼굴검출과 인식기법 (An Integrated Face Detection and Recognition System)

  • 박동희;이규봉;이유홍;나상동;배철수
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2003년도 춘계종합학술대회
    • /
    • pp.165-170
    • /
    • 2003
  • 본 논문에서는 임의의 장면에도 얼굴 인식에 영향을 받지 않는 통합된 얼굴 인식 방법을 제안한다. 크기 정규화는 피부 색 분할과 log-poler 매핑 절차의 새로운 조합을 통하여 얻어지고, 주요 얼굴 구성 요소 분석은 자세 변화들을 처리하기 위하여 제안된 멀티 뷰 접근을 통해 이루어진다. 주어진 컬러 입력 이미지로부터 검출기는 얼굴을 원형 경계 안에 둘러싸고 코의 위치를 표시하며 다음 인식을 위해, 원형 경계 내에 배치하는 방사형 격자는 특징 벡터 코 중심에 두었다. 컬러로 분할된 영역의 폭으로서 얼굴의 크기를 평가하고, 추출된 특징 벡터는 평가된 크기에 의하여 정규화된 크기이다. 특징 벡터는 얼굴 인식을 위해 훈련된 신경망 분류자에게 입력된다. 시스템은 서로 다른 복합적인 배경에서 다양한 크기와 자세를 가진 20명의 얼굴 데이터 베이스를 사용하여 실험한 결과 얼굴 인식기의 수행능력은 매우 작은 크기의 얼굴 이미지 외에는 87%에서 92%의 평균 인식율을 얻을 수 있었다.

  • PDF

통합된 시스템에서의 얼굴검출과 인식기법 (An Integrated Face Detection and Recognition System)

  • 박동희;배철수
    • 한국정보통신학회논문지
    • /
    • 제7권6호
    • /
    • pp.1312-1317
    • /
    • 2003
  • 본 논문에서는 임의의 장면에도 얼굴 인식에 영향을 받지 않는 통합된 얼굴 인식 방법을 제안한다. 크기 정규화는 피부 색 분할과 log-polar 매핑 절차의 새로운 조합을 통하여 얻어지고, 주요 얼굴 구성 요소 분석은 자세 변화들을 처리하기 위하여 제안된 멀티 뷰 접근을 통해 이루어진다. 주어진 컬러 입력 이미지로부터 검출기는 얼굴을 원형 경계 안에 둘러싸고 코의 위치를 표시하며 다음 인식을 위해, 원형 경계 내에 배치하는 방사형 격자는 특징 벡터 코 중심에 두었다. 컬러로 분할된 영역의 폭으로서 얼굴의 크기를 평가하고, 추출된 특정 벡터는 평가된 크기에 의하여 정규화 된 크기이다. 특징 벡터는 얼굴 인식을 위해 훈련된 신경망 분류자에게 입력된다. 시스템은 서로 다른 복합적인 배경에서 다양한 크기와 자세를 가진 20 명의 얼굴 데이터 베이스를 사용하여 실험한 결과 얼굴 인식기의 수행능력은 매우 작은 크기의 얼굴 이미지 외에는 87%에서 92%의 평균 인식율을 얻을 수 있었다.

딥 러닝 기반의 눈 랜드마크 위치 검출이 통합된 시선 방향 벡터 추정 네트워크 (Deep Learning-based Gaze Direction Vector Estimation Network Integrated with Eye Landmark Localization)

  • 주희영;고민수;송혁
    • 방송공학회논문지
    • /
    • 제26권6호
    • /
    • pp.748-757
    • /
    • 2021
  • 본 논문은 눈 랜드마크 위치 검출과 시선 방향 벡터 추정이 하나의 딥러닝 네트워크로 통합된 시선 추정 네트워크를 제안한다. 제안하는 네트워크는 Stacked Hourglass Network를 백본(Backbone) 구조로 이용하며, 크게 랜드마크 검출기, 특징 맵 추출기, 시선 방향 추정기라는 세 개의 부분(Part)으로 구성되어 있다. 랜드마크 검출기에서는 눈 랜드마크 50개 포인트의 좌표를 추정하며, 특징 맵 추출기에서는 시선 방향 추정을 위한 눈 이미지의 특징 맵을 생성한다. 그리고 시선 방향 추정기에서는 각 출력 결과를 조합하여 최종 시선 방향 벡터를 추정한다. 제안하는 네트워크는 UnityEyes 데이터셋을 통해 생성된 가상의 합성 눈 이미지와 랜드마크 좌표 데이터를 이용하여 학습하였으며, 성능 평가는 실제 사람의 눈 이미지로 구성된 MPIIGaze 데이터셋을 이용하였다. 실험을 통해 시선 추정 오차는 3.9°의 성능을 보였으며, 네트워크의 추정 속도는 42 FPS(Frame per second)로 측정되었다.

VILODE : 키 프레임 영상과 시각 단어들을 이용한 실시간 시각 루프 결합 탐지기 (VILODE : A Real-Time Visual Loop Closure Detector Using Key Frames and Bag of Words)

  • 김혜숙;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권5호
    • /
    • pp.225-230
    • /
    • 2015
  • 본 논문에서는 키 프레임 영상과 SURF 특징점 기반의 시각 단어들을 이용한 효과적인 실시간 시각 루프 결합 탐지기 VILODE를 제안한다. 시각 루프 결합 탐지기는 과거에 지나온 위치들 중 하나를 다시 재방문하였는지를 판단하기 위해, 새로운 입력 영상을 이미 지나온 위치들에서 수집한 과거 영상들과 모두 비교해보아야 한다. 따라서 새로운 위치나 장소를 방문할수록 비교 대상 영상들이 계속해서 증가하기 때문에, 일반적으로 루프 결합 탐지기는 실시간 제약과 높은 탐지 정확도를 동시에 만족하기 어렵다. 이러한 문제점을 극복하기 위해, 본 시스템에서는 입력 영상들 중에서 의미 있는 것들만을 선택해 이들만을 비교하는 효과적인 키 프레임 선택 방법을 채택하였다. 따라서 루프 탐지에 필요한 영상 비교를 대폭 줄일 수 있다. 또한 본 시스템에서는 루프 결합 탐지의 정확도와 효율성을 높이기 위해, 키 프레임 영상들을 시각 단어들로 표현하고, DBoW 데이터베이스 시스템을 이용해 키 프레임 영상들에 대한 색인을 구성하였다. TUM 대학의 벤치마크 데이터들을 이용한 실험을 통해, 본 논문에서 제안한 시각 루프 결합 탐지기의 높은 성능을 확인할 수 있었다.