• 제목/요약/키워드: computer vision systems

검색결과 600건 처리시간 0.023초

로봇 인터페이스 활용을 위한 가속도 센서 기반 제스처 인식 (Accelerometer-based Gesture Recognition for Robot Interface)

  • 장민수;조용석;김재홍;손주찬
    • 지능정보연구
    • /
    • 제17권1호
    • /
    • pp.53-69
    • /
    • 2011
  • 로봇 자체 또는 로봇에 탑재된 콘텐츠와의 상호작용을 위해 일반적으로 영상 또는 음성 인식 기술이 사용된다. 그러나 영상 음성인식 기술은 아직까지 기술 및 환경 측면에서 해결해야 할 어려움이 존재하며, 실적용을 위해서는 사용자의 협조가 필요한 경우가 많다. 이로 인해 로봇과의 상호작용은 터치스크린 인터페이스를 중심으로 개발되고 있다. 향후 로봇 서비스의 확대 및 다양화를 위해서는 이들 영상 음성 중심의 기존 기술 외에 상호보완적으로 활용이 가능한 인터페이스 기술의 개발이 필요하다. 본 논문에서는 로봇 인터페이스 활용을 위한 가속도 센서 기반의 제스처 인식 기술의 개발에 대해 소개한다. 본 논문에서는 비교적 어려운 문제인 26개의 영문 알파벳 인식을 기준으로 성능을 평가하고 개발된 기술이 로봇에 적용된 사례를 제시하였다. 향후 가속도 센서가 포함된 다양한 장치들이 개발되고 이들이 로봇의 인터페이스로 사용될 때 현재 터치스크린 중심으로 된 로봇의 인터페이스 및 콘텐츠가 다양한 형태로 확장이 가능할 것으로 기대한다.

두 영상검색 시스템의 협력적 이용을 통한 재순위화 (Re-ranking the Results from Two Image Retrieval System in Cooperative Manner)

  • 황중원;김현우;김준모
    • 한국지능시스템학회논문지
    • /
    • 제24권1호
    • /
    • pp.7-15
    • /
    • 2014
  • 영상검색은 컴퓨터 비전과 데이터 마이닝 분야의 주요한 주제 중 하나이다. 현재 상용화된 영상 검색 시스템이 놀라운 성능을 보여주고 있음에도 불구하고, 폭발적으로 증가하는 웹상의 영상정보를 효율적으로 검색하기 위하여, 영상 검색 기술의 성능향상이 꾸준히 요구되고 있다. 재순위화는, 이런 요구를 만족시키기 위한 방법 중 하나로서, 영상 검색 시스템이 도출한 초기 결과를, 독자적인 알고리즘을 통해 연관도를 한 번 더 계산하고, 그에 따라 검색 결과의 성능을 향상시키는 방법이다. 지금까지 제안된 많은 재순위화 알고리즘이, 영상 검색 시스템이 영상의 시각적 정보를 사용하지 않는다는 가정하에 개발되어 왔지만, 현재 Google 과 Baidu 등 많은 상업적 영상 검색 시스템이 영상의 시각적 패턴에 대한 정보를 사용하기 시작함에 따라 이러한 가정이 어긋나고 있다. 또한, 영상 검색 시스템들이 독자적인 환경에서 개발되었기 때문에, 다수의 영상 검색 시스템의 협력으로 성능을 향상시킬 수 있을 것이라 예측되는 상황에도 불구하고, 이에 대한 연구가 부족했다. 본 논문에서는 이 두 가지 문제를 해결하기 위하여, 두 영상 검색 시스템이 사용하는 시각적 특징을 바탕으로, 두 시스템의 상보적인 정보를 이용하는 방법에 대하여 제안한다. 성능에 대한 평가는 가상 모형에서 이루어졌으며, 제안된 방법을 통하여 성능향상이 가능하다는 것을 보여준다.

디지털 신호 분석 기법을 이용한 다양한 번호판 추출 방법 (An Extraction Method of Number Plates for Various Vehicles Using Digital Signal Analysis Processing Techniques)

  • 양선옥;전영민;정지상;류상환
    • 전자공학회논문지SC
    • /
    • 제45권3호
    • /
    • pp.12-19
    • /
    • 2008
  • 번호판 인식 작업은 번호판 영역분할, 개별문자 추출, 문자인식의 세 단계를 거쳐 이루어진다. 이 가운데 번호판 영역분할은 번호판 인식의 가장 핵심이 되는 부분이면서 또한 처리 시간이 가장 많이 소요되는 부분이다. 본 논문은 다양한 도로 주변 환경을 고려해야하는 불법주정차 무인단속 현장으로부터 획득된 차량영상을 대상으로 번호판 영역을 효과적으로 추출하는 방법에 관해 기술한다. 접근방법은 번호판 영역의 가로 명암 값 변화의 특성을 이용하여 번호판 영역에서 문자 폭, 배경영역과 문자 영역의 명암차를 조사하여 문자 영역임을 확인하고, 문자와 문자 사이의 거리를 조사하여 번호판 영역을 확인한다. 또한 번호판 영역 추출 과정에서 배경영역과 문자 영역의 명암차를 이용하여 번호판의 종류를 구분한다. 본 연구는 새로운 유럽형 번호판을 포함한 국내 번호판에 대하여 번호판 테두리 훼손에 따른 번호판 영역 추출 실패의 문제점을 해결하고 시간 소요의 문제를 실시간으로 처리함으로서 실용적 응용이 가능하도록 하였다.

실시간 능동 비전 카메라를 이용한 시선 위치 추적 시스템 (Gaze Detection System using Real-time Active Vision Camera)

  • 박강령
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권12호
    • /
    • pp.1228-1238
    • /
    • 2003
  • 이 논문에서는 컴퓨터 시각 인식 방법에 의해 모니터 상에 사용자가 쳐다보고 있는 시선 위치를 파악하기 위한 새롭고 실용적인 방법을 제안한다. 일반적으로 사용자가 모니터 상의 한 위치를 쳐다보기 위해서는 얼굴 및 눈동자를 동시에 움직이는 경향이 있다. 기존의 시선 위치 추적 시스템은 사용자의 얼굴 전체를 취득할 수 있는 단 하나의 광각 카메라 시스템을 주로 많이 이용하였다. 그러나 이러한 경우 영상의 해상도가 많이 떨어져서 사용자의 눈동자 움직임을 정확하게 추적하기 어려운 문제점이 있다. 그러므로 이 논문에서는 광각 카메라(얼굴의 움직임에 의한 시선 위치 추적용) 및 눈 영역을 확대하여 취득하는 협각 카메라(눈동자 움직임에 의한 시선 위치 추적용), 즉 이중 카메라를 이용하여 시선 위치 추적 시스템을 구현하였다. 얼굴의 움직임 시 전체적인 위치가 변화될 눈동자의 움직임을 정확히 추적하기 위해, 협각 카메라에는 광각 카메라로부터 추출된 눈 특징점의 위치를 기반으로 한 자동 초점 및 자동 상하/좌우 회전 기능이 포함되어 있으며, 눈 특징점을 보다 빠르고 정확하게 추출하기 위해 이중 적외선 조명을 사용하였다. 실험 결과, 본 논문에서는 실시간으로 동작하는 시선 위치 추적 시스템을 구현할 수 있었으며, 이때 얼굴 및 눈동자 움직임을 모두 고려하여 계산한 모니터상의 시선 위치 정확도는 약 3.44cm의 최소 자승 에러성능을 나타냈다.

시각장애인 안전을 위한 영상 기반 저비용 보행 공간 인지 알고리즘 (Vision-based Low-cost Walking Spatial Recognition Algorithm for the Safety of Blind People)

  • 강성현;이세훈;안준호
    • 인터넷정보학회논문지
    • /
    • 제24권6호
    • /
    • pp.81-89
    • /
    • 2023
  • 현대사회에서 시각장애인들은 도보, 승강기, 횡단보도 등 일반적인 환경에서 보행을 하는데 어려움이 있다. 시각장애인의 불편 해소를 위한 연구로 영상이나 음성을 이용한 연구가 있으며, 이런 연구는 고비용의 웨어러블 장치, 고성능 CCTV, 음성 센서 등을 사용하여 실생활에 적용하는 데는 한계가 있다. 본 논문에서 시각장애인이 보행 중에 안전한 이동을 위해서 스마트폰에 포함된 저비용의 영상 센서를 활용하여 주변 도보 공간을 인지하는 인공지능 융합 알고리즘을 제안한다. 제안된 알고리즘은 이동 중인 사람 탐지를 위해서 모션 캡처 알고리즘과 장애물 탐지를 위한 객체 탐지 알고리즘을 융합하여 개발하였다. 모션 캡처 알고리즘으로 mediapipe을 사용하여 이동 중에 있는 주변 보행자들을 모델링 및 탐지하였다. 객체 탐지 알고리즘을 사용했으며 도보 중에 발생하는 다양한 장애물을 모델링 하였다. 실험을 통하여 인공지능 융합 알고리즘을 검증했으며, 정확도 0.92, 정밀도 0.91, 재현율 0.99. F1 score 0.95로 결과를 얻어서 알고리즘의 성능을 확인하였다. 본 연구로 보행 중에 발생하는 볼라드, 공유 킥보드, 자동차 등의 주변 장애물 및 이동 중인 보행자 회피하여 시각장애인들의 통행에 도움을 줄 수 있다.

손 마비환자의 재활운동을 위한 테이블-탑 증강현실 시스템 구현 (An Implementation of Table-top based Augmented Reality System for Motor Rehabilitation of the Paretic Hand)

  • 이석준;박길흠;이양수;곽호완;문계완;최재헌;정순기
    • 한국멀티미디어학회논문지
    • /
    • 제16권2호
    • /
    • pp.254-268
    • /
    • 2013
  • 본 논문에서는 마비/편마비 환자의 손 재활운동을 위한 증강현실 인터랙션을 통한 재활운동시스템을 제안한다. 주로 기계적 장치에 의존하고 있는 기존의 마비환자 재활운동시스템에서 가정에서 손쉽게 재활훈련을 수행할 수 있도록 시스템을 구성하기위하여 컴퓨터 비전 기법을 이용하여 재활훈련에 필요한 장비를 최소화하고 좀 더 간편하게 설치하여 사용할 수 있도록 하는데 초점을 맞추었다. 본 논문에서 제안된 방법은 손끝의 움직임과 상태를 손끝마커의 위치와 접촉여부를 검사함으로써 인터랙션 상태를 점검한다. 한대의 카메라로부터 입력되는 손끝 마커의 2차원 위치는 3차원 객체와의 인터랙션을 위하여 ARToolKit 마커를 기반으로 보정된 3차원 카메라 공간상의 좌표로 변환되어 사용된다. 3차원 좌표계로 변환과정을 거친 손끝 마커의 3차원 위치는 3차원 객체와의 인터랙션에 반영함으로써 증강현실 기반의 인터랙션을 구현하였다. 본 논문에서 제시한 인터랙션 기법의 구현내용을 실험결과에서 나타내었고, 증강현실 기반 테이블탑 환경에서 마비환자의 재활운동에 활용될 수 있음을 나타내었다.

이미지 화질개선을 위한 Weber-Fechner 법칙을 적용한 가중 히스토그램 균등화 기법 (Weighted Histogram Equalization Method adopting Weber-Fechner's Law for Image Enhancement)

  • 김동형
    • 한국산학기술학회논문지
    • /
    • 제15권7호
    • /
    • pp.4475-4481
    • /
    • 2014
  • 저화질 이미지의 화질 개선에는 전통적으로 히스토그램균등화 기법이 사용되어 왔다. 히스토그램균등화 기법은 입력 이미지의 누적밀도함수를 변환함수로 사용하는 기법으로 이는 이론상 최대의 엔트로피를 가지지만 주관적 화질 측면에서는 백화현상이 나타나는 문제점이 있다. 본 논문에서는 히스토그램균등화 기법 기반의 가중 히스토그램 균등화 기법을 제안한다. 이는 인간의 시각특성을 반영한 Weber-Fechner 법칙을 사용하며 입력영상에 독립적인 변환함수를 제공하는 여러 이미지 화질 개선 기법들이 가지는 문제점을 해결하기 위해서 동적영역 재조정 과정을 포함한다. 최종적으로 재조정된 동적영역 범위 내에서 Weber-Fechner 법칙을 적용한 변환함수와 히스토그램균등화 기법을 통해 얻어진 변환함수간의 가중 평균을 통하여 변환함수를 생성한다. 실험결과 제안하는 알고리즘은 주관적 화질 측면에서 대비비를 효과적으로 향상시키는 것을 보여주며, 엔트로피 또한 비교에 사용된 여러 이전의 방법들과 비교하여 유사하거나 높은 값을 가지는 것을 볼 수 있었다.

A reliable quasi-dense corresponding points for structure from motion

  • Oh, Jangseok;Hong, Hyunggil;Cho, Yongjun;Yun, Haeyong;Seo, Kap-Ho;Kim, Hochul;Kim, Mingi;Lee, Onseok
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권9호
    • /
    • pp.3782-3796
    • /
    • 2020
  • A three-dimensional (3D) reconstruction is an important research area in computer vision. The ability to detect and match features across multiple views of a scene is a critical initial step. The tracking matrix W obtained from a 3D reconstruction can be applied to structure from motion (SFM) algorithms for 3D modeling. We often fail to generate an acceptable number of features when processing face or medical images because such images typically contain large homogeneous regions with minimal variation in intensity. In this study, we seek to locate sufficient matching points not only in general images but also in face and medical images, where it is difficult to determine the feature points. The algorithm is implemented on an adaptive threshold value, a scale invariant feature transform (SIFT), affine SIFT, speeded up robust features (SURF), and affine SURF. By applying the algorithm to face and general images and studying the geometric errors, we can achieve quasi-dense matching points that satisfy well-functioning geometric constraints. We also demonstrate a 3D reconstruction with a respectable performance by applying a column space fitting algorithm, which is an SFM algorithm.

자동초점에 사용되는 두 가지 Liquid Lens제어에 관한 연구 (Study on 2 types of Liquid Lens control system used for the autofocus)

  • 김남우;허창우
    • 한국정보통신학회논문지
    • /
    • 제19권6호
    • /
    • pp.1493-1498
    • /
    • 2015
  • 자동초점이란 영상을 획득하는 시스템에서 고정된 촬상면에 자동으로 초점이 맺히도록 렌즈를 구동시키는 방식으로 컴퓨터비전과 카메라 등에서 매우 중요하게 사용된다. 소형 카메라의 경우 자동초점에서 렌즈구동부인 actuator의 기술은 대량생산이 이용이하고, 위치센서가 불필요하며, 회로구성이 용이한 VCM방식이 널리 사용되고 있으며, 구동의 안정성에 비해 크기와 소음이 큰 스테핑모터 방식, 크기는 가장 작지만 납 함유문제 및 습도 취약성을 갖는 피에조 방식이 있다. 그 외에 액체렌즈방식이 있는데, 소형 구조에 저전력의 장점이 있지만 화질 및 신뢰성 검증 그리고 고압이 필요한 특징을 가지는 구조도 있다. 본 논문에서 5Mpixel급 이미지 센서를 통해 획득한 영상의 선예도를 이용하여 VCM의 actuator처럼 액체렌지를 제어할 수 있는 제어 시스템을 두 가지를 구현하여 자동으로 초점을 맞추는 기능을 구현 검증하였다.

Single Image Dehazing Using Dark Channel Prior and Minimal Atmospheric Veil

  • Zhou, Xiao;Wang, Chengyou;Wang, Liping;Wang, Nan;Fu, Qiming
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권1호
    • /
    • pp.341-363
    • /
    • 2016
  • Haze or fog is a common natural phenomenon. In foggy weather, the captured pictures are difficult to be applied to computer vision system, such as road traffic detection, target tracking, etc. Therefore, the image dehazing technique has become a hotspot in the field of image processing. This paper presents an overview of the existing achievements on the image dehazing technique. The intent of this paper is not to review all the relevant works that have appeared in the literature, but rather to focus on two main works, that is, image dehazing scheme based on atmospheric veil and image dehazing scheme based on dark channel prior. After the overview and a comparative study, we propose an improved image dehazing method, which is based on two image dehazing schemes mentioned above. Our image dehazing method can obtain the fog-free images by proposing a more desirable atmospheric veil and estimating atmospheric light more accurately. In addition, we adjust the transmission of the sky regions and conduct tone mapping for the obtained images. Compared with other state of the art algorithms, experiment results show that images recovered by our algorithm are clearer and more natural, especially at distant scene and places where scene depth jumps abruptly.