• 제목/요약/키워드: Computer Vision

검색결과 2,219건 처리시간 0.03초

GPU를 이용한 DWT 및 JPEG2000의 고속 연산 (Fast Computation of DWT and JPEG2000 using GPU)

  • 이만희;박인규;원석진;조성대
    • 대한전자공학회논문지SP
    • /
    • 제44권6호
    • /
    • pp.9-15
    • /
    • 2007
  • 본 논문에서는 GPU (Graphics Processing Unit)를 이용하여 JPEG2000 정지영상 압축 알고리즘의 DWT (Discrete Wavelet Transform) 연산을 고속으로 수행하기 위한 효율적인 구조와 방법을 제안한다. DWT 연산은 JPEG2000에서 EBCOT (embedded block coding with optimized truncation)과 더불어 많은 계산 량을 소모하는 부분이기 때문에, 본 논문에서는 DWT 알고리즘을 GPU의 화소 쉐이더에서 고속으로 수행하기 위하여 Render-To-Texture (RTT)를 활용한 구조를 설계하였다. 실제 구현을 통해 비슷한 등급의 CPU에서의 처리에 비해 DWT 자체는 10배 이상의 수행 속도의 향상을, 기존의 JPEG2000 참조 소프트웨어인 JasPer의 DWT를 대치하였을 때 2$\sim$16배의 수행 속도의 향상을 보였으며 해상도가 증가할수록 향상 폭이 크다. 본 논문에서 제시된 프레임 버퍼 객체(Frame Buffer Object)를 이용한 render-to-texture 수행 구조는 GPU 기반 영상처리의 기본 틀을 제공하며, 이를 응용하여 일반적인 영상처리와 컴퓨터 비전 처리를 GPU 상에서 고속 수행할 수 있다.

블록기반 라벨과 화소기반 스캔마스크를 이용한 이진 연결요소 라벨링 (Binary Connected-component Labeling with Block-based Labels and a Pixel-based Scan Mask)

  • 김교일
    • 전자공학회논문지
    • /
    • 제50권5호
    • /
    • pp.287-294
    • /
    • 2013
  • 이진 연결요소 라벨링은 영상처리와 컴퓨터비전 등의 영역에 널리 사용되는 기법 중의 하나이다. 지금까지 여러 가지 방법의 라벨링기법이 연구되어 왔는데 그 중에서 이중스캔 방법이 가장 효과가 있는 것으로 나타나고 있다. 이중스캔 방법에서는 전통적으로 화소단위로 스캐닝을 하면서 순차적으로 라벨링하는 방법을 사용했는데 최근에는 C. Grana et. al. 및 L. He et. al. 등이 제안한 복수의 인접화소를 묶은 블록을 기반으로 라벨링하는 방법이 가장 효율적인 것으로 인정받고 있다. 본 논문에서는 화소기반의 스캔마스크를 사용하면서 라벨링은 Grana의 블록을 기반으로 하는 새로운 라벨링 방법을 제안하고 있다. 실제 사용하는 영상들에 대해 실험한 결과 영상의 종류에 따라 제안된 방법이 현재 가장 효율이 좋은 He의 방법에 비해 평균 3.9%에서 22.4%까지 성능의 향상이 있는 것으로 나타났다.

생체 신호와 몸짓을 이용한 감정인식 방법 (Emotion Recognition Method using Physiological Signals and Gestures)

  • 김호덕;양현창;심귀보
    • 한국지능시스템학회논문지
    • /
    • 제17권3호
    • /
    • pp.322-327
    • /
    • 2007
  • 심리학 분야의 연구자들은 Electroencephalographic(EEG)을 오래전부터 인간 두뇌의 활동을 측정 기록하는데 사용하였다. 과학이 발달함에 따라 점차적으로 인간의 두뇌에서 감정을 조절하는 기본적인 영역들이 밝혀지고 있다. 그래서 인간의 감정을 조절하는 인간의 두뇌 활동 영역들을 EEG를 이용하여 측정하였다. 손짓이나 고개의 움직임은 사람들 사이에 대화를 위한 인간의 몸 언어로 사용된다. 그리고 그것들의 인식은 컴퓨터와 인간 사이에 유용한 회화수단으로 매우 중요하다. 몸짓에 관한 연구들은 주로 영상을 통한 인식 방법이 주를 이루고 있다. 많은 연구자들의 기존 연구에서는 생체신호나 몸짓중 한 가지만을 이용하여 감정인식 방법 연구를 하였다. 본 논문에서는 EEG 신호와 몸짓을 같이 사용해서 사람의 감정을 인식하였다. 그리고 인식의 대상자를 운전자라는 특정 대상자를 설정하고 실험을 하였다. 실험 결과 생체신호와 몸짓을 같이 사용한 실점의 인식률이 둘 중 한 가지만을 사용한 것보다 높은 인식률을 보였다. 생체신호와 몸짓들의 특징 신호들은 강화학습의 개념을 이용한 IFS(Interactive Feature Selection)를 이용하여 특징 선택을 하였다.

향상된 표적 추적 기법을 이용한 무유도 대전차 로켓의 조준 오차 제거 방법 (A Method for Eliminating Aiming Error of Unguided Anti-Tank Rocket Using Improved Target Tracking)

  • 송진모;김태완;박태선;도주철;배종수
    • 한국군사과학기술학회지
    • /
    • 제21권1호
    • /
    • pp.47-60
    • /
    • 2018
  • In this paper, we proposed a method for eliminating aiming error of unguided anti-tank rocket using improved target tracking. Since predicted fire is necessary to hit moving targets with unguided rockets, a method was proposed to estimate the position and velocity of target using fire control system. However, such a method has a problem that the hit rate may be lowered due to the aiming error of the shooter. In order to solve this problem, we used an image-based target tracking method to correct error caused by the shooter. We also proposed a robust tracking method based on TLD(Tracking Learning Detection) considering characteristics of the FCS(Fire Control System) devices. To verify the performance of our proposed algorithm, we measured the target velocity using GPS and compared it with our estimation. It is proved that our method is robust to shooter's aiming error.

HTML5 캔버스를 이용한 플랫폼 독립적인 게임의 구현 (Platform Independent Game Development Using HTML5 Canvas)

  • 장석우;허문행
    • 한국정보통신학회논문지
    • /
    • 제18권12호
    • /
    • pp.3042-3048
    • /
    • 2014
  • 최근 들어, 차세대의 웹 표준으로 자리매김하고 있으며, 별도의 프로그램을 설치하지 않고 인터넷 브라우저 상에서 다양한 그래픽과 멀티미디어의 구현이 가능한 웹 앱 저작 기술인 HTML5에 많은 사람들의 관심이 집중되고 있다. 본 논문에서는 HTML5에서 제공하는 캔버스를 활용하여 애플의 iOS, 구글의 안드로이드 등의 플랫폼에 의존적이지 않은 게임을 구현한다. 본 논문에서 구현하는 게임은 캐릭터가 주변의 적들과 충돌하지 않기 위해서 상하좌우로 이동한다. 그리고 캐릭터가 적과 충돌하면 생존 게이지가 줄어들고, 하트 아이템을 먹으면 생존 기간이 연장되는 게임이다. 향후에는 본 논문에서 개발된 게임에 보다 다양한 아이템을 추가할 예정이며, 제스처 인식과 같은 컴퓨터 비전기술을 적용하여 게임을 수행하는 사용자와의 인터페이스를 보다 다양화할 계획이다.

검출된 얼굴 영역 히스토그램 재조정을 통한 개선된 실시간 평균이동 얼굴 추적 방식 (Improved Real-Time Mean-Shift Face Tracking by Readjusting Detected Face Region Histogram)

  • 김귀식;이재성
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 추계학술대회
    • /
    • pp.195-198
    • /
    • 2013
  • 관심 객체의 인식 및 추적은 컴퓨터 비전 분야의 중요한 영역이다. 본 논문에서는 기존의 Mean-Shift 알고리즘의 고질적인 문제인 유사 히스토그램 분포를 가지는 객체 간 혼동 현상을 해결하는 방법을 제안한다. 피부색 필터링, 얼굴 인식, Mean-Shift 순으로 진행되는 처리 과정에서 각각의 알고리즘 블럭은 다음 진행 알고리즘의 성능을 높이는데 기여한다. 연산 오버헤드가 발생하지 않도록 추적 영역과 유사한 히스토그램 분포를 가지는 영역이 겹쳐질 때에만 화이트 픽셀의 수를 고려해 Viola-Jones 알고리즘을 실행하여 간단한 산술 연산을 통해 Mean-Shift의 수렴성을 높인다. 실험 결과 화이트 픽셀 수가 Mean-Shift의 탐색 반경에서 78%이상이 되면 Viola-Jones 알고리즘이 수행되도록 설정하였을 때 얼굴 영역 인식이 되는 경우에 한해서 객체 추적은 100% 성공하였다.

  • PDF

Kinect V2를 이용한 모바일 장치 실시간 알림 모니터링 시스템 (Real-time monitoring system with Kinect v2 using notifications on mobile devices)

  • 니욘사바 에릭;장종욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 춘계학술대회
    • /
    • pp.277-280
    • /
    • 2016
  • 실시간 원격 감지 시스템은 많은 감시 상황에서 중요한 가치를 지니고 있다. 실시간 원격 감지 시스템은 누군가가 그의 장소에서 무슨 일이 일어나고 있는지를 알 수 있게 한다. Kinect의 V2는 컴퓨터에게 눈의 역할을 제공하며 컬러와 깊이 이미지, 오디오 입력과 골격 데이터 등 다양한 데이터를 생성 할 수 있는 새로운 유형의 카메라이다. 본 논문에서는 깊이 이미지와 함께 Kinect V2의 센서를 사용하여, Kinect에 의해 덮인 공간에서의 모니터링 시스템을 제공한다. 따라서 Kinect 카메라에 의해 덮인 공간에 기초하여, 최소 및 최대 거리를 설정함으로써, 깊이의 범위를 이용하여 감시하는 대상 지역을 정의한다. 대상 공간에서 추적 개체가 있는 경우, 컴퓨터 비전 라이브러리(Emgu CV)에서 Kinect 카메라는 이미지 전체의 색상을 캡처하고, 이를 데이터베이스로 전송함으로써 인터넷이 있으면 어디서나 사용자가 자신의 모바일 장치를 통해 접속할 수 있다.

  • PDF

템플릿 매칭과 부분 워핑을 이용한 효율적인 원근 영상 워핑 기법 (Efficient Image Warping Mechanism Using Template Matching and Partial Warping)

  • 정대헌;조태훈
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 춘계학술대회
    • /
    • pp.339-342
    • /
    • 2017
  • 이미지의 기하학적 변형은 이미지 보정을 위해 사용되며 컴퓨터 비전 분야에서 강체 변환, 유사변환 등 많은 방법이 존재한다. 그 중에서도 워핑은 원근감이 있는 이미지에서 많이 활용되는 이미지 보정 방법이다. 일반적으로 워핑을 수행하기 위해서는 워핑할 위치에 대한 특징 점 4개를 추출해 워핑을 수행한다. 그러나 워핑 지점을 정확한 추출이 어려우며, 추출된 4개의 점을 이용해 원근 영상 보정을 할 경우 원본 이미지와 보정 후 영상과의 특정 부분 픽셀이 3~4픽셀 이상으로 오차가 나타나게 된다. 그렇기 때문에 본 논문에서는 정확한 워핑 결과를 가져오기 위해 템플릿 매칭을 이용해 워핑 할 부분의 4개점을 보다 정확하게 추출하고, 추출된 4개점들 중 2개의 점 각각에 대해 주변 3 by 3 영역으로 점을 이동 시켜 총 81번의 반복을 워핑 통해 이미지 보정하는 형태이다. 이와 같이 2개의 점을 주변 3 by 3 위치로 이동 시키면서 오차 픽셀이 1픽셀 이하로 나는 최적의 위치 즉, 최적 결과를 가져오는 4개의 점을 선정한 후 그 점들로 이미지 보정을 진행하여 최적의 결과를 가져올 수 있다.

  • PDF

적외선 조명 카메라를 이용한 시선 위치 추적 시스템 (Gaze Detection System by IR-LED based Camera)

  • 박강령
    • 한국통신학회논문지
    • /
    • 제29권4C호
    • /
    • pp.494-504
    • /
    • 2004
  • 사용자의 시선 위치를 파악하는 연구는 많은 응용분야를 가지고 지난 몇년간 눈부시게 발전되어 왔다. 기존의 대부분 연구에서는 영상 처리 방법만에 의존하여 시선 위치 추적 연구를 수행하였기 때문에 처리 속도도 늦고 많은 사용 제약을 가지는 문제점이 있었다. 이 논문에서는 적외선 조명이 부착된 단일 카메라를 이용한 컴퓨터 비전 시스템으로 시선 위치 추적 연구를 수행하였다. 사용자의 시선 위치를 파악하기 위해서는 얼굴 특징점의 위치를 추적해야하는데, 이를 위하여 이 논문에서는 적의선 기반 카메라와 SVM(Support Vector Machine) 알고리즘을 사용하였다. 사용자가 모니터상의 임의의 지점을 쳐다볼 때 얼굴 특징점의 3차원 위치는 3차원 움직임량 추정(3D motion estimation) 및 아핀 변환(affine transformation)에 의해 계산되어 질 수 있다. 얼굴 특징점의 변화된 3차원 위치가 계산되면. 이로부터 3개 이상의 얼굴 특징점으로부터 생성되는 얼굴 평면 및 얼굴 평면의 법선 벡터가 구해지게 되며, 이러한 법선 백터가 모니터 스크린과 만나는 위치가 사용자의 시선위치가 된다. 또한. 이 논문에서는 보다 정확한 시선 위치를 파악하기 위하여 사용자의 눈동자 움직임을 추적하였으며 이를 위하여 신경망(다층 퍼셉트론)을 사용하였다. 실험 결과, 얼굴 및 눈동자 움직임에 의한 모니터상의 시선 위치 정확도는 약 4.2cm의 최소 자승 에러성능을 나타냈다.

시공간 정합을 이용한 비디오 시퀀스에서의 가려진 객체의 복원 (Completion of Occluded Objects in a Video Sequence using Spatio-Temporal Matching)

  • 허미경;문재경;박순용
    • 정보처리학회논문지B
    • /
    • 제14B권5호
    • /
    • pp.351-360
    • /
    • 2007
  • 비디오 복원(video completion) 기술은 비디오 영상에서 색상 정보가 없는 픽셀에 적절한 색을 채워 영상을 복원하는 기술이다. 본 논문에서는 움직이는 물체가 서로 교차하는 비디오 영상에서 원하지 않는 물체를 제거하고 이때 발생한 영상 홀(image hole)을 채우는 비디오 복원 기술을 제안한다. 움직이는 카메라에서 획득한 비디오 영상에서 이동하는 두 물체 중 카메라와 가까운 물체를 제거함으로써 가려진 이동물체와 배경에 홀이 발생하게 되고, 이 홀온 다른 프레임들의 정보를 이용하여 채움으로써 새로운 비디오를 생성한다. 입력 영상의 모든 프레임에 대해 각 물체의 중심을 추정하여 물체의 중심을 기준으로 시-공간 볼륨(spatio-temporal volume)을 생성하고, 복셀 매칭(voxel matching)을 통한 시간적 탐색(temporal search)을 수행한 후 두 물체를 분리한다. 가리는 물체 영역으로 판단된 부분을 삭제하고 공간적 탐색(spatial search) 방법을 이용하여 홀을 채워 가려짐이 있는 이동 물체 및 배경을 복원한다. 복원된 영상에서 블렌딩을 통해 솔기(seam)를 제거한다. 비디오카메라로 획득한 두 실영상을 이용하여 실험을 수행한 결과 가려진 물체를 복원한 새로운 비디오 영상을 생성할 수 있었다.