• 제목/요약/키워드: occluded objects

검색결과 99건 처리시간 0.019초

정형체의 투사 선분의 오차 최소화에 의한 영상기반 모델링 (Image-based Modeling by Minimizing Projection Error of Primitive Edges)

  • 박종승
    • 정보처리학회논문지B
    • /
    • 제12B권5호
    • /
    • pp.567-576
    • /
    • 2005
  • 다중영상으로부터 투사 선분을 이용하여 3D 모델을 생성하고 각 면의 텍스쳐를 획득하는 구조 복원 기법을 제안한다 사용자는 매우 단순한 절차를 통해 정확한 3D 모델 데이터를 획득할 수 있다. 모델 파라메터 추정을 위해 내재된 비선형 최적화 방법은 사용자 지정 영상 선분과 모델의 투사 선분의 거리를 최소화하는 방법에 기반하고 있다. 모델링 기법의 기능적 주요 목표는 형상이 포함된 다중 영상으로부터 그 형상의 3차원 구조를 복원하고 각 면의 텍스쳐를 생성하는 것이다. 본 연구에서는 3D 정형체를 사용하여 사용의 편리성을 증대시킬 수 있고 정형체의 파라메터의 오차를 최소화하여 복원된 구조의 정확성을 높이는 방법을 제시한다. 제안된 방법은 유한 선분에 기반한 오차 함수를 도입하여 무한 직선에 기반한 방법보다 정확한 모델링이 가능하다. 제안된 방법을 다양한 실제 영상에 적용한 실험 결과를 제시하고 다중 영상기반 모델링 도구의 개발 과정에서의 기술적인 문제점과 해결책을 기술한다.

서비스 로봇의 물체 탐색 성능 향상을 위한 베이지안 네트워크 결합 기반 물체 관계 모델링 (Object Relationship Modeling based on Bayesian Network Integration for Improving Object Detection Performance of Service Robots)

  • 송윤석;조성배
    • 한국지능시스템학회논문지
    • /
    • 제15권7호
    • /
    • pp.817-822
    • /
    • 2005
  • 최근 실내 환경에서 로봇의 서비스를륵 위해 영상 정보를 사용하기 인한 인구가 활발하다. 과거의 영상 처리 전근 방법은 미리 정의된 기하학적 모델에 기반 하기에, 이를 실내 환경과 같은 가변적인 환경에 적용할 시 성능이 저하된다. 이에 지식을 기반으로 불확실성을 해결하여 영상 인식 성능을 높이기 위한 다양한 연구가 진행되어 왔다. 본 논문에서는 실내에서 활동하는 서비스 로봇의 물체 인식 성능을 향상시키기 위해, 대상 물체가 다른 물체에 의서 가려져 있는 경우 대상물체의 존재 여부를 추론하기 위한 베이지안 네트워크 모델링 방법을 제안한다. 제안하는 방법은 물체간이 관계를 모델링하여 발견된 물체를 통해 대상 물체를 추론할 수 있게 하였다. 이를 위해 작은 규모의 베이지안 네트워크(프리미티브 베이지안 네트워크)를 위한 설계 방법을 정의하고 이를을 다시 상황에 맞게 결합하였다. 실험은 설계된 모델의 성능을 검증하기 위해 수행되었는데, 5가지 장소에서 $82.8\%$의 정확도를 보여주었다.

도심 영상에서의 비음수행렬분해를 이용한 차량 인식 (Vehicle Recognition using NMF in Urban Scene)

  • 반재민;이병래;강현철
    • 한국통신학회논문지
    • /
    • 제37권7C호
    • /
    • pp.554-564
    • /
    • 2012
  • 차량인식은 차량 후보영역 검출단계와 검출된 후보 영역에서 특징을 기반으로 차량을 검증하는 차량 검증단계로 나누어진다. 선형 변환 방식의 특징은 차원 감소 효과와 통계적인 특징을 지니게 되어, 이동이나 회전에 강인한 특성을 갖는다. 선형 변환 방식 중 비음수행렬분해(Non-negative Matrix Factorization, NMF)는 부분 기반 표현 방식으로 차량의 국소적인 특징을 기저벡터로 사용하여 희소성을 갖는 특징을 추출할 수 있기 때문에 도심영상에서 발생하는 차폐 영역에 따른 인식률 저하를 방지할 수 있다. 본 논문에서는 차량 인식에 적합한 NMF 특징 추출 방법을 제안하고, 인식률을 검증하였다. 또한 희소성 제약 조건을 이용하여 기저 벡터에 희소성을 가지는 SNMF(Sparse NMF)와 LVQ2(Learning Vector Quantization) 신경 회로망을 결합하여 차폐 영역에 대한 차량 인식 효율을 기존의 NMF를 이용한 방법과 비교하였다. NMF를 이용하는 특징은 차량이 혼재되어 차폐 영역이 빈번히 발생하는 도심에서도 강건한 특징임을 보였다.

커브형 집적 영상에서 DPM 기반의 비선형 상관기를 이용한 3D 물체 인식 향상 (Improved recognition of 3D objects using nonlinear correlator based on direct pixel mapping in curving-effective integral imaging)

  • 이준재;신동학;이병국
    • 한국정보통신학회논문지
    • /
    • 제17권1호
    • /
    • pp.190-196
    • /
    • 2013
  • 커브형 집적 영상 기술은 렌즈 배열을 이용하여 3D 영상을 공간에 쉽게 표현할 수 있는 기술이며, 넓은 관측각을 제공한다. 본 논문에서는 커브형 집적 영상에서 물체의 인식 향상을 위하여 다이렉트 픽셀 매핑 (DPM) 방법 기반의 비선형 상관기를 제안한다. 제안하는 비선형 상관기는 커브형 집적 영상 시스템에서 장애물에 가려진 물체로부터 픽업된 요소 영상을 DPM 방법을 통하여 해상도가 향상된 새로운 요소 영상을 생성한다. 새로운 생성된 요소 영상을 사용하여 복원한 3D 영상들과 참조 영상간의 비선형 상호상관을 이용하여 3D 물체의 인식 성능 향상시킨다. 제안된 방법의 유용함을 보이기 위하여 기초적인 상관 관계 실험을 수행하고 기존의 방법과의 비교 결과를 보고한다.

Optical Flow와 Normalized Cut을 이용한 2차원 동영상의 3차원 동영상 변환 (Three-Dimensional Conversion of Two-Dimensional Movie Using Optical Flow and Normalized Cut)

  • 정재현;박길배;김주환;강진모;이병호
    • 한국광학회지
    • /
    • 제20권1호
    • /
    • pp.16-22
    • /
    • 2009
  • 본 논문에서는 2차원 동영상을 normalized cut과 optical flow를 이용하여 3차원 동영상으로 변환하는 방법을 제안하였다. 이를 통해 특정 디스플레이 장치와 특정 동영상 포맷에 국한되지 않는 2차원 동영상의 3차원 동영상 변환 방법을 제안하였다. 본 연구에서는 2차원 동영상의 3차원 변환을 위하여 먼저 영상을 객체로 분할하고, 분할된 객체의 깊이를 추정하는 방법을 사용하였다. Normalized cut은 영상분할의 한 방법으로, 본 연구에서는 연산속도 향상을 위하여 기존 방법에 watershed 알고리즘을 적용하였고, 정확도 향상을 위하여 가중치에 optical flow를 추가하였다. Normalized cut을 이용하여 분할된 영상의 깊이 정보를 추정하기 위하여 optical flow를 이용하였다. Optical flow의 차이를 통해 정의할 수 있는 가려진 영역의 분할 영상 변화를 통해 순서적 깊이 정보를 추정한다. 추정된 순서적 깊이를 보정하기 위해 optical flow의 절대적 크기를 이용해 운동시차로 상대적 깊이를 추정하였다. 최종적으로 추정된 깊이 정보는 순서적 깊이와 상대적 깊이의 곱을 평균 optical flow로 나누어, 순서적 깊이의 차이를 보정하였다. 제안한 방법의 검증을 위하여 2차원 동영상을 3차원 동영상으로 변환하여 깊이 정보가 추정됨을 확인하였다.

비디오 영상에서 시공간적 문자영역 제거방법 (Spatiotemporal Removal of Text in Image Sequences)

  • 이창우;강현;정기철;김항준
    • 전자공학회논문지CI
    • /
    • 제41권2호
    • /
    • pp.113-130
    • /
    • 2004
  • 많은 시각적 정보를 포함한 비디오 데이터들의 자동화된 처리 기술 중, 비디오 데이터들의 시청자적인 정보를 보강시키고, 부가적인 정보를 첨가하기 위한 일환으로 자막을 삽입하는 경우가 많다. 이러한 자막은 때로 영상자료의 재사용성(reusability)을 저해하고, 원 영상을 훼손하는 경우가 발생한다. 본 논문에서는 영상의 재사용성을 높이고 원 영상 복원을 위해 Support Vector Machines(SVM)과 시공간적 영상복원 방법(spatiotemporal restoration)을 이용한 비디오 영상에서의 자동 문자 검출과 제거 방법을 제안한다. 연속적인 두 프레임 이상의 영상을 입력받아, 현재 프레임 영상에서 SVM을 이용하여 문자 영역을 검출한 다음, 검출된 문자 영역을 제거하고, 문자 영역에 의해 가려졌던 원 영상을 복원하기 위한 두 단계- 시간적 복원(temporal restoration)과 공간적 복원(spatial restoration)접근방법을 제안한다. 제안된 복원 방법은 글자 모션(text motion) 정보와 두 영상의 배경 차이(background difference)를 이용하여 영상을 그 특징에 따라 분류하고, 각 영상의 특징에 맞는 복원 방법을 적용한다. 제안된 방법은 다양한 종류의 영상에서 문자뿐만 아니라 관심의 대상이 되는 객체의 자동 검출 및 복원 등 다양한 응용분야를 포함한다.

가상 시점 영상 합성을 위한 깊이 기반 가려짐 영역 메움법 (A Depth-based Disocclusion Filling Method for Virtual Viewpoint Image Synthesis)

  • 안일구;김창익
    • 대한전자공학회논문지SP
    • /
    • 제48권6호
    • /
    • pp.48-60
    • /
    • 2011
  • 최근 3차원 영상과 자유 시점 영상에 대한 연구가 매우 활발하다. 다수의 카메라로부터 취득된 다시점 영상 사이를 가상적으로 이동하며 시청할 수 있는 자유 시점 렌더링은 다양한 분야에 적용될 수 있어 주목받는 연구주제이다. 하지만 다시점 카메라 시스템은 경제적인 비용 및 전송의 제약이 따른다. 이러한 문제를 해결하기 위한 대안으로 한 장의 텍스처 영상과 상응하는 깊이 영상을 이용하여 가상 시점을 생성하는 방법이 주목받고 있다. 가상 시점 생성 시 발생하는 문제점은 원래 시점에서는 객체에 의해 가려져 있던 영역이 가상시점에서는 보이게 된다는 것이다. 이 가려짐 영역을 자연스럽게 채우는 것은 가상 시점 렌더링의 질을 결정한다. 본 논문은 가상 시점 렌더링에서 필연적으로 발생하는 가려짐 영역을 깊이 기반 인페인팅을 이용하여 합성하는 방법을 제안한다. 텍스처 합성 기술에서 우수한 성능을 보인 패치 기반 비모수적 텍스처 합성 방법에서 중요한 요소는 어느 부분을 먼저 채울 지 우선순위를 결정하는 것과 어느 배경 영역으로 채울 지 예제를 결정하는 것이다. 본 논문에서는 헤시안(Hessian) 행렬 구조 텐서(structure tensor)를 이용해 잡음에 강건한 우선순위 설정 방법을 제안한다. 또한 홀 영역을 채울 적절한 배경 패치를 결정하는 데에 있어서는 깊이 영상을 이용해 배경영역을 알아내고 에피폴라 라인을 고려한 패치 결정 방법을 제안한다. 기존 방법들과 객관적인 비교와 주관적인 비교를 통하여 제안된 방법의 우수성을 보이고자 한다.

고해상도 전정색 영상과 다중분광 영상을 활용한 그림자 분석기반의 3차원 건물 정보 추출 (Extraction of 3D Building Information by Modified Volumetric Shadow Analysis Using High Resolution Panchromatic and Multi-spectral Images)

  • 이태윤;김윤수;김태정
    • 대한원격탐사학회지
    • /
    • 제29권5호
    • /
    • pp.499-508
    • /
    • 2013
  • 각종 센서 정보에 기반한 3차원 건물 정보 추출 방법은 건물 형태를 보다 상세하게 묘사할 수 있지만 많은 비용 및 복잡한 처리가 요구된다. 단일 고해상도 영상에 기반한 방법은 추출할 수 있는 3차원 건물 정보가 비교적 제한적이지만 낮은 비용과 단순한 처리 과정으로 건물 정보를 추출할 수 있다는 장점을 갖는다. 단일 고해상도 위성영상만을 이용한 건물 정보 추출 방법 중에서도 Volumetric Shadow Analysis(VSA)는 그림자나 건물 밑 바닥이 일부분 가려져도 해당 건물의 높이와 바닥 위치 정보를 추출할 수 있다. 최근에는 반자동 VSA가 제안되었으나 이 방법은 주변 객체 형태와 그림자 영역 추출 정확도, 영상 노이즈 등에 큰 영향을 받는다. 반자동 VSA를 개선하기 위해서 본 논문은 단일 고해상도 전정색 영상과 다중분광 영상을 이용한 3차원 건물 정보 추출 방법을 제안한다. 제안된 방법은 각 밴드 영상에 반자동 VSA를 각각 적용하고 이를 통해서 계산된 파라미터로 비용함수를 구성한다. 비용함수로 계산된 값이 최대인 건물 높이를 실제 건물 높이로 결정한다. 제안된 방법의 성능평가를 위해서 Kompsat-2 영상이 사용되었으며 반자동 VSA와 제안된 방법으로 추출된 건물 정보를 비교 분석하였다. 그 결과는 제안된 방법이 보다 높은 성공률로 비교적 정확한 건물 정보를 추출할 수 있음을 보여준다.

3차원 추적영역 제한 기법을 이용한 손 동작 인식 시스템 (A Hand Gesture Recognition System using 3D Tracking Volume Restriction Technique)

  • 김경호;정다운;이석한;최종수
    • 전자공학회논문지
    • /
    • 제50권6호
    • /
    • pp.201-211
    • /
    • 2013
  • 본 논문에서는 손 추적과 제스처 인식 시스템을 제안한다. 제안한 시스템은 사용자 손의 3차원 기하학적 정보를 취득하기 위해 별도의 장비를 사용한다. 특히, 기존의 물체 검출 및 추적 시스템들에서 제기 되었던 추적 과정에서의 문제점을 피하기 위해 능동적인 타원체 영역을 만들고 손 추적을 위한 영역을 타원체 영역의 안으로 제한했다. 제안된 시스템은 미리 정의된 기간 동안에 손 위치의 이동평균을 계산한다. 그리고 추적영역은 3차원 공간에 편성된 공분산에 기반한 사용자 손 움직임의 불확실성을 추정하여 통계적인 데이터에 따라 능동적으로 제어하였다. 또한 손 위치가 획득되었을 때, 손 제스처를 인식하기 위해 펼쳐진 손가락을 검출한다. 사용자 인터페이스 체제 기반의 시스템을 구현하여 복잡한 환경에서 다중의 대상들이 동시에 존재하는 경우이거나 일시적인 가려짐이 발생하는 경우에도 정확성을 보여 매우 안정적으로 동작할 수 있음을 보여주며, 약 24-30fps의 프레임 비율로 사용할 수 있는 가능성을 보여주었다.