• 제목/요약/키워드: 컴퓨터 3D 비젼

검색결과 22건 처리시간 0.023초

문서 이미지에서 문자 추출과 3차원 면적-가중치 그래프를 이용한 단어 그룹핑 (Text Extraction and Word Grouping using 3D Area-Weighted Graph in Document)

  • 옥세영;박환철;조환규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.556-558
    • /
    • 1998
  • 이미지 분석이나 데이터 베이스 인덱싱 또는 종이 문서를 전자 문서화 하는 문제는컴퓨터 비젼 응용분야에서 중요 관심사가 되어왔다. 이러한 문제들을 처리하기 위해서는 제일 먼저 이미지와 문자가 혼합되어 있는 문서에서 자동으로 문자와 이미지들을 분리해 내는 과정이 필수 적이다. 본 논문에서는 신문이나 광고등에서 볼 수 있는 이미지, 음각 문자와 양각 문자가 섞여 있는 문서에서 문자만을 추출하는 알고리즘을 제안한다. 이 알고리즘은 Run-length code를 이용하여 문자나 이미지의 경계선(bound) 모양의 특징을 추출하여 음각 문자와 이미지, 양각 문자를 구분한다. 그리고 추출된 글자들을 3차원 공간상에 매핑한 후 3차원 면적 가중치 그래프를 이용하여 관련된 단어들로 묶어주는 3차원 그룹핑 알고리즘을 제시한다. 실험결과로는 추출된 문자와 그룹핑된 결과를 보여준다.

  • PDF

얼굴의 3차원 위치 및 움직임 추정에 의한 시선 위치 추적 (Facial Gaze Detection by Estimating Three Dimensional Positional Movements)

  • 박강령;김재희
    • 대한전자공학회논문지SP
    • /
    • 제39권3호
    • /
    • pp.23-35
    • /
    • 2002
  • 시선 위치 추적이란 모니터상에 사용자가 쳐다보고 있는 지점을 파악해 내는 기술이다 이 논문에서는 컴퓨터 비젼 방법을 이용하여 사용자가 모니터 상에 어느 지점을 쳐다보고 있는지를 파악(시선 위치 추적)하는 새로운 방법을 제안한다. 시선위치를 파악하기 위해 본 논문에서는 얼굴 영역 및 얼굴 특징점(양 눈, 양 콧구멍, 입술 끝점 등)을 2차원 카메라 영상으로부터 추출하였으며, 이들의 움직임으로부터 카메라 보정 및 매개변수 추정 방법등을 이용하여 초기 3차원 위치를 추정해 내었다. 이후 모니터 상의 한 지점을 쳐다보기 위해 사용자가 얼굴을 움직이는 경우 이러한 얼굴의 3차원 움직임 량 역시 자동으로 추정하였다. 이로부터 변화된 얼굴 특징점의 3차원 위치를 계산해 낼 수 있었으며, 이를 바탕으로 모니터 상의 시선 위치를 구하였다. 실험 결과, 19인치 모니터상의 임의의 지점을 사용자가 쳐다보았을 때, 약 2.01인치의 시선 위치에러 성능을 얻었다.

아크용접용 로봇을 위한 레이저비젼 센서 (Laser Vision Sensor for Robotic Arc Welding)

  • 이화조
    • Journal of Welding and Joining
    • /
    • 제14권1호
    • /
    • pp.15-23
    • /
    • 1996
  • 용접은 힘든 작업환경 때문에 심한 인력난을 겪고 있는 3D 업종 중의 하나이 다. 특히 아크용접을 위해서는 숙련된 작업자가 필요하기 때문에 인력난은 더욱 심각 하다. 현장에서 젊은 작업자는 보기 힘들고 대부분의 작업자는 중년이상의 나이이다. 따라서 머지않아 많은 업체들이 인력난으로 조업을 중단해야 할 사태도 우려하지 않을 수 없는 형편이다. 이러한 문제점들을 해결할 수 있는 용접자동화는 최근 많은 관심을 끌고 있으며 이제 세계적인 추세가 되었다. 용접자동화의 이점은 무엇보다도 일정한 수준의 품질과 생산성에서 찾아볼 수 있다. 용접자동화에서는 가공자동화와는 달리 시스템의 자율성이 특히 중요하다. 작업조건의 설정, 용접봉의 위치와 방향 등은 전적 으로 컴퓨터와 센서시스템을 장착한 로봇에 의해 결정되어야 한다. 따라서 작업자들이 용접에 이용하는 각종 지능적인 능력을 습득하고 이를 각종 제어기와 센서로 모방하여 자율적으로 제어하는 인공지능기술을 응용하는 용접을 로봇의 개발에 관한 각종 연구 가 활발히 진행되고 있다.

  • PDF

2차원 객체 영상의 3차원 모델링을 위한 손실 특징점 보정 (Correction of Missing Feature Points for 3D Modeling from 2D object images)

  • 고성식
    • 한국정보통신학회논문지
    • /
    • 제19권12호
    • /
    • pp.2844-2851
    • /
    • 2015
  • 다수의 2차원 객체 영상으로부터 3차원 형상을 복원하는 방법은 컴퓨터 비젼 분야에서 널리 연구되고 있다. 복원된 3차원 형상의 정확도 개선을 위해서는 잡음 영향을 줄이거나 영상 프레임 수를 확보하는 것이 무엇보다 중요하다. 그렇지만 특징점 추정 시 잡음은 잠재적으로 내포되고, 관측행렬을 구성하는 영상 프레임 수는 특징점 추적 실패, 장애요소 또는 낮은 해상력 등에 의해 일반적으로 감소하게 된다. 그래서 잠음 환경 하에 손실된 특징점을 보다 정확히 보정하여 사용 가능한 영상 프레임 수를 확보하는 것이 필수적이다. 따라서 우리는 잡음 분포 하에서 기하학적 특성을 이용해 손실 특징점의 오차 거리와 방향을 직접 제어할 수 있는 분석적 접근방법을 제안한다. 제안한 방법의 우수성은 합성과 실제 객체에 대한 실험 결과를 통해서 검증한다.

확장 환경에서의 위치 및 방향 정보 계산을 위한 실시간 3차원 위치 계산 (Real-time 3D Calibration for Pose Computation in Extended Environments)

  • 박준;장준호;권장우
    • 한국멀티미디어학회논문지
    • /
    • 제6권3호
    • /
    • pp.455-461
    • /
    • 2003
  • 비전을 이용한 사용자의 위치 및 방향 측정 시스템은 대부분 마커를 부착하고 그 마커들의 위치를 측정한 후, 이 마커들의 3차원 위치 정보와 이미지 상에서의 2차원 위치를 기초로 카메라(또는 사용자)의 위치 및 방향을 계산한다. 여기서 사용되는 마커들은 대부분 알고리즘 상으로 컴퓨터가 찾기 쉽도록 고안하는 경우가 많다. 그러나 환경이 확장되는 경우에 있어서는 그에 상응하는 마커를 부착하는 것이 실제적으로 어려운 경우가 많다. 이와 같은 경우에, 효과적으로 검색이 가능하다면, 마커가 아닌 환경에 이미 존재하는 물체를 이용할 수 있다. 이러한 물체들을 위치 및 방향 계산에 사용하기 위해서는 이 물체들의 3차원 위치를 미리 계산해야 한다. 본 논문에서는 확장 환경에서 카메라(또는 사용자)의 위치 및 방향의 계산이나 수정에 사용되는 물체들의 3차원 위치를 계산하는 방법을 제안하고 설명한다.

  • PDF

동영상에서 물체의 추출과 배경영역의 상대적인 깊이 추정 (Moving Object Extraction and Relative Depth Estimation of Backgrould regions in Video Sequences)

  • 박영민;장주석
    • 정보처리학회논문지B
    • /
    • 제12B권3호
    • /
    • pp.247-256
    • /
    • 2005
  • 컴퓨터 비젼에 관한 고전적인 연구 주제들 중의 하나는 두 개 이상의 이미지로부터 3차원 형상을 재구성하는 3차원 변환에 관한 것이다. 본 논문은 단안 카메라로 촬영한 일반적인 2차원 영상물에서 능동적으로 움직이는 3차원 영상의 깊이 정보를 추출하는 문제를 다룬다. 연속하는 프레임들간의 영상 블록의 움직임을 평가하여 카메라의 회전과 배율효과를 보상하고 다음과 같은 두 개의 단계에 걸쳐 블록의 움직임을 추출한다. (i) 블록의 위치와 움직임을 이용하여 카메라의 이동과 초점거리에 대한 전역 파라메타를 계산한다. (ii) 전역 파라메타, 블록의 위치와 움직임을 이용하여 평균 영상 깊이에 대한 상대적인 블록의 깊이를 계산한다. 다양한 동영상을 대상으로 특이점인 경우와 그렇지 않은 경우를 실험하였다. 결과로 얻어지는 상대적인 깊이 정보와 객체는 인간이 판단하는 경우와 동일함을 보였다.

증강현실을 위한 히스토그램 기반의 손 인식 시스템 (Histogram Based Hand Recognition System for Augmented Reality)

  • 고민수;유지상
    • 한국정보통신학회논문지
    • /
    • 제15권7호
    • /
    • pp.1564-1572
    • /
    • 2011
  • 본 논문에서는 증강현실을 위한 히스토그램 기반의 손 인식 기법을 제안한다. 손동작 인식은 사용자와 컴퓨터 사이의 친숙한 상호작용을 가능하게 한다. 하지만, 비젼 기반의 손동작 인식은 복잡한 손의 형태로 인한 관찰 방향 변화에 따른 입력 영상의 다양함으로 인식에 어려움이 따른다. 따라서 본 논문에서는 손의 형태적인 특징을 이용한 새로운 모델을 제안한다. 제안하는 기법에서 손 인식은 카메라로부터 획득한 영상에서 손 영역을 분리하는 부분과 인식하는 부분으로 구성된다. 카메라로부터 획득한 영상에서 배정을 제거하고 피부색 정보를 이용하여 손 영역을 분리한다. 다음으로 히스토그램을 이용하여 손의 특징점을 구하여 손의 형태를 계산한다. 마지막으로 판별된 손인식 정보를 이용하여 3차원 객체를 제어하는 증강현실 시스템을 구현하였다. 실험을 통해 제안한 기법의 구현 속도가 빠르고 인식률도 91.7%로 비교적 높음을 확인하였다.

움직이는 평면거울을 이용한 3차원 물체 복원 (3D Reconstruction using a Moving Planar Mirror)

  • 장경호;이동훈;정순기
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권11호
    • /
    • pp.1543-1550
    • /
    • 2004
  • 영상 열을 이용한 3차원 구조 복원 기법은 기하학 기반의 전통적인 3차원 모델링 기법의 대안으로 복잡한 대규모 장면을 쉽고 빠르게 모델링 할 수 있는 효과적인 수단이다. 이러한 모델은 모션을 통한 구조 복원기법을 통해 주로 얻어진다. 그러나 모션을 통한 구조복원 기법은 매우 복잡한 기하학 구조와 현란한 컬러를 포함한 물체의 경우, 적용하기에 어려움이 있다. 이러한 어려움을 해결하기 위해, 본 논문에서는 움직이는 평면거울 기반의 새로운 물체 복원 기법을 제안한다. 본 기법은 장면에 포함된 기하구조의 암묵적인 단서를 이용하는 대신 장면 속에 기하학적 단서 즉, 거울의 위치 정보를 강제로 삽입하여 가상 카메라의 위치 정보를 추출한다 구해진 가상 카메라의 위치 정보를 통해 장면의 복잡도에 무관한 3차원 기하 구조를 복원할 수 있다. 이를 위해 먼저 복원하고자 하는 장면을 포함한 평면거울의 영상 열을 포착한다. 다음으로 거울의 위치 정보를 이용하여 가상 카메라의 내, 외부 파라미터를 추정한다. 구해진 카메라 파라미터는 거울의 위치 정보 추출 시 발생하는 에러를 포함하고 있기 때문에 영상 열에 존재하는 코너점들의 대응관계를 이용하여 재 보정한다 마지막으로 구해진 가상 카메라의 내부 및 외부 파라미터 정보를 통해 3차원의 구조를 복원한다 본 논문에서 제안한 알고리즘을 다양한 영상을 통해 실험한 결과 신뢰할만한 구조 복원이 가능하였다.

비교정 영상 시퀀스로부터 3차원 모델링을 위한 프로젝티브 재구성 방법 (Projective Reconstruction Method for 3D modeling from Un-calibrated Image Sequence)

  • 홍현기;정윤용;황용호
    • 대한전자공학회논문지SP
    • /
    • 제42권2호
    • /
    • pp.113-120
    • /
    • 2005
  • 비교정 영상 시퀀스(un-calibrated sequence)로부터 대상 장면을 재구성하는 연구는 컴퓨터 비젼에서 중요한 주제이다. 3차인 정보론 유클리드 공간에서 재구성하기 위해 프로젝티브(projective) 재구성이 선행되며, 이는 병합(merging)방법과 분해 (factorization)방법으로 나뉜다. 분해방법은 카메라 투영행렬과 3차원 구조정보를 한 번에 계산하기 때문에 계산속도가 빠르며, 병합방법의 단점인 오차의 누적 문제를 해결할 수 있다. 그러나 사용되는 일치점(correspondence)이 모든 영상 시퀀스에 존재한다는 가정으로 인해 긴 시퀀스에 적용하기 어렵다. 본 논문에서는 영상 시퀀스를 몇 개의 그룹으로 나누고 각 그룹을 분해 법으로 프로젝티브 재구성을 한 다음, 하나의 프로젝티브 공간으로 다시 구성하는 새로운 방법을 제안하였다. 시퀀스에서 그룹을 결정하기 위해 매칭점의 개수, 평면사영변환(homography) 오차, 영상 내 매칭점의 분포를 함께 고려했으며, 병합방법에 비해 카메라 파라미터의 오차 누적이 적고 계산속도면에서도 우수함을 실험을 통해 확인하였다.

인체의 구조적 특성과 역운동학을 이용한 모션 캡처 (Motion Capture using both Human Structural Characteristic and Inverse Kinematics)

  • 서융호;두경수;최종수;이칠우
    • 대한전자공학회논문지SP
    • /
    • 제47권2호
    • /
    • pp.20-32
    • /
    • 2010
  • 기존 모션 캡쳐의 경우, 고가의 장비나 사용의 복잡도, 동작자의 움직임 제한 등 모션 캡쳐의 어려움이 있었다. 최근 실시간으로 모션 캡쳐가 가능한 컴퓨터 비젼 기반 시스템에 대한 연구가 활발히 진행되고 있다. 본 논문에서는 다시점 영상으로부터 쉽고, 빠르게 추출할 수 있는 피부색과 정확한 3차원 복원을 위한 2차원 영상 좌표 보정을 사용하여 효율적인 다시점 영상 분석 알고리즘을 제안한다. 동작자의 피부색을 검출하고, 카메라 보정 및 에피폴라 기하학 정보를 이용하여 보다 정확한 영상 분석, 그라고 칼만 필터(Kalman filter)를 사용한 추적 등을 통해 보다 안정적인 모션 캡쳐가 가능하게 된다. 실험결과를 통하여, 제안된 방법은 보다 정확한 위치 추정 및 살시간 모션 캡쳐를 위한 알고리즘임을 보여주고 있다.