• 제목/요약/키워드: 위치영역 투영

검색결과 78건 처리시간 0.028초

영역분할에 의한 SLI와 벡터 지도 간의 건물영역 일치도 향상 (Improvement of Building Region Correspondence between SLI and Vector Map Based on Region Splitting)

  • 이정호;가칠오;김용일;유기윤
    • 한국측량학회지
    • /
    • 제30권4호
    • /
    • pp.405-412
    • /
    • 2012
  • SLI(Street-Level Imagery)와 벡터지도의 합성을 통해 두 데이터 간의 위치 편차를 제거한 후, SLI의 매개변수를 기반으로 두 데이터의 대응되는 건물영역을 찾을 수 있다. 그러나 합성 이후에도 여러 요인으로 인하여 건물영역이 완전히 일치하지는 않는다. 본 연구는 영상의 영역분할을 통해 두 데이터 간의 건물영역 일치도를 향상시키는 것을 목적으로 한다. 합성을 통해 생성한 벡터 지도의 건물 객체를 SLI 영상에 투영한 선을 영역분할의 초기 정보로 사용한다. 우선, 필터링, 분할(segmentation), 하늘영역 탐지를 통해 하늘 영상을 생성한다. 그리고 에지 검출자를 통해 건물 분리 후보선을 추출한 후, 색상 차이와 하늘정보를 함께 활용하여 건물 최적분리선을 추출함으로써 보다 정확한 건물영역으로 분할한다. 실제 데이터에 대한 실험 결과, 영역 분할을 통해 건물영역 일치 정확도가 83.3%에서 89.7%로 향상된 것을 확인하였다. 본 연구의 성과는 SLI 서비스를 강화하는데 유용하게 활용될 수 있을 것이다.

HCI 를 위한 멀티터치 테이블-탑 디스플레이 시스템 구현 (Implementation of Multi-touch Tabletop Display for Human Computer Interaction)

  • 김송국;이칠우
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 1부
    • /
    • pp.553-560
    • /
    • 2007
  • 본 논문에서는 양손의 터치를 인식하여 실시간 상호작용이 가능한 테이블 탑 디스플레이 시스템 및 구현 알고리즘에 대해 기술한다. 제안하는 시스템은 FTIR(Frustrated Total Internal Reflection) 메커니즘을 기반으로 제작되었으며 multi-touch, multi-user 방식의 손 제스처 입력이 가능하다. 시스템은 크게 영상 투영을 위한 빔-프로젝터, 적외선 LED를 부착한 아크릴 스크린, Diffuser 그리고 영상을 획득하기 위한 적외선 카메라로 구성되어 있다. 시스템 제어에 필요한 제스처 명령어 종류는 상호작용 테이블에서의 입력과 출력의 자유도를 분석하고 편리함, 의사소통, 항상성, 완벽함의 정도를 고려하여 규정하였다. 규정된 제스처는 사용자가 상호작용을 위해 스크린에 접촉한 손가락의 개수, 위치, 그리고 움직임 변화를 기준으로 세분화된다. 적외선 카메라를 통해 입력받은 영상은 잡음제거 및 손가락 영역 탐색을 위해 간단한 모폴로지 기법이 적용된 후 인식과정에 들어간다. 인식 과정에서는 입력 받은 제스처 명령어들을 미리 정의해놓은 손 제스처 모델과 비교하여 인식을 행한다. 세부적으로는 먼저 스크린에 접촉된 손가락의 개수를 파악하고 그 영역을 결정하며 그 후 그 영역들의 중심점을 추출하여 그들의 각도 및 유클리디언 거리를 계산한다. 그리고 나서 멀티터치 포인트의 위치 변화값을 미리 정의해둔 모델의 정보와 비교를 한다. 본 논문에서 제안하는 시스템의 효율성은 Google-earth를 제어하는 것을 통해 입증될 수 있다.

  • PDF

UV-map 기반의 신경망 학습을 이용한 조립 설명서에서의 부품의 자세 추정 (UV Mapping Based Pose Estimation of Furniture Parts in Assembly Manuals)

  • 강이삭;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.667-670
    • /
    • 2020
  • 최근에는 증강현실, 로봇공학 등의 분야에서 객체의 위치 검출 이외에도, 객체의 자세에 대한 추정이 요구되고 있다. 객체의 자세 정보가 포함된 데이터셋은 위치 정보만 포함된 데이터셋에 비하여 상대적으로 매우 적기 때문에 인공 신경망 구조를 활용하기 어려운 측면이 있으나, 최근에 들어서는 기계학습 기반의 자세 추정 알고리즘들이 여럿 등장하고 있다. 본 논문에서는 이 가운데 Dense 6d Pose Object detector (DPOD) [11]의 구조를 기반으로 하여 가구의 조립 설명서에 그려진 가구 부품들의 자세를 추정하고자 한다. DPOD [11]는 입력으로 RGB 영상을 받으며, 해당 영상에서 자세를 추정하고자 하는 객체의 영역에 해당하는 픽셀들을 추정하고, 객체의 영역에 해당되는 각 픽셀에서 해당 객체의 3D 모델의 UV map 값을 추정한다. 이렇게 픽셀 개수만큼의 2D - 3D 대응이 생성된 이후에는, RANSAC과 PnP 알고리즘을 통해 RGB 영상에서의 객체와 객체의 3D 모델 간의 변환 관계 행렬이 구해지게 된다. 본 논문에서는 사전에 정해진 24개의 자세 후보들을 기반으로 가구 부품의 3D 모델을 2D에 투영한 RGB 영상들로 인공 신경망을 학습하였으며, 평가 시에는 실제 조립 설명서에서의 가구 부품의 자세를 추정하였다. 실험 결과 IKEA의 Stefan 의자 조립 설명서에 대하여 100%의 ADD score를 얻었으며, 추정 자세가 자세 후보군 중 정답 자세에 가장 근접한 경우를 정답으로 평가했을 때 100%의 정답률을 얻었다. 제안하는 신경망을 사용하였을 때, 가구 조립 설명서에서 가구 부품의 위치를 찾는 객체 검출기(object detection network)와, 각 개체의 종류를 구분하는 객체 리트리벌 네트워크(retrieval network)를 함께 사용하여 최종적으로 가구 부품의 자세를 추정할 수 있다.

  • PDF

영상처리를 이용한 도서 위치 추정 시스템 (Books Location Estimation System by Image Processing)

  • 조동욱
    • 정보처리학회논문지B
    • /
    • 제12B권1호
    • /
    • pp.17-24
    • /
    • 2005
  • 본 논문에서는 도서관이나 대형서점의 서고에서 일반인들인 보고난 도서가 제자리에 있지 않아 이를 사서가 찾아야 할 시 문제점이었던 직접 탐색을 제어탐색으로 행할 수 있는 방법론을 제안하고자 한다. 이를 위해 영상처리 기술을 적용하고자 한다. 즉, 현재는 사서가 제자리에 꽃혀 있지 않은 도서를 찾기 위해 전체 서고를 직접 탐색해야 하는 문제가 있었다. 이 같은 문제를 영상카메라에 의해 촬영된 영상에서 도서의 경계 영역을 에지연산자와 Hough 변환을 적용하여 찾는다. 이후 추출된 도서들의 경계 영역으로부터 투영에 의한 히스토그램을 생성하여 이로부터 타이틀 영역을 추출하고 도서명의 문자수, 저자명의 문자수, 출판사명의 문자수 그리고 이의 나열 순서 등을 토대로 도서가 있을 수 있는 후보 영역을 추출한다. 최종적으로 곡선적합과 회귀직선 추출 등을 통해 도서위치 최종 후보 영역을 추출할 수 있었으며 실험에 의해 본 논문의 유용성을 입증하고자 한다.

얼굴 움직임이 결합된 3차원 얼굴 모델의 표정 생성 (3D Facial Model Expression Creation with Head Motion)

  • 권오륜;전준철;민경필
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 1부
    • /
    • pp.1012-1018
    • /
    • 2007
  • 본 논문에서는 비전 기반 3차원 얼굴 모델의 자동 표정 생성 시스템을 제안한다. 기존의 3차원 얼굴 애니메이션에 관한 연구는 얼굴의 움직임을 나타내는 모션 추정을 배제한 얼굴 표정 생성에 초점을 맞추고 있으며 얼굴 모션 추정과 표정 제어에 관한 연구는 독립적으로 이루어지고 있다. 제안하는 얼굴 모델의 표정 생성 시스템은 크게 얼굴 검출, 얼굴 모션 추정, 표정 제어로 구성되어 있다. 얼굴 검출 방법으로는 얼굴 후보 영역 검출과 얼굴 영역 검출 과정으로 구성된다. HT 컬러 모델을 이용하며 얼굴의 후보 영역을 검출하며 얼굴 후보 영역으로부터 PCA 변환과 템플릿 매칭을 통해 얼굴 영역을 검출하게 된다. 검출된 얼굴 영역으로부터 얼굴 모션 추정과 얼굴 표정 제어를 수행한다. 3차원 실린더 모델의 투영과 LK 알고리즘을 이용하여 얼굴의 모션을 추정하며 추정된 결과를 3차원 얼굴 모델에 적용한다. 또한 영상 보정을 통해 강인한 모션 추정을 할 수 있다. 얼굴 모델의 표정을 생성하기 위해 특징점 기반의 얼굴 모델 표정 생성 방법을 적용하며 12개의 얼굴 특징점으로부터 얼굴 모델의 표정을 생성한다. 얼굴의 구조적 정보와 템플릿 매칭을 이용하여 눈썹, 눈, 입 주위의 얼굴 특징점을 검출하며 LK 알고리즘을 이용하여 특징점을 추적(Tracking)한다. 추적된 특징점의 위치는 얼굴의 모션 정보와 표정 정보의 조합으로 이루어져있기 때문에 기하학적 변환을 이용하여 얼굴의 방향이 정면이었을 경우의 특징점의 변위인 애니메이션 매개변수를 획득한다. 애니메이션 매개변수로부터 얼굴 모델의 제어점을 이동시키며 주위의 정점들은 RBF 보간법을 통해 변형한다. 변형된 얼굴 모델로부터 얼굴 표정을 생성하며 모션 추정 결과를 모델에 적용함으로써 얼굴 모션 정보가 결합된 3차원 얼굴 모델의 표정을 생성한다.

  • PDF

얼굴 표정인식을 위한 얼굴요소 추출 (Facial Feature Extraction for Face Expression Recognition)

  • 이경희;고재필;변혜란;이일병;정찬섭
    • 감성과학
    • /
    • 제1권1호
    • /
    • pp.33-40
    • /
    • 1998
  • 본 논문은 얼굴인식 분야에 있어서 필수 과정인 얼굴 및 얼굴의 주요소인 눈과 입의 추출에 관한 방법을 제시한다. 얼굴 영역 추출은 복잡한 배경하에서 움직임 정보나 색상정보를 사용하지 않고 통계적인 모델에 기반한 일종의 형찬정합 방법을 사용하였다. 통계적인 모델은 입력된 얼굴 영상들의 Hotelling변환 과정에서 생성되는 고유 얼굴로, 복잡한 얼굴 영상을 몇 개의 주성분 갑으로 나타낼 수 있게 한다. 얼굴의 크기, 영상의 명암, 얼굴의 위치에 무관하게 얼굴을 추출하기 위해서, 단계적인 크기를 가지는 탐색 윈도우를 이용하여 영상을 검색하고 영상 강화 기법을 적용한 후, 영상을 고유얼굴 공간으로 투영하고 복원하는 과정을 통해 얼굴을 추출한다. 얼굴 요소의 추출은 각 요소별 특성을 고려한 엣지 추출과 이진화에 따른 프로젝션 히스토그램 분석에 의하여 눈과 입의 경계영역을 추출한다. 얼굴 영상에 관련된 윤곽선 추출에 관한 기존의 연구에서 주로 기하학적인 모양을 갖는 눈과 입의 경우에는 주로 가변 템플릿(Deformable Template)방법을 사용하여 특징을 추출하고, 비교적 다양한 모양을 갖는 눈썹, 얼굴 윤곽선 추출에는 스네이크(Snakes: Active Contour Model)를 이용하는 연구들이 이루어지고 있는데, 본 논문에서는 이러한 기존의 연구와는 달리 스네이크를 이용하여 적절한 파라미터의 선택과 에너지함수를 정의하여 눈과 입의 윤곽선 추출을 실험하였다. 복잡한 배경하에서 얼굴 영역의 추출, 추출된 얼굴 영역에서 눈과 입의 영역 추출 및 윤곽선 추출이 비교적 좋은 결과를 보이고 있다.

  • PDF

영상 내 차량의 위치 및 촬영 각도에 강인한 차량 번호판 인식 시스템 (A License Plate Recognition System Robust to Vehicle Location and Viewing Angle)

  • 홍성은;황성수;김성대
    • 전자공학회논문지
    • /
    • 제49권12호
    • /
    • pp.113-123
    • /
    • 2012
  • 최근 지능형 교통 시스템을 다양한 상황 및 환경에 적용하려는 시도가 증가함에 따라, 다수의 지능형 교통 시스템에서 사용되고 있는 차량 번호판 인식 과정이 입력영상 내 차량의 위치 및 촬영 각도와 관계없이 정확하게 이루어질 필요성이 있다. 본 논문에서는 현행 번호판의 규격정보를 활용하여 오검출된 번호판 후보 영역의 제거 및 번호판 내 글자추출을 수행하고, 한글 특성을 고려한 글자인식을 수행하는 차량 번호판 인식 시스템을 제안한다. 제안하는 시스템은 입력영상에서 검출한 번호판 후보 영역들에 대해서 기울기 보정을 수행한 후, 후보 영역 내 글자로 판명되는 객체의 위치 및 형태 정보를 번호판 규격정보와 비교 검증하는 과정을 거쳐 오검출된 번호판 영역을 제거한다. 또한 글자추출 단계에서는 영역 내 밝기 변화를 고려한 이진화를 수행한 뒤, 번호판 규격정보 및 번호판 영역의 종횡비, 배경색, 투영정보 등을 종합적으로 활용하여 번호판 영역 내 글자를 정확하게 추출한다. 그리고 번호판 영역 내 글자들 중 오인식률이 높은 한글의 인식에 있어서, 형태적 유사성으로 그룹을 나눈 뒤, 주요 특징점들을 토대로 계층을 좁혀 나가는 super-class 개념을 적용하여 한글 인식을 수행한다. 성능 검증을 위해 다양한 배경에서 촬영된 영상에 대해서 실험을 수행한 결과 제안하는 번호판 인식 시스템이 영상 내 차량의 위치 및 촬영 각도의 변화에 강인한 것을 확인할 수 있었다.

한글 문자열 영상의 지형적 특징을 이용한 비선형 문자 분할 및 인식 (Nonlinear Character Segmentation and Recognition Using Topographic Features in Hangul String Images)

  • 이동준;이성환
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.201-206
    • /
    • 1994
  • 문서 인식 시스템의 성능을 저하시키는 가장 큰 원인 중의 하나로 문자 분할 오류를 들 수 있는데 보다 우수한 성능의 문서 인식 시스템 개발을 위해서는 정확한 문자 분할 방법이 절실히 요구된다. 기존의 문자 분할에 관한 연구들은 이진 영상을 대상으로 함으로써 접촉되거나 겹치는 문자의 경계 부분에서 문자 분할에 유용한 정보들을 잃어 문자 분할 오류를 초래할 수 있다. 하지만 명도 영상을 분석해 보면 문자의 접촉 부분에서 주로 나타나는 지형적 특징이 있으며, 문자 경계에서 명도값이 변하는 것을 관찰할 수 있는데 이와같은 명도 영상의 정보를 사용하면 보다 효과적으로 문자를 분할할 수 있을 것으로 판단된다. 본 연구에서는 이러한 점에 착안하여 명도 영상으로부터 지형적 특징을 추출하고 다단계 그래프 탐색 방법을 이용하여 명도값을 추적함으로써 비선형 문자 경계를 찾는 새로운 문자 분할 방법을 제안한다. 제안된 방법은 명도 문자열 영상을 입력으로 받아 명도 영상의 투영값과 명도 영상으로부터 추출된 지형적 특성을 이용하여 문자 분할 영역을 결정하고 문자 분할 영역내에서 다단계 그래프 탐색에 의한 비선형 문자 분할 경로를 찾는다. 그리고 문자 인식기와 결항하여 최종 문자 분할 위치를 확정하는 인식 결과를 이용한 문자 분할을 수행함으로써 문자 분할 위치 및 문자 인식 결과를 확정한다. 다양한 문서에 대한 실험 결과 제안된 방법이 이진 정보만을 사용하는 방법보다 접촉 혹은 겹친 문자 분할에 매우 효과적임을 알 수 있었다.

  • PDF

가우시안 차이와 반복 레이블링을 이용한 신형 차량번호판 검출 (A Detection of New Vehicle License Plates Using Difference of Gaussian and Iterative Labeling)

  • 여재윤;김민하;차의영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 추계학술대회
    • /
    • pp.78-81
    • /
    • 2012
  • 본 논문에서는 차량 출입통제, 주정차 단속, 과속 차량 단속 등 다양한 분야에서 사용가능한 신형 차량번호판 검출 방법을 제안한다. 먼저 가우시안 차이를 이용한 필터링을 사용하여 번호판의 연속적인 주요 숫자가 잘 나타나도록 이진화를 수행한다. 이후 번호판의 형태학적 특징을 이용한 반복 레이블링 기법을 이용하여 번호판 영역을 결정한다. 마지막으로 투영 변환을 통한 번호판의 정형화 과정을 거쳐 카메라나 차량의 위치에 따라 발생하는 기울어짐과 같은 왜곡을 보정한다.

  • PDF

일반화 대칭 변환 기반의 웨이퍼 위치 인식 (Wafer Position Recognition Based on Generalized Symmetry Transform)

  • 전미진;이준재
    • 한국멀티미디어학회논문지
    • /
    • 제16권6호
    • /
    • pp.782-794
    • /
    • 2013
  • 본 논문에서는 카메라를 이용한 웨이퍼 위치 인식 알고리즘을 제안한다. 먼저 챔버 외부의 조명 반사와 카메라로 인한 영상의 원근 왜곡을 제거하기 위하여 투영 변환을 적용하여 실제 웨이퍼와 같이 정원의 형태로 복원한다. 다음, 에지 검출 알고리즘을 이용하여 웨이퍼의 외부 경계를 추출한 후, 일반화 대칭 변환을 적용하여 원을 검출함으로서 웨이퍼의 위치를 검사한다. 일반화 대칭 변환은 영상에서 화소쌍들 사이의 대칭값을 거리 가중치 함수, 위상 가중치 함수, 화소들의 기울기 크기와 로그 맵핑이 결합되어 영상에서 관심 영역을 추출한다. 제안하는 방법을 적용하여 웨이퍼가 올바른 위치에 장착되었는가를 검사하여 클리닝 시스템 장비와 웨이퍼의 파손을 미연에 방지한다.