• 제목/요약/키워드: camera translation

검색결과 73건 처리시간 0.032초

모바일 변환 저장 서버에서 가중치 기반의 DVDS를 위한 방법 연구 (A Method for DVDS Based on Weight Value in the Mobile Translation Storage Server)

  • 임영환;조종근
    • 한국멀티미디어학회논문지
    • /
    • 제8권10호
    • /
    • pp.1383-1390
    • /
    • 2005
  • 모바일 멀티미디어 저장 서버는 동시에 다수의 개인용 이동 단말기(PDA)에서 요청하는 데이터를 실시간으로 저장 및 전송을 해야 한다. 그러나, 대역폭이 작은 모바일 인터넷 환경에서 다수의 개인용 이동 단말기가 동시에 서버로 접속하게 되면 병목(BottleNeck) 현상이 발생할 수 있다. 본 논문에서는 카메라가 장착된 개인용 이동 단말기에서 실시간으로 캡쳐(capture)한 영상을 모바일 변환 저장서버에서 저장 및 전송을 할 때 모바일 멀티미디어 저장 서버에서 발생할 수 있는 병목 현상을 효율적으로 해결할 수 있는 새로운 방법으로 가중치 기반의 동적 가변 디스크 스케줄링을 제안하고, 기존 방법들과 비교를 통해서 제안한 방법의 우수한 성능을 증명한다.

  • PDF

얼굴의 3차원 위치 및 움직임 추정에 의한 시선 위치 추적 (Facial Gaze Detection by Estimating Three Dimensional Positional Movements)

  • 박강령;김재희
    • 대한전자공학회논문지SP
    • /
    • 제39권3호
    • /
    • pp.23-35
    • /
    • 2002
  • 시선 위치 추적이란 모니터상에 사용자가 쳐다보고 있는 지점을 파악해 내는 기술이다 이 논문에서는 컴퓨터 비젼 방법을 이용하여 사용자가 모니터 상에 어느 지점을 쳐다보고 있는지를 파악(시선 위치 추적)하는 새로운 방법을 제안한다. 시선위치를 파악하기 위해 본 논문에서는 얼굴 영역 및 얼굴 특징점(양 눈, 양 콧구멍, 입술 끝점 등)을 2차원 카메라 영상으로부터 추출하였으며, 이들의 움직임으로부터 카메라 보정 및 매개변수 추정 방법등을 이용하여 초기 3차원 위치를 추정해 내었다. 이후 모니터 상의 한 지점을 쳐다보기 위해 사용자가 얼굴을 움직이는 경우 이러한 얼굴의 3차원 움직임 량 역시 자동으로 추정하였다. 이로부터 변화된 얼굴 특징점의 3차원 위치를 계산해 낼 수 있었으며, 이를 바탕으로 모니터 상의 시선 위치를 구하였다. 실험 결과, 19인치 모니터상의 임의의 지점을 사용자가 쳐다보았을 때, 약 2.01인치의 시선 위치에러 성능을 얻었다.

소실점을 이용한 3차원 재구성 (3D Reconstruction using vanishing points)

  • 김상훈;김태은;최종수
    • 정보처리학회논문지B
    • /
    • 제10B권5호
    • /
    • pp.515-520
    • /
    • 2003
  • 본 논문에서는 2장의 영상으로부터 카메라 내부 파라미터를 추출하는 교정 방법을 제시한다. 카메라 교정은 2차원 영상으로부터 3차원 정보를 얻기 위해서는 필수 불가결한 기술이다. 기존의 많은 연구들이 수행되어 왔는데, 영상내에 체크 패턴을 포함한 3장의 영상을 이용하는 방법과 연속된 3장의 영상으로부터 Kruppa 방정식을 풀어 카메라 교정하는 방법이 대표적인 예가 되겠다. 본 논문에서는 인간이 만든 조형물에서 쉽게 발견할 수 있는 기하학적인 정보를 이용하여 보다 쉽고 빠르게 내부 파라미터를 추출한다. 이러한 내부 파라미터는 소실점들로부터 추정되며 대응되는 2장의 영상에서 대응점들로부터 외부 파라미터를 추출할 수 있다. 이렇게 교정된 내부, 외부 파라미터를 이용하여 사영 행렬을 유도하고, 유도된 사영행렬로 3차원 정보를 얻게 되고 3차원 재구성을 구현하게 된다.

Detecting and Segmenting Text from Images for a Mobile Translator System

  • Chalidabhongse, Thanarat H.;Jeeraboon, Poonsak
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2004년도 ICCAS
    • /
    • pp.875-878
    • /
    • 2004
  • Researching in text detection and segmentation has been done for a long period in the OCR area. However, there is some other area that the text detection and segmentation from images can be very useful. In this report, we first propose the design of a mobile translator system which helps non-native speakers to understand the foreign language using ubiquitous mobile network and camera mobile phones. The main focus of the paper will be the algorithm in detecting and segmenting texts embedded in the natural scenes from taken images. The image, which is captured by a camera mobile phone, is transmitted to a translator server. It is initially passed through some preprocessing processes to smooth the image as well as suppress noises. A threshold is applied to binarize the image. Afterward, an edge detection algorithm and connected component analysis are performed on the filtered image to find edges and segment the components in the image. Finally, the pre-defined layout relation constraints are utilized in order to decide which components likely to be texts in the image. A preliminary experiment was done and the system yielded a recognition rate of 94.44% on a set of 36 various natural scene images that contain texts.

  • PDF

A Face Tracking Algorithm for Multi-view Display System

  • Han, Chung-Shin;Go, Min Soo;Seo, Young-Ho;Kim, Dong-Wook;Yoo, Ji-Sang
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제2권1호
    • /
    • pp.27-35
    • /
    • 2013
  • This paper proposes a face tracking algorithm for a viewpoint adaptive multi-view synthesis system. The original scene captured by a depth camera contains a texture image and 8 bit gray-scale depth map. From this original image, multi-view images that correspond to the viewer's position can be synthesized using geometrical transformations, such as rotation and translation. The proposed face tracking technique gives a motion parallax cue by different viewpoints and view angles. In the proposed algorithm, the viewer's dominant face, which is established initially from a camera, can be tracked using the statistical characteristics of face colors and deformable templates. As a result, a motion parallax cue can be provided by detecting the viewer's dominant face area and tracking it, even under a heterogeneous background, and synthesized sequences can be displayed successfully.

  • PDF

영상처리를 이용한 Mark 판독 기법에 관한 연구 (A Study on the Mark Reader Using the Image Processing)

  • 김승호;김범진;이용구;노도환
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2000년도 제15차 학술회의논문집
    • /
    • pp.83-83
    • /
    • 2000
  • Recently, Vision system has being used all around industry. Sensor systems are used for Mark Reader, for example, optical scanning is proximity sensor system, have many disadvantages, such as, lacking user interface and difficulty to store original specimens. In contrast with this, Vision systems for Mark Reader has many advantages, including function conversion to achieve other work, high accuracy, high speed, etc. In this thesis, we have researched the development of Mark Reader by using a Vision system. The processing course of this s)'stem is consist to Image Pre-Processing such as noise reduction, edge detection, threshold processing. And then, we have carried out camera calibration to calibrate images which are acquired from camera. After searching for reference point within scanning area(60pixe1${\times}$30pixe1), we have calculated points crossing by using line equations. And then, we decide to each ROI(region of interest) which are expressed by four points. Next we have converted absolute coordinate into relative coordinate for analysis a translation component. Finally we carry out Mark Reading with images classified by six patterns. As a result of experiment which follows the algorithm has proposed, we have get error within 0.5% from total image.

  • PDF

카메라 이동환경에서 mean shift와 깊이 지도를 결합한 다수 인체 추적 (Multiple Human Tracking using Mean Shift and Depth Map with a Moving Stereo Camera)

  • 김광수;홍수연;곽수영;안정호;변혜란
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권10호
    • /
    • pp.937-944
    • /
    • 2007
  • 본 논문은 스테레오 카메라를 이용한 이동 카메라 환경에서Mean Shift와 깊이지도를 결합하여 다수의 사람을 다양한 자세, 크기, 조명변화에 강인한 추적을 하는 방법을 제안한다. Mean Shift 추적 알고리즘은 빠르고 안정적인 성능으로 실시간 추적에 적합하다. 그러나 객체의 칼라 정보만으로는 배경과 칼라 분포가 유사한 객체의 경우 추적에 실패할 수 있는 단점을 보완하기 위하여 깊이 정보를 결합하는 방법을 제안한다. 또한 객체가 이동하면서 발생하는 가려짐 문제를 해결하기 위하여 검출된 사람 영역을 머리, 몸통, 다리로 나누어 신체 부위별 모델링을 하였고 박스 크기가 객체의 크기변화에 따라 적응적으로 변하도록 하였다. 본 논문에서 제안하는 알고리즘은 다양한 데이타에 대해서 실험한 결과 정확한 검출과 추적에 우수한 성능을 확인 할 수 있었다.

2D-3D 정합기반 실제 제품의 사실적 3D 모델 생성 (Realistic 3D model generation of a real product based on 2D-3D registration)

  • 김강연;손성민
    • 한국산학기술학회논문지
    • /
    • 제14권11호
    • /
    • pp.5385-5391
    • /
    • 2013
  • 온라인을 기반한 제품의 구매가 활성화 됨에 따라, 소비자들의 제품 디자인에 대한 사실적이고 정확한 정보를 요구하고 있다. 본 연구에서는 제품의 형상정보(3D mesh)와 색/질감정보(image)를 이용하여 텍스쳐 맵핑된 실사적 3차원 모델을 생성하는 효율적인 방법을 제안한다. 3 차원 형상정보에 대응하는 이미지 상의 텍스쳐 좌표 관계를 구하기 위해 오브젝트 좌표계와 카메라 좌표계 사이의 변환행렬, 카메라의 초점거리, 카메라 CCD 와 프레임상의 이미지 사이의 종횡비를 파라미터로 하는 2D-3D 정합을 수행한다. 이러한 2D-3D 정합에 있어 발생하는 연산의 복잡도와 비선형도를 낮추기 위하여, 카메라 내부파라미터 검정단계, 임의의 회전행렬에 대한 임시적 최적 이동 벡터 (TOTV), 회전행렬에 대한 비선형 최적화 단계로 접근한다. 제안하는 방법의 유용성을 시현하기 위해 3차원 컬러 측정기로는 색외관을 획득하기 힘든 메탈릭 페인트 재질로 이루어진 제품에 적용한 구현결과를 보인다.

적외선 조명 카메라를 이용한 시선 위치 추적 시스템 (Gaze Detection System by IR-LED based Camera)

  • 박강령
    • 한국통신학회논문지
    • /
    • 제29권4C호
    • /
    • pp.494-504
    • /
    • 2004
  • 사용자의 시선 위치를 파악하는 연구는 많은 응용분야를 가지고 지난 몇년간 눈부시게 발전되어 왔다. 기존의 대부분 연구에서는 영상 처리 방법만에 의존하여 시선 위치 추적 연구를 수행하였기 때문에 처리 속도도 늦고 많은 사용 제약을 가지는 문제점이 있었다. 이 논문에서는 적외선 조명이 부착된 단일 카메라를 이용한 컴퓨터 비전 시스템으로 시선 위치 추적 연구를 수행하였다. 사용자의 시선 위치를 파악하기 위해서는 얼굴 특징점의 위치를 추적해야하는데, 이를 위하여 이 논문에서는 적의선 기반 카메라와 SVM(Support Vector Machine) 알고리즘을 사용하였다. 사용자가 모니터상의 임의의 지점을 쳐다볼 때 얼굴 특징점의 3차원 위치는 3차원 움직임량 추정(3D motion estimation) 및 아핀 변환(affine transformation)에 의해 계산되어 질 수 있다. 얼굴 특징점의 변화된 3차원 위치가 계산되면. 이로부터 3개 이상의 얼굴 특징점으로부터 생성되는 얼굴 평면 및 얼굴 평면의 법선 벡터가 구해지게 되며, 이러한 법선 백터가 모니터 스크린과 만나는 위치가 사용자의 시선위치가 된다. 또한. 이 논문에서는 보다 정확한 시선 위치를 파악하기 위하여 사용자의 눈동자 움직임을 추적하였으며 이를 위하여 신경망(다층 퍼셉트론)을 사용하였다. 실험 결과, 얼굴 및 눈동자 움직임에 의한 모니터상의 시선 위치 정확도는 약 4.2cm의 최소 자승 에러성능을 나타냈다.

3D Reconstruction using three vanishing points from a single image

  • Yoon, Yong-In;Im, Jang-Hwan;Kim, Dae-Hyun;Park, Jong-Soo
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -2
    • /
    • pp.1145-1148
    • /
    • 2002
  • This paper presents a new method which is calculated to use only three vanishing points in order to compute the dimensions of object and its pose from a single image of perspective projection taken by a camera and the problem of recovering 3D models from three vanishing points of box scene. Our approach is to compute only three vanishing points without this information such as the focal length, rotation matrix, and translation from images in the case of perspective projection. We assume that the object can be modeled as a linear function of a dimension vector ν. The input of reconstruction is a set of correspondences between features in the model and features in the image. To minimize each the dimensions of the parameterized models, this reconstruction of optimization can be solved by the standard nonlinear optimization techniques with a multi-start method which generates multiple starting points for the optimizer by sampling the parameter space uniformly.

  • PDF