• 제목/요약/키워드: disparity image

검색결과 380건 처리시간 0.026초

Mass-Spring-Damper Model for Offline Handwritten Character Distortion Analysis

  • Cho, Beom-Joon
    • 한국멀티미디어학회논문지
    • /
    • 제14권5호
    • /
    • pp.642-649
    • /
    • 2011
  • Among the various aspects of offline handwritten character patterns, it is the great variety of writing styles and variations that renders the task of computer recognition very hard. The immense variety of character shape has been recognized but rarely studied during the past decades of numerous research efforts. This paper tries to address the problem of measuring image distortions and handwritten character patterns with respect to reference patterns. This work is based on mass-spring mesh model with the introduction of simulated electric charge as a source of the external force that can aid decoding the shape distortion. Given an input image and a reference image, the charge is defined, and then the relaxation procedure goes to find the optimum configuration of shape or patterns of least potential. The relaxation process is based on the fourth order Runge-Kutta algorithm, well-known for numerical integration. The proposed method of modeling is rigorous mathematically and leads to interesting results. Additional feature of the method is the global affine transformation that helps analyzing distortion and finding a good match by removing a large scale linear disparity between two images.

Stereo Image Quality Assessment Using Visual Attention and Distortion Predictors

  • Hwang, Jae-Jeong;Wu, Hong Ren
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제5권9호
    • /
    • pp.1613-1631
    • /
    • 2011
  • Several metrics have been reported in the literature to assess stereo image quality, mostly based on visual attention or human visual sensitivity based distortion prediction with the help of disparity information, which do not consider the combined aspects of human visual processing. In this paper, visual attention and depth assisted stereo image quality assessment model (VAD-SIQAM) is devised that consists of three main components, i.e., stereo attention predictor (SAP), depth variation (DV), and stereo distortion predictor (SDP). Visual attention is modeled based on entropy and inverse contrast to detect regions or objects of interest/attention. Depth variation is fused into the attention probability to account for the amount of changed depth in distorted stereo images. Finally, the stereo distortion predictor is designed by integrating distortion probability, which is based on low-level human visual system (HVS), responses into actual attention probabilities. The results show that regions of attention are detected among the visually significant distortions in the stereo image pair. Drawbacks of human visual sensitivity based picture quality metrics are alleviated by integrating visual attention and depth information. We also show that positive correlation with ground-truth attention and depth maps are increased by up to 0.949 and 0.936 in terms of the Pearson and the Spearman correlation coefficients, respectively.

물체의 위치 인식을 위한 유전 알고리즘과 스테레오 정합에 관한 연구 (A Study on Genetic Algorithm and Stereo Matching for Object Depth Recognition)

  • 홍석근;조석제
    • 한국항해항만학회지
    • /
    • 제32권5호
    • /
    • pp.355-361
    • /
    • 2008
  • 스테레오 정합은 스테레오 시각 분야에서 가장 활발히 연구되는 분야이다. 본 논문에서는 물체의 위치 인식을 위한 유전 알고리즘을 이용한 스테레오 정합을 제안한다. 정합 환경을 최적화 문제로 간주하고 진화 전략을 이용하여 최적해를 탐색한다. 따라서, 유전 연산자는 스테레오 정합에 맞게 설계하였고 개체는 변위집단을 대표한다. 영상의 수평화소라인을 염색체로 간주하였다. 비용함수는 스테레오 정합에서 사용하는 일반적인 제약조건들의 조합이다. 비용함수가 명암도, 유사도, 변위 평활성으로 구성되었기 때문에 정합을 시도할 때 매 세대마다 이 모든 요소들을 한번에 다룬다. 염색체를 정의하기 위해 LoG연산자로 경계선을 추출하였으며 실험을 통하여 제안한 방법을 검증하였다.

비순응 영역으로의 운동 잔여효과의 번짐에 미치는 삼차원 깊이 불연속의 효과 (The effect of depth discontinuity on spreading of motion aftereffect to non-adapted area)

  • 감기택
    • 인지과학
    • /
    • 제21권1호
    • /
    • pp.1-24
    • /
    • 2010
  • 운동자극에 오랫동안 노출된 이후 해당 자극이 제시된 망막상의 영역에 제시된 정지 자극은 운동 자극의 방향과는 반대방향으로 움직이는 것으로 지각되는 운동 잔여효과(motion aftereffect: MAE)가 발생한다. 본 연구에서는 운동순응에 의해 발생된 운동 잔여효과가 인접 비순응 영역에까지 번져나가는 현상이 양안 시차에 의해 깊이가 다른 표면에서도 발생하는지를 살펴보았다. 동심원의 고리부분에만 운동순응을 시킨 후, 실험 1에서는 양안 시차에 의한 경사 표면을 중앙 비순응 영역에 제시했고 실험 2에서는 양안시차에 의해 깊이가 다른 정면평행 표면(fronto parallel plane)을 중앙 비순응 영역에 제시하였다. 경사 표면인 경우 주변 순응영역과 깊이가 동일한 비경사조건에서의 MAE지속시간과 유사한 반면, 깊이가 다른 정면 평행 표면에서는 동일 깊이 조건보다 MAE 지속시간은 줄어들었지만 완전히 사라지지는 않았다. 이러한 결과는 MAE의 번짐 현상이 깊이 불연속 정보에 의해 영향 받는다는 것을 보여줄 뿐만 아니라 양안정보가 합치된 이후에도 발생될 수 있음을 시사한다.

  • PDF

경계-보존 방향성 평활화를 이용한 양안 영상의 변이 추정과 중간 시점 영상의 재구성 (Edge-Preserving Directional Regularization Technique for Disparity Estimation and Intermediate View Reconstruction of Stereoscopic Images)

  • 김미현;강문기;이철희;최윤식;손광훈
    • 방송공학회논문지
    • /
    • 제4권1호
    • /
    • pp.59-67
    • /
    • 1999
  • 본 논문에서는 입체 영상 시스템 중 전송단에서의 영상의 입체감 분석을 위한 변이추정 과정과 수신단에서의 중간시점영상 재구성 방식에 대해 중점적으로 연구하였다. 변이추정은 기본적으로 MAE(mean absolute error)를 최소가 되도록 하는 동시에, 블록의 변이를 각 방향에서의 영상의 벼화량에 반비례하게 평활화하는 반복적 블록 정합 방식을 제안하여 적용하였다. 수신단에서는 복원된 영상과 변이 정보를 이용하여 중간시점 영상을 재구성하였으며, 보간법(interpolation)을 사용하는 동시에 좌 또는 우영상의 가려진 영역(occlusion)에서는 좌우 영상 중 한 영상에서의 외삽법(extrapolation)을 사용하여 변이-보상 변이 전달방식으로 이를 합성하였다. 이 변이 추정 방식으로영상의 평활 영역에서 일정하게 평활화된 변이를 추정하여 변이 정보에 대한 정보량을 줄이고, 경계부분에서는 평활화 방식에서 흔히 발생하는 과평활화 문제를 해결하였다. 또한 IVR 에서는 다른 방식에 비해 영상의 경계 부분을 보존하며, occlusion 영역을 잘 살리는 특성을 보였다.

  • PDF

시청피로 저감형 S3D 영상 재생 시스템 구현 및 실시간 처리를 위한 알고리즘 연산량 분석 (Implementation of Stereoscopic 3D Video Player System Having Less Visual Fatigue and Its Computational Complexity Analysis for Real-Time Processing)

  • 이재성
    • 한국정보통신학회논문지
    • /
    • 제17권12호
    • /
    • pp.2865-2874
    • /
    • 2013
  • 최근 박스 오피스 상위권 작품들의 상당수가 Stereoscopic 3D 상영을 병행하고 있으며 삼성, LG 등 세계 유수 가전업체들이 3DTV 판촉에 열을 올리고 있다. 그러나 사람마다 양쪽 눈동자 간격이 다르고 시청 거리와 위치도 개인마다 다르다는 점을 무시한 채 동일한 양안 시차로 제작된 3D 컨텐츠를 시청하게 될 경우 실세계에서 느끼는 입체감과 커다란 괴리가 발생하게 되어 극심한 시각 피로와 두통을 유발하게 된다. 이를 해결하기 위해 본 논문에서는 양안 시차와 시청 거리를 반영하여 입체 컨텐츠를 실시간으로 보정, 재생하는 S3D 렌더링 시스템을 제안 및 구현하고 그 연산 복잡도를 분석한다. 분석 결과 Optical Flow 알고리즘 블록은 한 프레임당 수행 시간이 최대 732초에 이르러 반드시 하드웨어 가속기 형태로 전용칩화할 필요가 있음을 확인하였고 Warping 알고리즘 처리 블록도 프레임당 최대 5.7초의 시간이 필요해 HD급 또는 1080p Full HD 화면 재생을 위해서는 함께 전용칩화 할 필요가 있음을 확인하였다.

3D 스테레오스코픽(Stereoscopic)기술의 효율적 활용에 관한 연구 (Research on Efficient Usage of 3D Stereoscopic Technology)

  • 김지수
    • 한국콘텐츠학회논문지
    • /
    • 제10권2호
    • /
    • pp.138-145
    • /
    • 2010
  • 입체영상 기술은 차세대 입체 멀티미디어 정보통신 분야에서 공통적으로 요구되는 핵심 기반기술이라 할 수 있다. 현실과 가까운 자연스러운 영상을 표현하고자 하는 입체영상의 구현은 인간이 끊임없이 노력해온 부분으로, 초기의 시각 인식체계에서 시작해 양안시차를 이용한 입체사진을 거쳐 동영상 입체시대로 이행 되었다. 생활이 변화하고, 새로운 문화가 형성되고, IT산업 확장 등 핵심 트렌드의 바탕에는 가상을 실제처럼 구현하는 기술의 발전이 있으며, 그 중심에는 3D 입체영상 기술이 있다. 본 논문에서는 3D 입체영상 기술개발 동향 및 개발전략을 살펴보고, 지속적인 시장 확대를 위한 3D 입체영상 기술의 효율적 활용방안을 제시하고자 한다.

효율적인 비디오 브라우징을 위한 파노라믹 영상 구축 (Construction of Panoramic Image for Efficient Video Browsing)

  • 신성윤;박기홍;표성배
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권1호
    • /
    • pp.67-72
    • /
    • 2007
  • 본 논문에서는 파노라믹 영상 구축을 위해 투시 투사에서 2차원 표면의 움직임을 더욱더 잘 표현하는 투시모델을 이용하여 구축하는 방안을 제시한다. 투시 모델에서 모션 파라미터는 현재 프레임의 영역과 이전 프레임에서 매칭된 영역 사이의 불일치 측정을 최소화함으로써 얻어진다. 프레임들은 고정된 참조나 시간에 따라 변하는 참조에 의해 동적 파노라믹 영상으로 구축된다. 실험을 통해서 본 논문에서 제시한 파노라믹 영상이 정지 영상이나 전체적인 비디오 보다 효과적으로 비디오의 내용들을 표현해 주고 크기 절감율도 높음을 알 수 있다.

  • PDF

영상 분할을 이용한 다이내믹 프로그래밍 기반의 스테레오 정합 (Dynamic Programming-based Stereo Matching Using Image Segmentation)

  • 서용석;유지상
    • 한국통신학회논문지
    • /
    • 제35권8C호
    • /
    • pp.680-688
    • /
    • 2010
  • 본 논문에서는 영상 분할(image segmentation)을 이용한 다이내믹 프로그래밍(dynamic programming, DP) 기반의 스테레오 정합 (stereo matching)기법을 제안한다. 다이내믹 프로그래밍은 스테레오 정합을 포함하는 여러 가지 컴퓨터 비젼 문제들의 고전적이고 인기가 있는 최적화 방법이다. 그러나 스테레오 정합 문제에 적용될 때 스캔라인들 사이의 수직 상호 관계가 적절하게 고려되지 않기 때문에 기존의 DP의 성능은 만족스럽지 않다. 본 논문에서 제안하는 알고리즘에서는 영상을 분할하여 정확한 경계정보를 획득한 다음 경계 정보에 의거하여 변이의 불연속과 폐색영역을 고려한다. Middlebury 스테레오 영상에 적용한 실험 결과들은 제안된 알고리즘이 이전의 다이내믹 기반 알고리즘보다 더 좋은 성능을 보여주는 것을 입증해준다.

고해상도 색상 영상을 이용한 저해상도 깊이 영상 보간법 (Low Resolution Depth Interpolation using High Resolution Color Image)

  • 이교윤;호요성
    • 스마트미디어저널
    • /
    • 제2권4호
    • /
    • pp.60-65
    • /
    • 2013
  • 본 논문에서는 Time-of-Flight (TOF) 원리를 이용하여 획득한 저해상도 깊이 영상을 고해상도의 색상 영상에 정합하는 방법을 소개한다. 거리 정보 기반의 3차원 렌더링에서 깊이 영상은 렌더링 결과에 큰 영향을 끼치지만, 기존의 스테레오 정합은 색상 영상의 특성에 따라 성능이 크게 변하고, 깊이 정보를 획득하지 못하는 영역이 존재한다. 반면에 TOF 카메라는 적외선 센서를 통해 카메라로부터 물체까지의 거리를 직접 측정하여 영상으로 출력하기 때문에, 장면의 깊이 정보를 실시간으로 획득 할 수 있고 높은 정확도를 가지는 장점이 있다. 하지만 출력 영상의 해상도가 너무 작아 3차원 응용에 직접 이용하기가 어렵다. 또한, 색상 영상과 다른 카메라를 이용하기 때문에 두 영상의 3차원적 위치와 특성이 서로 다르다는 문제점을 갖는다. 따라서 해상도를 증가시키고 다른 두 카메라로 부터 찍힌 영상을 정합시키는 방법이 필요하다. 본 논문에서 제안하는 방법은 깊이 카메라에서 획득한 저해상도 깊이 정보를 고해상도 색상 정보를 이용하여 두 영상간의 정합이 이루어지도록 한다. 향상된 깊이 영상을 사용하여 3차원으로 복원한 실험을 통해, 제안하는 방법이 효과적으로 장면의 변위 정보를 생성함을 알 수 있다.

  • PDF