Abstract
A stereo matching method is one of the ways to obtain a depth value from two dimensional images. This method estimates the depth value of target images using stereo images which have two different viewpoints. In the result of stereo matching, the depth value is represented by a disparity value. The disparity means a distance difference between a current pixel in one side of stereo images and its corresponding point in the other side of stereo images. The stereo matching in a homogeneous region is always difficult to find corresponding points because there are no textures in that region. In this paper, we propose a novel matching equation using the distance transform to estimate accurate disparity values in the homogeneous region. The distance transform calculates pixel distances from the edge region. For this reason, pixels in the homogeneous region have specific values when we apply this transform to pixels in that region. Therefore, the stereo matching method using the distance transform improves the matching accuracy in the homogeneous regions. In addition, we also propose an adaptive matching cost computation using a kernel of one dimensional array depending on the characteristic of regions in the image. In order to aggregate the matching cost, we apply a cross-scale cost aggregation method to our proposed method. As a result, the proposed method has a lower average error rate than that of the conventional method in all regions.
스테레오 정합 방법은 2차원 영상으로부터 깊이정보를 얻는 여러 가지 방법들 중 하나다. 이 방법은 서로 다른 두 시점을 갖는 스테레오 영상을 이용해 영상 속 객체 및 배경의 깊이를 예측한다. 이때 물체의 깊이 값은 한 시점의 영상 속 화소들과 다른 시점 영상에 있는 대응점들 사이의 거리 차이인 변위값에 의해 결정된다. 본 논문은 평탄한 영역 속 각 화소의 대응점을 잘 찾기 위해 거리변환을 이용한 새로운 정합비용 함수를 제안한다. 거리변환은 영상 속 각 화소가 경계 영역으로부터 얼만큼 떨어져있는지 계산해준다. 따라서 평탄한 영역에 있는 화소에 거리변환을 적용하면 특정값을 갖는 화소로 변환할 수 있기 때문에 이 영역에서의 대응점 탐색 정확도를 높일 수 있다. 또한, 정합비용을 계산하는 과정에서 1차원 배열을 이용해 영상의 영역별 특성에 따라 정합 방법이 적응적으로 적용되도록 한다. 최적의 대응점을 찾기 위한 정합비용들의 종합 과정에는 교차 계층 구조를 이용한 종합 방법이 사용된다. 그 결과, 평탄한 영역을 포함한 모든 영역에서 기존의 방법보다 더 정확한 변위값을 얻었다.