• 제목/요약/키워드: Boundary Matching Algorithm

검색결과 94건 처리시간 0.022초

Intermediate Scene Generation using Fast Bidirectional Disparity Morphing and Three Occluding Patterns

  • Kim, Dae-Hyun;Park, Jong-Soo
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -2
    • /
    • pp.904-907
    • /
    • 2002
  • In this paper, we describe an algorithm to automatically generate an intermediate scene using the bidirectional disparity morphing from the parallel stereopair. To compute the disparity between two reference images, we use the 2-step fast block matching algorithm that restricts the searching range and accelerates the speed of the computation of the disparity. We also define three occluding patterns so as to smooth the computed disparities, especially for occluded regions. They are derived from the peculiar properties of the disparity map. The smoothed disparity maps present that the false disparities are well corrected and the boundary between foreground and background becomes sharper. We discuss the advantages of this algorithm compared to the commonly used schemes and we show some experimental results with real data.

  • PDF

HAQ 알고리즘과 Moment 기반 특징을 이용한 내용 기반 영상 검색 알고리즘 (Content-Based Image Retrieval Algorithm Using HAQ Algorithm and Moment-Based Feature)

  • 김대일;강대성
    • 대한전자공학회논문지SP
    • /
    • 제41권4호
    • /
    • pp.113-120
    • /
    • 2004
  • 본 논문은 내용 기반 검색 기법에 의한 보다 효율적인 특징 추출 및 영상 검색 알고리즘을 제안하였다. 먼저, MPEG 비디오의 key frame을 입력 영상으로 하여 Gaussian edge detector를 이용하여 객체를 추출하고, 그에 따른 객체 특징들, location feature distributed dimension feature와 invariant moments feature를 추출하였다. 다음, 제안하는 HAQ (Histogram Analysis and Quantization) 알고리즘으로 characteristic color feature를 추출하였다. 마지막으로 key frame이 아닌 shot frame을 질의영상으로 하여 제안된 matching 기법에 따라 4가지 특징들의 단계별 검색을 수행하였다. 본 논문의 목적은 사용자가 요구하는 장면이 속한 비디오의 shot 경계 내의 key frame을 검색하는 새로운 내용 기반 검색 알고리즘을 제안함에 있다. 제안된 알고리즘을 바탕으로 10개의 뮤직비디오, 836개의 시험 영상으로 실험한 결과, 효과적인 검색 효율을 보였다.

Webcam-Based 2D Eye Gaze Estimation System By Means of Binary Deformable Eyeball Templates

  • Kim, Jin-Woo
    • Journal of information and communication convergence engineering
    • /
    • 제8권5호
    • /
    • pp.575-580
    • /
    • 2010
  • Eye gaze as a form of input was primarily developed for users who are unable to use usual interaction devices such as keyboard and the mouse; however, with the increasing accuracy in eye gaze detection with decreasing cost of development, it tends to be a practical interaction method for able-bodied users in soon future as well. This paper explores a low-cost, robust, rotation and illumination independent eye gaze system for gaze enhanced user interfaces. We introduce two brand-new algorithms for fast and sub-pixel precise pupil center detection and 2D Eye Gaze estimation by means of deformable template matching methodology. In this paper, we propose a new algorithm based on the deformable angular integral search algorithm based on minimum intensity value to localize eyeball (iris outer boundary) in gray scale eye region images. Basically, it finds the center of the pupil in order to use it in our second proposed algorithm which is about 2D eye gaze tracking. First, we detect the eye regions by means of Intel OpenCV AdaBoost Haar cascade classifiers and assign the approximate size of eyeball depending on the eye region size. Secondly, using DAISMI (Deformable Angular Integral Search by Minimum Intensity) algorithm, pupil center is detected. Then, by using the percentage of black pixels over eyeball circle area, we convert the image into binary (Black and white color) for being used in the next part: DTBGE (Deformable Template based 2D Gaze Estimation) algorithm. Finally, using DTBGE algorithm, initial pupil center coordinates are assigned and DTBGE creates new pupil center coordinates and estimates the final gaze directions and eyeball size. We have performed extensive experiments and achieved very encouraging results. Finally, we discuss the effectiveness of the proposed method through several experimental results.

H.264 to MPEG-2 Transcoding을 위한 효율적인 P-Frame 변환 방법 (An Effective P-Frame Transcoding from H.264 to MPEG-2)

  • 김기홍;손남례;이귀상
    • 정보처리학회논문지B
    • /
    • 제17B권1호
    • /
    • pp.31-36
    • /
    • 2010
  • MPEG-2가 발표된 이후 Digital-TV나 DVD등 멀티미디어 분야에서 폭넓게 사용되어 왔다. 그 후 2004년도에 H.264가 발표된 이후 MPEG-2를 대체할 차세대 비디오 압축 표준으로 각광받으며 IPTV나 DMB등의 방송 표준으로 채택되었다. 그러나 지금까지 MPEG-2를 가장 많이 사용해 왔기 때문에 현재는 MPEG-2관련 장비들이 많이 사용되고 있으며 이 장비들로는 H.264방송을 시청할 수 없게 되었다. 본 논문에서는 효율적인 H.264 to MPEG-2 트랜스코더를 제안한다. 또한 화질의 열화를 줄이기 위해 기본적으로 직렬 화소 영역기반 트랜스코더(CPDT: Cascaded Pixel Domain Transcoder)구조를 이용하였고 변환속도를 높이기 위해 복호기에서 사용된 SKIP블록이나 INTRA 블록, 움직임벡터 등의 정보들을 재사용 한다. H.264의 가변블록의 움직임벡터들중 최적의 값을 선택하기 위해 수정된 경계정합알고리즘(BMA: Boundary Matching Algorithm)을 사용한다. 실험결과, MPEG-2 인코더의 'Full Search'와 비교하였을 때 PSNR측면에서는 0.1dB정도 감소되었지만, 부호화 시간에서는 약 66% 개선되었다. 제안한 방법은 기존방법과 비교하였을 때, 우수한 화질을 확보함과 동시에 연산시간을 단축할 수 있음을 확인하였다.

H.264 디코더에서 기울기 벡터를 이용한 에러복원 방법 (Error Concealment Using Gradient Vectors in H.264 Decoder)

  • 전성훈;유재명;이귀상
    • 정보처리학회논문지B
    • /
    • 제13B권3호
    • /
    • pp.197-204
    • /
    • 2006
  • 이동 통신의 급속한 발전으로 고품질 영상 서비스가 요구됨에 따라 이동 통신 환경과 같은 에러에 노출된 채널환경 하에서 고품질 영상 서비스를 제공하기 위한 에러 복원 기술의 필요성이 증가되고 있다. 본 논문에서는 H.264 화면간(Inter) 프레임에서의 채널 에러에 대한 보완 방법으로 기울기 벡터를 이용한 강화된 BMA(Boundary Matching Algorithm) 방법을 제안 한다. 일반적인 BMA 방법은 후보블록과 인접블록에 대해 차분을 계산할 때, 인접한 픽셀들의 차분의 합을 구한다. 이는 인접한 픽셀들이 대체적으로 같다는 가정에서 이루어지나 실제 영상에서는 기울기가 존재하게 되고 인접한 픽셀들은 특정한 방향으로 픽셀값이 증가하거나 감소하게 된다. 본 논문에서는 이러한 영상에서의 기울기를 고려한 정확한 차분방법을 개발하여 이를 적용한 영상복원을 시도한다. 채널 에러로 손실된 영상에 제안 방법을 적용한 결과 기존에 적용된 방법에 비해 약 $1{\sim}3dB$ 정도 향상된 영상을 획득할 수 있었다.

TEMPORAL ERROR CONCEALMENT ALGORITHM BASED ON ADAPTIVE SEACH RANGE AND MULTI-SIDE BOUNDARY INFORMATION FOR H.264/AVC

  • Kim, Myoung-Hoon;Jung, Soon-Hong;Kang, Beum-Joo;Sull, Sang-Hoon
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2009년도 IWAIT
    • /
    • pp.273-277
    • /
    • 2009
  • A compressed video stream is very sensitive to transmission errors that may severely degrade the reconstructed image. Therefore, error resilience is an essential problem in video communications. In this paper, we propose novel temporal error concealment techniques for recovering lost or erroneously received macroblock (MB). To reduce the computational complexity, the proposed method adaptively determines the search range for each lost MB to find best matched block in the previous frame. And the original corrupted MB split into for $8{\times}8$ sub-MBs, and estimates motion vector (MV) of each sub-MB using its boundary information. Then the estimated MVs are utilized to reconstruct the damaged MB. In simulation results, the proposed method shows better performance than conventional methods in both aspects of PSNR.

  • PDF

바이프리즘 스테레오 시각 센서를 이용한 GMA 용접 비드의 3차원 형상 측정 (Measurement of GMAW Bead Geometry Using Biprism Stereo Vision Sensor)

  • 이지혜;이두현;유중돈
    • Journal of Welding and Joining
    • /
    • 제19권2호
    • /
    • pp.200-207
    • /
    • 2001
  • Three-diemnsional bead profile was measured using the biprism stereo vision sensor in GMAW, which consists of an optical filter, biprism and CCD camera. Since single CCD camera is used, this system has various advantages over the conventional stereo vision system using two cameras such as finding the corresponding points along the horizontal scanline. In this wort, the biprism stereo vision sensor was designed for the GMAW, and the linear calibration method was proposed to determine the prism and camera parameters. Image processing techniques were employed to find the corresponding point along the pool boundary. The ism-intensity contour corresponding to the pool boundary was found in the pixel order and the filter-based matching algorithm was used to refine the corresponding points in the subpixel order. Predicted bead dimensions were in broad agreements with the measured results under the conditions of spray mode and humping bead.

  • PDF

문자열 검출을 위한 슬라브 영역 추정 (Slab Region Localization for Text Extraction using SIFT Features)

  • 최종현;최성후;윤종필;구근휘;김상우
    • 전기학회논문지
    • /
    • 제58권5호
    • /
    • pp.1025-1034
    • /
    • 2009
  • In steel making production line, steel slabs are given a unique identification number. This identification number, Slab management number(SMN), gives information about the use of the slab. Identification of SMN has been done by humans for several years, but this is expensive and not accurate and it has been a heavy burden on the workers. Consequently, to improve efficiency, automatic recognition system is desirable. Generally, a recognition system consists of text localization, text extraction, character segmentation, and character recognition. For exact SMN identification, all the stage of the recognition system must be successful. In particular, the text localization is great important stage and difficult to process. However, because of many text-like patterns in a complex background and high fuzziness between the slab and background, directly extracting text region is difficult to process. If the slab region including SMN can be detected precisely, text localization algorithm will be able to be developed on the more simple method and the processing time of the overall recognition system will be reduced. This paper describes about the slab region localization using SIFT(Scale Invariant Feature Transform) features in the image. First, SIFT algorithm is applied the captured background and slab image, then features of two images are matched by Nearest Neighbor(NN) algorithm. However, correct matching rate can be low when two images are matched. Thus, to remove incorrect match between the features of two images, geometric locations of the matched two feature points are used. Finally, search rectangle method is performed in correct matching features, and then the top boundary and side boundaries of the slab region are determined. For this processes, we can reduce search region for extraction of SMN from the slab image. Most cases, to extract text region, search region is heuristically fixed [1][2]. However, the proposed algorithm is more analytic than other algorithms, because the search region is not fixed and the slab region is searched in the whole image. Experimental results show that the proposed algorithm has a good performance.

푸리에 서술자를 이용한 물체 인식 (Object Recognition by Fourier Descriptor)

  • 오춘석;박용범
    • 한국정보처리학회논문지
    • /
    • 제1권1호
    • /
    • pp.73-80
    • /
    • 1994
  • 푸리에 서술자는 물체의 경계를 표현하는 일반적인 방법이다. 본 논문에서는 이 푸리에 서술자를 이용하여 물체를 인식할 수 있는 알고리즘을 구축하고 실제로 8가지 의 도구들을 구분 인식할 수 있는지를 직접 적용하여 알고리즘의 타당성 검토와 여러 분야에 응용될 수 있음을 추론하였다. 이 알고리즘 구축은 이미지 형성과정과 물체 인식 과정으로 분리하여 생각한다. 이미지 형성 과정은 가능한 인식을 용이하도록 적 절한 조도, 투영시각, 배경과 물체간에 선명한 대비를 이루는 것이 중요하다. 물체 인식과정은 푸리에 서술자와 경계선 매칭을 사용하여 여러 물체 가운데 최소 거리를 산출한 것을 인식한다. 또한 물체가 회전, 위치 변위, 확대 축소 변형에도 인식이 가 가능한지를 시험한다. 인식 과정을 신속히 수행하기 위해 푸리에 서술자 1024개중에 1/4 만을 사용하여 이를 달성한다.

  • PDF

3D 콘텐츠 생성에서의 스테레오 매칭 알고리즘에 대한 매칭 비용 함수 성능 분석 (Performance Analysis of Matching Cost Functions of Stereo Matching Algorithm for Making 3D Contents)

  • 홍광수;정연규;김병규
    • 융합보안논문지
    • /
    • 제13권3호
    • /
    • pp.9-15
    • /
    • 2013
  • 스테레오 매칭 과정에 있어서 매칭 비용을 구하는 것은 매우 중요한 과정이다. 이러한 스테레오 매칭 과정의 성능을 살펴보기 위하여 본 논문에서는 기존에 제안된 매칭 비용 함수들에 대한 기본 개념들을 소개하고 각각의 성능 및 장점을 분석하고자 한다. 가장 간단한 매칭 비용 함수는 매칭 되는 영상의 일관된 밝기를 이용하여 좌, 우 영상 간 서로 대응하는 대응점을 추정하는 과정으로, 본 논문에서 다루는 매칭 비용함수는 화소 기반과 윈도우 기반의 매칭 비용 방법으로 크게 두 가지로 나눌 수 있다. 화소 기반의 방법으로는 절대 밝기차(the absolute intensity differences: AD)와 sampling-intensitive absolute differences of Birchfield and Tomasi (BT) 방법이 있고, 윈도우 기반의 방법으로는 차이 절대 값의 합(sum of the absolute differences: SAD), 차이 제곱 값의 합(sum of squred differences: SSD), 표준화 상호상관성(normalized cross-correlation: NCC), 제로 평균 표준화 상호 상관성(zero-mean normalized cross-correlation: ZNCC), census transform, the absolute differences census transform (AD-Census) 이 있다. 본 논문에서는 앞서 언급한 기존에 제안된 매칭 비용 함수들을 정확도와 시간 복잡도를 측정했다. 정확도 측면에서 AD-Census 방법이 평균적으로 가장 낮은 매칭 율을 보여줬고, 제로 평균 표준화 상호 상관성 방법은 non-occlusion과 all 평가 항목에서 가장 낮은 매칭 오차율을 보여 주지만, discontinuities 평가 항목에서는 블러 효과 때문에 높은 매칭 오차율을 보여 주었다. 시간 복잡도 측면에서는 화소 기반인 절대 밝기차 방법이 낮은 복잡도를 보여 주였다.