• 제목/요약/키워드: matching template

검색결과 393건 처리시간 0.032초

스포츠 중계를 위한 자막 인식 시스템 개발 (Development of a Video Caption Recognition System for Sport Event Broadcasting)

  • 오주현
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.94-98
    • /
    • 2009
  • 메이저리그 야구 중계 등 해외 스포츠 중계제작에서 해결해야 할 문제 중 하나는 MPH(miles per hour)와 같이 영미식 단위로 표시된 자막을 국내 실정에 맞게 km/h 등으로 변환하는 것이다. 이를 위해 중계화면에 표시된 자막영역의 변화로부터 해당 자막이 표시되었음을 감지하고 숫자 정보를 인식하여 이를 국내실정에 맞는 SI 단위로 변환하는 스포츠 자막 인식 시스템을 개발하였다. 변환된 자막은 후단의 문자발생기 (CG) 시스템으로 전달되어 최종적으로 TV 화면에 표시된다. 일반적으로 문자 인식에 주로 사용되는 신경망(neural networks) 기반 방식은 사전에 유사 데이터를 이용한 신경망의 학습(training) 과정이 필수적으로 요구되며, 또한 학습에 사용된 데이터와 다른 모양의 자막이 예고 없이 사용되었을 경우 대처할 수 없다는 단점이 있다. 생방송이라는 사용 환경을 고려하여 새로운 폰트로 제작된 자막에도 신속하게 대처할 수 있는 템플릿 매칭(template matching) 방식을 사용하였다. 여러 가지 실험 영상으로 테스트한 결과 97% 이상의 정확한 인식 결과를 얻었으며, 정확성을 요하는 생방송의 특성상 매칭의 확신도(confidence)가 높지 않은 경우에는 작업자가 판단한 후 핫키를 이용하여 정확한 자막을 출력할 수 있게 하였다.

  • PDF

GUI기반 산업용 디지털 기기의 측정값 인식 시스템 (A GUI-based the Recognition System for Measured Values of Digital Instrument in the Industrial Site)

  • 전민식;고봉진
    • 한국항행학회논문지
    • /
    • 제20권5호
    • /
    • pp.496-502
    • /
    • 2016
  • 본 논문에서는 영상처리를 통해 GUI를 기반으로 산업용 디지털 기기의 측정값을 인식하고 기록하는 시스템을 제안하고 구현하였다. 제안한 시스템은 기존의 차량번호판 인식과 달리 산업용 측정기의 LCD화면에 표시되는 값은 디지털 숫자로 표시하고 있어 소수점과 마이너스 표시, LCD보호유리의 반사광등의 여러 가지 장애요인을 고려하였다. LCD화면에 표시된 숫자를 인식하기 위해 블롭 레이블링 (blob-labeling)기법을 사용하였으며, 인식한 숫자 이미지는 템플릿 매칭(template matching)을 통해 숫자가 무엇인지 판별하여, 인식한 측정값을 측정시간과 함께 저장장치에 기록하였다. 본 논문에서 제안한 시스템은 산업현장에서 제품의 내외경이나 높이를 측정하고 기록할 때 수기로 작성하는 번거로움을 줄이고, 수기로 작성 시 잘못 기입하는 경우를 방지함으로써 생산 공정 과정에서 오류가 없는 효율적인 공정관리가 가능하게 하였다.

동공의 반사특징을 이용한 얼굴위조판별 시스템 (Fake Face Detection System Using Pupil Reflection)

  • 양재준;조성원;정선태
    • 한국지능시스템학회논문지
    • /
    • 제20권5호
    • /
    • pp.645-651
    • /
    • 2010
  • 최근 지능형 범죄가 늘면서 첨단 보안 기술에 대한 요구가 점차 늘어나고 있다. 현재까지 보고된 위조영상검출방법은 실용화를 위하여 정확도 개선이 요구된다. 본 논문에서는 사람의 얼굴에 대하여 동공의 반사광을 이용한 얼굴위조판별 시스템을 제안한다. 제안된 시스템은 먼저 다중 스케일 가버특징 벡터를 기반으로 눈의 위치를 찾은 후 2단계의 템플릿 매칭을 통해서 설정된 적용범위를 벗어나는 눈에 대하여 위조판별을 고려하지 않음으로써 정확도를 높이는 방법을 사용한다. 신뢰도가 확보된 눈의 위치를 기반으로 적외선 조명에 반사되는 동공의 특징을 이용하여 눈위치 근처에서의 화소값을 계산하여 위조 여부를 판단한다. 실험을 통하여 본 논문에서 제안한 방법이 더욱 신뢰성 높은 위조판별시스템임을 확인하였다.

템플릿 매칭과 부분 워핑을 이용한 효율적인 원근 영상 워핑 기법 (Efficient Image Warping Mechanism Using Template Matching and Partial Warping)

  • 정대헌;조태훈
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 춘계학술대회
    • /
    • pp.339-342
    • /
    • 2017
  • 이미지의 기하학적 변형은 이미지 보정을 위해 사용되며 컴퓨터 비전 분야에서 강체 변환, 유사변환 등 많은 방법이 존재한다. 그 중에서도 워핑은 원근감이 있는 이미지에서 많이 활용되는 이미지 보정 방법이다. 일반적으로 워핑을 수행하기 위해서는 워핑할 위치에 대한 특징 점 4개를 추출해 워핑을 수행한다. 그러나 워핑 지점을 정확한 추출이 어려우며, 추출된 4개의 점을 이용해 원근 영상 보정을 할 경우 원본 이미지와 보정 후 영상과의 특정 부분 픽셀이 3~4픽셀 이상으로 오차가 나타나게 된다. 그렇기 때문에 본 논문에서는 정확한 워핑 결과를 가져오기 위해 템플릿 매칭을 이용해 워핑 할 부분의 4개점을 보다 정확하게 추출하고, 추출된 4개점들 중 2개의 점 각각에 대해 주변 3 by 3 영역으로 점을 이동 시켜 총 81번의 반복을 워핑 통해 이미지 보정하는 형태이다. 이와 같이 2개의 점을 주변 3 by 3 위치로 이동 시키면서 오차 픽셀이 1픽셀 이하로 나는 최적의 위치 즉, 최적 결과를 가져오는 4개의 점을 선정한 후 그 점들로 이미지 보정을 진행하여 최적의 결과를 가져올 수 있다.

  • PDF

탑뷰(top view) 영상을 이용한 곡선 템플릿 정합 기반 차선 및 곡률 검출 알고리즘 (Lane and Curvature Detection Algorithm based on the Curve Template Matching Method using Top View Image)

  • 한성지;한영준;한헌수
    • 대한전자공학회논문지SP
    • /
    • 제47권6호
    • /
    • pp.97-106
    • /
    • 2010
  • 본 논문에서는 곡선 템플릿 정합 방법을 이용한 곡률 검출 및 차선 검출 알고리즘을 제안한다. 본 논문에서는 영상의 원근감을 제거하기 위하여 입력 영상을 탑뷰(top view) 영상으로 변환한다. 생성된 탑뷰 영상을 이용하여 에지 영상을 생성하는데 검출의 정확도를 높이기 위해 차선 검출에 적합한 에지 검출 방법을 제안한다. 검출된 에지 영상을 이용하여 먼저 직선 차선을 검출한 후 본 논문에서 제안한 곡선 템플릿 정합 방법을 이용하여 가장 적합한 곡선 차선을 결정하여 곡률을 검출한다. 제안된 곡선 템플릿 정합 방법은 법선의 방정식과 원의 방정식만을 이용한 단순한 계산만으로 곡선 차선을 검출하기 때문에 알고리즘이 단순하고 검출 시간이 매우 짧다. 또한 본 논문에서는 이전 프레임에서 검출된 차선 정보를 이용하여 현재 프레임의 차선 정보를 보정하고 보완함으로써 보다 안정적인 차선 검출이 가능하였다. 제안된 알고리즘은 고속도로나 비교적 복잡한 시내 도로, 야간 시 고속도로 등에서 얻은 다양한 환경에서의 영상을 이용하여 실험하였다. 제안된 알고리즘은 초당 70 frame 가량의 영상 처리가 가능하였고 95% 이상의 차선 검출율과 90% 가량의 곡률 검출율을 얻을 수 있었다.

OpenCV를 활용한 이미지 유사성 비교 시스템 (The Similarity of the Image Comparison System utilizing OpenCV)

  • 반태학;방진숙;육정수
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 춘계학술대회
    • /
    • pp.834-835
    • /
    • 2016
  • 최근 들어 IT기술의 발전은 급속도로 성장하고 있다. 이에 따라 실시간 이미지 프로세싱 및 여러 플랫폼의 호환성을 제공하는 OpenCV를 활용한 이미지 처리 기술들에 대한 연구도 활발히 진행 중에 있다. 현재, 서로 다른 이미지를 비교, 유사성을 판별하는 시스템은 일치율이 낮거나, 사람이 아날로그적인 수치를 이용하여 판별하는 시스템이 대부분이다. 본 논문에서는 OpenCV의 Template Matching과 Feature Matching을 활용하여 서로 다른 이미지 간 유사성을 디지털 값으로 판별하는 시스템에 대해 연구한다. 이미지 스크린 중 비교점을 특정하여 피처를 추출, 서로 상이한 크기에서도 동일한 피처로 인식하여 비교대상 이미지의 피처셋과 비교하여 유서성을 비교, 검증하게 된다. 이는 음성 및 영상 인식 및 분석, 처리기술에서 보다 정확인 일치율 판독이 가능하다. 향후 법의학 및 OpenCV외의 이미지 처리기술에 대한 연구가 필요할 것으로 사료된다.

  • PDF

컬러 기반 영상에서 눈동자 템플릿을 이용한 얼굴영상 추출 (A Face Detection using Pupil-Template from Color Base Image)

  • 최지영;김미경;차의영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 춘계종합학술대회
    • /
    • pp.828-831
    • /
    • 2005
  • 본 논문에서는 얼굴을 검출하기 위해서 컬러영상에서 눈동자 템플릿을 사용한 얼굴을 검출하는 방법에 관해 제안하였다. 전체 시스템의 구성은 크게 피부색 모델에 의한 피부 영역을 검출하고 검출된 피부 영역에 타원을 적용하여 얼굴영역을 찾은 뒤 템플릿을 사용하여 눈동자를 추출하여 정규화 된 얼굴을 검출하는 단계로 이루어 졌다. 특히 타원을 적용할 때와 눈동자 템플릿을 적용할 때는 모멘트를 사용하였으며, 눈동자를 추출할 때 벡터를 기반으로 하기 때문에 사이즈에 제한 없이 자유로운 변형이 가능할 뿐만 아니라 눈동자 템플릿을 사용하면 눈동자의 위치와 크기를 동시에 얻어 낼 수 있었다. 마지막으로 이렇게 검출된 얼굴을 기울어진 각도만큼 회전시켜 정규화 된 얼굴을 검출 할 수 있었다.

  • PDF

투영된 모션과 히스토그램 인터섹션을 이용한 강건한 물체추적 (Robust object tracking using projected motion and histogram intersection)

  • 이봉석;문영식
    • 정보처리학회논문지B
    • /
    • 제9B권1호
    • /
    • pp.99-104
    • /
    • 2002
  • 기존의 물체추적기법은 템플릿 매칭, 물체의 경계선 재 검출, 물체의 움직임 정보 등을 사용하여 수행되었다. 그러나, 템플릿 매칭의 경우 많은 계산 시간을 요구하고, 경계선을 재 검출하는 경우 윤곽선이 잘못 설정되는 경우가 있으며, 물체의 움직임 정보를 사용하는 경우에는 움직이는 카메라에서 움직이는 물체만을 추적하기가 쉽지 않은 단점이 있다. 본 논문에서는 투영된 모션과 히스토그램 인터섹션을 이용한 강건한 물체추적 방법을 제안한다. 초기 객체추출은 영상분할 후 영역선택을 통하여 구성하고 선택된 객체를 가로 및 세로의 밝기 값을 1차원 신호로 투영하여 객체의 개략적인 평행이동 벡터를 추정한다. 추정된 변위를 기준으로 하여 객체의 가능한 회전 및 스케일에 대한 템플릿을 구성하고, 이들에 대하여 개선된 히스토그램 인터섹션을 사용하여 물체 추적을 수행한다. 제안한 알고리즘의 강건한 물체추적 성능을 실험에 의하여 확인하였다.

PCA와 LDA를 이용한 실시간 얼굴 검출 및 검증 기법 (Real-time Face Detection and Verification Method using PCA and LDA)

  • 홍은혜;고병철;변혜란
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권2호
    • /
    • pp.213-223
    • /
    • 2004
  • 본 논문에서는 실시간 응용을 위해 형판 정합 방법을 기반으로 하면서 동시에 외형 기반 (appearance_based) 방법에서 제시하는 학습 모델을 이용한 새로운 얼굴 검출 방법을 제안한다. 우선, 빛이나 조명의 영향에 의한 오류를 방지하기 위한 효과적인 전처리 과정으로 최소-최대 정규화(Min-max Normalization) 방법과 히스토그램 정규화 방법을 적용시킨다. 그런 뒤에 입력 영상과 형판을 PCA 변환하여 각각의 주성분(PC : Principal Component)을 생성하고 이를 LDA 변환한다. PCA 및 LDA 변환된 형판을 이용하여 입력 영상과의 거리 값을 구한 후 거리 값이 가장 작은 영역을 얼굴 영역으로 선택하고, 선택된 영역은 SVM을 이용하여 얼굴인지 아닌지를 검증하는 과정을 거친다. 또한, 본 논문에서는 실시간 얼굴 검출 방법을 위해 전체 영역이 아닌 $\pm$12 화소 크기의 탐색 윈도우를 이용하여 시스템의 속도 및 정확도를 고려하도록 하였다. 실제 환경과 같은 6개 부류의 동영상을 중심으로 실험한 결과, 본 논문에서 제안하는 방법이 기존의 PCA 변환만을 이용한 방법보다 좋은 성능을 보여줌을 알 수 있었고, 또한 SVM을 이용한 얼굴 검증 과정을 추가한 방법이 PCA 변환과 LDA 변환을 사용한 방법보다 좋은 성능을 보여줌을 알 수 있었다.

Visual Model of Pattern Design Based on Deep Convolutional Neural Network

  • Jingjing Ye;Jun Wang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제18권2호
    • /
    • pp.311-326
    • /
    • 2024
  • The rapid development of neural network technology promotes the neural network model driven by big data to overcome the texture effect of complex objects. Due to the limitations in complex scenes, it is necessary to establish custom template matching and apply it to the research of many fields of computational vision technology. The dependence on high-quality small label sample database data is not very strong, and the machine learning system of deep feature connection to complete the task of texture effect inference and speculation is relatively poor. The style transfer algorithm based on neural network collects and preserves the data of patterns, extracts and modernizes their features. Through the algorithm model, it is easier to present the texture color of patterns and display them digitally. In this paper, according to the texture effect reasoning of custom template matching, the 3D visualization of the target is transformed into a 3D model. The high similarity between the scene to be inferred and the user-defined template is calculated by the user-defined template of the multi-dimensional external feature label. The convolutional neural network is adopted to optimize the external area of the object to improve the sampling quality and computational performance of the sample pyramid structure. The results indicate that the proposed algorithm can accurately capture the significant target, achieve more ablation noise, and improve the visualization results. The proposed deep convolutional neural network optimization algorithm has good rapidity, data accuracy and robustness. The proposed algorithm can adapt to the calculation of more task scenes, display the redundant vision-related information of image conversion, enhance the powerful computing power, and further improve the computational efficiency and accuracy of convolutional networks, which has a high research significance for the study of image information conversion.