• 제목/요약/키워드: 문자 영역 추출

검색결과 288건 처리시간 0.063초

서포트벡터머신과 정칙화판별함수를 이용한 비디오 문자인식의 분류 성능 개선 (Video character recognition improvement by support vector machines and regularized discriminant analysis)

  • 임수열;백장선;김민수
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권4호
    • /
    • pp.689-697
    • /
    • 2010
  • 본 연구에서는 비디오이미지로부터 추출된 텍스트영역으로부터 문자인식을 수행하였다. 비디오영상으로부터 추출된 문자열은 한글, 영어, 숫자, 특수문자 등으로 혼합되어 있거나, 또는 다양한 폰트와 크기, 그래픽 형태의 글자 존재, 영상의 기울어짐, 끊김, 잡영, 접촉, 저해상도의 글자 등으로 인하여 일반적인 문자인식에 비해 많은 어려움이 존재한다. 이와 같은 어려움을 극복하기위해 본 연구에서는 모든 글자에 대해서 인식하지 않고 가장 빈번하게 등장하는 글자만을 인식하고 나머지는 버리는 방법을 사용하였으며 지지도벡터기계와 정칙화판별분석의 2단계 문자인식 방법을 이용하여 인식률을 개선하였다. 또한 인식률이 좋지 못한 4형식과 5형식 글자에 대해 모음별로 중분류를 실시하였다. 실험결과 지지도벡터기계와 정칙화판별분석을 동시에 사용하는 방법이 다른 문자인식의 방법들보다 인식률이 우수하였으며, 부분적인 중분류의 방법을 이용한 경우 향상된 인식 성능을 나타냈다.

컴퓨터 비전 기술을 이용한 OSD Menu 자동검증 기법 (An Automatic OSD Verification Method using Computer Vision Techniques)

  • 이진석;강득철;조윤석;김호준
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2005년도 학술대회
    • /
    • pp.275-278
    • /
    • 2005
  • 본 연구는 디스플레이 제품의 개발 및 생산과정에서 OSD 메뉴문자의 오류 유무를 검사하는 과정을 컴퓨터 비전기술을 사용하여 자동화하는 방법을 제안한다. 디스플레이 제품의 OSD 메뉴는 순차적인 제어과정을 통해서 제한된 디스플레이 영역에 여러 종류의 언어와 기호를 포함하는 형태로 출력된다. 기존의 제품개발 과정에서 이러한 메뉴 항목의 정확성을 검증하는 작업은 작업자의 육안에 의한 판단과 수작업에 의해 이루어지고 있는데, 이는 반복작업에 의한 집중력 저하 및 판단착오에 의한 오류의 가능성을 내재한다. 또한 작업자가 다양한 나라의 언어에 대한 문자형태와 기호표현의 특성을 이해하여야 하고, 검증작업 자체에 따르는 부수적인 시간과 노력을 필요로 한다. 이에 본 연구에서는 디스플레이 제품의 OSD 메뉴와 같이 특수한 구조를 갖는 문서영상에 대한 논리적인 구조분석을 통해서 연속적인 문서영상을 발생시키는 작업스케쥴러를 생성하고, 작업스케쥴러에 의해 순차적으로 발생된 영상문서에 대한 전처리, OSD 메뉴의 기하학적 구조분석 및 문자영역을 추출하는 방법과, 표준패턴 구축 및 원형정합에 의한 문자의 오류를 검증하는 방법과 오류를 관리하는 기법을 제안한다.

  • PDF

국소 영역별 대비 개선과 쌍선형 보간에 의한 불균등 대비 영상의 효율적 적응 이진화 (An Adaptive Thresholding of the Nonuniformly Contrasted Images by Using Local Contrast Enhancement and Bilinear Interpolation)

  • 정동현;조상현;최흥문
    • 전자공학회논문지S
    • /
    • 제36S권12호
    • /
    • pp.51-57
    • /
    • 1999
  • 본 논문에서는 불균등 대비 영상에서 국소 영역별 대비개선과 문턱치 평면의 쌍선형 보간을 이용한 효과적인 적응 이진화 방법을 제안하였다. 제안한 방법에서는 먼저 영상을 국소 영역으로 나누고, 영역별로 흐리거나 대비가 낮은 부분의 명도차를 증대시켜 전체적으로 대비를 개선한 후, 대비 개선된 국소 영역별 명도 분포로부터 해당 영역의 최적 문턱치를 구하였다. 국소 영역간에 이웃하는 문턱치들을 쌍선형 보간하여 전역적으로 영역별 문턱치들간의 불연속성을 없앰으로써 불균등 대비 영상에 대해서도 관심 영역이나 문자 부분에서의 불연속을 줄이도록 하였다. 불균등 대비를 갖는 일반문서 및 PCB나 웨이퍼상의 문자 영상을 제안한 방법과 기존 방법으로 이진화한 영상들로부터 문자들을 추출하고, 동일 조건하에서 같은 역전파 신경회로망으로 인식 실험하여 제안한 방법의 실효성을 확인하였다.

  • PDF

골격을 이용한 문자 인식을 위한 지역경계 연산 (Regional Boundary Operation for Character Recognition Using Skeleton)

  • 유석원
    • 문화기술의 융합
    • /
    • 제4권4호
    • /
    • pp.361-366
    • /
    • 2018
  • 학습 데이터를 구성하는 각각의 문자들에 대해 서로 다른 글자체들을 픽셀 단위로 더해서 MASK를 만들고, 해당 MASK에 속하는 픽셀값들을 세 영역으로 나눈다. 실험 데이터를 골격 형태로 수정하고, 지역 경계 연산을 사용하여 수정된 실험 데이터의 배경 중에서 문자의 골격에 인접한 배경 영역을 구분하는 경계를 만든다. 수정된 실험 데이터와 MASK들 간의 불일치 정도를 계산해서 최소값을 가지는 MASK를 찾는다. 이 MASK가 해당 실험 데이터에 대해 최종적으로 인식된 학습 데이터 문자로 선택된다. 문자의 골격과 지역 경계 연산을 사용하는 인식법은 주어진 학습 데이터에 새로운 글자체를 추가해서 학습 데이터를 쉽게 확장할 수 있으며, 구현하기가 간단하면서도 높은 문자 인식률을 얻을 수 있다.

모바일정보검색 서비스를 위한 문자 인식 (Image Processing for Mobile Information Retrieval Service)

  • 임명재;현성경;박지은;이기영
    • 한국인터넷방송통신학회논문지
    • /
    • 제11권1호
    • /
    • pp.103-108
    • /
    • 2011
  • 현대 사회는 정보화에 대한 인식이 크게 보편화되면서 정보 통신 기술에 대한 개발이 급속화 되고 있는 추세이다. 특히 모바일 기기에 대한 기술 또한 빠르게 진행됨에 따라 자신이 원하는 정보를 언제 어디서나 제공받기를 기대한다. 이에 따라 편리한 정보검색을 위한 이미지 검색이 보편화 되고 있다. 하지만 일반적인 이미지 검색은 이미지에서의 문자영역 추출의 부정확성과 추출된 문자로 상세한 정보를 얻는데 어려움이 따른다. 따라서 본 논문에서는 촬영한 영상에서 문자인식을 통해 관광지를 포함한 여러 상점들의 간판을 인식하여 사용자에게 편리한 정보제공을 목적으로 하고 있으며, Top-Hat이라는 문자추출 방법과 서버를 함께 연동시키므로 시킴으로써 보다 정확하고 상세한 정보를 얻을 수 있다.

연결요소 방법과 메디안 필터를 이용한 문서영상 기하학적 구조분석 (The Geometric Layout Analysis of the Document Image Using Connected Components Method and Median Filter)

  • 장대근;황찬식
    • 한국통신학회논문지
    • /
    • 제27권8A호
    • /
    • pp.805-813
    • /
    • 2002
  • 인쇄문서를 전자문서로 자동전환하기 위해서는 먼저 문서영상의 기하학적 구조를 분석하여 문자, 그림, 표 등의 세부 영역으로 분류해야한다. 그러나 문서구조의 복잡성과 그림의 크기와 밀도의 다양함은 기하학적 구조분석을 어렵게 만드는 원인이 되고 있다. 본 논문에서는 연결요소 기반의 방법을 이용하여 복잡한 구조의 문서도 세부적 영역분할이 가능하며, separable 메디안 필터를 이용하여 크기와 밀도가 다양한 문자가 그림을 분류하고, 1차원 메디안 필터를 수평, 수직방향으로 각각 적용하여 표를 구성하는 직선이 훼손되거나 직선에 문자가 붙어있는 경우에도 추출을 가능하게 함으로써, 상용제품이나 기존의 방법에 비해 영역분할 및 분류 그리고 표를 구성하는 직선추출이 우수한 방법을 제안한다.

얼굴 컬러 분석에 의한 지능형 여권 얼굴 인증 시스템 (Intelligent Passport′s Face Verification System Using Face Color Analysis)

  • 김도현;차의영;김광백
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2004년도 추계학술대회
    • /
    • pp.279-286
    • /
    • 2004
  • 본 논문에서는 출입국자 관리의 효율성과 체계적인 출입국 관리를 위하여 위조 여권을 판별할 수 있는 지능형 여권 얼굴 인증 시스템을 제안한다. 제안하는 지능형 여권 얼굴 인증 시스템은 여권 이미지에서 여권 코드 문자열을 인식하여 여권 사용자의 사진 및 관련 정보를 여권 데이터베이스에서 추출한다. 추출된 출입국자의 사진 및 얼굴과 여권에 부착된 사진 및 얼굴과의 유사도 측정을 통하여 여권 사진의 위조 여부을 판단한다. 이때, 이미지의 유사도 측정을 위해서 다양한 실험을 통한 결과를 종합 분석해 본 결과 사진 영역의 인증에는 Luminance, Edge, RGB 특징이, 얼굴 영역의 인증을 위해서는 Hue, YIQ-I, YCbCr-Cb 특징이 효과적인 것으로 나타났으며 사진 영역의 유사도와 얼굴영역의 유사도가 모두 0.8이상인 경우 정상적인 여권으로 판정하고 그렇지 않은 경우 위조가 되었을 가능성이 있는 여권으로 판정하는 방법을 사용하여 FAR 3.1%, FRR 2.7%의 우수한 결과를 나타내었다.

  • PDF

교육용 도서 영상을 위한 효과적인 객체 자동 분류 기술 (Efficient Object Classification Scheme for Scanned Educational Book Image)

  • 최영주;김지해;이영운;이종혁;홍광수;김병규
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권7호
    • /
    • pp.1323-1331
    • /
    • 2017
  • 오늘날 저작권 관련 산업이 사회, 경제적으로 큰 영향을 미치는 대규모 산업으로 성장하였음에도 불구하고 저작물에 대한 소유권 및 저작권에 대한 문제가 끊임없이 발생하고 있으며 특히 이미지 저작권과 관련된 연구는 거의 진행되지 않는 상태이다. 본 연구에서는 기존의 문서 영상처리 기술과 딥 러닝 기술을 융합하여 교육용 도서 영상에서의 객체 자동 추출 및 분류 기술 시스템을 제안한다. 제안된 기술은 먼저 잡음을 제거한 후, 시각적 주의(visual attention) 기반 영역 추출 과정을 수행한다. 추출된 영역을 기반으로 블록화 작업을 수행하고, 각 블록을 그림인지 아니면 문자 영역인지를 분류한다. 마지막으로 추출된 그림 영역 주위를 검색하여 캡션 영역을 추출한다. 본 연구에서 진행한 성능 평가 결과, 그림 영역은 최대 97% 정확도를 보이며, 그림 및 캡션 영역 추출에 있어서는 평균 83%의 정확도를 보여 준다.

웹 영상에 포함된 문자 영역의 추출 (Text Extraction In WWW Images)

  • 김상현;심재창;김중수
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 하계종합학술대회 논문집(4)
    • /
    • pp.15-18
    • /
    • 2000
  • In this paper, we propose a method for text extraction in the Web images. Our approach is based on contrast detecting and pixel component ratio analysis in mouse position. Extracted data with OCR can be used for real time dictionary call or language translation application in Web browser.

  • PDF

기울어진 차량 번호판 영역의 검출 (The Detection of Slanted Car License Plate Region)

  • 문성원;장언동;송영준
    • 한국콘텐츠학회논문지
    • /
    • 제4권3호
    • /
    • pp.125-130
    • /
    • 2004
  • 본 논문에서는 디지털 카메라를 통하여 입력된 차량 영상으로부터 차량 번호판을 인식하는 방법을 제안한다. 최근 몇 년간 차량 번호판 영상을 인식하는 기술은 많은 발전을 이루어 왔다. 정확한 인식을 위한 핵심 기술은 차량 번호판 영역의 정확한 추출이다. 에지 정보나 칼라 정보로 번호판 영역을 추출할 경우, 번호판을 보는 시각에 따른 기울어진 번호판의 정확한 영역 추출이 어렵기 때문에 기존의 번호판 인식은 차량의 정면에서 촬영된 영상을 사용하였고 번호판 영역에 경사나 기울기를 고려하지 않았다. 본 연구에서는 입력 영상의 경사나 기울어진 입력 영상에 대한 인식이 가능한 형태로 변환하는 데 중점을 둔다. 그에 따라 영상에서 번호판의 위치 및 기울어짐 혹은 높낮이가 정면에서 벗어나더라도 번호판 영역 추출을 가능토록 칼라 정보를 이용하여 후보 영역을 추출한 후 선형 회귀 방정식을 사용하여 보다 정확하게 차량 번호판 영역을 추출하였다. 실험 결과 92%의 번호판 검출율을 보였으며, 50$^{\circ}$ 정도 기울어진 번호판에서도 문자의 인식이 가능함을 확인하였다.

  • PDF