• 제목/요약/키워드: 문자 영역 탐색

검색결과 25건 처리시간 0.03초

한글 문자열 영상의 지형적 특징을 이용한 비선형 문자 분할 및 인식 (Nonlinear Character Segmentation and Recognition Using Topographic Features in Hangul String Images)

  • 이동준;이성환
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.201-206
    • /
    • 1994
  • 문서 인식 시스템의 성능을 저하시키는 가장 큰 원인 중의 하나로 문자 분할 오류를 들 수 있는데 보다 우수한 성능의 문서 인식 시스템 개발을 위해서는 정확한 문자 분할 방법이 절실히 요구된다. 기존의 문자 분할에 관한 연구들은 이진 영상을 대상으로 함으로써 접촉되거나 겹치는 문자의 경계 부분에서 문자 분할에 유용한 정보들을 잃어 문자 분할 오류를 초래할 수 있다. 하지만 명도 영상을 분석해 보면 문자의 접촉 부분에서 주로 나타나는 지형적 특징이 있으며, 문자 경계에서 명도값이 변하는 것을 관찰할 수 있는데 이와같은 명도 영상의 정보를 사용하면 보다 효과적으로 문자를 분할할 수 있을 것으로 판단된다. 본 연구에서는 이러한 점에 착안하여 명도 영상으로부터 지형적 특징을 추출하고 다단계 그래프 탐색 방법을 이용하여 명도값을 추적함으로써 비선형 문자 경계를 찾는 새로운 문자 분할 방법을 제안한다. 제안된 방법은 명도 문자열 영상을 입력으로 받아 명도 영상의 투영값과 명도 영상으로부터 추출된 지형적 특성을 이용하여 문자 분할 영역을 결정하고 문자 분할 영역내에서 다단계 그래프 탐색에 의한 비선형 문자 분할 경로를 찾는다. 그리고 문자 인식기와 결항하여 최종 문자 분할 위치를 확정하는 인식 결과를 이용한 문자 분할을 수행함으로써 문자 분할 위치 및 문자 인식 결과를 확정한다. 다양한 문서에 대한 실험 결과 제안된 방법이 이진 정보만을 사용하는 방법보다 접촉 혹은 겹친 문자 분할에 매우 효과적임을 알 수 있었다.

  • PDF

무제약 필기체 한글 분할을 위한 가상 네트워크 탐색 시스템의 설계 및 구현 (Design and Implementation of Virtual Network Search System for Segmentation of Unconstrained Handwritten Hangul)

  • 박성호;조범준
    • 한국멀티미디어학회논문지
    • /
    • 제8권5호
    • /
    • pp.651-659
    • /
    • 2005
  • 본 논문에서는 무제약 필기체 한글 분할을 위하여 기존 방법들에서 제시된 적이 없는 문자간 여백에서 가상 네트워크 탐색 시스템을 이용하는 새로운 방법을 설계하고 구현하였다 제안된 방법은 다양한 필기자들이 제한 없이 쓰여진 모든 문자들에 대하여 적용이 가능하도록 설계되었고, 또한 문자간 여백에서 생성되는 가상 네트워크의 경로를 이용함으로서 꺾은선 형태의 다양한 분할경로를 얻을 수 있도록 설계되었다. 또한 탐색 시스템을 구현하는 과정에서 분할대상 블록의 길이에 따른 탐색 윈도우를 달리 적용함으로서 원하지 않는 영역에서 분할경로가 생성되는 것을 방지하였다 본 논문에서 제안하는 가상 네트워크 탐색 시스템에 대해 임의의 필기자들로 부터 자체적으로 수집한 800여개의 데이터를 대상으로 실험을 수행한 결과, 중첩되거나 접촉된 문자들을 포함하여 전체적으로 $91.4\%$ 정도의 분할 정확도를 얻을 수 있었다.

  • PDF

히스토그램과 확률을 이용한 차량 번호 검출 방법 (Vehicle number detection using histogram and probability)

  • 김효연;정도욱;최형일
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2015년도 춘계 종합학술대회 논문집
    • /
    • pp.307-308
    • /
    • 2015
  • 자동차 번호판의 문자를 검출하기 위한 과정 중 그림자가 있는 후면 번호판을 이진화하는 방법을 제안한다. 대부분의 경우 차량구조에 의한 그림자 발생이 문자를 검출하는데 오류를 발생시킨다. 이를 해결하기 위해 그림자 영역과 아닌 영역의 경계를 검출해야 한다. 하지만, 기존 방법은 히스토그램에서 세 개의 영역사이에 있는 임계값 2개를 수동으로 결정해야 되는 점과 현재번호판의 색상인 흰색 바탕에 검은 문자에 적용하면 문자 영역의 그림자 경계선 검출이 모호하다는 단점이 있다. 본 논문에서는 이 문제를 해결하기 위하여 슬라이딩 윈도우를 이용한 히스토그램과 탐색하는 픽셀의 좌, 우 픽셀들을 스캔하여 연결되지 않은 에지를 찾아 그림자 경계선 에지를 연결하는 방법을 제안한다.

  • PDF

카메라 영상 위에서의 문자 영역 추출 및 OCR (Text Region Extraction and OCR on Camera Based Images)

  • 신현경
    • 정보처리학회논문지D
    • /
    • 제17D권1호
    • /
    • pp.59-66
    • /
    • 2010
  • 기존의 OCR 엔진은 보정된 환경에서 읽혀진 서류 영상에 맞게 설계되어있다. 스마트 폰을 비롯한 검정 화면 거리가 보정되지 않은 기기에서 읽혀진 영상에서는 삼차원 원근 투시에 의한 찌그러짐 또는 곡면상에서의 찌그러짐 등이 핵심적인 문제점들로 여겨진다. 휴대용 단말기에서 읽혀진 영상들에서의 OCR 기능에 대한 요구가 증가일로에 있는 시점에서, 본 논문에서는 문제점들을 세 가지로 구분하고 - 회전에 무관한 문자 영역 추출, 폰트 등의 크기에 무관한 문자 선 영역 추출, 3차원 매핑 이론 - 이를 해결하기위한 방법을 제시하였다. 이러한 방법론을 통합하여 카메라 영상 위에서의 OCR을 개발하였다.

Mean Shift 알고리즘을 이용한 효율적인 문자 추출 (An Efficient Text Location using Mean Shift Algorithm)

  • 정기철;김광인;한정현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (상)
    • /
    • pp.123-126
    • /
    • 2001
  • 영상내의 문자 정보는 색인에 필요한 유용한 정보를 제공하므로, 이를 이용한 멀티미디어 데이터의 인덱싱기법이 최근 많이 연구되고 있다. 본 논문은 mean shift 알고리즘을 이용한 텍스춰 기반의 문자 영역 추출 방법을 제안한다. 다양한 크기와 모양의 문자에 적응성을 가지는 필터를 만들기 위해 신경망을 이용한다. 문자 영역의 위치와 크기는 문자 확률 영상상에서 mean shift 알고리즘을 이용하여, 국소 탐색만으로 별도의 후처리 과정 없이 기존의 문자 추출 방법보다 우수한 성능을 보인다.

  • PDF

다중색상 모델과 문자배치 정보를 이용한 복잡한 배경 영상에서의 자동차 번호판 추출 (A License Plate Detection Method Using Multiple-Color Model and Character Layout Information in Complex Background)

  • 김민기
    • 한국멀티미디어학회논문지
    • /
    • 제11권11호
    • /
    • pp.1515-1524
    • /
    • 2008
  • 본 논문에서는 복잡한 배경이 나타나는 자동차 영상에서 다중색상 모델과 문자배치 정보를 이용한 번호판 추출 방법을 제안한다. 녹색 번호판과 흰색 번호판에 나타나는 문자의 배치 형태가 다르기 때문에, 먼저 번호판 색상을 추정한 후 해당 색상 번호판의 문자배치 정보를 최대한 활용하는 접근 방식을 사용하였다. RGB 색상 모델에 HSI와 YIQ 색상 모델을 결합한 다중색상 모델을 이용하여 녹색 영역이 추출되면, 해당 영역에서 추출된 연결요소를 분석하여 녹색 번호판의 문자배치 형태를 탐색한다. 이때 번호판이 추출되지 않으면, 전체 영역에서 추출된 연결요소를 분석하여 흰색 번호판의 문자배치 형태를 탐색한다. 마지막으로 번호판 문자배치 형태와 유사한 연결요소들을 묶어 번호판을 추출한다. 4개 영상에 대한 실험 결과 98.1%의 번호판 추출 성공률을 얻었으며, 제안된 방법이 빛의 세기, 그림자, 그리고 날씨의 변화에도 강건함을 알 수 있었다.

  • PDF

영상처리를 이용한 도서 위치 추정 시스템 (Books Location Estimation System by Image Processing)

  • 조동욱
    • 정보처리학회논문지B
    • /
    • 제12B권1호
    • /
    • pp.17-24
    • /
    • 2005
  • 본 논문에서는 도서관이나 대형서점의 서고에서 일반인들인 보고난 도서가 제자리에 있지 않아 이를 사서가 찾아야 할 시 문제점이었던 직접 탐색을 제어탐색으로 행할 수 있는 방법론을 제안하고자 한다. 이를 위해 영상처리 기술을 적용하고자 한다. 즉, 현재는 사서가 제자리에 꽃혀 있지 않은 도서를 찾기 위해 전체 서고를 직접 탐색해야 하는 문제가 있었다. 이 같은 문제를 영상카메라에 의해 촬영된 영상에서 도서의 경계 영역을 에지연산자와 Hough 변환을 적용하여 찾는다. 이후 추출된 도서들의 경계 영역으로부터 투영에 의한 히스토그램을 생성하여 이로부터 타이틀 영역을 추출하고 도서명의 문자수, 저자명의 문자수, 출판사명의 문자수 그리고 이의 나열 순서 등을 토대로 도서가 있을 수 있는 후보 영역을 추출한다. 최종적으로 곡선적합과 회귀직선 추출 등을 통해 도서위치 최종 후보 영역을 추출할 수 있었으며 실험에 의해 본 논문의 유용성을 입증하고자 한다.

인식된 문자의 강한 특징점을 활용하는 측위시스템 (Odometry Using Strong Features of Recognized Text)

  • 송도훈;박종일
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.219-222
    • /
    • 2021
  • 본 논문에서는 시각-관성 측위시스템(Visual-Inertial Odometry, VIO)에서 광학 문자 인식(Optical Character Recognition, OCR)을 활용해 문자의 영역을 찾아내고, 그 위치를 기억해 측위시스템에서 다시 인식되었을 때 비교하기 위해 위치와 특징점을 저장하고자 한다. 먼저, 실시간으로 움직이는 카메라의 영상에서 문자를 찾아내고, 카메라의 상대적인 위치를 이용하여 문자가 인식된 위치와 특징점을 저장하는 방법을 제안한다. 또한 저장된 문자가 다시 탐색되었을 때, 문자가 재인식되었는 지 판별하기 위한 방법을 제안한다. 인공적인 마커나 미리 학습된 객체를 사용하지 않고 상황에 따른 문자를 사용하는 이 방법은 문자가 존재하는 범용적인 공간에서 사용이 가능하다.

  • PDF

한글 인쇄체 문자의 형식 분류 및 비선형적 자소 분리에 관한 연구 (A Study on Korean Printed Character Type Classification And Nonlinear Grapheme Segmentation)

  • 박용민;김도현;차의영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2006년도 춘계종합학술대회
    • /
    • pp.784-787
    • /
    • 2006
  • 본 논문에서는 한글 인쇄체 문자의 자소를 비선형적으로 분리하는 방법을 제안한다. 자소 분리 대상 문자는 자소의 조합 방식에 따라 6개의 형식으로 분류한다. 인쇄체 한글의 6형식 분류를 위해 그레이 레벨의 문자 이미지로부터 망 특성과 수직 수평 투영 기법을 이용해 특징을 추출하고, 오류 역전파 기법을 이용하여 분류를 시도한다. 분류된 문자 형식을 기반으로 분리 후보 영역을 지정하고, 이 영역을 기반으로 다단식 그래프 탐색 알고리즘을 이용하여 최적의 비선형적 자소 분리 경로를 찾아낸다. 실험 결과, 제안한 방법은 한글의 6형식 분류에 적합하였으며, 자소가 서로 붙어 선형적으로 분리가 어려운 문자의 자소 분리에 좋은 성능을 나타내었다.

  • PDF

신경망 기반의 텍스춰 분석을 이용한 효율적인 문자 추출 (Efficient Text Localization using MLP-based Texture Classification)

  • 정기철;김광인;한정현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권3호
    • /
    • pp.180-191
    • /
    • 2002
  • 본 논문은 MLP와 MultiCAMShift 알고리즘을 이용한 텍스춰 기반의 영상 내 문자 추출 방법을 제안한다. MLP를 이용한 텍스춰 분석기는 별도의 특징값 추출 단계 없이 다양한 환경의 입력 영상에 대해 효과적으로 문자 확률 영상을 생성하며, 문자 확률 영상 상에서 수행되는 MultiCAMShift 알고리즘은 국소 탐색만으로 효율적으로 문자 영역을 추출할 수 있다.