• Title/Summary/Keyword: 문자영역추출

Search Result 288, Processing Time 0.03 seconds

Character Region Detection using Edge Features of Character and Character String in Signboard Image (문자 및 문자열의 에지 특징을 이용한 표시판 이미지에서 문자영역 검출)

  • Park, Jong-Cheon;Hwang, Dong-Guk;Jun, Byoung-Min
    • Proceedings of the KAIS Fall Conference
    • /
    • 2008.05a
    • /
    • pp.212-214
    • /
    • 2008
  • 자연이미지에 포함된 안내 표시판은 많은 유용한 정보를 포함하고 있으므로 이를 효과적으로 검출하여 문자인식시스템과 연동될 수 있다면 다양한 응용분야에서 활용될 수 있다. 그러므로 본 논문에서는 문자 및 문자열의 에지 특징을 이용하여 표시판이미지로부터 문자영역을 검출하는 방법을 제안한다. 캐니-에지 검출기로 에지를 검출하여 에지 이미지를 생성한다. 에지 이미지를 레이블링을 하여 연결요소 성분을 추출한다. 레이블 영역에서 문자와 문자열 에지 특징을 분석하여 후보 문자영역으로 추출한다. 후보 문자영역에 대한 검증을 수행함으로서 최종적인 문자영역을 검출한다. 제안한 방법은 다양한 종류의 자연이미지를 대상으로 실험하였고, 자연이미지에서 기울어진 문자영역과 다양한 크기의 문자를 갖는 문자영역을 효과적으로 검출하였다.

  • PDF

The Block Segmentation and Extraction of Layout Information In Document (문서의 영역분리와 레이아웃 정보의 추출)

  • 조용주;남궁재찬
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.17 no.10
    • /
    • pp.1131-1146
    • /
    • 1992
  • In this paper, we suggest a new algorithm applied to the segmentation of published documents to obtain constituent and layout information of document. Firstly, we begin the process of blocking and labeling on a 300dpi scanned document. Secondly, we classify the blocked document by individual sub-regions. Thirdly, we group sub-regions into graphic areas and text areas. Finally, we extract information for layout recognition by using the data. From an experiment on papers of an academic society, we obtain the above 98% of region classification rate and extraction rate of information for the layout recognition.

  • PDF

Study on Hangul Character Region Detection in Natural Images (자연영상에서 한글문자 영역 검출에 관한 연구)

  • Bak, Jong-Cheon;Gwon, Gyo-Hyeon;Jeon, Byeong-Min
    • Proceedings of the KAIS Fall Conference
    • /
    • 2010.11a
    • /
    • pp.430-433
    • /
    • 2010
  • 최근 모바일 기기로 획득된 영상을 이용한 다양한 분야의 연구가 활발히 진행되고 있으며, 스마트폰의 보급이 확대되면서 증강현실을 지원하고자 자연영상으로부터 문자정보를 추출 및 인식하여 이미지 검색을 가능하도록 하는 많은 연구도 진행되고 있다. 자연영상에서 한글문자 영역 검출은 한글문자 인식을 위한 전단계로서 다양한 환경에 노출된 문자영역을 정확히 검출하는 것이 인식 성능을 결정함으로 중요한 전처리 단계이다. 본 연구는 한글문자 영역의 에지 및 지역적 연결요소 성분 특징을 이용하여 한글문자 영역을 검출하는 방법을 제안한다. 에지 및 연결요소 성분의 특징을 검출하고, 그 결과를 레이블화하고 이를 분석함으로서 한글문자 후보 영역을 검출한다. 검출된 후보영역은 검증과정을 수행하여 최종적인 한글문자 영역을 추출한다. 제안한 방법은 다양한 환경에서 얻어진 자연영상을 대상으로 실험한 결과, 에지 및 연결요소 성분의 두 가지 특징을 결합함으로서 한글 문자영역 검출의 정확도를 향상하였다.

  • PDF

Character String Detection using Character-Edge Map with Adaptive Character Size and Character String Orientation in Natural Images (자연영상에서 문자의 크기와 문자열의 방향에 적응적인 문자-에지 맵을 이용한 문자열 검출)

  • Park, Jong-Cheon;Hwang, Dong-Guk;Lee, Woo-Ram;Jun, Byoung-Min
    • Proceedings of the KAIS Fall Conference
    • /
    • 2007.11a
    • /
    • pp.262-265
    • /
    • 2007
  • 이미지 데이터베이스 시스템에서 이미지에 포함된 문자정보를 기반으로 검색어를 사용한다면 검색의 정확도 높일 수 있다. 이미지에서 문자정보를 추출을 위한 전단계로서 문자열 영역 검출이 필수적인 과제가 된다. 그러므로 본 논문에서는 문자의 크기와 문자열의 방향에 적응적인 문자-에지 맵을 이용한 문자열 영역 검출 방법을 제안한다. 캐니-에지 검출기로 에지를 추출하고, 생성된 에지 이미지로 레이블 이미지를 얻고, 그 영역의 문자구조 특징을 분석하기 위해서 배열문법으로 문자-에지 맵에 적응적으로 분석한다. 문자-에지 맵의 분석결과로서 문자열 후보 영역을 얻고, 문자열 영역의 구조적인 특징을 이용하여 문자열 후보 영역을 검증함으로서 최종적인 문자열 영역을 검출한다. 제안한 방법은 다양한 종류의 자연영상을 대상으로 실험하였고, 자연영상에서 기울어진 문자열과 다양한 크기의 문자를 갖는 문자열 영역을 효과적으로 검출하였다.

  • PDF

Edge-based Text Localization Using Geometrical Features of Hangul Character in Mobile Images (모바일 영상에서 한글 문자의 기하학적 특징을 이용한 에지 기반 텍스트 검출)

  • Park, Jong-Cheon;Oh, Myoung-Kwan;Jeon, Byeong-Min
    • Proceedings of the KAIS Fall Conference
    • /
    • 2012.05b
    • /
    • pp.820-822
    • /
    • 2012
  • 최근 모바일 기기의 보급이 일반화됨으로서 모바일 영상을 다루는 많은 응용프로그램이 개발되고 있다. 모바일 영상을 분석하여 정보를 추출한 결과를 인터넷 검색의 키워드로 연계함으로서 직관적인 멀티미디어 검색을 가능하도록 한다. 본 연구는 모바일 영상에 포함된 한글 문자영역을 검출하는 방법을 제안하였다. 한글 문자의 기하학적인 특징을 추출하고 이를 분석함으로서 후보 한글문자 영역을 검출하고, 검출된 후보 문자영역을 한글 자소 병합 알고리즘을 이용하여 병합한다. 그리고 후보 문자 영역을 한글 6가지 한글 문자 유형 특징을 이용하여 한글 문자 영역을 판별함으로서 최종적인 한글 문자영역을 검출한다. 실험결과, 문자영역 검출률의 성능 평가 요소로서 재현률이 향상됨을 알 수 있었다.

  • PDF

Vehicle License Plate Recognition System using Color Information and PCA (칼라정보와 주성분분석법을 이용한 차량 번호판 인식에 관한 연구)

  • Han Soow-Han;Park Sung-Dae;Park Pan-Gon
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2005.05a
    • /
    • pp.437-442
    • /
    • 2005
  • 본 연구에서는 칼라정보와 주성분분석법(principal component analysis : PCA)를 이용한 차량 번호판 인식시스템을 구성하였다. 먼저 입력된 차량 영상에서 번호판의 형태적 특징과 녹색 칼라 정보를 이용하여 번호판 영역을 추출하였으며, 추출된 번호판내의 문자 및 숫자의 위치적 특징을 이용하여 번호판의 종류(구형, 신형, 최신형)를 구분하였다. 이렇게 추출되고 구분된 번호판은 문자의 상대적 위치정보와 수평 및 수직 투영 정보를 함께 이용하여 각각의 문자영역을 분리 추출하였다. 추출된 문자영역은 주성분분석법을 이용하여 고유벡터를 추출한 후 문자 인식에 사용하였다. 본 논문의 실험과정에서는 다양한 시간대 환경에서 촬영된 주행 중인 자동차 320대의 자가용 차량영상에 대하여 실험하였으며 높은 번호판 추출률과 번호판종류 구분률 그리고 문자 인식률을 얻을 수 있었다.

  • PDF

Digital Image Processing in Analyzing the Signal Pattern of Rock-Inscribed Letter (디지털영상신호처리에 의한 금석문 음각문자 신호 패턴 분석)

  • Hwang, Jae-Ho
    • Proceedings of the KIEE Conference
    • /
    • 2003.11c
    • /
    • pp.758-761
    • /
    • 2003
  • 금석문의 영상데이터를 디지털 형태로 검출하고, 영상신호처리 알고리즘을 사용하여 신호의 특성을 분석하고 그 결과를 제시하였다. 대상체는 비석에 음각된 문자로 하였다. 대전 주변의 백제권에서 몇몇 유형의 음각 문자를 형태별로 분류하여 디지털 이미지화한 다음, 문자가 각인된 정보영역과 바탕영역의 신호패턴을 추출하였다. 먼저 칼라 이미지를 grey tone으로 변환한 후, 전처리 과정을 거쳐 이미지의 노이즈나 불명확성을 제거하고 히스토그램 전 영역에 걸쳐 스케일 확장시켰다. 문자가 각인된 정보영역과 바탕영역을 구분하여 무작위로 소이미지 샘플을 취득하고 각 소이미지의 신호패턴을 분석하였다. 그 결과를 중첩의 원리를 이용하여 합성한 후 영역별 신호분석 패턴을 정형화하였다. 유형별로 다소 차이를 보이나 두 영역의 이미지 분석 결과는 차별성을 보였다. 문자 영역은 grey level 범위가 좁고 한정되며 일관성을 보이는데 비해, 바탕영역은 범위가 넓고 광범위하였다. 두 영역의 교차 레벨 범위는 극히 제한적이었으며 패턴 분리에 큰 영향을 끼치지 못하였음이 밝혀졌다. 이 일련의 과정은 알고리즘화되어, 1-2분 정도의 사전 작업만 하면 프로그램에 의해 문자를 추출할 수 있다. 이러한 사실들은 종래 무리한 탁본 작업에만 전적으로 의존하던 금석학 분야의 디지털화를 가능케 할 수 있다.

  • PDF

A License Plate Recognition Using Intensity Variation and Hybrid Pattern Vector (명암도 변화값과 하이브리드 패턴 벡터를 이용한 번호판 인식)

  • 석영수;김정훈;이응주
    • Proceedings of the Korea Institute of Convergence Signal Processing
    • /
    • 2001.06a
    • /
    • pp.153-156
    • /
    • 2001
  • 본 논문에서는 하이브리드 패턴 벡터를 이용하여 차량 번호를 실시간으로 인식하는 알고리즘을 제안하였다. 차량 입력 영상에서 전처리 과정을 거쳐 번호판의 수평 및 수직 명암값 빈도수 변화를 이용해 번호판 영역을 추출하고 하이브리드 패턴을 적용해 더 정확한 번호판 문자 및 숫자를 인식하는 알고리즘을 제안하였다. 제안한 알고리즘의 번호판 추출 과정에서는 번호판 영역의 문자와 배경이 뚜렷하게 구별되는 특성 및 번호 판 영역의 상대적인 크기의 특성과 수평 및 수직 빈도 수를 추하여 입력된 차량영상에서 번호판 영역을 추출한다. 또한 번호판 영역에서 잡음 제거와 세선화(Thinning)를 적용해 문자 및 숫자를 하이브리드 패턴 벡터를 적용하여 문자의 크기, 문자와 문자 사이의 밀집도의 특성, 이동에 무관한 특성을 이용해 차량 번호를 인식하는 알고리즘을 제안하였다. 제안한 방법들을 적용한 결과 기존의 원형 패턴 벡터 보다 훨씬 계산 속도가 빠르며, 차량 번호판의 크기에 관계없이 잡음에 영향을 받지 않고 차량 번호를 실시간으로 처리할 수 있는 가능성을 제시하였고, 번호판 영역이 불규칙한 조명 상태에서도 더 정확한 차량 번호를 인식 할 수 있는 알고리즘을 본 논문에서 제안하였다.

  • PDF

A Study on the Recognition of an English Calling Card by using Contour Tracking Algorithm and Enhanced ART1 (윤곽선 추적 알고리즘과 개선된 ART1을 이용한 영문 명함 인식에 관한 연구)

  • 김광백;김철기;김정원
    • Journal of Intelligence and Information Systems
    • /
    • v.8 no.2
    • /
    • pp.105-115
    • /
    • 2002
  • This paper proposed a recognition method of english calling card using both 4-directed contour tracking algorithm and enhanced ART1 algorithm. After we extract candidate character string region using horizontal smearing and 4-directed contour tracking method, we extract character string region through comparison of character region and non-character region using horizontal and vertical ratio and area in english calling card. In extracted character string region, we extract each character using horizontal smearing and contour tracking algorithm, and recognize each character by enhanced ART1 algorithm. The proposed ART1 algorithm is enhanced by dynamic control of similarity using fuzzy sum connective operator. The result indicate that the proposed method is superior in performance.

  • PDF

Word Image Decomposition from Image Regions in Document Images using Statistical Analyses (문서 영상의 그림 영역에서 통계적 분석을 이용한 단어 영상 추출)

  • Jeong, Chang-Bu;Kim, Soo-Hyung
    • The KIPS Transactions:PartB
    • /
    • v.13B no.6 s.109
    • /
    • pp.591-600
    • /
    • 2006
  • This paper describes the development and implementation of a algorithm to decompose word images from image regions mixed text/graphics in document images using statistical analyses. To decompose word images from image regions, the character components need to be separated from graphic components. For this process, we propose a method to separate them with an analysis of box-plot using a statistics of structural components. An accuracy of this method is not sensitive to the changes of images because the criterion of separation is defined by the statistics of components. And then the character regions are determined by analyzing a local crowdedness of the separated character components. finally, we devide the character regions into text lines and word images using projection profile analysis, gap clustering, special symbol detection, etc. The proposed system could reduce the influence resulted from the changes of images because it uses the criterion based on the statistics of image regions. Also, we made an experiment with the proposed method in document image processing system for keyword spotting and showed the necessity of studying for the proposed method.