• Title/Summary/Keyword: 문자 추출

Search Result 670, Processing Time 0.03 seconds

Recognition of English Calling Card by Using Hierarchical Approach and Enhanced RBF Networks (계층적인 접근과 개선된 RBF 네트워크를 이용한 영문 명함 인식)

  • 임은경;김광백
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2003.05a
    • /
    • pp.141-146
    • /
    • 2003
  • 본 논문에서는 문자열 영역 추출을 위한 3배 축소 명함 영상, 개별 문자 추출을 위한 2배 축소 명함 영상, 정확한 인식을 위한 원본 영상으로 명함 영상을 분리하고, 분리된 영상들을 대상으로 각 영상 크기에 적합한 처리를 수행하고 각각의 결과들을 이용하여 정확한 문자를 추출할 수 있는 방법을 제안한다 그리고 추출된 개별 문자들의 인식을 위해서 ART1을 적용한 개선된 RBF 네트워크를 제안하여 적용한다 제안된 명함 추출 방법은 원 영상을 각각의 처리 방법에 적합하도록 하기 위해서 다해상도로 분리한다. 문자열의 추출은 문자들의 간격을 축소 시켜서 블록을 추출하기 쉬운 적절한 최소 크기의 영상에서 수행하고, 개별 문자의 추출은 문자들의 간격을 분리할 수 있는 적절한 영상의 크기에서 수행한다 개별 문자 인식은 문자의 형태학적 특성을 잘 나타내기 위해서 원본 영상에 적용한다 본 논문에서 제안한 추출 방법은 문자를 정확히 추출할 수 있으며 병렬 처리가 가능하여 처리시간을 단축할 수 있는 장점을 가진다. 그리고 정확히 추출된 개별 문자들을 개선된 R8F 네트워크를 이용하여 인식률을 향상시킨다. 제안된 명함 추출 및 인식 방법의 성능을 확인하기 위해서 실제 영문 명함 영상을 대상으로 실험한 결과, 기존의 방법보다 명함 추출 및 인식에서 우수한 성능이 있음을 확인하였다.

  • PDF

A Study on Character Area Extraction of An English Calling Card Image (영문 명함 영상에서의 문자 영역 추출에 관한 연구)

  • 이지훈;류재욱;이준행;신철수;김광백
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2003.05b
    • /
    • pp.750-753
    • /
    • 2003
  • 본 논문에서는 명함 영상에서 문자 영역을 추출하기 위해서 전처리 과정을 수행하여 잡영을 제거한다. 잡영이 제거된 명함 영상을 3배로 축소하여 가로 스미어링을 적용하여 문자열의 후보 영역을 추출하고 문자열과 비문자열의 영역으로 분리한 후, 문자열 영역에 세로 스미어링을 적용한다. 추출된 문자열 영역과 세로 스미어링된 문자열 영역에 대해 OR연산을 수행하여 문자의 특징이 분리되는 것을 제거하고 윤곽선 따라가기 알고리즘을 적용하여 문자의 영역을 추출한다 제안된 방법을 실제 영문 명함의 개별 문자 추출에 적용한 결과, 기존의 영문 명함 추출 방법보다 개선되었다.

  • PDF

The Extraction of Character from an English Name Card by Using Smearing Method and Contour Trucking Algorithm (스미어링 기법과 윤곽선 추적 알고리즘을 이용한 영문 명함 영상에서의 문자 추출)

  • 조아현;이혜현;류재욱;김광백
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2002.05a
    • /
    • pp.410-413
    • /
    • 2002
  • 본 논문에서는 영문 명함 영상에서 개별 문자 추출 방법을 제안한다. 30개의 원본 명함 영상을 대상으로 스미어링 기법과 윤곽선 추적 알고리즘을 이용하여 영문 명함의 개별 문자들 추출하였다. 본 논문에서는 3$\times$3 마스크를 이용하여 가장 작은 값으로 3 배 축소하는 방법을 적용하여 스미어링하는 시간을 단축시키고 문자들간의 간격을 제거하여 윤곽선 추적 알고리즘을 이용하여 문자열 후보 영역을 추출하였다 그리고 추출된 후보 영역의 가로 및 세로의 비율과 면적을 이용하여 문자열과 비 문자열로 분리하고, 문자열 영역에서 4 방향 윤곽선 추적 알고리즘을 이용하여 개별문자를 추출하였다. 30개의 명함 영상을 실험한 결과, 309개의 문자열 중에서 280개가 추출되었고 개별 문자는 4504개중에서 4110개가 추출되었다

  • PDF

Automatic News Caption Segmentation Using Region Growing (영역확장을 이용한 뉴스 비디오 자막 자동 추출)

  • 이상호;손광훈;박철남
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 1998.06a
    • /
    • pp.67-70
    • /
    • 1998
  • 본 논문에서는 뉴스 비디오 자막의 구조적 문자 특성을 이용한 자동 자막추출방법을 기술하였다. 기존의 방법들은 경계 추출이나 이진화 과정 후에 화소값의 변화 profile에 나타나는 문자의 굵기, 간격 등의 문자 특징을 이용하는데 반해 본 논문에서 제안한 방식은 뉴스 비디오 자막에서 문자와 배경을 구분하는 테두리선을 배경과 문자를 구분하는 경계로 하여, 적절한 이진화 과정과 영역확장 기법을 이용하여 문자를 추출하였다. 제안한 방법은 문자에 대하 사전지식이 없어도 되며, 사용한 영역확장 기법은 기존의 방법에서의 경계 추출기법보다 간단하면서도 효과적인 문자추출 결과를 나타낸다.

  • PDF

DOT Classification Code Extraction through 3-Dimensional Features (3차원 특징을 이용한 DOT 분류 코드 추출)

  • 김재한;심재창
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.394-396
    • /
    • 2001
  • 본 논문의 목적은 타이어에 각인되어 있는 DOT 코드 문자를 효과적으로 추출하는데 있다. 기존의 DOT 문자 인식 방법에서는 카메라와 조명에 의한 2차원 영상에서 DOT 문자 추출을 시도하였는데, 타이어는 DOT 문자와 배경이 동일한 색상이고, 조명에 민감해서 DOT 문자의 추출이 용이하지 않았다. 그래서, 본 논문에서는 타이어의 DOT 문자를 조명에 거의 영향을 받지 않는 3자원 레이저 스캐너를 이용해서 획득하고, 획득된 영상에서 높이 값 정보를 추출했으며 추출된 높이 값 정보를 가진 영상에 패턴 인식 기법을 적용하여 DOT 문자를 효과적으로 추출할 수 있었다.

  • PDF

Character Grouping using 3-D Neighborhood Graph on Raster Map (래스터 지도상에서 3차원 인접 그래프를 이용한 문자 그룹핑)

  • Gang, Yong-Bin;Ok, Se-Yeong;Jo, Hwan-Gyu
    • Journal of KIISE:Software and Applications
    • /
    • v.26 no.2
    • /
    • pp.273-283
    • /
    • 1999
  • 래스터 지도에서 직선 또는 곡선과 중첩되어 있는 경우의 문자는 추출하기가 쉽지 않다. 따라서 본 논문에서는 고립되어 있는 문자뿐만 아니라 문자이외의 요소와 중첩되어 있는 문자도 효과적으로 추출할수 있는 분할 정복(divide and conquer) 개념에 기반한 문자 추출방법을 제시한다. 이를 위해 먼저 이미지의 연결 요소로부터 볼록다각형(convex hull)을 생성한다. 그리고 이 다각형이 충분한게 문자영역만을 포함할때가지 볼록 다각형을 이등분하면서 가장 긴 선분(투사 선분)을 기준으로 두 영역으로 분할한다. 다음으로 문자를 추출하기 위해서 이 선분을 기준으로 연결 요소상의 픽셀의 밀집도를 계산하는 알고리즘(프로파일링)을 적용한다. 또한 지도상에서 추출된 개별적인 문자들을 의미있는 단어들로 묶기(grouping)한 새로운 알고리즘을 소개한다. 특히 지도상에 나타나는 문자의 종류는 매우 다양하고 또한 이 문자들이 놓여있는 방향 역시 일정하지 않기 때문에 이러한 단어를 찾는 kd법은 쉽지 않다. 이를 위해 본 논문에서는 3차원 인접 그래프(3-D neighborhood graph)G를 소개한다. 이 그래프 G에서 각 노드는 하나의 분리된 문자를 나타내며 자신의 크기와 위치에 따라서 3차원 공간상에서 위치하게된다. 따라서, 크기가 큰 (작은)문자들은 보다 큰 (작은) z값을 가지고 되며 이 그래프 G에서 서로 인접한 노드들을 연결함으로써 지도상에 존재하는 서로 다른 종류의 문자 스트링을 추출할수 있다. 실험결과는 서로 다른 지도 이미지에 대해서 약 95% 이상의 단어 추출율을 보여준다.

A Study on Character Recognition of Container Image using Brightness Variation and Canny Edge (명암도 변화와 Canny 에지를 이용한 컨테이너 영상의 문자인식에 관한 연구)

  • 남미영;임은경;허남숙;김광백
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2001.06a
    • /
    • pp.111-115
    • /
    • 2001
  • 컨테이너 영상의 문자를 인식하는데 있어 정규화 되어 있지 않은 컨테이너 영상의 문자영역을 추출한다는 것은 어렵다. 색깔. 위치, 글자 크기 등이 정해져 있지 않기 때문에 일정한 규칙으로 찾기는 힘들다. 따라서 본 논문에서는 이러한 특성을 고려하여 형태학적인 특성이 아니라 명암도를 조사하여 문자가 분포할 가능성이 있는 후보 영역을 찾고 Canny 에지 추출 기법과 에지 추적 기법으로서 문자가 있는 영역을 추출한다. 추출된 컨테이너의 문자 영역에서 히스토그램 방법을 이용하여 개별 문자를 추출하고 ART 알고리즘을 이용하여 인식한다. 실험 결과에서는 여러 영상에 대해 인식율이 우수한 것을 보인다.

  • PDF

A Study on Character Extraction in Vehicle Number Plate and Character Recognition (자동차 번호판 영역의 문자추출과 인식에 관한 연구)

  • 김도형;이선화;김미숙;차의영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.338-340
    • /
    • 2000
  • 자동차 번호판 인식 시스템은 영상획득, 번호판 영역 추출, 추출된 번호판 영역의 전처리, 문자부분 영역화, 문자인식 등의 5가지 핵심부분으로 구성된다. 그 중에서도 번호판 영역 추출, 추출된 영역의 전처리, 문자부분 영역화의 정확성은 전체 시스템 인식률에 지대한 영향을 줄 수 있는 부분으로써 그 정확성이 요구된다. 이에 본 논문에서는 컴퓨터 비젼 분야 중의 하나인 영상처리 기법을 사용하여 명암의 변화에도 문자를 잘 추출할 수 있는 Dynamic Adaptive Threshold 방법을 사용하여 추출된 번호판 영역을 이진화하고, 정확하게 문자 부분을 영역화하기 위한 방법으로 누적분포와 번호판 문자배열 특성을 이용한 방법을 제안한다. 그리고 추출되어진 문자는 ART2 신경망을 이용하여 인식한다.

  • PDF

A Method for Character Segmentation using MST(Minimum Spanning Tree) (MST를 이용한 문자 영역 분할 방법)

  • Chun, Byung-Tae;Kim, Young-In
    • Journal of the Korea Society of Computer and Information
    • /
    • v.11 no.3
    • /
    • pp.73-78
    • /
    • 2006
  • Conventional caption extraction methods use the difference between frames or color segmentation methods from the whole image. Because these methods depend heavily on heuristics, we should have a priori knowledge of the captions to be extracted. Also they are difficult to implement. In this paper, we propose a method that uses little heuristic and simplified algorithm. We use topographical features of characters to extract the character points and use MST(Minimum Spanning Tree) to extract the candidate regions for captions. Character regions are determined by testing several conditions and verifying those candidate regions. Experimental results show that the candidate region extraction rate is 100%, and the character region extraction rate is 98.2%. And then we can see the results that caption area in complex images is well extracted.

  • PDF

character segmentation using histogram (히스토그램을 이용한 문자 영역 추출)

  • Kim, Jieum;Jung, Woo Young
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.173-174
    • /
    • 2012
  • 문자 영역의 추출은 명함 등 문서의 정형화된 문자 인식, 비전 기반 감시 시스템에서의 간판, 부호 등의 자연영상에서의 문자 인식 등 다양한 분야에 활용될 수 있다. 우리가 관심을 갖는 문자는 간판이나 이름표 등 다른 이에게 정보를 전달해주는 기능을 하는 것으로 그 전배경의 구분이 명확하다. 이러한 특징은 히스토그램의 변화와 관련이 되어 있으며 본 논문에서는 그 변화를 분석함으로써 문자 영역 추출 방법을 제안한다.

  • PDF