• 제목/요약/키워드: 문자특징 추출

검색결과 252건 처리시간 0.019초

자연영상에서 한글문자 영역 검출에 관한 연구 (Study on Hangul Character Region Detection in Natural Images)

  • 박종천;권교현;전병민
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2010년도 추계학술발표논문집 1부
    • /
    • pp.430-433
    • /
    • 2010
  • 최근 모바일 기기로 획득된 영상을 이용한 다양한 분야의 연구가 활발히 진행되고 있으며, 스마트폰의 보급이 확대되면서 증강현실을 지원하고자 자연영상으로부터 문자정보를 추출 및 인식하여 이미지 검색을 가능하도록 하는 많은 연구도 진행되고 있다. 자연영상에서 한글문자 영역 검출은 한글문자 인식을 위한 전단계로서 다양한 환경에 노출된 문자영역을 정확히 검출하는 것이 인식 성능을 결정함으로 중요한 전처리 단계이다. 본 연구는 한글문자 영역의 에지 및 지역적 연결요소 성분 특징을 이용하여 한글문자 영역을 검출하는 방법을 제안한다. 에지 및 연결요소 성분의 특징을 검출하고, 그 결과를 레이블화하고 이를 분석함으로서 한글문자 후보 영역을 검출한다. 검출된 후보영역은 검증과정을 수행하여 최종적인 한글문자 영역을 추출한다. 제안한 방법은 다양한 환경에서 얻어진 자연영상을 대상으로 실험한 결과, 에지 및 연결요소 성분의 두 가지 특징을 결합함으로서 한글 문자영역 검출의 정확도를 향상하였다.

  • PDF

모바일 영상에서 한글 문자의 기하학적 특징을 이용한 에지 기반 텍스트 검출 (Edge-based Text Localization Using Geometrical Features of Hangul Character in Mobile Images)

  • 박종천;오명관;전병민
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2012년도 춘계학술논문집 2부
    • /
    • pp.820-822
    • /
    • 2012
  • 최근 모바일 기기의 보급이 일반화됨으로서 모바일 영상을 다루는 많은 응용프로그램이 개발되고 있다. 모바일 영상을 분석하여 정보를 추출한 결과를 인터넷 검색의 키워드로 연계함으로서 직관적인 멀티미디어 검색을 가능하도록 한다. 본 연구는 모바일 영상에 포함된 한글 문자영역을 검출하는 방법을 제안하였다. 한글 문자의 기하학적인 특징을 추출하고 이를 분석함으로서 후보 한글문자 영역을 검출하고, 검출된 후보 문자영역을 한글 자소 병합 알고리즘을 이용하여 병합한다. 그리고 후보 문자 영역을 한글 6가지 한글 문자 유형 특징을 이용하여 한글 문자 영역을 판별함으로서 최종적인 한글 문자영역을 검출한다. 실험결과, 문자영역 검출률의 성능 평가 요소로서 재현률이 향상됨을 알 수 있었다.

  • PDF

특징 영역 기반의 자동차 번호판 인식 시스템 (Feature Area-based Vehicle Plate Recognition System(VPRS))

  • 조보호;정성환
    • 한국정보처리학회논문지
    • /
    • 제6권6호
    • /
    • pp.1686-1692
    • /
    • 1999
  • 본 논문은 특징 영역 기반의 자동차 번호판 인식 시스템(VPRS : Vehicle Plate Recognition System)에 대한 연구이다. 자동차영상에서 번호판을 추출하기 위해 명암도 변화를 이용하였고, 추출된 번호판에서 문자를 포함하는 특징 영역을 추출하기 위해 히스토그램 기법과 번호판 문자의 상대적인 위치 정보를 이용하였다. 이렇게 추출된 특징 영역을 ART2 신경회로망의 입력 벡터로 사용하여 인식하였다. 제안한 방법은 기존의 문자 인식을 위한 전처리 과정을 간소화 할 수 있었고, 이치화 과정에서의 원 화상의 왜곡과 노이즈 발생 문제를 해결할 수 있었으며, 또한 기존의 이치화 방법으로 문자 추출이 어려운 번호판에 대해서도 효과적으로 문자영역을 추출하여 인식할 수 있었다.

  • PDF

히스토그램을 이용한 문자 영역 추출 (character segmentation using histogram)

  • 김지은;정우영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.173-174
    • /
    • 2012
  • 문자 영역의 추출은 명함 등 문서의 정형화된 문자 인식, 비전 기반 감시 시스템에서의 간판, 부호 등의 자연영상에서의 문자 인식 등 다양한 분야에 활용될 수 있다. 우리가 관심을 갖는 문자는 간판이나 이름표 등 다른 이에게 정보를 전달해주는 기능을 하는 것으로 그 전배경의 구분이 명확하다. 이러한 특징은 히스토그램의 변화와 관련이 되어 있으며 본 논문에서는 그 변화를 분석함으로써 문자 영역 추출 방법을 제안한다.

  • PDF

유전 알고리즘을 이용한 특징 결합과 선택 (Feature Combination and Selection Using Genetic Algorithm for Character Recognition)

  • 이진선
    • 한국콘텐츠학회논문지
    • /
    • 제5권5호
    • /
    • pp.152-158
    • /
    • 2005
  • 문자 패턴에서 추출한 서로 다른 특징 집합을 결합함으로써 문자 인식 시스템의 성능을 향상시킬 수 있다. 이때 결합된 특징 벡터의 차원을 줄이기 위해 특징 선택을 수행해야 한다. 이 논문은 문자 인식 문제에서 특징 결합과 선택을 위한 일반적인 틀을 제시한다. 또한 필기 숫자 인식을 위한 설계와 구현을 제시한다. 이 설계에서는 필기 숫자 패턴에서 DDD 특징 집합과 AGD 특징 집합을 추출하며 특징 선택을 위해 유전 알고리즘을 사용한다. 실험 결과 CENPARMI 필기 숫자 데이터베이스에 대해 0.7%의 정확률 향상을 얻었다.

  • PDF

한글 문자열 영상의 지형적 특징을 이용한 비선형 문자 분할 및 인식 (Nonlinear Character Segmentation and Recognition Using Topographic Features in Hangul String Images)

  • 이동준;이성환
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.201-206
    • /
    • 1994
  • 문서 인식 시스템의 성능을 저하시키는 가장 큰 원인 중의 하나로 문자 분할 오류를 들 수 있는데 보다 우수한 성능의 문서 인식 시스템 개발을 위해서는 정확한 문자 분할 방법이 절실히 요구된다. 기존의 문자 분할에 관한 연구들은 이진 영상을 대상으로 함으로써 접촉되거나 겹치는 문자의 경계 부분에서 문자 분할에 유용한 정보들을 잃어 문자 분할 오류를 초래할 수 있다. 하지만 명도 영상을 분석해 보면 문자의 접촉 부분에서 주로 나타나는 지형적 특징이 있으며, 문자 경계에서 명도값이 변하는 것을 관찰할 수 있는데 이와같은 명도 영상의 정보를 사용하면 보다 효과적으로 문자를 분할할 수 있을 것으로 판단된다. 본 연구에서는 이러한 점에 착안하여 명도 영상으로부터 지형적 특징을 추출하고 다단계 그래프 탐색 방법을 이용하여 명도값을 추적함으로써 비선형 문자 경계를 찾는 새로운 문자 분할 방법을 제안한다. 제안된 방법은 명도 문자열 영상을 입력으로 받아 명도 영상의 투영값과 명도 영상으로부터 추출된 지형적 특성을 이용하여 문자 분할 영역을 결정하고 문자 분할 영역내에서 다단계 그래프 탐색에 의한 비선형 문자 분할 경로를 찾는다. 그리고 문자 인식기와 결항하여 최종 문자 분할 위치를 확정하는 인식 결과를 이용한 문자 분할을 수행함으로써 문자 분할 위치 및 문자 인식 결과를 확정한다. 다양한 문서에 대한 실험 결과 제안된 방법이 이진 정보만을 사용하는 방법보다 접촉 혹은 겹친 문자 분할에 매우 효과적임을 알 수 있었다.

  • PDF

연역적이고 국부적인 영문자의 폰트 분류법 (A Priori and the Local Font Classification)

  • 정민철
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2002년도 추계학술발표논문집
    • /
    • pp.205-208
    • /
    • 2002
  • 본 연구에서는 영문 단어로부터 폰트를 분류하기 위해 연역적이고 국부적인 폰트 분류 방법을 제안한다. 이는 문자 인식 전에 한 단어에서 폰트를 분류하는 것을 말한다. 폰트 분류를 위해 활자 특성인 Ascender, Descender와 Serif가 사용된다. 입력 단어로부터 Ascender, Descender와 Serif가 추출되어 특징 벡터가 추출되고, 그 특징 벡터는 인공 신경망에 의해 입력 단어에 대한 폰트 그룹, 폰트 이름이 분류된다. 제안된 연역적이고 국부적인 폰트 분류 방법은 폰트 정보가 문자 분할기와 문자 인식기에 사용될 수 있게 한다 나아가, 특정 폰트에 따른 Mono-font 문자 분할기와 Mono-Font 문자 인식기로 구성되는 OCR 시스템을 구성할 수 있는 것을 가능하게 한다.

Mellin 변환 방식과 BPEJTC를 이용한 영상 문자 인식 (Image Character Recognition using the Mellin Transform and BPEJTC)

  • 서춘원;고성원;이병선
    • 조명전기설비학회논문지
    • /
    • 제17권4호
    • /
    • pp.26-35
    • /
    • 2003
  • 자연계에서 다양한 형태로 입력되는 물체 영상을 효과적으로 인식하려면, 물체의 위치, 회전, 크기 변화에 관계없이 인식할 수 있는 왜곡 불변 특성의 추출이 반드시 요구된다. 이러한 왜곡 불변 특성은 동일한 영상의 변화에 대하여 인식 특성이 같고, 서로 다른 영상의 변화에 대해서는 분리 식별이 용이해야 한다. 이러한 인식 특성을 얻기위해 다각도로 많은 연구가 진행되고 있으며, 특히 회전 및 크기에 불변 특성을 동시에 얻을 수 있는 Mellin변환을 이용한 방법 등이 영상 인식에 많이 이용되고 있다[1][2][3]. 따라서, 본 논문에서는 Mellin 변환 방법에 의한 크기 및 회전에 대한 불변 특성을 얻을 수 있는 문자 인식 시스템을 위한 문자 특징 추출 방법을 제시하고자 하였으며, 영문자 26 문자의 입력 영상에 대하여 무게 중심법에 의한 문자 이동과 Mellin 변환 방법에 의한 특징 추출 방법에 보간법을 이용하여 특징을 추출하였으며, 추출된 특징에 대하여 특징의 이질도를 검사하여, 각 특징의 이질도가 약 50% 이상의 결과를 얻었다. 또한, Mellin 변환 방법에 의해 추출된 특징을 기준 영상으로 하는 BPEJTC(Binary Phase Extraction Joint Transform Correlator)를 이용하여 크기, 회전 및 이동에 따른 입력 문자의 인식이 가능한 BPEJTC 시스템을 구현하였으며, 이에 따라 본 논문에서는 약 90%의 인식률을 얻을 수 있었다. 따라서 본 논문에서 제시하는 Mellin 변환 방법에 따라 추출된 문자의 특징과 BPEJTC를 이용하여 영상 문자를 인식할 수 있는 영상 문자 인식 시스템의 가능성을 제시하였다.

개선된 퍼지 ART 기반 RBF 네트워크와 PCA 알고리즘을 이용한 여권 인식 및 얼굴 인증

  • 장도원;김광백
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2005년도 공동추계학술대회
    • /
    • pp.547-556
    • /
    • 2005
  • 본 논문에서는 출입국자 관리의 효율성과 제계적인 출입국 관리를 위하여 여권 코드를 자동으로 인식하고 위조 여권을 판별할 수 있는 여권 인식 및 얼굴 인증 방법을 제안한다. 여권 이미지가 기울어진 상태로 스캔되어 획득되어질 경우 개별 코드 인식과 얼굴 인증에 많은 영향을 미칠 수도 있으므로 기울기 보정은 문자 분할 및 인식, 얼굴 인증에 있어 매우 중요하다. 따라서 본 논문에서는 여권 영상을 스미어링한 후, 추출된 문자열 중에서 가장 긴 문자열을 선택하고 이 문자열의 좌측과 우측 부분의 두께 중심을 연결하는 직선과 수평선과의 기울기를 이용하여 여권 영상에 대한 각도 보정을 수행한다. 여권 모드 추출은 소벨 연산자와 수평 스미어링, 8 방향 윤곽선 추적 알고리즘을 적용하여 여권 코드의 문자열 영역을 추출하고, 추출된 여권 코드 문자열 영역에 대해 반복 이지화 방법을 적용하여 코드의 문자열 영역을 이진화한다. 이진화된 문자열 영역에 대해 CDM 마스크를 적용하여 문자열의 코드들을 복원하고 8 방향 윤곽선 추적 알고리즘을 적용하여 개별 코드를 추출한다. 추출된 개별 코드 인식은 개선된 RBF 네트워크를 제안하여 적용한다. 제안된 RBF 네트워크는 퍼지 논리 접속 연산자를 이용하여 경계변수를 통적으로 조정하는 개선된 퍼지 ART 알고리즘을 제안하여 RBF 네트워크의 중간층으로 적용한다. 얼굴 인증을 위해서는 얼굴 인증에 가장 보편적으로 사용되는 PCA 알고리즘을 적용한다. PCA 알고리즘은 고차원의 벡터를 저 차원의 벡터로 감량하여 전체 입력 영상들의 직교적인 공분산행렬을 계산한 후 그것의 고유 값에 따라 각 영상의 고유벡터를 구하므로 PCA 알고리즘을 적용하여 얼굴의 고유 벡터를 구한 후 특징 벡터를 추출한다. 따라서 여권 영상에서 획득되어진 얼굴 영상의 특징벡터와 데이터베이스에 있는 얼굴 영상의 특징벡터와의 거리 값을 계산하여 사진 위조 여부를 판별한다. 제안된 여권 인식 및 얼굴 인증 방법의 성능을 평가를 위하여 원본 여권에서 얼굴 부분을 위조한 여권과 기울어진 여권 영상을 대상으로 실험한 결과, 제안된 방법이 여권의 코드 인식 및 얼굴 인증에 있어서 우수한 성능이 있음을 확인하였다.

  • PDF

방향성분 특징과 Fisher Measure를 이용한 간판영상 한글인식 (Recognition of Korean Text in Outdoor Signboard Images Using Directional Feature and Fisher Measure)

  • 임준식;김수형;이귀상;양형정;이명은
    • 정보처리학회논문지B
    • /
    • 제16B권3호
    • /
    • pp.239-246
    • /
    • 2009
  • 본 논문은 모바일 폰 기반의 간판 영상내 한글 문자인식에 관한 연구로써 인식 대상은 간판영상에서 추출된 상호명으로 하였고 인식대상 문자 수는 상호명 빈도수 기반 808자로 한정하였다. 인식과정은 특징 추출, 대분류, 상세 분류로 구성되고 특징 추출과정에서는 문자영상의 크기, 잡음 및 왜곡에 강건한 비선형 방향성분 특징을 이용하였고 대분류 과정에서는 추출된 특징과 인식 대상문자에 대하여 최소거리 분류를 수행하고 10순위까지의 후보 문자를 추출하였다. 상세 분류 과정에서는 Fisher discriminant measure 이용하여 대분류에서 발생 할 수 있는 오인 식 결과를 보완하였다. 실험결과 1순위 인식률은 80.45%이고 5순위까지의 누적 인식률은 93.51%를 보였다.