• 제목/요약/키워드: Character Feature Extraction

검색결과 119건 처리시간 0.025초

장면 이미지로부터 문자-에지 맵 특징을 이용한 텍스트 추출 (Text Extraction using Character-Edge Map Feature From Scene Images)

  • 박종천;황동국;이우람;권교현;전병민
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2006년도 춘계학술발표논문집
    • /
    • pp.139-142
    • /
    • 2006
  • 본 연구는 장면 이미지로부터 텍스트에 존재하는 문자-에지 특징을 이용하여 텍스트를 추출하는 방법을 제안한다. 캐니(Canny)에지 연산자를 이용하여 장면 이미지로부터 에지를 추출하고, 추출된 에지로부터 16종류의 에지-맵 생성한다. 생성된 에지 맵을 재구성하여 문자 특징을 갖는 8종류의 문자-에지 맵을 만단다. 텍스트는 배경과 잘 분리되는 특징이 있으므로 텍스트에 존재하는 '문자-에지 맵'의 특징을 이용하여 텍스트를 추출한다. 텍스트 영역에 대한 검증은 문자-에지 맵의 분포와 텍스트에 존재하는 글자간의 공백 특징으로 한다. 제안한 방법은 다양한 종류의 장면 이미지를 실험대상으로 하였고, 텍스트는 적어도 2글자 이상으로 구성된다는 제한조건과 너무 크거나 작은 텍스트는 텍스트 추출에서 제외하였다. 실험결과 텍스트 영역 추출률은 약 83%를 얻었다.

  • PDF

온라인 한글인식을 위한 특징추출 신경망에 관한 연구 (Feature Extraction by Neural Network for On-line Recognition of Korean Characters)

  • 김길중;최석;남기곤;윤태훈;김재창;박의열;이양성
    • 한국통신학회논문지
    • /
    • 제17권2호
    • /
    • pp.159-167
    • /
    • 1992
  • 본 연구는 온라인 한글 필기체 인식을 위한 전처리 단계로서 다층구조 신경망을 이용하여 한글 자획의 특징을 추출하였다. 특징추출을 위한 신경망은 경쟁 자율학습하는 특성을 가진 Masking field 모델을 이용하여 구성하였다. 이 모델에 의해서 off영역이 없는 on영역만의 수용영역을 구성하여 한글 자획에 내포된 방향, 연결점 및 모서리 특징 추축을 병렬처리하였고, 이 모델의 수정에 의하여 방향유지특성을 구현하였다. 입력자획의 폭이 한 화소로 제한됨에 따라 입력 정보의 교란을 설정한 수용영역에 의하여 제거 할 수 있었다. 구성한 신경망은 순차적으로 입력되는 자획으로부터 동필특징을 추출하고, 이것을 집적하여 자획 특징을 추출한다. 한글자획의 특징추출 결과는 자획내의 방향특징들의 통계적 분포에 따르는 출력을 얻을 수 있었으며, 자획패턴이 고정되지 않은 온라인 한글 필기체의 자획인식에 유용하리라 생각된다.

  • PDF

Smith-Waterman 정렬 알고리즘을 이용한 온라인 필기체 숫자인식 (Online Handwritten Digit Recognition by Smith-Waterman Alignment)

  • 문원호;최연석;이상걸;차의영
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권9호
    • /
    • pp.27-33
    • /
    • 2011
  • 본 논문에서는 필기체 문자의 Convex-Concave한 곡선 특징을 문자로 변환하고 추출된 문자를 Smith-Waterman 정렬 알고리즘을 이용하여 온라인 필기체 숫자 인식 방법을 제안한다. 필기체 숫자 인식을 위한 입력 데이터는 시간에 순서적인 좌표로 순서화하고 전처리의 입력데이터로 적용된다. 필기자의 개성이 표현된 필기체 문자는 크기, 회전, 곡선 비율이 다양한 형태로 나타난다. 따라서 본 논문에서는 곡선의 Convex-Concave 특징을 이용하여 크기, 회전에 강인한 특징을 추출한다. 추출된 특징은 문자로 변환하고 Smith-Waterman 정렬 알고리즘의 입력데이터로 적용한다. 본 논문에서는 실시간 필기체 숫자를 대상으로 실험한 결과, 오류역전파 신경 회로망을 적용한 것과 비교하여 제안된 방법이 좋은 성능을 보였다.

한글 외곽선 폰트의 자소 분할 (Hangul Component Decomposition in Outline Fonts)

  • 구상옥;정순기
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제17권4호
    • /
    • pp.11-21
    • /
    • 2011
  • 본 논문은 한글 외곽선 폰트를 입력으로 글자의 초성, 중성, 종성 요소(컴포넌트)를 통계적-구조적 정보를 이용하여 분할하는 방법을 제안한다. 한 폰트 내에서 한글 컴포넌트는 통계적으로 일정한 위치에 나타나며, 각 컴포넌트를 이루는 획 간의 관계는 그 컴포넌트의 구조적 특징을 나타낸다. 우리는 먼저 각 컴포넌트의 위치를 저장하는 컴포넌트 히스토그램을 생성하여 컴포넌트 위치에 관한 통계 정보를 저장하였다. 그리고 글자의 구조적 정보를 반영하기 위해 픽셀의 방향성 확률을 기반으로 픽셀클러스터를 만들고, 클러스터의 위치, 방향 및 크기, 클러스터간 인접성 정보를 이용하여 후보 획을 추출하였다. 마지막으로 릴렉세이션 레이블링을 통해 후보 획 집합과 미리 정의된 글자 모델 간의 가장 적합한 구조적 매치를 구하였다. 본 논문에서 제안한 컴포넌트 분할방법은 한글 폰트의 조형적 특징에 관한 연구 및 이를 활용한 폰트분류 빛 폰트검색에 활용될 수 있다.

A Study on Automation about Painting the Letters to Road Surface

  • Lee, Kyong-Ho
    • 한국컴퓨터정보학회논문지
    • /
    • 제23권1호
    • /
    • pp.75-84
    • /
    • 2018
  • In this study, the researchers attempted to automate the process of painting the characters on the road surface, which is currently done by manual labor, by using the information and communication technology. Here are the descriptions of how we put in our efforts to achieve such a goal. First, we familiarized ourselves with the current regulations about painting letters or characters on the road, with reference to Road Mark Installation Management Manual of the National Police Agency. Regarding the graphemes, we adopted a new one using connection components, in Gothic print characters which was within the range of acceptance according to the aforementioned manual. We also made it possible for the automated program to recognize the graphemes by means of the feature dots of the isolated dots, end dots, 2-line gathering dots, and gathering dots of 3 lines or more. Regarding the database, we built graphemes database for plotting information, classified the characters by means of the arrangement information of the graphemes and the layers that the graphemes form within the characters, and last but not least, made the character shape information database for character plotting by using such data. We measured the layers and the arrangement information of the graphemes consisting the characters by using the information of: 1) the information of the position of the center of gravity, and 2) the information of the graphemes that was acquired through vertical exploration from the center of gravity in each grapheme. We identified and compared the group to which each character of the database belonged, and recognized the characters through the use of the information gathered using this method. We analyzed the input characters using the aforementioned analysis method and database, and then converted into plotting information. It was shown that the plotting was performed after the correction.

관심 문자열 인식 기술을 이용한 가스계량기 자동 검침 시스템 (Automatic gasometer reading system using selective optical character recognition)

  • 이교혁;김태연;김우주
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.1-25
    • /
    • 2020
  • 본 연구에서는 모바일 기기를 이용하여 획득한 가스계량기 사진을 서버로 전송하고, 이를 분석하여 가스 사용량 및 계량기 기물 번호를 인식함으로써 가스 사용량에 대한 과금을 자동으로 처리할 수 있는 응용 시스템 구조를 제안하고자 한다. 모바일 기기는 일반인들이 사용하는 스마트 폰에 준하는 기기를 사용하였으며, 획득한 이미지는 가스 공급사의 사설 LTE 망을 통해 서버로 전송된다. 서버에서는 전송받은 이미지를 분석하여 가스계량기 기물 번호 및 가스 사용량 정보를 추출하고, 사설 LTE 망을 통해 분석 결과를 모바일 기기로 회신한다. 일반적으로 이미지 내에는 많은 종류의 문자 정보가 포함되어 있으나, 본 연구의 응용분야인 가스계량기 자동 검침과 같이 많은 종류의 문자 정보 중 특정 형태의 문자 정보만이 유용한 분야가 존재한다. 본 연구의 응용분야 적용을 위해서는 가스계량기 사진 내의 많은 문자 정보 중에서 관심 대상인 기물 번호 및 가스 사용량 정보만을 선별적으로 검출하고 인식하는 관심 문자열 인식 기술이 필요하다. 관심 문자열 인식을 위해 CNN (Convolutional Neural Network) 심층 신경망 기반의 객체 검출 기술을 적용하여 이미지 내에서 가스 사용량 및 계량기 기물번호의 영역 정보를 추출하고, 추출된 문자열 영역 각각에 CRNN (Convolutional Recurrent Neural Network) 심층 신경망 기술을 적용하여 문자열 전체를 한 번에 인식하였다. 본 연구에서 제안하는 관심문자열 기술 구조는 총 3개의 심층 신경망으로 구성되어 있다. 첫 번째는 관심 문자열 영역을 검출하는 합성곱신경망이고, 두 번째는 관심 문자열 영역 내의 문자열 인식을 위해 영역 내의 이미지를 세로 열 별로 특징 추출하는 합성곱 신경망이며, 마지막 세 번째는 세로 열 별로 추출된 특징 벡터 나열을 문자열로 변환하는 시계열 분석 신경망이다. 관심 문자열은 12자리 기물번호 및 4 ~ 5 자리 사용량이며, 인식 정확도는 각각 0.960, 0.864 이다. 전체 시스템은 Amazon Web Service 에서 제공하는 클라우드 환경에서 구현하였으며 인텔 제온 E5-2686 v4 CPU 및 Nvidia TESLA V100 GPU를 사용하였다. 1일 70만 건의 검침 요청을 고속 병렬 처리하기 위해 마스터-슬레이브 처리 구조를 채용하였다. 마스터 프로세스는 CPU 에서 구동되며, 모바일 기기로 부터의 검침 요청을 입력 큐에 저장한다. 슬레이브 프로세스는 문자열 인식을 수행하는 심층 신경망으로써, GPU에서 구동된다. 슬레이브 프로세스는 입력 큐에 저장된 이미지를 기물번호 문자열, 기물번호 위치, 사용량 문자열, 사용량 위치 등으로 변환하여 출력 큐에 저장한다. 마스터 프로세스는 출력 큐에 저장된 검침 정보를 모바일 기기로 전달한다.

Generative Adversarial Network를 이용한 카툰 원화의 라인 드로잉 추출 (Extraction of Line Drawing From Cartoon Painting Using Generative Adversarial Network)

  • 유경호;양희덕
    • 스마트미디어저널
    • /
    • 제10권2호
    • /
    • pp.30-37
    • /
    • 2021
  • 최근 웹툰이나 애니메이션을 3D 콘텐츠로 제작하는 사례가 증가하고 있다. 3D 콘텐츠 제작에서 모델링은 반드시 필요하지만 시간이 오래 걸리는 작업이다. 드로잉 기반 모델링을 사용하여 2D 카툰 원화에서 3D 모델을 생성하기 위해서는 라인 드로잉이 필요하다. 하지만 2D 카툰원화는 3D 모델의 기하학적 특성이 표현되지 않고 카툰원화의 제작 기법이 다양하여 일관성 있게 라인 드로잉 추출이 힘들다. 본 연구에서는 generative adversarial network (GAN) 모델을 사용하여 2D 카툰 원화에서 3D 모델의 기하학적 특성을 나타내는 라인 드로잉을 추출하는 방법을 제안하고 이를 실험한다.

주색상 기반의 애니메이션 캐릭터 얼굴과 구성요소 검출 (Face and Its Components Extraction of Animation Characters Based on Dominant Colors)

  • 장석우;신현민;김계영
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권10호
    • /
    • pp.93-100
    • /
    • 2011
  • 애니메이션 캐릭터의 감정과 성격을 가장 잘 표출해 낼 수 있는 부분이 캐릭터의 얼굴이므로 애니메이션 캐릭터의 얼굴과 얼굴의 구성요소를 효과적으로 분석하여 필요한 정보를 추출하는 연구의 필요성이 증가하고 있는 추세이다. 본 논문에서는 애니메이션 캐릭터 얼굴의 특성에 맞게 수정한 메쉬모델을 정의하고, 주색상 정보를 이용하여 애니메이션 캐릭터의 얼굴과 얼굴의 구성요소를 효과적으로 검출하는 방법을 제안한다. 제안된 시스템은 먼저 애니메이션 캐릭터 얼굴에 맞는 메쉬모델을 생성하고, 이 메쉬모델을 처음 입력되는 애니메이션 캐릭터의 얼굴에 정합시켜 얼굴과 얼굴의구성요소에 대한 주색상 값을 추출한다. 그리고 추출된 주색상 값을 이용하여 새롭게 입력되는 영상으로부터 캐릭터의 얼굴과 얼굴 구성요소의 후보 영역을 선정한 후, 모델로부터 추출한 주색상 정보와 후보 영역들의 주색상 사이의 유사도를 측정하여 최종적인 애니메이션 캐릭터의 얼굴과 얼굴의 구성요소를 검출한다. 본 논문의 실험에서는 제안된 애니메이션 캐릭터 얼굴과 구성요소 검출 방법의 성능을 평가하기 위한 실험결과를 보인다.

퍼지 멤버쉽 함수로 최적화된 LVQ를 이용한 패턴 분류 모델 (Pattern Classification Model using LVQ Optimized by Fuzzy Membership Function)

  • 김도현;강민경;차의영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권8호
    • /
    • pp.573-583
    • /
    • 2002
  • 패턴인식은 전처리 과정에서 패턴들의 특징을 추출하고 이를 학습을 통하여 유사한 패턴들끼리 클러스터링을 한 다음 식별 과정을 거쳐 인식하게 된다. 본 연구에서는 OCR 시스템에서의 패턴 인식을 위한 패턴 분류 모델로서 퍼지 멤버쉽 함수를 도입하여 LVQ 학습 알고리즘을 최적화한 F-LVQ(Fuzzy Learning Vector Quantization)를 제안한다 본 논문의 효율성을 검증하기 위하여 한글 및 영어 22종의 글꼴에 대한 숫자 데이타 220개 패턴을 학습한 후 이를 다양한 형태로 변형시킨 4840개의 테스트 패턴에 대하여, 기존의 여러 가지 패턴 분류 모델과의 비교 분석을 통해 그 유효성과 강인성을 증명하였다.

개미 군락 시스템을 이용한 개선된 에지 검색 알고리즘 (Improved Edge Detection Algorithm Using Ant Colony System)

  • 김인겸;윤민영
    • 정보처리학회논문지B
    • /
    • 제13B권3호
    • /
    • pp.315-322
    • /
    • 2006
  • 개미 군락 시스템(Ant Colony System, ACS)은 조합 최적화 문제 중의 하나인 방문 판매원 문제에(Traveling Salesman Problem, TSP) 간단하게 응용할 수 있고 좋은 결과를 보여주었으며 최근에는 영상처리 분야의 패턴 인식, 영상 추출, 에지 검색 등에 응용되고 있다. 에지 검색은 검색된 에지를 이용하여 문서 분류, 문자 인식, 얼굴 인식 등과 같은 분야에서 다양하게 응용될 수 있다. 기존의 연산자 위주의 에지 검색 기법들은 에지를 명확하게 검색한다고 해도 이 검색 결과를 이용하여 다음 단계의 영상처리를 위해서는 그 목적에 맞도록 새로운 후처리 작업을 거쳐야 한다는 단점이 있다. 본 연구에서는 개미 군락 시스템의 특성을 이용하여 에지의 명확한 검색뿐 아니라, 좀 더 안정적이고(robustness) 유연성을(flexibility) 갖는 에지 검색 기법을 제안하며 실제 디지털 영상에 적용하였을 때 만족할 만한 결과를 얻을 수 있었다.