• 제목/요약/키워드: 문자특징 추출

검색결과 252건 처리시간 0.023초

딥러닝 기반 미얀마 문자의 특징 추출 및 인식 (Feature Extraction and Recognition of Myanmar Characters Based on Deep Learning)

  • 옴마킨;이성근
    • 한국전자통신학회논문지
    • /
    • 제17권5호
    • /
    • pp.977-984
    • /
    • 2022
  • 최근 동남아시아의 경제발전에 따라 정보기기의 활용이 광범위하게 확산되고 있으며, 지능적 문자인식을 이용한 응용서비스에 대한 수요가 증가하고 있다. 본 논문은 동남아시아 국가 중 하나인 미얀마 문자에 대한 딥러닝 기반 특징 추출 및 인식에 대해 논한다. 특징 추출에는 미얀마 알파벳(33자)과 숫자(10자리)를 사용한다. 본 논문은 9개의 특징을 추출하고 3개 이상의 새로운 특징을 제안한다. 각 문자와 숫자의 특징을 추출하여 성공적인 결과로 표현하였다. 인식 부분에서는 합성곱 신경망을 사용하여 문자 구분에 대한 실행을 평가한다. 제안한 알고리즘은 캡처된 이미지 데이터 세트에 구현되고, 이에 대한 성능을 평가한다. 입력 데이터 세트에 대한 모델의 정밀도는 96%이며 실시간 입력 이미지를 사용한다.

자연영상에서 문자의 크기와 문자열의 방향에 적응적인 문자-에지 맵을 이용한 문자열 검출 (Character String Detection using Character-Edge Map with Adaptive Character Size and Character String Orientation in Natural Images)

  • 박종천;황동국;;전병민
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2007년도 추계학술발표논문집
    • /
    • pp.262-265
    • /
    • 2007
  • 이미지 데이터베이스 시스템에서 이미지에 포함된 문자정보를 기반으로 검색어를 사용한다면 검색의 정확도 높일 수 있다. 이미지에서 문자정보를 추출을 위한 전단계로서 문자열 영역 검출이 필수적인 과제가 된다. 그러므로 본 논문에서는 문자의 크기와 문자열의 방향에 적응적인 문자-에지 맵을 이용한 문자열 영역 검출 방법을 제안한다. 캐니-에지 검출기로 에지를 추출하고, 생성된 에지 이미지로 레이블 이미지를 얻고, 그 영역의 문자구조 특징을 분석하기 위해서 배열문법으로 문자-에지 맵에 적응적으로 분석한다. 문자-에지 맵의 분석결과로서 문자열 후보 영역을 얻고, 문자열 영역의 구조적인 특징을 이용하여 문자열 후보 영역을 검증함으로서 최종적인 문자열 영역을 검출한다. 제안한 방법은 다양한 종류의 자연영상을 대상으로 실험하였고, 자연영상에서 기울어진 문자열과 다양한 크기의 문자를 갖는 문자열 영역을 효과적으로 검출하였다.

  • PDF

PCA 기반 얼굴 인증과 SOM 알고리즘을 이용한 여권 인식 (Passport Recognition using PCA-based Face Verification and SOM Algorithm)

  • 이상수;장도원;김광백
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2006년도 춘계종합학술대회
    • /
    • pp.285-290
    • /
    • 2006
  • 본 논문에서는 출입국자 관리의 효율성과 체계적인 출입국 관리를 위하여 여권 코드를 자동으로 인식하고 위조 여권을 판별할 수 있는 여권 인식 및 얼굴 인증 방법을 제안한다. 본 논문의 구성은 여권 인식과 얼굴 인증 부분으로 구성되며, 여권 인식 부분에서는 소벨 연산자, 수평 최소값 필터 등을 적용한 후, 8 방향 윤곽선 추적 알고리즘을 적용하여 코드의 문자열 영역을 추출하고 기울기를 보정한다. 추출된 문자열은 반복 이진화 방법을 적용하여 코드의 문자열 영역을 이진화 한다. 이진화된 문자열 영역에 대해 8 방향 윤곽선 추적 알고리즘을 적용하여 개별 코드를 추출한 후에 SOM(Self-Organizing Maps) 알고리즘을 적용하여 여권 코드를 인식한다. 얼굴 인증 부분에서는 여권 사진 영역의 특징을 이용하여 얼굴 후보 영역을 추출한 후, RGB와 YCbCr 색공간에서 피부색 정보를 이용하여 얼굴 영역을 추출한다. 추출된 얼굴 영역은 PCA(Principal Component Analysis) 알고리즘을 적용하여 특징 벡터를 구하고 여권 코드가 인식된 결과를 바탕으로 여권 소지자의 데이터 베이스에 있는 얼굴 영상의 특징벡터와의 거리 값을 계산하여 사진 위조 여부를 판별한다. 제안된 여권 인식 및 얼굴 인증 방법의 성능 평가를 위하여 원본 여권의 얼굴 부분을 위조한 여권과 기울어진 여권 영상을 대상으로 실험한 결과, 제안된 방법이 여권의 코드 인식 및 얼굴 인증에 있어서 우수한 성능이 있음을 확인하였다.

  • PDF

MST를 이용한 문자 영역 분할 방법 (A Method for Character Segmentation using MST(Minimum Spanning Tree))

  • 전병태;김영인
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권3호
    • /
    • pp.73-78
    • /
    • 2006
  • 기존의 문자 영역 추출 방법은 전체 영상으로부터 컬러 영역 분할이나 프레임 차 방법을 이용하였다. 이들 방법은 휴리스틱에 많이 의존하므로 추출하려는 문자의 사전 정보를 가지고 있어야한다는 점과 구현에 많은 어려움이 존재한다. 본 논문에서는 휴리스틱한 부분을 줄이고 알고리즘을 단순화한 방법을 제안하고자 한다 문자의 지형학적 특징점을 추출하고 이 점들을 MST(Minimum Spanning Tree)를 형성하여 문자의 후보 영역을 추출한다. 문자 영역을 후보 영역의 검증을 통하여 추출한다. 실험 결과 문자의 후보 영역 추출율은 100%이었으며 최종 문자 영역 추출율은 98.2%이었다. 또한 복잡한 영상에서 존재하는 문자 영역도 잘 추출됨을 볼 수 있다.

  • PDF

네비게이션을 위한 문자영상기반의 영상매칭 방법 (Text Cues-based Image Matching Method for Navigation)

  • 박안진;정기철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.631-633
    • /
    • 2005
  • 유비쿼터스 시대가 다가오면서, 많은 사람들은 모르는 장소에서 자신의 위치와 목적지까지의 경로에 대한 정보를 알고 싶어할 것이다. 기존의 네비게이션(navigation)을 위한 비전기술은 고차원과 저차원 특징값을 이용하였다. 텍스춰 정보, 색상 히스토그램과 같은 저차원 특징값은 영상의 특징을 정확하게 표현하기 어려우며, 마커와 같은 고차원 정보는 실험환경을 구축하는데 어려움이 있다. 우리는 기존 저/고차원의 특징값 대신, 영상의 특징을 표현하고 인덱싱(indexing)하기 위한 유용한 정보를 많이 포함하고 있으며, 실제환경에서 널리 분포되어있는 중차원 특징값인 문자영상을 이용한다. 문자영상추출은 MLP(Multi-layer perceptron)와 CAMShift알고리즘을 결합한 방법을 이용하며, 서로 다른 장소지만 같은 문자를 가진 곳에서 인식을 수행하기 위해 문자영상의 크기와 기울기를 기반으로 한 영상 검색공간을 대상으로 영상매칭을 수행한다. 실험에서 문자영상을 포함하는 직사각형 검색공간으로 인해 다양한 크기와 기울기에서 높은 인식률을 보이며, 간단한 계산으로 빠른 수행시간을 가진다.

  • PDF

퍼지추론을 이용한 한글 문자 인식:최대 길이 투영에 의한 한글 문자 유형 분류 (Hangul Character Recognition Using Fuzzy Reasoning:Hangul Character Type Classification by Maximum Run Length Projenction)

  • 이근수;최형일
    • 인지과학
    • /
    • 제3권2호
    • /
    • pp.249-270
    • /
    • 1992
  • 본 논문은 입력 문자에 대한 특징 추출을 위하여 최대 길이 투영(MRLP:Maximum Run Length Project)방법을 제안한다. 제안된 최대길이 투영 방법은 잡음에 강하며 필요한 정보를 가능한 정확하고 효율적으로 추출하는데 유용하다.한글문자는 그 양이 방대하고 그 구조가 복잡하며 몬자들 사이에 밀접한 유사성이 있다.따라서 본 논문에서는 추출된 특징들에 대한 퍼지추론을 적용하여 유형 분류율의 향상을 도모하였다.사용 빈도수가 높은 인쇄체 한글 문자 917자에 대하여 실험한 결과 98.58%의 분류율을 얻었다.

한글 문자의 전자계산조직에 적응하기 위한 특징추출에 관한 연구(I) (A Method For the Recognition of Printed Korean Characters)

  • 이주근
    • 대한전자공학회논문지
    • /
    • 제6권4호
    • /
    • pp.8-19
    • /
    • 1969
  • 우리 문자는 자모의 조합된 언어문자이기 때문에 그 수가 방대하여 수천개의 식별기구를 필요로 할 뿐만 dkl니라 재조가 복잡하며 대부분이 유이문자이기 때문에 Patttern 인식문제에 잇어서는 허다한 난점이 있다. 따라서 이들 재조상에서 오는 문제점을 분석, 평가하하여 최적조건을 결정하고, 특징추출에 노이적별함수의 적용은 다른 문자에서는 볼 수 없는 한글 문자에 관한 한 특수한 장점으로 나타난다는 것을 확인하여다. 이 특수점을 Systen의 서례에 최대한으로 적용하여 3분지 1이상의 System축소를 보았다. 인식방버버으로서는 표본 Pattern을 추출해 내서 Register에 기제한 다음 인식 Matrix에 의하여 식별하였다. 식별된 문자는 판정논리에 의하여 특수Parameter를 추출하였다. 이논적인 입증을 위한 몇가지의 실험적인 검사를 가하였으며 이 과정에서 얻어진 모든 자료들은 이 분양의 연구에 매우 유익한 기초자료를 제공할 것이로 보며, 한글문자의 Patterndlstlr에 관한 실마리가 잡혀졌다고 보겠다.

  • PDF

카오스 이론을 이용한 한글 문자 특징 추출에 관한 연구 (Feature Extraction of Hangul Character Based on Chaos Theory)

  • 손영우;남궁재찬;홍경순
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.315-317
    • /
    • 1999
  • 미세한 차이를 고감도 식별하는 카오스 이론의 프랙탈 차원과 스트레인즈 어트랙터를 생성하는 수정된 에농 함수를 이용하여, 한글 2,350자에 대한 시계열 데이터의 혼도도를 분석하기 위해, 각각의 문자 0트랙터를 구성한 후, 프랙탈 차원을 나타내는 Box-counting Dimension 및 Natural Measure, Information Bit, Information Dimension 등을 구하여 문자 특징을 추출하는 새로운 알고리즘을 제시하였다. 실험결과 한글 2,350자에 대하여 99.23%의 분류율을 나타내어 제안된 방법의 유효성을 보였다.

  • PDF

무제약 필기체 한글분할을 위한 가상 분할경로 생성 (Virtual Segmentation Path Construction for Unconstrained Handwritten Hangul Segmentation)

  • 박성호;조범준
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2004년도 춘계학술발표대회논문집
    • /
    • pp.827-830
    • /
    • 2004
  • 현재까지도 대부분의 필기체 한글 인식은 완벽한 분할을 가정하여 개발되고 있으며 한글 분할 그 자체에 대한 관심은 매우 낮은 편이다. 또한 한글은 자소의 모아쓰기 형태를 갖고 있어 문자내에 여백이 존재할 뿐만 아니라 문자와 문자 사이의 접촉되는 특징이 흔히 발생되기 때문에 기존의 영문자에 사용된 방법을 그대로 직접 적용하기에는 많은 어려움이 있다. 본 논문에서는 무제약 필기체 한글을 분할하기 위하여 가상 분할경로를 이용하는 방법을 제안한다. 제안된 방법은 기존의 분할 방법들이 갖는 직선화된 분할경로 뿐만 아니라 문자내에 존재하는 여백의 정보를 활용하여 꺽은선 분할경로를 주로 이용하는데 특징이 있다. 분할과정은 크게 2단계로 구성되는데 첫 번째 단계는 입력받은 한글 문자열에 대한 전처리 과정과 수직투영을 통해 직선화된 분할경로를 찾고 이에 따라 쉽게 분할 가능한 문자와 중첩되거나 접촉된 문자를 구분하여 다음 단계의 분할대상으로 결정한다. 두 번째 단계에서는 다양한 가상의 꺽은선 분할경로를 생성하기 위하여 각 문자에서 특징점을 추출하고, 인접한 특징점들 간의 무게 중심점을 찾아서 더 세밀한 경로 생성을 함으로서 가장 최상의 분할경로를 결정한다.

  • PDF

자연 영상에서 문자열 추출 (Text Location in Scene Images)

  • 최미화;김희승
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.389-391
    • /
    • 2000
  • 본 논문을 자연여상에서 문자열의 위치를 찾아내는데 모폴로지 연산인 WTH(white top-hats)과 BTH(black top-hars)을 사용하였다. 기존의 자연영상에서의 문자열추출은 칼라양자화방법 경우 각 칼라공간에서 문자열 추출과정을 반복 적용하거나 모델기반방법의 경우 문자열의 획의 크기나 특징에 따라서 하나의 영상을 여러 개로 분리 적용하여 추가적인 계산비용을 필요로 한다는 점을 개선하고 공간적 변화도를 이용하여 영상을 직접 처리하는 경우 최소 문자열 후보영역을 찾기 위한 프로세스를 다시 적용해야 한다는 점을 개선하였다. 자연영상에 문자열의 위치를 대략적으로 찾아내기 위해 WTH+BTH을 적용하여 그 결과로 문자열의 대략적 위치와 최소문자열후보영역을 동시에 얻을 수 있다. 문자열이 가지는 특성을 적용하여 문자열-비문자열 분류과정을 적용하고 후처리를 통해 완전한 문자열의 위치를 보여준다.

  • PDF