• 제목/요약/키워드: 글자 인식

검색결과 182건 처리시간 0.029초

계층적 신경회로망을 이용한 한글 패턴 분류에 관한 연구 (A Study on the Classification of Hangeul Patterns Using Hierarchical Neural Network)

  • 김도현;이병모;차의영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.569-572
    • /
    • 2002
  • 한글을 인식하기 위한 전처리 방법으로 흔히 모음의 종류 및 자음과의 결합 정도에 따라 6가지 유형으로 분류하는 방법을 많이 사용하고 있다. 간 논문에서는 이러한 한글 문자를 인식하기 위한 전처리 과정으로써 한글의 유형을 분류하는 방법에 대한 연구로 계층적인 신경회로망을 도입하여 빠르고 신뢰성 있는 분류 방법을 제안한다. 실험에 사용된 글자는 KS X 1001(KS C 5601) 완성형 글자 2,350개에 대한 굴림, 바탕, 돋움, 궁서 글꼴로 총 9400개의 이미지 파일을 사용하였으며. 이 중 일부는 훈련에 사용하고 나머지는 분류를 위한 테스트 데이터로 사용한 결과 약 94%의 유형 분류율과 개별 패턴을 5.67ms에 분류하는 빠른 분류 속도를 나타내었다.

  • PDF

텍스트 문서 인식을 위한 학습 기반 단어 분할 (Learning-based Word Segmentation for Text Document Recognition)

  • 로말리자쟝피에르;문광석;박한훈
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 하계학술대회
    • /
    • pp.41-42
    • /
    • 2018
  • 텍스트 문서 영상으로부터 단어를 검출하고, LLAH(locally likely arrangement hashing) 알고리즘을 이용하여 이웃 단어 사이의 기하 관계를 표현하는 특징 벡터를 계산한 후, 특징 벡터를 비교함으로써 텍스트 문서를 효과적으로 인식하거나 검색할 수 있다. 그러나, 이는 문서 내 각 단어가 정확하고 강건하게 검출된다는 전제를 필요로 한다. 본 논문에서는 텍스트 내 각 라인을 검출하고, 각 라인 내에서 단어 사이의 간격과 글자 사이의 간격을 깊은 신경망(deep neural network)을 이용하여 학습하고 분류함으로써, 보다 카메라와 텍스트 문서 사이의 거리나 방향이 동적으로 변하는 조건에서 각 단어를 강건하게 검출하는 방법을 제안한다. 모바일 환경에서 제안된 방법을 구현하였으며, 실험을 통해 단어 사이의 간격과 글자 사이의 간격을 92.5%의 정확도로 구별할 수 있으며, 이를 통해 동적인 환경에서 단어 검출의 강건성을 크게 개선할 수 있음을 확인하였다.

  • PDF

딥러닝을 이용한 번호판 검출과 인식 알고리즘 (License Plate Detection and Recognition Algorithm using Deep Learning)

  • 김정환;임준홍
    • 전기전자학회논문지
    • /
    • 제23권2호
    • /
    • pp.642-651
    • /
    • 2019
  • 최근 지능형 교통관제 시스템에 관한 다양한 연구가 진행되고 있는 가운데 번호판 검출과 인식 알고리즘은 가장 중요한 요소 중에 하나로 대두되고 있다. 번호판은 차량의 고유 식별값을 가지고 있기 때문이다. 기존의 차량 통행 관제 시스템은 정차를 기반으로 하고 있으며 차량의 입출입 인식 방법으로 루프 코일을 사용하고 있다. 이러한 방법은 교통 정체를 유발하고 유지보수 비용이 상승하는 단점을 가지고 있다. 본 논문에서는 이러한 문제점을 해결하기 위해서 차량의 입출입 인식 방법으로 카메라 영상을 사용한다. 차량 통행 관제 시스템의 특성상 카메라가 고정되어 있다. 이에 차량이 접근하면 카메라의 배경화면이 달라진다. 이 특징을 이용하여 배경화면의 차분영상을 구하면 차량의 입출입을 인식할 수 있다. 입출입 인식 후 한국 번호판의 형태학적 특성을 이용하여 후보 이미지를 추정한다. 그리고 선형 SVM(Support Vector Machine)을 이용해서 최종 번호판을 검출한다. 검출한 번호판의 글자와 숫자 인식 방법으로는 CNN(Convolutional Neural Network) 알고리즘을 사용한다. 제안한 알고리즘은 기존의 시스템과 달리 검출 위치를 기준으로 글자와 숫자를 인식하기 때문에 번호판의 규격이 변해도 인식할 수 있다. 실험한 결과 기존의 번호판 인식 알고리즘들 보다 제안한 알고리즘이 더 높은 인식률을 가진다.

명암도 변화와 Canny 에지를 이용한 컨테이너 영상의 문자인식에 관한 연구 (A Study on Character Recognition of Container Image using Brightness Variation and Canny Edge)

  • 남미영;임은경;허남숙;김광백
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 춘계학술발표논문집
    • /
    • pp.111-115
    • /
    • 2001
  • 컨테이너 영상의 문자를 인식하는데 있어 정규화 되어 있지 않은 컨테이너 영상의 문자영역을 추출한다는 것은 어렵다. 색깔. 위치, 글자 크기 등이 정해져 있지 않기 때문에 일정한 규칙으로 찾기는 힘들다. 따라서 본 논문에서는 이러한 특성을 고려하여 형태학적인 특성이 아니라 명암도를 조사하여 문자가 분포할 가능성이 있는 후보 영역을 찾고 Canny 에지 추출 기법과 에지 추적 기법으로서 문자가 있는 영역을 추출한다. 추출된 컨테이너의 문자 영역에서 히스토그램 방법을 이용하여 개별 문자를 추출하고 ART 알고리즘을 이용하여 인식한다. 실험 결과에서는 여러 영상에 대해 인식율이 우수한 것을 보인다.

  • PDF

상호활성화모형에 기반한 문자인식방법의 타당성 평가 (Viability of Korean character recognition method based on IAM)

  • 김상기;박창수;방승양;김대진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.547-549
    • /
    • 2001
  • 여기서 우리는 한국어의 글자를 인식하기 위한 계산모형을 제시한다. 이 모형은 상호활성화모형에 기반하고 있으나, 입력처리부분이 개선되었다. 우리는 기존의 상호활성화모형에서 모든 입력이 규격화된 형태라는 가정을 배제하였다. 또한 우리는 성능향상을 위하여 다중해상도경로 학설을 결합시켰다. 우리는 제안된 모형을 구현하고, 그것을 실제 자료에 적용해 보았다. 우리는 모의실험결과를 통하여 제안된 모형이 실용적인 의미를 갖고 있음과 다중해상도 경로가 실제적으로 인식 성능 향상에 도움을 주고 있음을 확인 할 수 있었다.

  • PDF

상호활성화모형과 다중해상도경로에 기반한 문자인식을 위한 계산 모형 (A computational model for character recognition based on multi-resolution channels and IAM)

  • 박창수;김상기;방승양;김대진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.314-316
    • /
    • 2000
  • 여기서 우리는 한국어의 글자를 인식하기 위한 계산모형을 제시한다. 이 모형은 상호활성화 모형에 기반하고 있으나, 입력처리부분이 개선되었다. 우리는 기존의 상호활성화모형에서 모든 입력이 규격화된 형태라는 가정을 배제하였다. 또한 우리는 성능향상을 위하여 다중해상도경로 학설을 결합시켰다. 우리는 제안된 모형을 구현하고, 그것을 실제 자료에 적용해 보았다. 우리는 모의실험결과를 통하여 제안된 모형이 실용적인 의미를 갖고 있음과 다중해상도 경로가 실제적으로 인식 성능 향상에 도움을 주고 있음을 확인할 수 있었다.

  • PDF

제스처를 이용한 애니메이션 구현 (Animation Maker Using Gestures)

  • 이광조;양성봉
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(B)
    • /
    • pp.188-191
    • /
    • 2010
  • 최근 다양한 2D 기반 스케치 기법이 제시되고 이를 활용한 다양한 어플리케이션이 제작되고 있다. 이러한 스케치 기법들은 사용자의 인터페이스에 많은 영향을 주고 있다. 그 중에 제스처 기법은 사용자의 글자 인식과 메뉴의 빠른 접근을 위해서 널리 사용되고 있다. 본 논문에서는 페이퍼 커팅 기법이라고 불리는 예술 분야의 기술을 구현하기 위해서 제스처를 활용한 인터페이스를 제시하고 향후에 이를 응용한 모바일 분야에서의 응용에 대하여 고찰해 보았다. 본 논문에서는 구현을 위하여 제스처 인식 방법을 위한 스케치 인식과 애니메이션을 위한 시간 조정 방법을 제시 하였다.

  • PDF

GoogLenet 기반의 딥 러닝을 이용한 향상된 한글 필기체 인식 (Improved Handwritten Hangeul Recognition using Deep Learning based on GoogLenet)

  • 김현우;정유진
    • 한국콘텐츠학회논문지
    • /
    • 제18권7호
    • /
    • pp.495-502
    • /
    • 2018
  • 딥 러닝 기술의 등장으로 여러 나라의 필기체 인식은 높은 정확도 (중국어 필기체 인식은 97.2%, 일본어 필기체 인식은 99.53%)를 보인다. 하지만 한글 필기체는 한글의 특성으로 유사글자가 많은데 비해 문자의 데이터 수는 적어 글자 인식에 어려움이 있다. 하이브리드 러닝을 통한 한글 필기체 인식에서는 lenet을 기반으로 하여 낮은 레이어를 가진 모델을 사용하여 한글 필기체 데이터베이스 PE92에서 96.34%의 정확도를 보여주었다. 본 논문에서는 하이브리드 러닝에서 사용하였던 데이터 확장 기법(data augmentation)이나 multitasking을 사용하지 않고도 GoogLenet 네트워크를 기본으로 한글 필기체 데이터에 적합한 더 깊고 더 넓은 CNN(Convolution Neural Network) 네트워크를 도입하여 PE92 데이터베이스에서 98.64%의 정확도를 얻었다.

비트맵 파라미터를 이용한 온라인 필기체 문자인식 (Online Cursive Handwriting Character Recognition Using a Bitmap Parameter)

  • 석수영;김민정;정호열;정현열
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.421-424
    • /
    • 2001
  • 개별적인 인식기를 하나의 단일 인식 시스템으로 구성하여 음성과 문자를 인식할 수 있는 공용인식시스템의 성능향상을 위해 온라인 필기에서 전역적인 정보를 추출할 수 있는 비트맵 파라미터 추출 방법을 제안하였다. 제안된 방식에서는 고속의 파라미터 추출을 위해 보간법을 이용한 재샘플링 과정 대신에 새로운 시간열을 구성하는 방식을 이용한다. 제안한 비트맵 파라미터를 본 연구실에서 개발한 음성/문자 공용인식 시스템에 적용하기 위하여 67개의 자소를 5상태 10천이 CHMM(Continuous Hidden Markov Model)모델로 구성한 다음 인식알고리즘으로서는 상태단위로 지속 시간 정보를 제어하는 OnePassDP법을 이용하였다. 실험결과, 제안한 방법을 이용한 경우, 자소인식률은 61.3%에서 85.3%로 24%의 인식률 향상을 가져왔으며, 글자인식률은 64.3%에서 82.2%로 17.9%의 인식률 향상을 가져와 제안한 방법의 유효성을 확인할 수 있었다.

  • PDF

오픈소스를 이용한 문자/음성 인식 및 번역 앱 개발 (Text/Voice Recognition & Translation Application Development Using Open-Source)

  • 윤태진;서효종;김도헌
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2017년도 제56차 하계학술대회논문집 25권2호
    • /
    • pp.425-426
    • /
    • 2017
  • 본 논문에서는 Google에서 지원하는 오픈소스인 Tesseract-OCR을 이용한 문자/음성 인식 및 번역 앱에 대해 제안한다. 최근 한국어를 포함한 외국어 인식과 번역기능을 이용한 다양한 스마트폰 앱이 개발되어 여행에 필수품으로 자리잡고 있다. 스마트폰의 카메라기능을 이용하여 촬영한 영상을 인식률을 높이도록 처리하고, Crop기능을 넣어 부분 인식기능을 지원하며, Tesseract-OCR의 train data를 보완하여 인식률을 높이고, Google 음성인식 API를 이용한 음성인식 기능을 통해 인식된 유사한 문장들을 선택하도록 하고, 이를 번역하고 보여주도록 개발하였다. 번역 기능은 번역대상 언어와 번역할 언어를 선택할 수 있고 기본적으로 영어, 한국어, 일본어, 중국어로 번역이 가능하다. 이 기능을 이용하여 차량번호 인식, 사진에 포함된 글자를 통한 검색 등 다양한 응용분야에 맞게 앱을 개발할 수 있다.

  • PDF