• 제목/요약/키워드: 한글 문자 인식

검색결과 326건 처리시간 0.033초

퍼지소속함수를 이용한 온라인 한글 인식 (On-line Recognition in Korean Character Using Fuzzy Membership Function)

  • 심영철;오경환
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1991년도 제3회 한글 및 한국어정보처리 학술대회
    • /
    • pp.300-306
    • /
    • 1991
  • 본 논문에서는 온라인 한글 인식을 위하여 퍼지소속함수를 사용하였다. 획의 오인식으로 인한 문자의 오인식 문제를 해결하기 위하여 인식 시스템 내에서 획을 퍼지집합으로 표현하며, 자모를 인식하는데 사용되는 획의 중심점들 간의 방향은 퍼지소속 함수로 정의하여 추론한다. 본 논문에서 제시하는 퍼지추론 방법은 같은 획으로 시작되는 모든 자소에 대하여 적용되며, 애매모호한 상황하에서도 인식을 수행한다. 따라서 퍼지소속함수를 사용한 시스템은 종래에 오인식 되었던 애매한 글자들을 정확하게 인식할 수 있었다.

  • PDF

신경회로망과 기억이론에 기반한 한글영상 인식과 복원 (The Hangeul image's recognition and restoration based on Neural Network and Memory Theory)

  • 장재혁;박중양;박재홍
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.17-27
    • /
    • 2005
  • 본 논문에서는 문자인식과 복원을 위한 신경회로망 시스템을 제안한다. 제안하는 시스템은 인식부와 연상부로 구성되었다. 인식부에서는 ART 신경회로망의 인식성능을 개선하기 위해 불필요한 하향틀의 생성과 변화를 제한하여 효과적인 패턴인식이 가능한 모델을 제안하였다. 또한, 한글의 구조적인 특징을 능동적으로 적용할 수 있게 구성된 위치특징 추출 알고리즘을 적용하였다. 연상부에서는 Hopfield 신경회로망으로, 입력된 이미지 패턴의 복원이 가능한 모델을 구성하였다. 제안하는 시스템은 그 성능을 확인하기 위해 각 부분별 실험을 하였다. 그 결과 인식율이 개선되고 복원이 가능함을 보였다.

  • PDF

인쇄체 한글문자 인식을 위한 계층적 신경망 (A Hierarchical Neural Network for Printed Hangul Character Recognition)

  • 조성배;김진형
    • 인지과학
    • /
    • 제2권1호
    • /
    • pp.33-50
    • /
    • 1990
  • 기존의 방법으로 해결하기 어려운 문제를 풀기 위하여 최근에는 인간늬 두뇌 구조를 모델링한 신경망이 새로운 방법으로 도입되고 있다. 본 논문에서는 여러가지 지각 심리학적 연구에 근거를 두고 신경망을 통한 인쇄체 한글인 식 시스템을 구축한 후, 몇가지 실험을 통하여 신경망 기법이 인간과 유사한 특성을 나타냄을 살펴보았다. 상용하는 990자에 대하여 실험한 결과 오인식 된 문자의 혼동패턴이 기존의 연구결과와 비슷하였으며, 학습하지 않은 문자도 어느정도 인식해 내는 일반화 능력이 있음을 볼 수 있었다. 또, 학습이 잘되지 않는 문자를 좀더 반복하여 경우 학습속도가 향상됨을 볼 수 있었다.

위상회전에 의한 필기체 한글의 자동인식 (Automatic Recognition of Hand-written Hangout by the Phase Rotation)

  • 이주근;김홍기
    • 대한전자공학회논문지
    • /
    • 제13권1호
    • /
    • pp.23-30
    • /
    • 1976
  • 이 논문에서는 위상회전에 의한 오목구조의 짐출로서 필기체 한글을 인식하는 한 방법을 검토한다. 문자 Pattern를 오목구조적인 기본 Segment로 분해하여 집합으로 분류하고, 그들 집함에 대한 각 Segment의 폐상태와 위상특징을 logic으로 표현한다. 다음 그들 logic pattern의 위상회전으로서 오목구조의 topological성질과 위상특징을 검출하여 문자를 결정한다. 이 방법은 필기체의 변화와 문자의 대소, 경사 띤 위치 변위에 대한 식별의 유연성을 가지며, 인식율이 높다. In this paper, a method is proposed for the recognition of hand-written Hangeul. This is peiformed by extraction of the concave structural segments by phase rotation. Character patterns can be decomposed into the fundamental concave structural segments which are also categorized into segment sects, and the closure and phase features of each segment in set is represented by logics. By rotating the logic pattern, the topological and phase features of segment are extracted for the reliable recognition of the character. It is also evaluated that this method applies to a wide variety of shape, position and declination of the character.

  • PDF

중간점 알고리즘을 이용한 신경회로망 필기체 패턴인식 (Neural Network Handwriting Recognition Using Middle Point Algorithm)

  • 소아람;신병석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.394-397
    • /
    • 2007
  • 본 논문에서는 문자 인식의 특징 선별 방법으로 중간점 알고리즘을 이용하는 방법을 제안한다. 영상자료의 특징들로부터 중간점을 선별하고 심볼패턴을 이용하여 필기체 문자를 인식한다. 이 방법은 사전에 많은 심볼 패턴을 학습해야 하지만 한글과 영어의 높은 인식률을 보이고 있으며, 특히 복잡한 문자들의 경우 좋은 결과를 낸다. 여기서는 중간점 알고리즘으로 입력된 데이터를 심볼 패턴과 비교하고, 심볼 영역에 의해 최적 판별 기저를 탐색한 후, 그것을 특징으로 선택한다. 또한 사전 기능과 투명도 기능을 구현하여 필기체 인식을 이용한 여러 활용 방안을 제시한다.

  • PDF

문자 기반 LSTM-CRF 한국어 개체명 인식을 위한 사전 자질 활용 (Lexicon Feature Infused Character-Based LSTM CRFs for Korean Named Entity Recognition)

  • 민진우;나승훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.99-101
    • /
    • 2016
  • 문자 기반 LSTM CRF는 개체명 인식에서 높은 인식을 보여주고 있는 LSTM-CRF 방식에서 미등록어 문제를 해결하기 위해 단어 단위의 임베딩 뿐만 아니라 단어를 구성하는 문자로부터 단어 임베딩을 합성해 내는 방식으로 기존의 LSTM CRF에서의 성능 향상을 가져왔다. 한편, 개체명 인식에서 어휘 사전은 성능 향상을 위한 외부 리소스원으로 활용하고 있는데 다양한 사전 매칭 방법이 파생될 수 있음에도 이들 자질들에 대한 비교 연구가 이루어지지 않았다. 본 논문에서는 개체명 인식을 위해 다양한 사전 매칭 자질들을 정의하고 이들을 LSTM-CRF의 입력 자질로 활용했을 때의 성능 비교 결과를 제시한다. 실험 결과 사전 자질이 추가된 LSTM-CRF는 ETRI 개체명 말뭉치의 학습데이터에서 F1 measure 기준 최대 89.34%의 성능까지 달성할 수 있었다.

  • PDF

한글 문장의 자동 띄어쓰기를 위한 어절 블록 양방향 알고리즘 (Eojeol-Block Bidirectional Algorithm for Automatic Word Spacing of Hangul Sentences)

  • 강승식
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권4호
    • /
    • pp.441-447
    • /
    • 2000
  • 자동 띄어쓰기는 띄어쓰기가 무시된 한글 문서의 자동색인이나 문자인식 시스템에서 줄바꿈 문자에 대한 공백 삽입 문제 등을 해결하는데 필요하다. 이러한 문서에서 공백이 삽입될 위치를 자동으로 찾아주는 자동 띄어쓰기 알고리즘으로 문장 분할 기법과 양방향 최장일치법을 이용한 어절 인식 방법을 제안한다. 문장 분할은 한글의 음절 특성을 이용하여 어절 경계가 비교적 명확한 어절 블록을 추출하는 것이며, 형태소 분석기를 이용한 양방향 최장일치법에 의해 어절 블록에 나타난 각 어절들을 인식한다. 4,500여 어절로 구성된 두 가지 유형의 문장 집합에 대하여 제안한 방법의 띄어쓰기 정확도를 평가한 결과 '공백 재현율'이 97.3%, '어절 재현율'이 93.2%로 나타났다.

  • PDF

나이브 베이즈 분류기와 혼동 행렬을 이용한 OCR에서의 철자 교정 (Using Naïve Bayes Classifier and Confusion Matrix Spelling Correction in OCR)

  • 노경목;김창현;천민아;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.310-312
    • /
    • 2016
  • OCR(Optical Character Recognition)의 오류를 줄이기 위해 본 논문에서는 교정 어휘 쌍의 혼동 행렬(confusion matrix)과 나이브 베이즈 분류기($na{\ddot{i}}ve$ Bayes classifier)를 이용한 철자 교정 시스템을 제안한다. 본 시스템에서는 철자 오류 중 한글에 대한 철자 오류만을 교정하였다. 실험에 사용된 말뭉치는 한국어 원시 말뭉치와 OCR 출력 말뭉치, OCR 정답 말뭉치이다. 한국어 원시 말뭉치로부터 자소 단위의 언어 모델(language model)과 교정 후보 검색을 위한 접두사 말뭉치를 구축했고, OCR 출력 말뭉치와 OCR 정답 말뭉치로부터 교정 어휘 쌍을 추출하고, 자소 단위로 분해하여 혼동 행렬을 만들고, 이를 이용하여 오류 모델(error model)을 구축했다. 접두사 말뭉치를 이용해서 교정 후보를 찾고 나이브 베이즈 분류기를 통해 확률이 높은 교정 후보 n개를 제시하였다. 후보 n개 내에 정답 어절이 있다면 교정을 성공하였다고 판단했고, 그 결과 약 97.73%의 인식률을 가지는 OCR에서, 3개의 교정 후보를 제시하였을 때, 약 0.28% 향상된 98.01%의 인식률을 보였다. 이는 한글에 대한 오류를 교정했을 때이며, 향후 특수 문자와 숫자 등을 복합적으로 처리하여 교정을 시도한다면 더 나은 결과를 보여줄 것이라 기대한다.

  • PDF

역전파 학습 신경망을 이용한 한글 숫자 인식에 관한 연구 (A Study on the Handwritten Korean Numeric Recognition using a Backpropagation Learning Neural Network)

  • 박창민;박귀순;김대원;이동춘;김명원;배현주;차의영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.137-141
    • /
    • 1989
  • 본 논문에서는 신경망 구조의 한 모델인 feed-forward multi-layered network에 역전파 학습(back-propagation learning) 기법을 이용하여 필기체 한글 숫자를 인식하고 그 가능성을 보였다. 문자 인식에 있어 입력 대상의 모양이 왜곡되거나, 대상의 크기 혹은 위치의 변화 등과 같은 잡음 (noise)에 대해서 정확히 대상을 인식하는 데는 대상의 구조 추출에 크게 관여되므로 한글의 구조 추출에 적합하다고 생각되는 bar mask 투사법을 제안하였다. 모델의 학습을 필기체 한글 숫자 16자의 입력 패턴과 타겟 ( target) 입력의 쌍을 이용해 학습시켰다. 또한, 모델의 인식 정도를 측정해 보기 위해 시험패턴을 적용하여 훈련된 패턴과 훈련되지 않은 패턴간의 인식률을 비교하여 보았다.

  • PDF

전표 금액란에 나타나는 필기 한글의 신경망-기반 인식 (Neural Network-based Recognition of Handwritten Hangul Characters in Form's Monetary Fields)

  • 이진선;오일석
    • 한국산업정보학회논문지
    • /
    • 제5권1호
    • /
    • pp.25-30
    • /
    • 2000
  • 한글은 부류수의 방대성과 글자간의 유사성으로 인해 인식이 어려운 문자 집합으로 간주되고 있다. 기존 연구 대부분은 일반적으로 사용되는 2,350 글자를 대상으로 인식을 시도하였는데, 이는 일반성을 제공하는 대신 낮은 성능 문제를 안고 있다. 이에 반해, 우편 영상이나 전표 영상 등의 특정 필드에 나타나는 한글만을 대상으로 하는 접근 방법이 보다 현실적이라 할 수 있다. 본 논문은 금액란에 나타나는 필기 한글을 인식하는 연구를 기술한다. 인식을 위해 모듈러 신경망 인식기를 사용하였으며, 세 종류의 특징을 사용하였다. 표준 한글 데이터베이스 PE92에 대해 실험한 결과 정인식률 97.56%를 얻었다.

  • PDF