• 제목/요약/키워드: 자모인식

검색결과 50건 처리시간 0.023초

굴곡점에서의 삼각분할을 이용한 필기체 한글자모 고속인식에 관한 연구 (A Fast Recognition of The Korean Hand_Written Character using the Triangulation of the Bend Points)

  • 김현경;조동섭
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1988년도 전기.전자공학 학술대회 논문집
    • /
    • pp.632-635
    • /
    • 1988
  • 이 논문에서는 필기체 한글 인식에 있어서 입력된 기본자소를 window를 이용한 윤곽선 추적과 삼각분할에 의한 이분점 추출에 의해 각 기본자소가 갖고있는 특징성분을 찾아내고 그 특징성분에 의해 문자의 골격을 추출하여 인식하는 방법을 제안하였다. 윤곽선 추적시 window를 이용함으로 간단한 잡음제거와 추적속도를 증가 시켰으며 삼각분할에 의한 이분점 추출방법을 사용함으로 단순한 윤곽선 추적에 의해 특징성분을 추출하는 방법보다 문자의 특징성분을 정확하게 추출할 수 있다는 장점을 갖는다.

  • PDF

HMM을 이용한 수기숫자 인식에 관한 연구 (A Study on the Hand-written Number Recognition by HMM(Hidden Markov Model))

  • 조민환
    • 한국컴퓨터정보학회논문지
    • /
    • 제9권3호
    • /
    • pp.121-125
    • /
    • 2004
  • 대부분의 수기 숫자 인식 시스템에서는 자모 형태를 이용한 특징 점 추출과, 형태소 적 분석기법을 많이 사용하였다. 본 연구에서는 체인코드를 사용하고, 생성된 체인코드를 미분하여 최소 값이 되는 미분코드를 만들었다. 이 미분코드는 대부분의 수기 숫자에 적용해 본 결과 숫자 변별력이 매우 뛰어남을 알 수 있었다. 처리 순서는 몇 개의 수기숫자를 전 처리하고, 체인코드와 미분코드를 생성 한 후, HMM 인식 네트워크를 사용하여 숫자 인식하였다. 처리 결과 96.1%의 수기숫자를 인식하였으며, 매우 심하게 왜곡된 숫자는 인식하지 못하였다.

  • PDF

제한된 언어 자원 환경에서의 다국어 개체명 인식 (Multilingual Named Entity Recognition with Limited Language Resources)

  • 천민아;김창현;박호민;노경목;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.143-146
    • /
    • 2017
  • 심층학습 모델 중 LSTM-CRF는 개체명 인식, 품사 태깅과 같은 sequence labeling에서 우수한 성능을 보이고 있다. 한국어 개체명 인식에 대해서도 LSTM-CRF 모델을 기본 골격으로 단어, 형태소, 자모음, 품사, 기구축 사전 정보 등 다양한 정보와 외부 자원을 활용하여 성능을 높이는 연구가 진행되고 있다. 그러나 이런 방법은 언어 자원과 성능이 좋은 자연어 처리 모듈(형태소 세그먼트, 품사 태거 등)이 없으면 사용할 수 없다. 본 논문에서는 LSTM-CRF와 최소한의 언어 자원을 사용하여 다국어에 대한 개체명 인식에 대한 성능을 평가한다. LSTM-CRF의 입력은 문자 기반의 n-gram 표상으로, 성능 평가에는 unigram 표상과 bigram 표상을 사용했다. 한국어, 일본어, 중국어에 대해 개체명 인식 성능 평가를 한 결과 한국어의 경우 bigram을 사용했을 때 78.54%의 성능을, 일본어와 중국어는 unigram을 사용했을 때 각 63.2%, 26.65%의 성능을 보였다.

  • PDF

전처리의 고속화에 기반한 문자 인식 시스템 (Character Recognition System using Fast Preprocessing Method)

  • 공용해
    • 한국멀티미디어학회논문지
    • /
    • 제2권3호
    • /
    • pp.297-307
    • /
    • 1999
  • 다량의 문자가 온라인으로 실시간 입력되는 문자인식시스템에서는 영상의 전처리가 매우 신속하게 이루어 져야 한다. 또한 크기가 작거나 잡음을 포함하는 문자 영상에 대한 기하학적 정규화나 세선화 등의 영상 변환은 원영상의 정보 유실이나 왜곡을 유발하므로 최소화되어야 한다. 이에 따라 본 연구는 원영상을 변환하지 않은 상태에서 신속하게 인식에 효과적인 특정을 구하고자 하였다. 이를 위해 인식의 관점에서 의미를 가지는 윤곽화소를 정의하고 다양한 영상의 변화를 수용하는 효과적인 특징을 윤곽화소로부터 구하였다. 필기체 자모음과 자동차 번호판 숫자 인식 실험 결과, 제안된 방법이 기존의 방법보다 인식에 보다 효과적이었으며 한번의 영상 주사로 전처리를 완료하므로 소요 시간을 크게 줄일 수 있었다.

  • PDF

제한된 언어 자원 환경에서의 다국어 개체명 인식 (Multilingual Named Entity Recognition with Limited Language Resources)

  • 천민아;김창현;박호민;노경목;김재훈
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.143-146
    • /
    • 2017
  • 심층학습 모델 중 LSTM-CRF는 개체명 인식, 품사 태깅과 같은 sequence labeling에서 우수한 성능을 보이고 있다. 한국어 개체명 인식에 대해서도 LSTM-CRF 모델을 기본 골격으로 단어, 형태소, 자모음, 품사, 기구축 사전 정보 등 다양한 정보와 외부 자원을 활용하여 성능을 높이는 연구가 진행되고 있다. 그러나 이런 방법은 언어 자원과 성능이 좋은 자연어 처리 모듈(형태소 세그먼트, 품사 태거 등)이 없으면 사용할 수 없다. 본 논문에서는 LSTM-CRF와 최소한의 언어 자원을 사용하여 다국어에 대한 개체명 인식에 대한 성능을 평가한다. LSTM-CRF의 입력은 문자 기반의 n-gram 표상으로, 성능 평가에는 unigram 표상과 bigram 표상을 사용했다. 한국어, 일본어, 중국어에 대해 개체명 인식 성능 평가를 한 결과 한국어의 경우 bigram을 사용했을 때 78.54%의 성능을, 일본어와 중국어는 unigram을 사용했을 때 각 63.2%, 26.65%의 성능을 보였다.

  • PDF

Syntactic법에 의한 한글의 패턴 인식에 관한 연구 (A Study on the Pattern Recognition of Korean Characters by Syntactic Method)

  • 김태균
    • 대한전자공학회논문지
    • /
    • 제14권5호
    • /
    • pp.15-21
    • /
    • 1977
  • 본 논문은 Syntactic법에 의한 한글의 인식 algorithm에 대하여 논한 것으로 인식절차는 크게 나누어 전처리, graph화, 분할의 3단계로 구성되어 있다. 전처리과정에서는 Hilditch의 thinning algorithm을 이용하여 입력문자의 골격패턴을 얻었다. graph화 단계에서는 세선화패턴으로 부터 4종류의 특징점을 추출하여 입력패턴을 기본패턴의 구성관계로 나타냈다. 분할단에서는 tree문법에 의한 패턴해석을 수행, 입력패턴을 구성하는 각 자모를 순차적으로 추출하였다. 본 algorithm의 효용성을 검토하기 위하여 전자계산기를 이용, 511자의 인쇄체 한글에 대하여 인식실험을 행하였다. 그 결과 약 90%의 정인식율을 얻었다.

  • PDF

인쇄체 한글 및 한자의 인식에 관한 연구 (A Study on the Printed Korean and Chinese Character Recognition)

  • 김정우;이세행
    • 한국통신학회논문지
    • /
    • 제17권11호
    • /
    • pp.1175-1184
    • /
    • 1992
  • 본 논문에서는 한자를 포함하는 한글 문서 인식을 위한 인쇄체 한글, 한자의 구분과 인식 방법에 대하여 연구하였다. 제안된 한글, 한자 구분 방법은 한글의 수직모음과 수평모음의 구조적 특징을 이용하였다. 한글은 6가지 형태로 분류하고 분류된 각 형태에 대하여 세선화 과정을 거치지 않고 모음 우선추출에 의한 자모분리를 행하고 분리된 자음에 대하여 변형된 교차거리 특징을 이용하여 인식하였다. 한자에 대해서는 획교차수의 평균치를 이용하여 전체 한자 대상문자에 대해 분류를 하였으며, 문자의 획교차수와 흑점비율 특징을 이용하여 인식하였다. 한글과 한자의 구분에서는 90.5%의 분류율을 얻었다. 한글인식에 있어서는 대상문자 명조체 2512자에 대하여 90.0%의 형태 분류율을 얻었다. 인식 결과 실험 데이타 1278자에 대하여 92.2%의 인식율을 얻었다. 한자인식에 있어서는 대상문자 4585자에 대하여 분류한 결과 최대밀집 구간은 124자로서 약 1/40 정도로 분류되었음을 알 수 있었고, 인식실험 결과 89.2%의 인식율을 얻었다.

  • PDF

한글 문자의 전자계산조직에 적응하기 위한 특징추출에 관한 연구(I) (A Method For the Recognition of Printed Korean Characters)

  • 이주근
    • 대한전자공학회논문지
    • /
    • 제6권4호
    • /
    • pp.8-19
    • /
    • 1969
  • 우리 문자는 자모의 조합된 언어문자이기 때문에 그 수가 방대하여 수천개의 식별기구를 필요로 할 뿐만 dkl니라 재조가 복잡하며 대부분이 유이문자이기 때문에 Patttern 인식문제에 잇어서는 허다한 난점이 있다. 따라서 이들 재조상에서 오는 문제점을 분석, 평가하하여 최적조건을 결정하고, 특징추출에 노이적별함수의 적용은 다른 문자에서는 볼 수 없는 한글 문자에 관한 한 특수한 장점으로 나타난다는 것을 확인하여다. 이 특수점을 Systen의 서례에 최대한으로 적용하여 3분지 1이상의 System축소를 보았다. 인식방버버으로서는 표본 Pattern을 추출해 내서 Register에 기제한 다음 인식 Matrix에 의하여 식별하였다. 식별된 문자는 판정논리에 의하여 특수Parameter를 추출하였다. 이논적인 입증을 위한 몇가지의 실험적인 검사를 가하였으며 이 과정에서 얻어진 모든 자료들은 이 분양의 연구에 매우 유익한 기초자료를 제공할 것이로 보며, 한글문자의 Patterndlstlr에 관한 실마리가 잡혀졌다고 보겠다.

  • PDF

인간의 정보처리 방법에 기반한 특징추출 및 필기체 문자인식에의 응용 (Feature extraction motivated by human information processing method and application to handwritter character recognition)

  • 윤성수;변혜란;이일병
    • 인지과학
    • /
    • 제9권1호
    • /
    • pp.1-11
    • /
    • 1998
  • 본 논문에서는 인간의 정보처리 과정에 관한 심리학적 실험에 바탕을 두고 인간이 사용하고 있는 것으로 생각되는 특징을 이용하여 이를 문자 인식에 적용하였다. 인간의 경우 화소단위의 정보뿐만 아니라 일정지역의 정보를 함께 처리하는 경향이 있다. 그러므로 일정지역에 대한 정보를 표시하는 영역 특징을 정의하고 정의된 이 영역 특징과 기존의 화소단위 특징들을 결합하였다. 사용한 특징으로는 영역 특징에 기반 한 초등 적 분석결과, 영역특징을 포함한 망 특징, 교차거리와 특징 그리고 기울기 특징들이다. 성능 평가 실험은 필기 한글자모, 숫자 그리고 대소영문자를 대상으로 하였으며, 인식기는 역전과 학습 방법을 이용한 신경망 인식기를 사용하였다. 각각의 인식 결과는 90.27∼93.25%, 98.00% 그리고 79.73∼85.75였다. 영역 특징과 유사한 UDLRH 특징을 대상으로 비교한 결과 전체적으로 1∼2% 정도 인식률 향상이 있었으며 인간이 판단하기에 보다 납득하기 쉬운 오 인식 성향을 보였다.

  • PDF

신경회로망을 이용한 필기체 한글 자모음 및 숫자인식에 관한 연구 (A study on the Recognition of Hand-written Characters and Arabic numbers by Neural Networks)

  • 오동수;이은철;유재근;남문현
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1991년도 하계학술대회 논문집
    • /
    • pp.900-904
    • /
    • 1991
  • In this paper, our study for the recognition of Hand-written Korean characters, Arabic numbers and alphabets by neural netwoks. This System extracts feature of character by using the MESH feature point of handwritten character, Arabic numbers and alphabets. To reduce the input image data, features are extracted from each input images. A MLP(multi-layer perceptron) with one hidden layer was trained with a modified BEP(back error propagation) algorithm. This method extracts feature sets of the characters directly from the scanner and can enhance computation speed without using the special preprocesses such as size normalization, smoothing, and thinning.

  • PDF