• 제목/요약/키워드: numerals

검색결과 96건 처리시간 0.034초

Feature Extraction and Statistical Pattern Recognition for Image Data using Wavelet Decomposition

  • Kim, Min-Soo;Baek, Jang-Sun
    • Communications for Statistical Applications and Methods
    • /
    • 제6권3호
    • /
    • pp.831-842
    • /
    • 1999
  • We propose a wavelet decomposition feature extraction method for the hand-written character recognition. Comparing the recognition rates of which methods with original image features and with selected features by the wavelet decomposition we study the characteristics of the proposed method. LDA(Linear Discriminant Analysis) QDA(Quadratic Discriminant Analysis) RDA(Regularized Discriminant Analysis) and NN(Neural network) are used for the calculation of recognition rates. 6000 hand-written numerals from CENPARMI at Concordia University are used for the experiment. We found that the set of significantly selected wavelet decomposed features generates higher recognition rate than the original image features.

  • PDF

BERT를 이용한 숫자-한국어 음역 모호성 해소 (Arabic-Numerals to Korean Transliteration Disambiguation using BERT)

  • 박정연;육대범;이재성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.42-44
    • /
    • 2020
  • TTS(Text-to-Speech) 시스템을 위해서는 한글 이외의 문자열을 한글로 변환해줄 필요가 있다. 이러한 문자열에는 숫자, 특수문자 등의 문자열이 포함되어 있다. 특히 숫자의 경우, 숫자가 사용되는 문맥에 따라 그 발음방법이 달라지는 문제점이 있다. 본 논문에서는 기존의 규칙기반과 한정된 문맥 정보만을 활용할 수 있는 방법이 아닌, 딥러닝을 이용한 방법으로 문맥에 따라 발음방법이 달라지는 숫자 음역의 모호성을 해소하는 방법을 소개한다.

  • PDF

GLVQ클러스터링을 위한 필기체 숫자의 효율적인 특징 추출 방법 (The Efficient Feature Extraction of Handwritten Numerals in GLVQ Clustering Network)

  • 전종원;민준영
    • 한국정보처리학회논문지
    • /
    • 제2권6호
    • /
    • pp.995-1001
    • /
    • 1995
  • 패턴인식은 전처리, 특징추출, 식별의 과정을 거쳐 인식을 하게된다. 식별과정 에서 여러개의 패턴이 흩어져 있을 경우에 유사한 패턴끼리 클러스터링을 위하여 한 카테고리 내에서 패턴을 분할하게 된다. 클러스터링 방법에는 통계적인 방법으로 k-means 방법, ISODATA알고리즘등이 있으며〔1〕, 최근에는 신경망에 의한 클러스터링 방법으로 T, Kohonen의 LVQ(Learning Vector Quantization)가 주로 이용되었다〔6〕. Nikhil R, Pal. et al은 LVQ알고리즘을 보다 개선한 방법으로 GLVQ(Generalized LVQ, 1993)를 제안하였다〔4〕.본 논문은 GLVQ 알고니즘으로 패턴을 클러스터링 할 경우에 효율적인 특징추출 방법을 제안한다. 본 논문에서는 20명의 필기체 숫자 0에서 9까지 의 200개 패턴을 여러 가지 방법으로 특징 추출하여 GLVQ알고리즘으로 10개(0-9의 패턴) 의 클러스터로 구분하고, 해당 클러스터에서 오분류되는 패턴의 비율로서 그 효율성을 비교 하였다. 그 결과 투영조합 방법을 이용하였을 경우 98.5%의 분류율을 나타내었다.

  • PDF

데이터베이스 의미론을 이용한 한국어 구현 시론: 수사-분류사 구조를 중심으로 (A pilot implementation of Korean in Database Semantics: focusing on numeral-classifier construction)

  • 최재웅
    • 인지과학
    • /
    • 제18권4호
    • /
    • pp.457-483
    • /
    • 2007
  • 데이터베이스 의미론(Database Semantics, DBS)은 인간의 의사소통 방식에 대한 종합적인 이론 틀과 분석을 제공하고, 또한 이를 구체적인 컴퓨터 프로그램으로 구현하는 것을 목적으로 하고 있다. DBS의 두 가지 주요 특징으로는 문장 처리 알고리즘으로 좌연접 방식을 취한다는 점과 문장의 의미 내용을 표상하는 데이터베이스로 '어휘은행 (Word bank)를 취한다는 점을 들 수 있다. 본 연구에서는 DBS에 입각하여 한국어의 기본 현상에 대한 분석 및 구현을 시도한다. 우선 간단한 한국어 예를 통해 듣고, 추론하고, 말하는 단계가 어떻게 진행될 수 있는지를 보이고, 이어서 한국어의 특징적 현상중의 하나인 수사-분류사(classifier) 구조가 어떻게 분석되는지를 보임으로써, 영어와 독일어를 소재로 개발중인 DBS가 언어적 특성이 많이 다른 한국어 분석에도 활용될 가능성이 있음을 보인다. 또한 기존 연구에서 제시된 바 있는 좌연접 알고리즘에 대한 한국어 적용상의 문제점을 검토하면서 그에 대한 대안의 방향을 살펴보기로 한다.

  • PDF

복합 특징과 결합 인식기에 의한 필기체 숫자인식 (Recognition of Handwritten Numerals using Hybrid Features And Combined Classifier)

  • 박중조;송영기;김경민
    • 한국정보통신학회논문지
    • /
    • 제5권1호
    • /
    • pp.14-22
    • /
    • 2001
  • 필기체 숫자는 개인에 따라 필체가 매우 다양하므로 단일 특징과 단일 분류기를 사용하여 오프라인 필기체 숫자인식을 수행할 경우 높은 인식률을 얻기가 어렵다. 이에 본 논문에서는 복합 특징과 결합 인식기를 사용하여 필기체 숫자 인식의 인식률을 향상시키는 방안을 제시한다. 인식률의 향상을 위해, 먼저 상호 보완적인 특징들-방향특징, 교차점특징, 망특징-을 선정하고 이를 사용하여 숫자영상의 전역적 및 국부적 특징을 갖는 세 종류의 새로운 복합 특징을 구성한다. 그리고 패턴 인식기로는 세 개의 신경회로망 분류기를 퍼지 적분으로 결합한 결합 인식기를 사용한다. 본 인식기의 성능 평가를 위해 Concordia 대차의 무제약 필기체 숫자 데이터베이스를 사용하여 실험한 결과 97.85%의 인식률을 달성하였다.

  • PDF

다중 특징의 반복적 분석에 의한 퍼지 분류기의 설계 (Design of a Fuzzy Classifier by Repetitive Analyses of Multifeatures)

  • 신대정;나승유
    • 한국지능시스템학회논문지
    • /
    • 제6권3호
    • /
    • pp.14-24
    • /
    • 1996
  • 유전자 알고리즘을 이용한 다양한 특징의 분석이 필요한 퍼지 분류기의 설계방법을 제안한다. 본 논문에서 제안한 퍼지 분류기의 퍼지 논리를 이용한 분류 부분과 우전자 알고리즘을 이용한 규칙생성부분으로 구성된다. 유전자 알고리즘을 이용한 규칙 생성 부분에서는 최적의 퍼지 멤버쉽 함수를 결정하고, 각 특징이 규칙에 포함되는지 포함되지 않는지의 여부도 결정하게 된다. 또한 특정 대상에 대한 인식률을 분석하여 큰 오인식률을 갖는 부분에 세부 특징을 추가하는 방법과 문자열과 population의 최소크기, 인식률 개선을 위한 반복적 분석 방법을 사용한다. 제안된 퍼지 분류기의 적용 예로서, 아이리스 테이터와 갑상선 종양 세포, 그리고 필기된 숫자와 인쇄된 숫자의 인식을 든다. 필기된 숫자와 인쇄된 숫자의 인식을 위해서 각 숫자를 구조적인 정보가 동일한 그룹으로 분류한다. 본 논문에서 제안한 퍼지 분류기는 아이리스 데이터에 대해 98.67%의 인식률을 갑상선 종양 세포에 대해서 98.25%의 인식률을 필기된 숫자와 인쇄된 숫자에 대해서 96.3%의 인신룩을 얻었다.

  • PDF

은행 수납장표 자동인식을 위한 융합기반 필기 숫자 인식방법 (FUSION BASED RECOGNITION METHOD FOR HANDWRITTEN NUMERALS ON BANK SHEETS)

  • 전효세;소영성
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.449-451
    • /
    • 1999
  • 지금까지 많은 필기 숫자 인식 방법들이 제안되었지만 고도의 신뢰도가 요구되는 은행 수납 장표상의 숫자 인식에 적합한 방법은 아직 발표된 것이 미미한 실정이다. 본 연구에서는 세 개의 분류기의 결과를 융합하여 100%에 가까운 신뢰도를 낼 수 있는 필기숫자 인식 시스템을 제안하였다. Karhunen-Loeve Transform(KLT)를 통하여 특징을 추출하였으며 오류 역전파 신경망(BP), LVQ를 적용한 SOFM(SOFM-LVQ)과 Weignted Several Nearest Neighbor(WSNN)을 분류기로 사용하였다. 융합을 위해서는 다수결(Majority Voting)이 아닌 만장일치제(Unanimous Voting)을 적용하여 신뢰도를 높혔다. ETL-6 DB를 사용하여 실험하였으며 실험 결과 99.95%의 높은 신뢰도를 기록하였다.

  • PDF

Combining Different Distance Measurements Methods with Dempster-Shafer-Theory for Recognition of Urdu Character Script

  • Khan, Yunus;Nagar, Chetan;Kaushal, Devendra S.
    • International Journal of Ocean System Engineering
    • /
    • 제2권1호
    • /
    • pp.16-23
    • /
    • 2012
  • In this paper we discussed a new methodology for Urdu Character Recognition system using Dempster-Shafer theory which can powerfully estimate the similarity ratings between a recognized character and sampling characters in the character database. Recognition of character is done by five probability calculation methods such as (similarity, hamming, linear correlation, cross-correlation, nearest neighbor) with Dempster-Shafer theory of belief functions. The main objective of this paper is to Recognition of Urdu letters and numerals through five similarity and dissimilarity algorithms to find the similarity between the given image and the standard template in the character recognition system. In this paper we develop a method to combine the results of the different distance measurement methods using the Dempster-Shafer theory. This idea enables us to obtain a single precision result. It was observed that the combination of these results ultimately enhanced the success rate.

신경망 및 통계적 방법에 의한 클러스터링 성능평가 (A Study on Performance Evaluation of Clustering Algorithms using Neural and Statistical Method)

  • 윤석환;민준영;신용백
    • 산업경영시스템학회지
    • /
    • 제19권37호
    • /
    • pp.41-51
    • /
    • 1996
  • This paper evaluates the clustering performance of a neural network and a statistical method. Algorithms which are used in this paper are the GLVQ(Generalized Learning vector Quantization) for a neural method and the k-means algorithm fer a statistical clustering method. For comparison of two methods, we calculate the Rand's c statistics. As a result, the mean of c value obtained with the GLVQ is higher than that obtained with the k-means algorithm, while standard deviation of c value is lower. Experimental data sets were the Fisher's IRIS data and patterns extracted from handwritten numerals.

  • PDF

고유벡터를 이용한 필기체 숫자인식 (Recognition of Handwritten Numerals using Eigenvectors)

  • 박중조;김경민;송명현
    • 한국정보통신학회논문지
    • /
    • 제6권6호
    • /
    • pp.986-991
    • /
    • 2002
  • 본 논문에서는 고유벡터를 이용한 오프라인 필기체 숫자인식 기법을 제시한다. 본 기법에서는 KL 변환에 의한 고유벡터를 이용하여 통계적으로 숫자의 특징을 추출하며, 특징공간상에서 최소거리기법으로 숫자를 인식한다. 본 기법에서 제안된 특징추출 방법에서는 많은 표본 숫자영상에서 각 숫자들의 특징을 가장 잘 표현하는 기저벡터를 찾아내고 이로부터 숫자의 특징을 구한다. 제시된 기법의 성능 평가를 위해 Concordia대학의 무제약 필기체 숫자 데이터베이스를 사용하여 실험한 결과 96.2%의 인식률을 얻을 수 있었다.