• 제목/요약/키워드: 숫자열

검색결과 112건 처리시간 0.02초

획의 일부분이 손상된 숫자가 포함된 필기체 숫자 열의 인식 (Recognition of numeral stings with broken digits)

  • 김계경;김진호;조수현;지수영;정연구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.503-506
    • /
    • 2001
  • 본 논문에서는 획의 일부분이 손상된 숫자(broken digit)나 붙은 숫자(touching digits)와 같은 비정형 숫자들이 포함된 필기체 숫자 열을 인식할 수 있는 방법에 대하여 제안하였다. 비정형 숫자들은 분류(pre-segmentation) 단계에서 숫자들의 구조적인 특징 정보를 이용하여 정형인 개별 숫자(isolated digit)로부터 획의 일부분이 손상된 숫자 또는 붙은 숫자들로 분류된다. 획의 일부분이 분리된 숫자의 결합 및 붙은 숫자들의 분할 단계를 거쳐 인식을 시도하였다. 제안된 방법의 타당성을 증명하기 위하여 NIST SDl9 데이터베이스를 이용하여 시뮬레이션 해 보았다.

  • PDF

음절수와 모음 열을 이용한 한국어 연결 숫자 음성인식 (Connected Korean Digit Speech Recognition Using Vowel String and Number of Syllables)

  • 윤재선;홍광석
    • 정보처리학회논문지A
    • /
    • 제10A권1호
    • /
    • pp.1-6
    • /
    • 2003
  • 본 논문에서는 음절수와 모음 열 정보를 이용한 한국어 연속 숫자 인식을 제안하였다. 제안한 연속 숫자 인식기는 첫 단계로 발성된 연속 숫자 음성에서 음절수와 구간을 추출하고, 두 번째 단계로 모음 열을 인식한다. 이와 같이 인식된 모음 열 정보를 이용하여 인식 후보를 줄이게 된다. 인식후보 모델은 조음효과에 효과적으로 대처할 수 있는 CV(Consonant Vowel), VCCV, VC단위 HMM(Hidden Markov Model)을 사용하여 연속 숫자 음성인식기를 구성하였다. 실험결과 제안된 방법이 조음효과를 효과적으로 대처하고 연결 숫자 인식에 유효함을 확인하였다.

한국어 연결숫자인식을 위한 숫자 모델링에 관한 연구 (A Study on Digit Modeling for Korean Connected Digit Recognition)

  • 김기성
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.293-297
    • /
    • 1998
  • 전화망에서의 연결 숫자 인식 시스템의 개발에 대한 내용을 다루며, 이 시스템에서 다양한 숫자 모델링 방법들을 구현하고 비겨하였다. Word 모델의 경우 문맥독립 whole-word 모델을 구현하였으며, sub-word 모델로는 triphone 모델과 불파음화 자음을 모음에 포함시킨 modified triphone 모델을 구현하였다. 그리고 tree-based clustering 방법을 sub-word 모델과 문맥종속 whole-word 모델에 적용하였다. 이와 같은 숫자모델들에 대해 연속 HMM을 이용하여 화자독립 연결숫자 인식 실험을 수행한 결과, 문맥종속 단어 모델이 문맥독립 단어 모델보다 우수한 성능을 나타냈으며, triphone 모델과 modified triphone 모델은 유사한 성능을 나타냈다. 특히 tree-based clustering 방법을 적용한 문맥종속 단어 모델이 4연 숫자열에 대해 99.8%의 단어 dsltlr률 및 99.1%의 숫자열 인식률로서 가장 우수한 성능을 나타내었다.

  • PDF

수정된 에농 어트랙터를 이용한 고정도 숫자 인식 (High Precision Numeric Character Recognition using Modified Henon Attractor)

  • 손영우
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 추계학술발표논문집
    • /
    • pp.114-117
    • /
    • 2002
  • 본 논문에서는 미세한 차이를 식별할 수 있는 Chaos 이론을 숫자 패턴 인식 분야에 응용한다. 먼저, 숫자 영상의 특징 정보들을 시계열 데이터로 변환한 후, 제안된 수정된 에농 시스템으로부터 숫자 어트랙터를 재구성하고, 어트랙터의 특성 분석을 위해 프랙탈 차원 특징을 나타내는 정보 차원값을 이용하여 숫자를 인식하는 새로운 알고리즘을 제안함으로써, 특수한 용도로 숫자를 전문적으로 빠르고 정확하게 인식하는 고정도 숫자 인식 시스템을 구현하였다.

  • PDF

LDA를 이용한 한국어 연결숫자 인식기 성능향상에 관한 연구 (Study on Performance Improvement of Korean Connected Digit Recognition using LDA)

  • 송화전;김형순
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2001년도 추계학술발표대회 논문집 제20권 2호
    • /
    • pp.61-64
    • /
    • 2001
  • 본 논문에서는 class간의 변별력을 증가시키기 위한 유용한 방법인 LDA(Linear Discriminant Analysis)를 사용하여 한국어 숫자음간의 변별력을 높여 연결숫자 인식성능을 높이고자 하였다. 한국어 숫자음은 모두 단음절이며 또한 혼동가능성이 높은 숫자쌍이 존재하여 이것이 전체 인식률을 저하시킨다. LDA를 사용한 경우 숫자열 오인식률이 $8\%$ 감소하였다. 그리고, 음성특징 벡터의 차수를 감소시키고 LDA 사용전 보다 약간의 인식률 증가를 보였다. 그러나, 선형적인 방법으로 분리가 불가능한 class들의 분포가 존재할 때는 LDA를 사용하여도 변별력 향상은 기대하기 어렵다. 이와 같은 분포의 class사이의 변별력을 증가시키기 위해 between-scatter covariance matrix를 구할 때 class 사이에 혼동가능성 정도를 나타내는 weighting factor를 적용하였으며, 그 결과 숫자열 오인식률이 LDA 사용전보다 $9.7\%$ 감소하였다.

  • PDF

지로 서식 문서의 인쇄체 숫자 인식 (Printed Numeric Character Recognition on Giro Form)

  • 김진숙;변영철;김경환;최영우;이일병
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.446-448
    • /
    • 1999
  • 본 논문에서는 일상 생활에서 쉽게 접할 수 있는 지로(Giro) 서식 상에 있는 인쇄체 숫자열 인식 방법으로서 템플릿 매칭 방법에 대해 설명한다. 지로 서식 문서 상의 인쇄체 숫자는 인쇄시의 오류로 인하여 숫자의 굵기나 높이, 그리고 폭이 다를 수는 있지만 기본적으로 폰트의 유형이 한가지라는 것과 나타날 수 있는 오류의 유형이 몇 가지로 제한되어 있다는 특징을 갖는다. 따라서 이러한 데이터 특징을 효율적으로 수용할 수 있도록 템플릿을 정의한 후 매칭 방법을 통해 숫자를 인식하는 템플릿 매칭 방법에 대해 설명한다. 실험 결과 비교적 간단한 방법을 이용하더라고 인쇄체 숫자열을 효율적으로 인식할 수 있었다.

  • PDF

은행전표 항목의 무제약 필기 숫자열 인식 (Recognition of Unconstrained Handwritten Numerals in Bank Slip)

  • 윤성수;이일병
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.375-377
    • /
    • 1998
  • 실생활에서 사용되는 은행전표에는 많은 숫자 항목이 포함되어 있다. 이 항목들에 나타나는 숫자들은 단순히 숫자들의 배열이 아니라 콤마나 하이픈 등이 포함되어 있으며 많은 경우 숫자들끼리 서로 접촉되어 있다. 본 논문에서는 이런 시중 은행에서 사용되는 전표의 필기 숫자 항목을 처리하기 위한 시스템을 제안하고 이 효용성을 확인하기 위한 실험결과를 보였다. 실험은 크게 숫자분할 알고리즘에 대한 실험과 전체 시스템 성능에 대한 실험으로 나뉜다. 접촉된 두 숫자의 분할 알고리즘 성능 결과는 78.1%의 분할 성공률을 보였고 은행전표의 필기숫자 항목에 적용 결과는 53.5%였다.

  • PDF

한국어 발음열 자동 생성을 위한 형태소 태그 정보 기반의 텍스트 전처리기 (Text Preprocessor for Generating Korean Automatic Pronunciation Variants Using Morpheme-trg Information)

  • 이경님;정민화
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.199-201
    • /
    • 2001
  • 일반적으로 발음열 자동 생성기는 음성 인식 및 음성 합성에 사용되며, 그 주된 역할은 입력된 한글 철자에 대해 발음 나는 데로 표기된 음소열로 출력하는 것이다. 그러나 실제 입력되는 문장에는 특수 기호 및 알파벳. 아라비아 숫자, 영어 단어, 알파벳과 숫자가 혼용된 약어, 기호 단위 명사 등이 포함되어 있다. 게다가 아라비아 숫자의 경우 단위 명사의 종류에 따라서 뿐만 아니라, 문맥에 따라 숫자를 읽는 방식이 달라지게 된다. 이러한 모든 현상들을 발음열 생성기 내부에서 처리하게 되면 선행작업이 상대적으로 크게 되어 과부하 문제 가 발생된다. 또한 어절 내의 문맥 정보만으로 정확한 변환 결과를 얻기 힘들기 때문에 형태소 분석 수행 결과 및 예외처리를 위 한 루틴을 포함하여 한글 자소 단위의 입력형식으로 변환하는 전처리 시스템을 구성하였다.

  • PDF

반음절 단위 HMM을 이용한 연속 숫자 음성인식 (Continuous Digits Speech Recognition using Semisyllable Unit HMM)

  • 윤재선;홍광석
    • 한국음향학회지
    • /
    • 제17권5호
    • /
    • pp.73-78
    • /
    • 1998
  • 본 논문에서는 조음 효과에 대처할 수 있는 새로운 음성인식 단위로 반음절, 반음절 +반음절 단위 HMM을 제안하여 연속 숫자 음성인식을 하였다. 반음절 단위는 무음과 안정 구간으로, 반음절+반음절 단위는 안정, 천이, 안정구간으로 구성되어 있고, 음성인식 단위 분 할시 비교적 스펙트럼의 변화가 안정한 모음구간에서 분할하므로 분할 위치가 약간 변하여 도 인식성능에는 큰 영향을 주지 않게 된다. 또한, 제안된 반음절, 반음절+반음절 인식단위 는 그 패턴 안에 다음 숫자열의 정보를 포함하고 있기 때문에 모든 HMM 패턴들과 비교하 는 것이 아니라, 다음 숫자열의 정보를 포함한 HMM 패턴들과 비교한다. 인식실험결과 제 안된 방법이 효율적임을 확인하였다.

  • PDF