• Title/Summary/Keyword: Hangul matching

검색결과 27건 처리시간 0.021초

문자 가분할과 Support Vector Machine을 이용한 필기 한글 단어 고속 검증기 (Hangul Segmentation and Word Verification System for Automatic Address Processing)

  • 이충식;김인중;신종탁;김진형
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 추계종합학술대회 논문집(3)
    • /
    • pp.37-40
    • /
    • 2000
  • A fast method of Hangul address word verification is presented in this Paper. Pre-segmentation and recognition by DP matching is adopted in this paper. An address line image is over-segmented by analyzing the topology of connected components and the projection profile. A fast individual Hangul character verifier was developed by applying SVM (Support Vector Machine). The segmentation hypothesis was represented by lattice structure, and a best path search by dynamic programming generates the most probable segmentation path and the final verification score. The word verifier was tested on 310 address image DB, and it show the possibility of improvements of this method.

  • PDF

PDA상에서의 한글 필기체 매칭 알고리즘 (A Hangul Script Matching Algorithm for PDA)

  • 조미경;조환규
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권10호
    • /
    • pp.684-693
    • /
    • 2002
  • 전자 잉크 데이터는 펜 기반 컴퓨터나 PDA(Personal Digital Assistants)등에서 자연스럽고 편리한 데이터 입력을 제공하기 위해 펜으로 입력한 데이터를 온라인 문자 인식기를 이용하여 아스키 문자로 변환하지 않고 스크립트 형태로 저장하는 데이터를 말한다. 전자 잉크 데이터를 사용하기 위해 가장 중요한 것 중 하나는 전자 잉크 데이터의 검색 문제이다. 본 연구에서는 전자 잉크 데이터를 획 특징 벡터 형태로 저장하고, 이를 이용해서 잉크 데이터를 검색하는 매칭 알고리즘을 제안하고 구현하였다. 제안된 매칭 알고리즘은 입력된 데이터를 곡률(curvature)을 이용하여 기본획(primitive stroke)으로 분리하고 기본획의 종류를 결정한 다음 획 특징 벡터를 생성한다. 그리고 동적 프로그래밍 기법에 의해 획 특징 벡터의 거리값을 계산한다. 제안된 매칭 알고리즘을 이용하여 다양한 실험을 하였으며 한글 스크립트로 구성된 경우 97.7%이상의 매칭률을 보여 주었고 한글 및 한자 흔합 스크립트에서는 94%이상의 매칭률을 보여 주였다.

오프라인 필기체 한글 인식을 위한 자소 내 자획의 분리 (Stroke Extraction in Phoneme for Off-Line Handwritten Hangul Recognition)

  • 정민철
    • 한국산학기술학회논문지
    • /
    • 제7권3호
    • /
    • pp.385-392
    • /
    • 2006
  • 본 논문은 오프라인 필기체 한글 인식을 위한 요소 기술의 하나인 자소 분할을 위한 새로운 자획 추출법을 제안한다. 수평 런 길이를 이용하여 자소의 자획을 수직, 경사, 수평으로 구분 분리한다. 수직 자획이나 경사 자획의 수평 런 길이는 자획 두에가 되며, 수평 자획의 수평 런의 개수가 자획 두께가 된다. 수평 자획을 분리 추출한 후, 끊어진 수직, 경사 자획을 자획 두께의 수평 런으로 연결하여 분리한 자획들이 문자의 특징을 나타내게 한다. 추출된 자획들은 온라인 필기체 한글 인식 시스템에서 개발 사용되고 있는 자획 사전 정합을 통해 문자 인식을 할 수 있다.

  • PDF

한글-로마자 인명 변환의 통계적 순위 추천 시스템 (Statistical Ranking Recommendation System of Hangul-to-Roman Conversion for Korean Names)

  • 이정훈;김민호;권혁철
    • 정보과학회 논문지
    • /
    • 제44권12호
    • /
    • pp.1269-1274
    • /
    • 2017
  • 본 논문에서는 한글-로마자 인명 변환을 다루며, 기존에 사용되고 있는 다양한 표기를 인정하고 인명 변환의 사용 빈도에 따라 결과를 제공함을 목표로 한다. 한글-로마자 인명 표기가 다양해진 이유는 크게 두 가지이다. 첫째로 국내외에서 만들어진 다양한 표기법의 무분별한 사용이며, 둘째로 현행표기법에서의 관습적인 표기를 허용하기 때문이다. 이런 이유로 한글 인명 하나에도 다양한 로마자 표기가 가능해졌다. 시스템에서는 400만 명의 인명 데이터를 통계 사전으로 구축하여 변환한다. 첫 단계에서는 성씨의 매칭과정을 통해 인명 유무를 판단하고, 두 번째 단계에서는 이름 전체를 통계사전에서 비교하여 변환한다. 마지막 단계에서는 이름의 음절을 비교 후 변환하여 결과를 사용 빈도에 따라 순위로 제공한다. 본 논문에서는 기존의 웹에서 서비스 중인 시스템과 비교하여 성능을 측정하였으며, 타 시스템에 비해서 다소 높은 성능을 보였다.

Pocket PC용 한글 매칭 시스템 설계 및 구현 (Design and Implementation of Hangul matching System for Pocket PC)

  • 이호현;조범준
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.74-79
    • /
    • 2003
  • 한글위주의 스크립트를 전자 잉크 데이터(electronic ink data)형태로 Pocket PC에서 사용하기 위한 한글 매칭 알고리즘을 적용하여 시스템을 구현하였다. 적용된 한글 매칭 알고리즘은 전자잉크데이터(electronic ink data)를 스크립트 형태로 변화한 후 이를 다이나믹 프로그래밍 기법을 사용하여 시스템을 구현한다. Pocket PC의 하드웨적 제약을 고려하여 효율적인 속도를 보장하면서 인식률을 높이기 위해 기본 획을 인식한 후, 획 정보와 획간의 위치관계를 이용하여 자소로 분리된 데이터의 값으로 변환하여 이를 CF메모리상에 있는 통계적 수치 데이터로 저장된 한글 데이터의 값과 비교하여 한글을 인식할 수 있는 시스템 구현에 목적이 있다.

  • PDF

문자 별 특징 모델을 이용한 한글 문서 영상에서 키워드 검색 (Keyword Spotting on Hangul Document Images Using Character Feature Models)

  • 박상철;김수형;최덕재
    • 정보처리학회논문지B
    • /
    • 제12B권5호
    • /
    • pp.521-526
    • /
    • 2005
  • 본 논문에서는 저 품질의 한글 문서 영상에서 OCR 기반 검색 시스템의 대안으로 키워드 검출 시스템(Keyword Spotting)을 제안하고 OCR 기반 문서 검색 시스템과 비교한다. 제안 시스템은 문자 분할, 키워드 특징 추출 그리고 단어 매칭으로 구성된다. 문자 분할 단계에서는 인접한 두 문자간의 연결을 효과적으로 분리하면서 문자 넓이 값의 분산이 최소가 되도록 하는 문자 분할 방법을 제안한다. 키워드 특징은 서체별 문자 모델의 결합으로 구성한다. 단어 매칭 단계에서는 문자 매칭에 기반한 단어 대 단어 매칭 방법을 적용한다. 본 논문에서 제안한 키워드 검출 시스템의 성능을 평가하기 위해 한글 문서 영상을 대상으로 OCR 기반 문서 검색 시스템과 비교하였다. 그 결과 한글 글자 크기가 작고 문서의 상태가 좋지 않은 경우 제안한 키워드 검출 시스템에 의한 검색 성능이 OCR 기반 검색 시스템 보다 우수함을 입증하였다.

A Keyword Matching for the Retrieval of Low-Quality Hangul Document Images

  • 나인섭;박상철;김수형
    • 한국문헌정보학회지
    • /
    • 제47권1호
    • /
    • pp.39-55
    • /
    • 2013
  • It is a difficult problem to use keyword retrieval for low-quality Korean document images because these include adjacent characters that are connected. In addition, images that are created from various fonts are likely to be distorted during acquisition. In this paper, we propose and test a keyword retrieval system, using a support vector machine (SVM) for the retrieval of low-quality Korean document images. We propose a keyword retrieval method using an SVM to discriminate the similarity between two word images. We demonstrated that the proposed keyword retrieval method is more effective than the accumulated Optical Character Recognition (OCR)-based searching method. Moreover, using the SVM is better than Bayesian decision or artificial neural network for determining the similarity of two images.

음성처리를 위한 표준 발음법의 전산화 (Computerization and Application of Hangeul Standard Pronunciation Rule)

  • 이계영
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅲ
    • /
    • pp.1363-1366
    • /
    • 2003
  • This paper introduces computerized version of Hangout(Korean Language) Standard Pronunciation Rule that can be used in Korean processing systems such as Korean voice synthesis system and Korean voice recognition system. For this purpose, we build Petri net models for each items of the Standard Pronunciation Rule, and then integrate them into the vocal sound conversion table. The reversion of Hangul Standard Pronunciation Rule regulates the way of matching vocal sounds into grammatically correct written characters. This paper presents not only the vocal sound conversion table but also character conversion table obtained by reversely converting the vocal sound conversion table. Making use of these tables, we have implemented a Hangeul character into a vocal sound system and a Korean vocal sound into character conversion system, and tested them with various data sets reflecting all the items of the Standard Pronunciation Rule to verify the soundness and completeness of our tables. The test results shows that the tables improves the process speed in addition to the soundness and completeness.

  • PDF

Pocket PC용 한글 매칭 시스템 설계에 관한 연구 (A Study on Implementation of Hangul matching System for Pocket PC)

  • 이호현;조범준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (상)
    • /
    • pp.279-282
    • /
    • 2003
  • 한글위주의 스크립트를 전자 잉크 데이터(electronic ink data)형태로 Pocket PC에서 사용하기 위한 한글 매칭 알고리즘을 적용한 시스템 설계에 관한 연구이다. 적용된 한글 매칭 알고리즘은 전자 잉크 데이터(electronic ink data)를 스크립트 형태로 변화한 후 이를 모바일 환경의 프로그래밍 기법을 사용하여 시스템을 구현한다. Pocket PC의 하드웨어적 제약을 고려하여 효율적인 속도를 보장하면서 인식률을 높이기 위해 기본 획을 인식한 후, 획 정보와 획 간의 위치관계를 이용하여 자소로 분리된 데이터의 값으로 변환하여 이를 CF메모리상에 있는 통계적 수치 데이터로 저장된 한글 데이터의 값과 비교하여 한글을 인식할 수 있는 시스템 구현에 목적이 있다.

  • PDF

적응적 패턴 정합을 이용한 필기체 한글의 오프라인 인식 (Off-line recognition of handwritten Hangul using adaptive pattern matching)

  • 박정선;이성환
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.469-484
    • /
    • 1993
  • 본 논문에서는 다양한 양상으로 발생하는 필기체 한글에서의 변형을 흡수하기 위한 적응적 패턴 정합 방법을 제안한다. 제안된 방법은 정합의 정확도를 개선하기 위하여 구조적인 정보를 사용하고, 단일 정합 과정에서의 처리 속도를 개선하기 위하여 각각의 검은 점에서의 이웃들만을 고려하여 처리한다. 또한, 반복 적용시 수렴 속도를 빠르게 하기 위하여 입력 패턴을 부분영역으로 나누어 각 부분 영역에서의 정합이 성공적인지 여부에 따라 적응적으로 다음 반복 정합 과정을 수행한다. 제안된 방법의 효용성을 입증하기 위하여 다양한 필기체 한글 데이타에 대하여 실험한 결과, 제안된 적응적 패턴 정합 방법이 기존의 패턴 정합 방법 보다 처리 속도 및 정합의 성능 측면에서 우수함을 알 수 있었다.

  • PDF