• 제목/요약/키워드: Character Matching

검색결과 155건 처리시간 0.022초

온톨로지 매핑 기반 엔지니어링 정보 검색 (Engineering Information Search based on Ontology Mapping)

  • 정민;서효원
    • 한국정밀공학회지
    • /
    • 제23권5호
    • /
    • pp.30-36
    • /
    • 2006
  • The participants in collaborative environment want to get the right information or documents which are intended to find. In general search systems, documents which contain only the keywords are retrieved. For searching different word-expressions for the same meaning, we perform mapping before searching. Our mapping-based search approach has two parts, ontology-based mapping logic and ontology libraries. The ontology-based mapping consists of three steps such as character matching (CM), definition comparing (DC) and similarity checking (SC). First, the character matching is the mapping of two terminologies that have identical character strings. Second, the definition comparing is the method that compares two terminologies' ontological definitions. Third, the similarity checking pairs two terminologies which were not mapped by two prior steps through evaluating the similarity of the ontological definitions. For the ontology libraries, document ontology library (DOL), keyword ontology library (KOL), and mapping result library (MRL) are defined. With these three libraries and three mapping steps, an ontology-based search engine (OntSE) is built, and a use case scenario is discussed to show the applicability.

칩의 문자들을 검사하기 위한 마크 자동 검사 시스템 (A Mark Automatic Checking System to Inspect Character Strings on Chips)

  • 주기세
    • 해양환경안전학회:학술대회논문집
    • /
    • 해양환경안전학회 2005년도 추계학술대회지
    • /
    • pp.191-196
    • /
    • 2005
  • 칩의 마크는 종류별로 다르고 매우 작아서 작업자가 육안 검사로 처리하기에는 매우 어려운 작업이다. 본 논문에서는 칩의 마크를 인식하여 잘못된 마크를 판별하는 마크 자동 검사 시스템에 대하여 제안한다. 불량 항목을 검사하기 위해서 템플릿 매칭 방법과 다양한 불량 판별 조건을 사용한다. 그리고 불량판별 조건은 문자 ROI 명암도, 문자 ROI 매칭, 문자 명암도, 브로컨, 브렌치로 분류된다. 제안된 방법은 마크 불량 판별에 커다란 성능향상이 보임을 일련의 실험들을 통하여 보여준다.

  • PDF

칩의 문자들을 검사하기 위한 마크 자동 검사 시스템 (A Mark Automatic Checking System to Inspect Character String on Chip)

  • 김은석
    • 한국정보통신학회논문지
    • /
    • 제11권3호
    • /
    • pp.577-583
    • /
    • 2007
  • 칩의 마크는 종류별로 다르고 매우 작아서 작업자가 육안 검사로 처리하기에는 매우 어려운 작업이다. 본 논문에서는 칩의 마크를 인식하여 잘못된 마크를 판별하는 마크 자동 검사 시스템에 대하여 제안한다. 불량항목을 검사하기 위해서 템플릿 매칭 방법과 다양한 불량 판별 조건을 사용한다. 그리고 불량판별 조건은 문자 ROI 명암도, 문자 ROI 매칭, 문자 명암도, 브로컨, 브렌치로 분류된다. 제안된 방법은 마크 불량 판별에 커다란 성능향상이 보임을 일련의 실험들을 통하여 보여준다.

Automatic Generation of Training Character Samples for OCR Systems

  • Le, Ha;Kim, Soo-Hyung;Na, In-Seop;Do, Yen;Park, Sang-Cheol;Jeong, Sun-Hwa
    • International Journal of Contents
    • /
    • 제8권3호
    • /
    • pp.83-93
    • /
    • 2012
  • In this paper, we propose a novel method that automatically generates real character images to familiarize existing OCR systems with new fonts. At first, we generate synthetic character images using a simple degradation model. The synthetic data is used to train an OCR engine, and the trained OCR is used to recognize and label real character images that are segmented from ideal document images. Since the OCR engine is unable to recognize accurately all real character images, a substring matching method is employed to fix wrongly labeled characters by comparing two strings; one is the string grouped by recognized characters in an ideal document image, and the other is the ordered string of characters which we are considering to train and recognize. Based on our method, we build a system that automatically generates 2350 most common Korean and 117 alphanumeric characters from new fonts. The ideal document images used in the system are postal envelope images with characters printed in ascending order of their codes. The proposed system achieved a labeling accuracy of 99%. Therefore, we believe that our system is effective in facilitating the generation of numerous character samples to enhance the recognition rate of existing OCR systems for fonts that have never been trained.

Character Recognition using Regional Structure

  • Yoo, Suk Won
    • International Journal of Advanced Culture Technology
    • /
    • 제7권1호
    • /
    • pp.64-69
    • /
    • 2019
  • With the advent of the fourth industry, the need for office automation with automatic character recognition capabilities is increasing day by day. Therefore, in this paper, we study a character recognition algorithm that effectively recognizes a new experimental data character by using learning data characters. The proposed algorithm computes the degree of similarity that the structural regions of learning data characters match the corresponding regions of the experimental data character. It has been confirmed that satisfactory results can be obtained by selecting the learning data character with the highest degree of similarity in the matching process as the final recognition result for a given experimental data character.

A Study on Design Concept of an App with Matching Enneagram and Character

  • Park, Jongjin
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제14권1호
    • /
    • pp.19-24
    • /
    • 2022
  • "Know thyself" is one of the most famous ancient proverbs. We need to know ourselves to understand others and find true ourselves. Enneagram is one of the tools we can use to do it. It has drawn more and more attention from people by its effectiveness and spiritual depth. It has been widely promoted in both business management and spirituality contexts. It has many concepts to be understood. Holy ideas and virtues are understood to be restored to find our true self which is the purpose of using the Enneagram. Actually, holy ideas and virtues are similar with character qualities which comprise character. In this paper, holy ideas and virtues are matched with corresponding character qualities. To promote transformative process of character development through Enneagram, an app was designed. It has 2 levels. Level 1 is to find personality type and show corresponding character qualities of 9 personality types to users. Level 2 is to find subtypes and Enneagram Levels of Development for further purpose.

한글 인식에서 자소 추출에 관한 연구 (A Study on Algorithm of Phonemes Extraction in Korean Character Pattern Recognition)

  • 정영화;김은진;김정선
    • 한국통신학회:학술대회논문집
    • /
    • 한국통신학회 1985년도 추계학술발표회 논문집
    • /
    • pp.109-112
    • /
    • 1985
  • This paper proposes a algorithm of phonemes extraction in korean character pattern recognition. The phonemes are classified into the patterns which are separable and connected with each other. The former is extracted by means of pattern matching in consideration of topological structure of ponemes and direction of stroke sequentially. The latter is extracted by means of index and window algorithm which are performed by a 3$\times$3 sequential local operation in the thinned character pattern.

  • PDF

MWLD 알고리즘을 이용한 문자열정합 1차원 Bit-Serial 어레이 프로세서의 설계 (A Study on 1-D Bit-Serial Array Processor Design for Code-String Matching Using a MWLD Algorithm)

  • 박종진;김은원;조원경
    • 전자공학회논문지B
    • /
    • 제29B권2호
    • /
    • pp.1-8
    • /
    • 1992
  • This paper is proposed a Modified WLD (Weighted Levenshtein Distance) algorithm for processor desihn of code-string matching. A proposed MWLD (Modified Weighted Levenshtein Distance) algorithm is consist of 1-dimension bit-serial array processor to pattern matching using a Hamming Distance. The proposed processor is applied to recognition of character with real time input. The recognition rate of Hangul strokes is resulted to 98.65$\%$

  • PDF

스포츠 중계를 위한 자막 인식 시스템 개발 (Development of a Video Caption Recognition System for Sport Event Broadcasting)

  • 오주현
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.94-98
    • /
    • 2009
  • 메이저리그 야구 중계 등 해외 스포츠 중계제작에서 해결해야 할 문제 중 하나는 MPH(miles per hour)와 같이 영미식 단위로 표시된 자막을 국내 실정에 맞게 km/h 등으로 변환하는 것이다. 이를 위해 중계화면에 표시된 자막영역의 변화로부터 해당 자막이 표시되었음을 감지하고 숫자 정보를 인식하여 이를 국내실정에 맞는 SI 단위로 변환하는 스포츠 자막 인식 시스템을 개발하였다. 변환된 자막은 후단의 문자발생기 (CG) 시스템으로 전달되어 최종적으로 TV 화면에 표시된다. 일반적으로 문자 인식에 주로 사용되는 신경망(neural networks) 기반 방식은 사전에 유사 데이터를 이용한 신경망의 학습(training) 과정이 필수적으로 요구되며, 또한 학습에 사용된 데이터와 다른 모양의 자막이 예고 없이 사용되었을 경우 대처할 수 없다는 단점이 있다. 생방송이라는 사용 환경을 고려하여 새로운 폰트로 제작된 자막에도 신속하게 대처할 수 있는 템플릿 매칭(template matching) 방식을 사용하였다. 여러 가지 실험 영상으로 테스트한 결과 97% 이상의 정확한 인식 결과를 얻었으며, 정확성을 요하는 생방송의 특성상 매칭의 확신도(confidence)가 높지 않은 경우에는 작업자가 판단한 후 핫키를 이용하여 정확한 자막을 출력할 수 있게 하였다.

  • PDF

임베디드 시스템에서의 템플릿 매칭 기법을 이용한 번호판 인식 시스템 개발 (The Development of a License Plate Recognition System using Template Matching Method in Embedded System)

  • 김홍희;이재흥
    • 전기전자학회논문지
    • /
    • 제15권4호
    • /
    • pp.274-280
    • /
    • 2011
  • 본 연구에서는 SoC를 이용한 임베디드 시스템에 리눅스 OS 환경을 구축하고 번호판 인식 시스템을 구현하여 그 성능을 측정하였다. 자동차 번호판을 인식하기 위해서는 번호판을 검출하고 검출된 번호판을 보정 한 뒤 각 문자들에 대해 인식을 한다. 번호판 검출 방법으로는 레이블링 기법과 숫자의 특징을 이용하여 검출하였다. 검출된 번호판의 표기되어 있는 숫자들은 각각의 좌표가 있다. 이러한 숫자들의 좌표를 비교하여 영상을 보정하고 템플릿 매칭을 통해 인식을 한다. 그 결과로 번호판의 검출율은 96%, 문자 인식률은 73%, 숫자 인식률은 97%로 나타났다. 인식 시스템은 기존의 PC기반이 아닌 임베디드 보드에서 측정 되었으며 총 인식시간은 약 0.66초가 소요되었다.