• 제목/요약/키워드: Character Matching

검색결과 155건 처리시간 0.025초

문자클래스 매칭을 지원하는 정규표현식 매칭 프로세서 구조 (Regular Expression Matching Processor Architecture Supporting Character Class Matching)

  • 윤상균
    • 정보과학회 논문지
    • /
    • 제42권10호
    • /
    • pp.1280-1285
    • /
    • 2015
  • 고속 정규표현식 매칭을 수행하기 위한 여러 종류의 정규표현식 매칭 하드웨어 구조가 연구되었다. 특히 프로그램과 같이 패턴의 갱신이 쉽도록 범용 프로세서와 유사한 방식으로 정규표현식 매칭을 수행하는 ReCPU와 SMPU와 같은 정규표현식 프로세서가 연구되었다. 그렇지만 기존의 정규표현식 프로세서들은 문자클래스 매칭을 위한 별도의 기능을 제공하지 않아서 문자클래스 처리에 비효율적이다. 본 논문에서는 문자클래스 매칭을 지원하는 정규표현식 매칭 프로세서의 명령어 집합을 제시하고, 이에 대한 프로세서 구조를 설계 구현한다. 제시된 프로세서는 문자클래스, 문자 범위와 부정 문자클래스 처리 기능을 포함하고 있어서 문자클래스 매칭을 매우 효율적으로 처리할 수 있다.

정규표현식 프로세서에서의 효율적 문자 클래스 매칭을 위한 구조 (Architecture for Efficient Character Class Matching in Regular Expression Processor)

  • 윤상균
    • 전기전자학회논문지
    • /
    • 제22권1호
    • /
    • pp.87-92
    • /
    • 2018
  • 보통의 CPU 처럼 명령어 기반으로 정규표현식 패턴 매칭을 수행하는 정규표현식 프로세서가 최근에 연구되었다. 이들 중 REMPc만이 문자 클래스 처리를 위한 기능을 제공한다. 본 논문에서는 정규표현식에서 사용 빈도가 높은 문자 클래스들에 대해서 명령어의 오퍼랜드 필드에 비트맵 방식으로 나타내고, 하드 배선 방식으로 이 문자 클래스에 대한 매칭을 수행하여 효율적인 문자클래스 매칭을 수행하는 구조를 제안한다. 제안한 방법을 사용하면 Snort 규칙의 문자 클래스에 대해서 대부분의 문자 클래스를 명령어의 한 오퍼런드 또는 한 명령어로 나타낼 수 있다. 이처럼 REMPc에 비해서 적은 수의 명령어를 사용하므로 효율적인 문자 클래스 매칭을 할 수 있다.

다중바이트 문자집합 텍스트에서의 문자열 검색 알고리즘 (String Matching Algorithm on Multi-byte Character Set Texts)

  • 김은상;김진욱;박근수
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권10호
    • /
    • pp.1015-1019
    • /
    • 2010
  • 문자열 완전일치 검색 알고리즘용 지금까지 많은 연구가 되어왔지만, EUC-KR 용 다중바이트 문자집합에 대해서는 연구원 것이 부족한 상황이다. 이 논문에서는 기존의 KMP 알고리즘을 사용할 때 EUC-KR과 같은 다중바이트 문자집합 텍스트에서 오검색이 발생할 수 있음을 보이며, 문자 단위의 접두사 함수를 적용하여 오검색이 발생하지 않도록 개선한 KMP 알고리즘을 제안한다. 또한, 널리 사용되고 있는 편집기인 Vim과 Emacs의 검색 알고리즘 및 기존의 오토마타 방식의 연구 결과에 비해 논문에서 제안한 알고리즘이 더 빠른 속도를 보이는 실험 결과를 제시한다.

Bipartite Matching을 이용한 강인한 캐릭터 영상 검색 방법 (Robust Character Image Retrieval Method Using Bipartite Matching)

  • 이상엽;김회율
    • 방송공학회논문지
    • /
    • 제7권2호
    • /
    • pp.136-144
    • /
    • 2002
  • 본 논문에서는 다양하게 변화되는 캐릭터 영상을 색상과 형태의 정보를 포함한 국부 색상 분포(local color histogram)를 이용하여 유사도 검색을 하는 강인한 방법을 제안한다. 국부 색상 분포의 값을 양자화 하여 특징 값을 최적화하고, 대규모 데이터베이스에 저장되어 있는 영상정보와 Bipartite matching을 이용하여 검색한다. 제안되는 방법은 다양하게 변화되는 영상의 유사도 검색, 동영상 및 정지 영상에서 유사 영상 검색에 매우 효과적인 방법이다.

문자 별 특징 모델을 이용한 한글 문서 영상에서 키워드 검색 (Keyword Spotting on Hangul Document Images Using Character Feature Models)

  • 박상철;김수형;최덕재
    • 정보처리학회논문지B
    • /
    • 제12B권5호
    • /
    • pp.521-526
    • /
    • 2005
  • 본 논문에서는 저 품질의 한글 문서 영상에서 OCR 기반 검색 시스템의 대안으로 키워드 검출 시스템(Keyword Spotting)을 제안하고 OCR 기반 문서 검색 시스템과 비교한다. 제안 시스템은 문자 분할, 키워드 특징 추출 그리고 단어 매칭으로 구성된다. 문자 분할 단계에서는 인접한 두 문자간의 연결을 효과적으로 분리하면서 문자 넓이 값의 분산이 최소가 되도록 하는 문자 분할 방법을 제안한다. 키워드 특징은 서체별 문자 모델의 결합으로 구성한다. 단어 매칭 단계에서는 문자 매칭에 기반한 단어 대 단어 매칭 방법을 적용한다. 본 논문에서 제안한 키워드 검출 시스템의 성능을 평가하기 위해 한글 문서 영상을 대상으로 OCR 기반 문서 검색 시스템과 비교하였다. 그 결과 한글 글자 크기가 작고 문서의 상태가 좋지 않은 경우 제안한 키워드 검출 시스템에 의한 검색 성능이 OCR 기반 검색 시스템 보다 우수함을 입증하였다.

동적 프로그래밍 정합을 이용한 효율적인 필기 단어 인식 방법 (An Approach for Efficient Handwritten Word Recognition Using Dynamic Programming Matching)

  • 김경환
    • 전자공학회논문지C
    • /
    • 제36C권4호
    • /
    • pp.54-64
    • /
    • 1999
  • 본 논문에서는 실제 응용분야에서 사용될 수 있는 효율적인 필기 영어 단어 인식 방법을 제안한다. 필기 단어인식과 관련된 대부분의 응용분야에서 제공되는 사전의 활용을 극대화하기 위해 사전단어들을 인식의 초기 단계에서부터 사용한다. 초과 분할된 단어의 세크먼트들과 사전단어들 사이의 정합을 위해 동적 프로그래밍을 사용하며, 정합구간을 가변적으로 조정할 수 있도록 학습단계에서 추출한 문자 분할과 관련된 통계를 활용한다. 또한, 사전단어의 각 문자와 세그먼트들 사이의 정합 결과를 저장하여 반복되는 계산을 피한다. 제안하는 방법의 효용성을 입증하기 위해 다양한 서체를 갖는 실험용 필기 단어영상을 사용하여 실험을 수행한 결과, 사전에 기반한 단어 인식 과정을 최대로 활용하기 위한 가변정합구간 개념 및 문자단위 정합결과 저장 방법이 동적 프로그래밍과 함께 인식 속도 및 정확도 향상에 모두 크게 기여함을 확인하였다.

  • PDF

자. 모 해석적 모델에 의한 고정도 한글 인식 알고리즘에 관한 연구 - 패턴정합법에 기초한 후보문자 선정 및 구조해석적인 방법에 의한 유사문자 판별 - (A Study on the Highly Accurate Korean Character Recognition Algorithm, by analyzing Vowel and Consonant Models - Selectiong of candidates using pattern matching method and discriminating similar characters by structural analysis -)

  • 강선미;김봉석;김덕진
    • 전자공학회논문지B
    • /
    • 제30B권7호
    • /
    • pp.24-30
    • /
    • 1993
  • In this paper, a new method is proposed to recognize a character from its similar characters, which are selected by pattern matching method in Korean character recognition. This new method, which couples the merits of already suggested methods, can choose the character to be in the candidate set and discriminate it from the others correctly. To evaluate performance of this algorithm, we used 15 kinds of different laser printer fonts and obtained about 97% of recognition rate.

  • PDF

擴張된 DP 매칭법에 依한 흘림체 한글 온라인 認識 (On-Line Recognition of Cursive Hangeul by Extended DP Matching Method)

  • 이의동;김태균
    • 대한전자공학회논문지
    • /
    • 제26권1호
    • /
    • pp.29-37
    • /
    • 1989
  • 본 논문은 DP(dynamic programming) 매칭법을 확장하여 흘림체 한글을 온라인으로 인식하는 방법에 대하여 논한 것이다. 한글의 자소는 보다 간단한 자소에 선분이 점차로 추가되어 보다 복잡한 구조로 발전되는 특징이 있다. 자소의 조합에 의해 구성되는 한글에는 유사한 문자 패턴이 많다. 이러한 특성으로 인하여 한글에 대하여 DP매칭법을 적용하여도, 입력문자와 표준문자와의 패턴간 거리를 정확하게 구하는 것이 곤란하다. 본 방식에서는 DP매칭을 행하기 전에, 한글의 최초, 최후선분의 특성을 살린 대분류매칭을 행함으로써 DP매칭의 대상수를 줄였다. 본 방식은 DP매칭법에 자소패턴의 추출기능을 부가함으로써, DP매칭을 확장하여, 한글의 문자패턴간의 거리를 정확하게 측정하는 것을 시도한다. 자소패턴의 추출은, 자소패턴을 구성하는 선분의 ON/OFF, 방향코오드, 방향코오드의 변화, 배치 구조등을 조사함으로써 행한다. 이와같이 하므로써 필기운동 변화의 흡수와 비교적 안정된 스트로크의 분리가 가능함을 확인하였다.

  • PDF

한글 Shape 문자 Pattern에서의 구조적 정보를 이용한 형식분류와 인식 관한 연구 (A Study on Type Classification and Recognition Using Structural Information in Character Pattern of HANGEUL Shape)

  • 전종익;조용주;남궁재찬
    • 한국통신학회논문지
    • /
    • 제16권2호
    • /
    • pp.180-195
    • /
    • 1991
  • 본 논문은 한글 문자 패턴을 인식하기 위하여 쉐이프 패턴을 대상으로 한글의 구조적 정보를 이용한 새로운인식 방법에 대해서 연구하였다. 먼저, 입력된 데이타에 대하여 문자의 위치를 알기 위하여 문자 영역의 블럭화를 행하였고, 둘째로 한글의 무게 중심을 이용한 종모음의 유무를 결정하고, 횡모음과 짧은 기둥의 위치와 길이 조사 및 종정의 존재 여부를 조사하여 한글이 가지는 6가지의 기본 구조로 형식 분류를 하였으며, 마지막으로 분류된 형식에 따라 각각의 자소에 대해 유크리드 기리(Uclid distance)에 의한 탬플레이트 매칭(template matching)을 실행하여 인식을 행하였다. 본 연구는 실험을 통하여 총 2350자의 문자에 대하여 98.3%의 형식 분류율과 95.2%의 한글 인식율을 얻었다.

  • PDF

PCB 조립 장비를 위한 거버 문자 인식 알고리즘 개발 (Development Character Recognition Algorithm in Gerber File for the PCB Assembly Machine)

  • 김철한;박태형
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2000년도 제15차 학술회의논문집
    • /
    • pp.297-297
    • /
    • 2000
  • This paper proposed character recognition method by using DB Matching and Artificial Neural Network at the Gerber files. Gerber files are file for make PCB. But we also use the file to a program of extraction PCB position data. If the Gerber file recognized a character, the extraction PCB position data will be faster and also when the recognition rate is high, it can be possible to automatic extraction. We apply to the construction PCB Gerber file program and Simulation results are presented to verify the usefulness of the method.

  • PDF