• Title/Summary/Keyword: 문자패턴

Search Result 297, Processing Time 0.024 seconds

Design and Implementation of High-Speed Pattern Matcher Using Multi-Entry Simultaneous Comparator in Network Intrusion Detection System (네트워크 침입 탐지 시스템에서 다중 엔트리 동시 비교기를 이용한 고속패턴 매칭기의 설계 및 구현)

  • Jeon, Myung-Jae;Hwang, Sun-Young
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.40 no.11
    • /
    • pp.2169-2177
    • /
    • 2015
  • This paper proposes a new pattern matching module to overcome the increased runtime of previous algorithm using RAM, which was designed to overcome cost limitation of hash-based algorithm using CAM (Content Addressable Memory). By adopting Merge FSM algorithm to reduce the number of state, the proposed module contains state block and entry block to use in RAM. In the proposed module, one input string is compared with multiple entry strings simultaneously using entry block. The effectiveness of the proposed pattern matching unit is verified by executing Snort 2.9 rule set. Experimental results show that the number of memory reads has decreased by 15.8%, throughput has increased by 47.1%, while memory usage has increased by 2.6%, when compared to previous methods.

Pattern Search Algorithm in Suffix Arrays (접미사 배열에서의 패턴 검색 알고리즘)

  • 최용욱;박근수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04a
    • /
    • pp.958-960
    • /
    • 2004
  • 접미사 배열은 긴 문자열에 대한 효율적인 패턴 검색을 위해 널리 쓰이는 자료 구조로서 지금까지 접미사 배열을 이용하여 텔스트 T 안에서 패턴 P를 검색하는 O(|P|ㆍ|∑|), O(|P|ㆍlog|∑|)시간 알고리즘(|∑|:알파벳 크기)들 이 발표되었다. 본 논문에서는 O(|P|)시간 알고리즘을 제시하고, 기존의 알고리즘들과 비교한 실험 결과를 보여준다.

  • PDF

Job Scheduling and Pattern Recognition for Auto OSD Verification System (OSD 메뉴 자동검증을 위한 작업스케줄링 및 패턴 인식 기법)

  • Lee Jin-Seok;Kim Ho-Joon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06b
    • /
    • pp.379-381
    • /
    • 2006
  • 본 연구는 디스플레이 제품의 OSD(On Screen Display) 메뉴의 문자 오류 검사 과정을 자동화하는 방법과 FMM 신경망을 이용한 실시간 문자인식 방법을 제안한다. 이는 일반적인 문자인식 문제와는 달리 시스템 환경에 대한 몇 가지 가정과 제약조건을 고려해야 한다. 예컨대 문제의 특성상 카메라 및 TV제어 기기부의 동작과 연동하는 작업 스케줄링 기능과 실시간 분석기능 등의 요건은 시스템개발을 복잡하게 하는 반면, 주어진 OSD 메뉴 데이터로부터 검증과정은 미지 패턴에 대한 인식과정을 단순화하여 일종의 판정(decision) 문제로 고려될 수 있게 한다. 본 연구에서는 디스플레이 제품의 OSD 메뉴와 같이 특수한 구조를 갖는 문서영상에 대한 논리적인 구조분석을 통해서 연속적인 문서영상을 발생시켜서 검증과정을 자동화하는 작업스케줄링 방법을 제안하고 인식의 방법론으로서 수정된 구조의 FMM신경망을 적용한다. 또한 실제 데이터를 사용한 실험결과를 통해 시스템의 유용성을 고찰한다.

  • PDF

Text Region Detection Using Regional Connected Component and Edge Structure Component Feature From Natural Scene Images (지역적 연결요소 및 에지 구조 성분 특징을 이용한 자연이미지로부터 문자영역 검출)

  • Bak, Jong-Cheon;Hwang, Dong-Guk;Gwon, Gyo-Hyeon;Jeon, Byeong-Min
    • Proceedings of the KAIS Fall Conference
    • /
    • 2009.05a
    • /
    • pp.40-43
    • /
    • 2009
  • 최근 모바일 영상기반 응용 분야에 관한 연구가 활발히 진행되고 있으며 모바일기기로 촬영된 영상에서 문자정보를 추출하고자 하는 많은 연구도 진행되고 있다. 자연이미지로부터 문자정보를 추출을 위한 전단계로 문자영역 검출이 필수적이다. 본 연구는 문자영역의 지역적 에지 및 연결요소 특징을 고려하여 조명 및 복잡한 배경에서도 문자영역을 검출하는 방법을 제안한다. 에지 검출은 캐니-에지 검출기로 추출하고, RGB 컬러분포 패턴을 분석하여 컬러 양자화를 함으로서 연결성분을 추출한다. 각각 추출된 에지 및 연결성분으로부터 문자후보 영역을 검출하고, 각각의 결과를 결합하여 최종적인 문자 후보 영역을 검출하고, 문자 후보 영역에 대한 검증을 수행함으로서 최종적인 문자영역을 검출한다. 제안한 방법은 다양한 환경에서 얻어진 자연이미지를 대상으로 실험한 결과, 에지 및 연결성분의 두 가지 특징을 결합함으로서 자연이미지에 존재하는 다양한 형태의 문자영역을 효과적으로 검출하였다.

  • PDF

Extraction of Skeletons from Handwritten Hangul Characters using Shape Decomposition (모양 분해를 이용한 필기 한글 문자의 골격선 추출)

  • Hong, Ki-Cheon;Oh, Il-Seok
    • Journal of KIISE:Software and Applications
    • /
    • v.27 no.6
    • /
    • pp.583-594
    • /
    • 2000
  • The thinning process which is commonly used in extracting skeletons from handwritten Hangul characters has a problem of distorting the original pattern shapes. This paper proposes a method of skeleton extraction using a shape decomposition algorithm. We decompose the character pattern into a set of near convex parts using a shape decomposition algorithm. From the shape-decomposed pattern, we detect the joint parts and extract the skeletons from the parts incident to the joint parts. Then the skeletons not incident to the joint parts are extracted. Finally, the process of skeleton extension is performed to ensure the connectivity. We setup five criteria for the comparison of quality of skeletons extracted by our method and the thinning based method. The comparison shows the superiority of our method in terms of several criteria.

  • PDF

Constant Time RMESH Algorithm for Computing Longest Common Substring and Maximal Repeat of String (문자열의 최장 공통 부분문자열과 최대 반복자를 구하기 위한 상수시간 RMESH 알고리즘)

  • Han, Seon-Mi;Woo, Jin-Woon
    • The KIPS Transactions:PartA
    • /
    • v.16A no.5
    • /
    • pp.319-326
    • /
    • 2009
  • Since string operations were applied to computational biology area, various data structures and algorithms for computing efficient string operations have been studied. The longest common substring problem is an operation to find the longest matching substring in more than two strings, and maximal repeat of string problem is an operation to find substrings repeated more than once in the given string. These operations are importantly used in the string processing area such as pattern matching and likelihood measurement. In this paper, we present algorithms to compute the longest common substring of two strings and to find the maximal repeat of string using three-dimensional $n{\times}n{\times}n$ processors on RMESH(Reconfigurable MESH). Our algorithms have O(1) time complexity.

Regular Expression Matching Processor Architecture Supporting Character Class Matching (문자클래스 매칭을 지원하는 정규표현식 매칭 프로세서 구조)

  • Yun, SangKyun
    • Journal of KIISE
    • /
    • v.42 no.10
    • /
    • pp.1280-1285
    • /
    • 2015
  • Many hardware-based regular expression matching architectures are proposed for high performance matching. In particular, regular expression processors such as ReCPU and SMPU perform pattern matching in a similar approach to that used in general purpose processors, which provide the flexibility when updating patterns. However, these processors are inefficient in performing class matching since they do not provide character class matching capabilities. This paper proposes an instruction set and architecture of a regular expression matching processor, which can support character class matching. The proposed processor can efficiently perform character class matching since it includes character class, character range, and negated character class matching capabilities.

이동과 축척과 회전에 불변인 실용적인 패턴 인식 시스템

  • 김회율
    • The Magazine of the IEIE
    • /
    • v.21 no.10
    • /
    • pp.47-54
    • /
    • 1994
  • 본 논문에서는 물체들의 이동(translation) 축적(scale) 그리고 회전방향(orientation)에 무관하게 물체를 인식하는 실용적인 패턴 인식 시스템을 소개한다. 이 시스템은 2진영상으로 변환하는데 필요한 임계치(threshold)의 큰 변화에도 덜 민감하다. 특징 벡터(feature vector)로 서는 Zernike 모멘트를 사용하였는데 지금까지 잘 알려진 Hu가 제안한 7개의 모멘트 불변수 (moment invariants)와 비교한다. 또한, 실용적인 기계 시각(machine vision) 시스템에 대해 세 가지 중요한 문제로서 패턴 정규화(pattern nomalization), Zernike 모멘트의 신속한 계산, 그리고 k-NN 규칙을 이용한 분류 등을 논의하였다. 실험에서는 임의의 회전 방향에서 문자들의 크기가 10x10 화소(pixel)에서 512x512 화소까지 변하는 서로 다른 크기를 가진 인쇄된 62개의 문자와 숫자 그리고 기호들을 서로 다른 임계치에서 인식하는 것을 보여준다.

  • PDF

A Study on Pattern Recognition of Dynamic Object (동적인 생물체의 패턴 인식)

  • 강동구;차의영;전태수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.437-439
    • /
    • 2000
  • 본 논문은 연층형 생물체의 형태를 인식하는 방법을 제안한다. 고정된 카메라에 제약된 공간상에서 움직이는 생물체를 인식하기 위하여 다음과 같은 과정을 거친다. 먼저 배경 영상을 추출한 후 배경 영상과 현재 영상의 차영상을 통하여 물체의 이진화 영상을 생성하여 세선화 작업을 거친 후 마지막으로 변환된 이미지에서 대표점을 추출하여 패턴 생성기의 입력 데이터로 사용한다. 생물체의 형태 인식 방법은 문자 인식 방법과 몇 가지 차이점을 가지는데 문자의 경우 'q'와 'b'가 다르게 인식되지만 생물체의 경우 이 두 형태는 단지 하나의 형태가 회전한 결과이므로 두 형태를 동일하게 인식해야 한다. 그러므로 패턴 생성을 위한 입력 데이터도 다른 형태를 띄게 된다. 본 논문에서 제안한 방법은 지렁이, 뱀 등과 같은 물체의 행동 분석을 하기 위한 기초 데이터를 생성하는 좋은 방법이 될 수 있다.

  • PDF

A DNA Index Structure Using Signature by Weighted Number of Characters (가중치를 갖는 문자의 개수를 서명으로 이용한 DNA 인덱스 구조)

  • 김우철;민준기;박상현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.337-339
    • /
    • 2004
  • 우리는 대규모의 유전자 데이터베이스에서 원하는 패턴을 빠르고 정확하게 찾고 싶어한다 하지만 지금까지 나온 대부분의 검색방법들은 인덱스의 크기를 실제 데 이 터 보다 훨씬 크게 만들어 사용해왔다. 그런 방법들은 기하급수적으로 증가하고 있는 데 이 터를 처 리 하는 데는 비효율적이다. 따라서 인덱스 크기를 실제 데이터보다 작게 만들면서도 원하는 패턴을 빨리 찾을 수 있는 효율적 인 방법 이 필요하다. 이렇게 하기 위해서는 일정한 크기의 데이터를 작은 크기의 데이터로 줄인 후, 이 데이터를 이용하여 인덱스를 만들어야 한다. 이 논문에서는 일정한 크기의 문자열(=윈도우)을 작은 크기의 숫자들(=서명)로 표현해서 인덱스를 구축한 후, 이를 이용해 우리가 원하는 패턴을 최소한의 디스크 접근을 통해 빠르게 찾을 수 있는 방법을 제시한다.

  • PDF