• 제목/요약/키워드: 패턴 매칭 알고리즘

검색결과 156건 처리시간 0.027초

정규 표현식을 이용한 패턴 매칭 엔진 개발 (Development of the Pattern Matching Engine using Regular Expression)

  • 고광만;박홍진
    • 한국콘텐츠학회논문지
    • /
    • 제8권2호
    • /
    • pp.33-40
    • /
    • 2008
  • 스트링 패턴 매칭 알고리즘은 특정 검색어, 키워드를 검색하는 속도에서는 우수성이 다양한 방법으로 입증되었지만 다양한 패턴에 대해서는 기존의 알고리즘으로는 한계를 가지고 있다. 본 논문에서는 정규 표현식을 이용하여 특정 키워드를 포함하여 다양한 패턴의 검색어에 대해서도 효율적인 패턴 매칭을 수행하여 패턴 검색의 효율을 높이고자 한다. 이러한 연구는 기존의 단순한 키워드 매칭에 비해 각종 유해한 스트링 패턴을 효과적으로 검색할 수 있으며 스트링 패턴 매칭 속도에서도 기존의 알고리즘에 비해 우수성을 갖는다. 본 연구에서 제안한 LEX로부터 생성된 스트링 검색 엔진은 패턴 검색 속도에 대한 실험에서 패턴의 수가 1000개 이상인 경우에서는 BM&AC 알고리즘보다 효율적이지만 키워드 검색에서는 유사한 결과를 얻었다.

k개의 오차를 허용하는 순위 패턴 매칭 (Order preserving matching with k mismatches)

  • 이인복
    • 스마트미디어저널
    • /
    • 제9권2호
    • /
    • pp.33-38
    • /
    • 2020
  • 순위 패턴 매칭 문제는 패턴과 텍스트가 주어졌을 때, 텍스트의 부분 문자열 중 패턴과 순위 동형을 만족하는 것들을 찾는 문제이다. 이 논문에서는 순위 패턴 매칭에 k개의 오차를 허용하는 문제를 푸는 알고리즘을 제안한다. 제안하는 알고리즘은 기존의 알고리즘에 비하여 간단하고 구현이 쉬우며, 평균적인 경우 선형 시간 복잡도를 가진다. 또한 실험을 통해서, 제안된 알고리즘이 현실적인 데이터에 대해서 효율적으로 동작함을 보인다.

트리패턴매칭기법의 재목적 가능한 중간코드 최적화 시스템 (Retargetable Intermediate Code Optimization System Using Tree Pattern Matching Techniques)

  • 김정숙;오세만
    • 한국정보처리학회논문지
    • /
    • 제6권8호
    • /
    • pp.2253-2261
    • /
    • 1999
  • ACK에서는 패턴 테이블 생성기와 핍홀 최적화기에서 스트링 패턴 매칭 기법을 이용하여 EM 중간 코드에 대한 최적화 코드를 생성한다. 하지만 이 스트링 패턴 매칭 방법은 패턴 결정 시에 반복적으로 많은 비교 동작이 이루어지므로 비효율적이다. 본 논문은 ACK의 중간 코드 최적화기를 개선하기 위해 EM 트리 생성기, 최적화 패턴 테이블 생성기, 트리 패턴 매칭기로 구성된 트리 패턴 매칭 알고리즘을 이용한 EM 중간 코드 최적화 시스템을 설계하고 구현하였다. 이러한 트리 패턴 매칭 알고리즘은 EM 트리를 하향식으로 순회하면서 트리 구조를 가진 패턴 테이블을 참조하여 루트 노드를 중심으로 패턴 매칭을 수행한다. 트리 패턴 매칭 동작은 궁극적으로 ACK의 스트링 패턴 매칭에 비해 최적화 패턴을 찾는데 걸리는 시간을 평균 10.8% 감소시킬 수 있는 효과를 보였다.

  • PDF

순위다중패턴매칭을 위한 해싱기반 알고리즘 (A Hashing-Based Algorithm for Order-Preserving Multiple Pattern Matching)

  • 강문성;조석현;심정섭
    • 정보과학회 논문지
    • /
    • 제43권5호
    • /
    • pp.509-515
    • /
    • 2016
  • 순위패턴매칭문제는 텍스트 T와 패턴 P가 주어질 때, P와 각 문자들의 순위가 동일한 순서로 나타나는 T의 모든 부분문자열을 찾는 문제이다. 순위패턴매칭문제는 주가지수분석과 음악의 유사성분석과 같이 문자 자체를 비교하는 것보다 값의 변화순서가 중요한 분야에서 연구가 진행되었다. 순위다중패턴매칭문제는 텍스트 T와 여러 개의 패턴들로 이루어진 패턴집합 $\mathbb{P}$가 주어질 때, $\mathbb{P}$에 속한 패턴과 각 문자들의 순위가 동일한 순서로 나타나는 T의 모든 부분문자열을 찾는 문제이다. 본 논문에서는 순위다중패턴매칭문제를 해결하는 해싱기반 알고리즘을 제시한다.

패턴매칭 알고리즘의 측위 성능 분석 및 데이터베이스 구축 알고리즘을 이용한 정확도 향상 방법 (Location Accuracy Analysis and Accuracy Improvement Method of Pattern Matching Algorithm Using Database Construction Algorithm)

  • 주영환;박용완
    • 대한전자공학회논문지TC
    • /
    • 제46권4호
    • /
    • pp.86-94
    • /
    • 2009
  • 현재 위치기반서비스(LBS : Location Based Service) 를 위해 사용되고 있는 위치측위 방식은 GPS 기반의 측위 방식과 이동통신망을 이용한 네트워크 기반의 측위기술들이 있다. 그러나 GPS 와 네트워크기반의 측위 방식은 비가시선 효과(NLOS) 와 중계기에 의한 전파 지연 발생 때문에 위치측위 정확도가 저하되는 문제점이 있다. 이러한 단점을 보완하기 위해 현재 CDMA 시스템에서는 패턴매칭(Pattern Matching) 알고리즘을 사용한다. 패턴매칭 알고리즘은 GPS 에 의한 위치측위 시 측정된 RF 신호의 전파 특성을 측위 된 위치와 함께 데이터베이스로 구축하여, 사용자의 측위 요청이 있을 때 수신신호의 전파특성과 데이터베이스를 비교하여 위치를 제공하는 방식이다. 그러나 패턴매칭 알고리즘은 GPS 신호를 수신할 수 없는 음영 지역과 실내 에서는 데이터베이스가 구축되어지지 않는다. 패턴매칭 알고리즘은 데이터베이스의 위치 정보가 위치측위를 요청하는 사용자의 위치를 결정하기 때문에 데이터베이스가 구축이 되지 않는 지역에서는 측위정확도의 오차가 발생하게 된다. 따라서 본 논문에서는 현재 CDMA 시스템에서 사용하는 패턴매칭 알고리즘의 위치측위 성능을 분석하고 패턴매칭 알고리즘을 이용한 위치측위 시스템의 성능을 향상시키기 위해서 신호세기 예측 알고리즘을 이용하여 현재 구축이 되지 않은 지역의 데이터베이스를 구축하기 위한 알고리즘을 제안하였다. 제안하는 알고리즘으로 데이터베이스가 없는 지역의 신호세기를 예측하여 데이터베이스를 구축한 후 패턴매칭 알고리즘의 위치측위 성능을 분석하였다.

네트워크 보안을 위한 서픽스 트리 기반 고속 패턴 매칭 알고리즘 (High Performance Pattern Matching algorithm with Suffix Tree Structure for Network Security)

  • 오두환;노원우
    • 전자공학회논문지
    • /
    • 제51권6호
    • /
    • pp.110-116
    • /
    • 2014
  • 패턴 매칭 알고리즘은 컴퓨터 네트워크, 유비쿼터스 네트워크, 그리고 센서 네트워크 등을 위한 보안 프로그램에 주로 사용 된다. IT 기술의 발전과 함께 정보의 디지털화가 가속화되면서 네트워크를 통해 전달되는 데이터양이 급증하고 있다. 이에 따라 패턴 매칭 연산의 복잡도도 폭발적으로 증가하고 있다. 따라서 더 많은 패턴을 보다 빠르게 검색할 수 있는 고성능 알고리즘의 개발이 끊임없이 요구되고 있다. 본 논문은 서픽스 트리 기반 패턴 매칭 알고리즘을 새롭게 제안하여 대용량 패턴 매칭 연산의 성능을 높였다. 서픽스 트리는 사전에 정의된 복수 패턴들의 서픽스를 기반으로 생성된다. 이 트리에 쉬프트 노드 개념을 추가하여 기존 패턴 매칭 연산들 중 불필요한 연산의 수행 횟수를 줄였다. 결과적으로 제안하는 구조를 통해 기존 알고리즘 대비 24% 이상의 성능 향상을 이루었다.

침입 탐지시스템의 유사 패턴 매칭을 위한 알고리즘 (Algorithm for Similar Pattern Matching on Intrusion Detecting System)

  • 정유석;홍만표
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.853-856
    • /
    • 2000
  • 최근 정보통신 관련 시장의 양적 팽창과 함께 발생된 수많은 시스템 침입 사건들은 컴퓨터 보안 문제와 이를 해결하기 위한 보안 시스템에 대한 관심을 증가시키고 있다. 침입탐지시스템은 보안 시스템의 핵심 요소로, 그 중 대부분이 패턴 매칭을 이용한 침입탐지방식을 채택하고 있다. 그러나 현재의 패턴 매칭을 위한 알고리즘은 유연하지 못하기 때문에, 다양한 특성을 지닌 공격들에 대한 대처 능력이 부족하다. 이를 해결하기 위해 본 논문에서는 패턴들의 특성에 따라 유연하게 대처할 수 있는 세 가지의 유사 패턴 매칭 알고리즘을 제안한다.

  • PDF

텍스트의 핑거프린트를 이용한 순위다중패턴매칭 알고리즘 병렬 구현 (A Parallel Implementation of the Order-Preserving Multiple Pattern Matching Algorithm using Fingerprints of Texts)

  • 박소민;김영호;심정섭
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.57-60
    • /
    • 2020
  • 순위다중패턴매칭문제는 길이가 n인 텍스트 T와 패턴들의 집합 P' = {P1,P2…,Pk}가 주어졌을 때, P'에 속하는 패턴들과 상대적인 순위가 일치하는 T의 모든 부분문자열들의 위치를 찾는 문제이다. P'에서 가장 짧은 패턴의 길이가 m, 가장 긴 패턴의 길이를 $\bar{m}$, 모든 패턴들의 길이의 합을 M, q개의 연속된 문자들을 q-그램이라 할 때, 기존에 텍스트의 핑거프린트를 이용하여 순위다중패턴매칭문제를 $O(q!+nqlogq+Mlog\bar{m}+nM)$ 시간에 해결하는 알고리즘이 제시되었다. 본 논문에서는 텍스트의 핑거프린트를 활용하여 O(max(q!,M,n))개의 스레드를 이용하여 순위다중패턴매칭문제를 평균적으로 $O(\bar{m}+qlogq+n/q!)$ 시간에 해결하는 병렬 구현 방법을 제시한다. 실험 결과, n = 1,000,000, k = 1,000, m = 5, q = 3일 때, 본 논문에서 제시하는 병렬 구현 방법은 기존의 순차 알고리즘보다 약 19.8배 빠르게 수행되었다.

순위다중패턴매칭을 위한 해싱기반 알고리즘의 이동테이블 병렬계산 (Parellel Computation of the Shift Table of a Hashing-Based Algorithm for the Order-Preserving Multiple Pattern Matching)

  • 박정훈;김영호;권상훈;심정섭
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.36-39
    • /
    • 2017
  • 길이가 같은 두 문자열의 같은 위치에 있는 문자의 순위가 모두 일치할 때, 두 문자열은 순위동형이라 한다. 순위다중패턴매칭문제는 텍스트 T와 k개의 패턴들의 집합 $P^{\prime}=\{P_1,P_2{\ldots},P_k\}$이 주어졌을 때, P'의 패턴들과 순위동형인 T의 모든 부분문자열의 위치를 찾는 문제이다. 최근 전처리단계에서 P'에 대한 이동테이블을 O(kmqlogq) 시간에 계산하여 순위다중패턴매칭문제를 해결하는 해싱기반 알고리즘이 제시되었다. 이때 P'에서 가장 짧은 패턴의 길이를 m, q-그램의 길이를 q라고 한다. 본 논문에서는 P'이 주어졌을 때, 이동테이블을 O(mqlogq) 시간에 계산하는 병렬알고리즘을 제시한다. 실험결과, 본 논문에서 제시하는 병렬알고리즘은 k개의 스레드를 이용하여 m=100, q=5에 대해 k=100일때와 k=1,000일 때 순차알고리즘보다 각각 약 12.9배, 약 215배 빠른 수행시간을 보였다.

다중 발화점을 이용한 Grassfire 스팟매칭 기법 (Grassfire Spot Matching Method for multi-seed matched spot pair)

  • 류윤규
    • 한국정보컨버전스학회논문지
    • /
    • 제7권2호
    • /
    • pp.59-65
    • /
    • 2014
  • grassfire 스팟매칭 알고리즘은 중심 스팟을 기준으로 이웃 스팟들의 패턴 유사도에 따라 스팟을 매칭하는 알고리즘으로 잔디에 붙는 불이 사방으로 번져가는 방식을 이용한 grassfire 알고리즘을 이다. 씨드 스팟쌍은 매칭이 정확하게 확인된 스팟쌍으로써 매칭이 시작되는 발화점이며 이것으로부터 스팟매칭이 시작된다. grassfire 스팟매칭 알고리즘에서는 스팟매칭을 시작하는 발화점이 필요한데 기존 grassfire 스팟매칭 알고리즘에서는 한 개의 발화점을 이용하였다. 본 논문에서는 grassfire 알고리즘의 스팟매칭의 성능을 높이기 위하여 한 개의 발화점이 아닌 다중의 발화점을 선정하는 방법을 제안한다. 다중 발화점을 이용한 grassifre 알고리즘은 여러 개의 발화점을 선정한 후 개별 발화점으로부터 스팟매칭을 수행하고 결과들을 계산한다. 제안된 알고리즘은 한 개의 씨드스팟을 이용한 방법보다 스팟 검출율과 스팻매칭 정확도의 측면에서 좋은 성능을 보인다.

  • PDF