• Title/Summary/Keyword: 정규 패턴

Search Result 273, Processing Time 0.023 seconds

Implementation of Regular Path Expression for XML Query (XML질의를 위한 정규 경로 표현 구현 기법)

  • 박성희;김대중;류근호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.100-102
    • /
    • 2001
  • XML과 같은 반 구조 데이터는 일반적으로 방향그래프 기반의 데이터 모델을 가지므로 XML에 대한 질의는 이러한 그래프를 탐색하기 위한 패스 표현을 기반으로 한다. 도한 구조가 정형화되지 않고 빠르게 변하기 때문에 질의시 특정한 패턴을 탐색하기 위해 정규 경로 표현이 이용된다. 그러나 이러한 정규 경로 표현은 실행시에 전체 데이터베이스 그래프를 탐색하므로 실행 비용이 매우 높다는 문제점이 있다. 따라서 이 논문에서는 정규 경로 표현 연산자를 효율적으로 실행하기 위해 데이터 그래프에 대한 경로 인덱스와 SQL의 패턴 매치를 이용한 경로 표현 질의 변환기법을 제시한다. 즉, XML-QL 질의언어에 포함된 정규 패스 표현 연산자를 관계형 데이터베이스를 기반으로 효율적으로 실행할수 있는 질의 변환 기법과 경로 인덱스그래프를 이용하여 처리비용이 높은 순환연산을 처리할 수 있는 기법을 구형하여 성능 평가를 실시한 결과를 보여준다.

  • PDF

A Hardware Architecture of Multibyte-based Regular Expression Pattern Matching for NIDS (NIDS를 위한 다중바이트 기반 정규표현식 패턴매칭 하드웨어 구조)

  • Yun, Sang-Kyun;Lee, Kyu-Hee
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.34 no.1B
    • /
    • pp.47-55
    • /
    • 2009
  • In recent network intrusion detection systems, regular expressions are used to represent malicious packets. In order to process incoming packets through high speed networks in real time, we should perform hardware-based pattern matching using the configurable device such as FPGAs. However, operating speed of FPGAs is slower than giga-bit speed network and so, multi-byte processing per clock cycle may be needed. In this paper, we propose a hardware architecture of multi-byte based regular expression pattern matching and implement the pattern matching circuit generator. The throughput improvements in four-byte based pattern matching circuit synthesized in FPGA for several Snort rules are $2.62{\sim}3.4$ times.

On the Filtering of Hangul character Element with the Spatial Positioning Modulation (공간 위치 변조에 의한 한글자소의 필터링)

  • 강대수;진용옥
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.17 no.9
    • /
    • pp.1029-1039
    • /
    • 1992
  • This paper presents the filtering method which is processed on the frequency domain among Hangul character recognition methods. It is processed the Hangul character parrern with spatial positioning modulation and mapped the Hangul character element which have spatial position variant feature onto frequency domain, at this time, normalized spatial position and so normalized the character size in frequency domain. And it is grouped the Hangul character element according to the generating position and set the standard pattern, and used each standard character element pattern with character element filter and filtering the character pattern of Hangul character, it is derived the normalized cross correlation function and the coherence function led to the filtering results, and calculated classification threshold.

  • PDF

Pattern and Instance Generation for Self-knowledge Learning in Korean (한국어 자가 지식 학습을 위한 패턴 및 인스턴스 생성)

  • Yoon, Hee-Geun;Park, Seong-Bae
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.25 no.1
    • /
    • pp.63-69
    • /
    • 2015
  • There are various researches which proposed an automatic instance generation from freetext on the web. Existing researches that focused on English, adopts pattern representation which is generated by simple rules and regular expression. These simple patterns achieves high performance, but it is not suitable in Korean due to differences of characteristics between Korean and English. Thus, this paper proposes a novel method for generating patterns and instances which focuses on Korean. A proposed method generates high quality patterns by taking advantages of dependency relations in a target sentences. In addition, a proposed method overcome restrictions from high degree of freedom of word order in Korean by utilizing postposition and it identifies a subject and an object more reliably. In experiment results, a proposed method shows higher precision than baseline and it is implies that proposed approache is suitable for self-knowledge learning system.

Time Expression Analysis For Reminder Applications Using Speech Recognition (음성인식 기반 리마인더를 위한 시간 표현 분석 기법)

  • Park, Jaeseong;Lee, Sangwon;Jang, Jaena;Kang, Sangwoo
    • Annual Conference on Human and Language Technology
    • /
    • 2017.10a
    • /
    • pp.264-266
    • /
    • 2017
  • 본 연구는 리마인더 앱을 위한 효과적인 시간 표현 분석 방법을 제안한다. 시간 표현 분석을 위한 정규식 패턴을 이용하여 사용자 발화 텍스트로부터 시간 정보를 분석하고 시간 표현 유형에 따라 절대적 시간 정보로 변환한다. 제안한 방법은 정규식 패턴을 이용한 시간 표현 분석 기법으로 시스템의 유지 관리가 용이하고 정보량이 많은 패턴과의 매칭을 위해 효과적이다.

  • PDF

Performance Evaluation of Various Normalization Methods and Score-level Fusion Algorithms for Multiple-Biometric System (다중 생체 인식 시스템을 위한 정규화함수와 결합알고리즘의 성능 평가)

  • Woo Na-Young;Kim Hak-Il
    • Journal of the Korea Institute of Information Security & Cryptology
    • /
    • v.16 no.3
    • /
    • pp.115-127
    • /
    • 2006
  • The purpose of this paper is evaluation of various normalization methods and fusion algorithms in addition to pattern classification algorithms for multi-biometric systems. Experiments are performed using various normalization functions, fusion algorithms and pattern classification algorithms based on Biometric Scores Set-Releasel(BSSR1) provided by NIST. The performance results are presented by Half Total Error Rate (WTER). This study gives base data for the study on performance enhancement of multiple-biometric system by showing performance results using single database and metrics.

An Accurate Log Object Recognition Technique

  • Jiho, Ju;Byungchul, Tak
    • Journal of the Korea Society of Computer and Information
    • /
    • v.28 no.2
    • /
    • pp.89-97
    • /
    • 2023
  • In this paper, we propose factors that make log analysis difficult and design technique for detecting various objects embedded in the logs which helps in the subsequent analysis. In today's IT systems, logs have become a critical source data for many advanced AI analysis techniques. Although logs contain wealth of useful information, it is difficult to directly apply techniques since logs are semi-structured by nature. The factors that interfere with log analysis are various objects such as file path, identifiers, JSON documents, etc. We have designed a BERT-based object pattern recognition algorithm for these objects and performed object identification. Object pattern recognition algorithms are based on object definition, GROK pattern, and regular expression. We find that simple pattern matchings based on known patterns and regular expressions are ineffective. The results show significantly better accuracy than using only the patterns and regular expressions. In addition, in the case of the BERT model, the accuracy of classifying objects reached as high as 99%.

Gesture Recognition Algorithmfrom the Webcam Images (웹캠 이미지에서 손동작 인식 알고리즘)

  • Choi, Chul-Seung;Oh, Kab-Suk
    • Proceedings of the KAIS Fall Conference
    • /
    • 2010.11a
    • /
    • pp.88-91
    • /
    • 2010
  • 최근 무선통신 기술의 발당과 인터넷의 발달로 웹캠을 활용하여 얼굴인식, 몸동작 인식, 제스처 인식 등의 연구가 활발히 진행되고 있다. 본 연구에서는 웹캠으로부터 입력되는 손동작 동영상을 처리하여 수화 패턴 신호를 인식하는 손동작 인식 알고리즘을 제안한다. 제안방법은 프레임간의 차 연산을 이용하여 움직이는 오브젝트를 추출하고, YCbCr로 변환하여 손 모양 영역을 추출하여 특정 크기의 정규화 영상으로 변화하며, 정규화 영상의 오브젝트의 무게중심점을 기준으로 원의 반지름을 결정하고 원을 탐색하여 손가락의 펴짐과 굽힘에 대한 패턴 비교를 통하여 손 모양을 인식한다.

  • PDF

Regression Model With High Reliability by Using Neural Networks (신경망을 이용한 고신뢰성의 회귀분석 모델)

  • Jo, Yong-Hyeon
    • The KIPS Transactions:PartB
    • /
    • v.8B no.4
    • /
    • pp.327-334
    • /
    • 2001
  • 본 논문에서는 기울기하강과 동적터널링이 조합된 학습알고리즘의 다층신경망을 이용한 고신회성의 회귀분석 모델을 제안하였다. 기울기하강은 빠른 수렴속도의 최적화가 가능하도록 하기 위함이고, 동적터널링은 국소최적해를 만났을 때 이를 벗어난 새로운 연결가중치를 설정하여 전역최적해로 수렴되도록 하기 위함이다. 또한 대용량의 입력 데이터를 통계적으로 독립인 특징들의 집합으로 변환시키는 주요성분분석 기법의 속성을 살려 학습데이터의 차원을 감소시킴으로서 고차원의 학습데이터에 따른 회귀분석 모델의 제약도 동시에 해결하였다. 제안된 기법의 신경망을 3개의 독립변수 패턴을 가진 암모니아 제조공정문제와 10개의 독립변수 패턴을 가진 자동차 연비문제에 각각 적용하여 시뮬레이션한 결과, 기존의 역전과 알고리즘의 신경망이나 주요성분분석에 의한 차원을 감소시키지 않은 학습패턴을 이용한 신경망보다 각각 더욱 우수한 학습성능과 회귀성능이 있음을 확인할 수 있었다. 또한 학습패턴의 영평균 정규화로 회귀용 신경망의 성능을 더욱 더 개선하였다.

  • PDF

Pattern Segmentation of Low-quality Images using Active Multiple Template (능동 다중 템플레이트에 의한 저화질 패턴 분할)

  • Ahn, In-Mo;Lee, Kee-Sang;Hur, Hak-Bom
    • Proceedings of the KIEE Conference
    • /
    • 2003.07d
    • /
    • pp.2555-2557
    • /
    • 2003
  • 본 논문에서는 열화된 이미지상에서의 자동 패턴 분할을 위해 농담 정규화 정합(NGC)법과 다중 템플레이트를 이용하여 검사 이미지내의 각 문자의 정합 계수치 합을 이용한 문자나 패턴을 자동으로 분할(segmentation)하는 알고리즘을 제안한다. 전통적인 NGC를 사용하는 검사 알고리즘은 기준 패턴의 기하학적인 level 값에 의해 계산되어 지기 때문에 검사 이미지의 획득이 불완전하다면 정합의 부독율(reject rate)은 높아진다. 제안한 알고리즘은 가시화가 좋지 않은 영상 회득 시 문자부와 배경부를 효과적으로 자동으로 분류하며 이미지 영역내의 정보와 정규화 된 상관관계를 이용하여 실제 영상에 적용시켜 제안된 알고리즘의 검증을 목표로 한다.

  • PDF