• 제목/요약/키워드: 정규 패턴

검색결과 273건 처리시간 0.032초

XML질의를 위한 정규 경로 표현 구현 기법 (Implementation of Regular Path Expression for XML Query)

  • 박성희;김대중;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.100-102
    • /
    • 2001
  • XML과 같은 반 구조 데이터는 일반적으로 방향그래프 기반의 데이터 모델을 가지므로 XML에 대한 질의는 이러한 그래프를 탐색하기 위한 패스 표현을 기반으로 한다. 도한 구조가 정형화되지 않고 빠르게 변하기 때문에 질의시 특정한 패턴을 탐색하기 위해 정규 경로 표현이 이용된다. 그러나 이러한 정규 경로 표현은 실행시에 전체 데이터베이스 그래프를 탐색하므로 실행 비용이 매우 높다는 문제점이 있다. 따라서 이 논문에서는 정규 경로 표현 연산자를 효율적으로 실행하기 위해 데이터 그래프에 대한 경로 인덱스와 SQL의 패턴 매치를 이용한 경로 표현 질의 변환기법을 제시한다. 즉, XML-QL 질의언어에 포함된 정규 패스 표현 연산자를 관계형 데이터베이스를 기반으로 효율적으로 실행할수 있는 질의 변환 기법과 경로 인덱스그래프를 이용하여 처리비용이 높은 순환연산을 처리할 수 있는 기법을 구형하여 성능 평가를 실시한 결과를 보여준다.

  • PDF

NIDS를 위한 다중바이트 기반 정규표현식 패턴매칭 하드웨어 구조 (A Hardware Architecture of Multibyte-based Regular Expression Pattern Matching for NIDS)

  • 윤상균;이규희
    • 한국통신학회논문지
    • /
    • 제34권1B호
    • /
    • pp.47-55
    • /
    • 2009
  • 최근의 네트워크 침입탐지 시스템에서는 침입이 의심되는 패킷을 나타내는 데 정규표현식이 사용되고 있다. 고속 네트워크를 통해서 입력되는 패킷을 실시간으로 검사하기 위해서는 하드웨어 기반 패턴 매칭이 필수적이며 변화되는 패턴 규칙을 다루기 위해서는 FPGA와 같은 재구성 가능한 디바이스를 사용하는 것이 바람직하다. FPGA의 동작 속도 제한으로 바이트 단위의 패킷 검사로는 실시간 검사를 할 수 없는 경우에 이를 해결하기 위해서 여러 바이트 단위로 검사하는 것이 필요하다. 본 논문에서는 정규표현식 패턴 매칭을 n바이트 단위로 처리하는 하드웨어의 구조와 설계 방법을 제시하고 이에 대한 패턴 매칭 회로 생성기를 구현한다. Snort 규칙에 대해 FPGA로 합성된 하드웨어는 n=4일 때에 규칙에 따라서 $2.62{\sim}3.4$배의 처리 속도 향상을 보였다.

공간 위치 변조에 의한 한글자소의 필터링 (On the Filtering of Hangul character Element with the Spatial Positioning Modulation)

  • 강대수;진용옥
    • 한국통신학회논문지
    • /
    • 제17권9호
    • /
    • pp.1029-1039
    • /
    • 1992
  • 본 논문은 한글인식 방법중 주파수 변환영역에서 행하는 필터링의 방법을 제시한 것이다. 한글 문자패턴을 2차원 변조처리하여 공간위치에 의존적인 한글자소의 위상문자적 특징을 주파수 영역으로 사상하였고, 이때 변조 주파수를 정규화함으로서 주파수 영역에서 문자의 크기를 정규화 한다. 또한 한글의 각 자소를 발생위치에 따라 분류하여 표준패턴으로 설정하고, 설정된 각 자소의 표준패턴을 자소필터로 사용하여 주파수 영역으로 사상된 문자패턴을 필터링하였다. 한글자소의 분별 파라미터로는 정규화된 상호상관함수와 필터링 결과로 부터 유도된 코히어런스 함수를 산출하여 분별기준을 설정하였으며, 그 결과로서 문자크기의 변화, 자소의 융착, 제한적인 자획의 유실이나 잡음의 혼입등의 요인이 발생하였음 경우에도 한글자소의 분별이 가능하였고 또한 표준패턴을 설정함에 따라 숫자, 영문자등의 분별에도 적용할 수 있었다.

  • PDF

한국어 자가 지식 학습을 위한 패턴 및 인스턴스 생성 (Pattern and Instance Generation for Self-knowledge Learning in Korean)

  • 윤희근;박성배
    • 한국지능시스템학회논문지
    • /
    • 제25권1호
    • /
    • pp.63-69
    • /
    • 2015
  • 웹의 비구조 문서로부터 자동으로 인스턴스를 생성하기 위한 다양한 연구가 제안되었다. 영어권의 기존 연구들에서는 간단한 규칙과 정규식 기반의 패턴을 활용하였다. 영어에서는 단순한 정규식 기반의 패턴만으로도 충분히 높은 정확도를 보여주었지만. 한국어는 영어와 다른 언어적인 특성으로 인하여 기존의 정규식 형태의 패턴으로는 적합한 패턴을 생성할 수 없다. 이에 본 논문에서는 한국어에 적합한 패턴 및 인스턴스 생성 방법을 제안한다. 제안한 방법은 대상 문장의 의존 관계를 고려함으로써 높은 정확도를 가지는 패턴 집합을 생성한다. 또한 인스턴스의 주어(subject)와 목적어(object) 판별을 위하여 조사 정보를 함께 활용함으로써 한국어의 자유로운 어순으로부터 오는 제약을 해결한다. 실험 결과에 따르면 본 논문에서 제안한 패턴 생성 방법이 단순 어순만을 고려하여 생성된 패턴들에 비하여 더 높은 정확률을 보여주어, 한국어 대상 자동 인스턴스 생성에 적합함을 확인하였다.

음성인식 기반 리마인더를 위한 시간 표현 분석 기법 (Time Expression Analysis For Reminder Applications Using Speech Recognition)

  • 박재성;이상원;장재나;강상우
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.264-266
    • /
    • 2017
  • 본 연구는 리마인더 앱을 위한 효과적인 시간 표현 분석 방법을 제안한다. 시간 표현 분석을 위한 정규식 패턴을 이용하여 사용자 발화 텍스트로부터 시간 정보를 분석하고 시간 표현 유형에 따라 절대적 시간 정보로 변환한다. 제안한 방법은 정규식 패턴을 이용한 시간 표현 분석 기법으로 시스템의 유지 관리가 용이하고 정보량이 많은 패턴과의 매칭을 위해 효과적이다.

  • PDF

다중 생체 인식 시스템을 위한 정규화함수와 결합알고리즘의 성능 평가 (Performance Evaluation of Various Normalization Methods and Score-level Fusion Algorithms for Multiple-Biometric System)

  • 우나영;김학일
    • 정보보호학회논문지
    • /
    • 제16권3호
    • /
    • pp.115-127
    • /
    • 2006
  • 본 논문의 목적은 다중 생체 인식을 위하여 사용되는 다양한 정규화함수와 결합 및 패턴 분류 알고리즘들의 성능을 비교 평가하는 것이다. 이를 위하여 NIST에서 제공하는 유사도 집합인 BSSR(Biometric from Set-Releasel) 데이터베이스와 다양한 정규화함수, 결합 및 패턴 분류 알고리즘을 이용하여 실험을 수행하였으며, HTER(Half Total Error Rate)을 이용한 평가 결과를 제시하고 있다. 본 연구는 단일 데이터베이스와 평가 항목을 이용한 평가 결과를 제시함으로써 다중 생체 인식시스템의 성능 개선 연구를 위한 토대가 될 수 있다.

An Accurate Log Object Recognition Technique

  • Jiho, Ju;Byungchul, Tak
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권2호
    • /
    • pp.89-97
    • /
    • 2023
  • 본 논문에서는 로그 분석을 어렵게 하는 요인을 제안하고 이후 분석에 도움을 주는 로그 내 다양한 객체 인식 기법을 설계한다. 오늘날의 IT 시스템에서 로그는 다수의 고급 AI 분석 기술의 핵심적인 원천 데이터이다. 로그에는 유용한 정보가 많이 포함되어 있지만 로그는 본질적으로 반구조화되어 있기 때문에 로그 내 유용 정보에 기술을 직접적으로 적용시키기 어렵다. 로그 분석을 방해하는 요소는 file path, identifier, json 등 다양한 객체이다. 이러한 객체에 대한 BERT기반의 패턴 인식 알고리즘을 설계하고 객체 인식을 수행한다. 본 실험에서 정의한 패턴 인식 알고리즘은 객체의 정의, GROK 패턴, 그리고 정규 표현식에 기반한다. 기존에 알려진 패턴과 정규 표현식을 기반으로 한 간단한 패턴 매칭이 효과적이지 않다는 것을 확인할 수 있었다. 그 결과 기존 패턴과 정규 표현식만을 사용하는 것보다 훨씬 나은 정확도를 보여준다. 또한, BERT 모델의 경우 인식 객체 이외의 객체를 분류하는 정확도가 99%에 달하는 것을 확인할 수 있다.

웹캠 이미지에서 손동작 인식 알고리즘 (Gesture Recognition Algorithmfrom the Webcam Images)

  • 최철승;오갑석
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2010년도 추계학술발표논문집 1부
    • /
    • pp.88-91
    • /
    • 2010
  • 최근 무선통신 기술의 발당과 인터넷의 발달로 웹캠을 활용하여 얼굴인식, 몸동작 인식, 제스처 인식 등의 연구가 활발히 진행되고 있다. 본 연구에서는 웹캠으로부터 입력되는 손동작 동영상을 처리하여 수화 패턴 신호를 인식하는 손동작 인식 알고리즘을 제안한다. 제안방법은 프레임간의 차 연산을 이용하여 움직이는 오브젝트를 추출하고, YCbCr로 변환하여 손 모양 영역을 추출하여 특정 크기의 정규화 영상으로 변화하며, 정규화 영상의 오브젝트의 무게중심점을 기준으로 원의 반지름을 결정하고 원을 탐색하여 손가락의 펴짐과 굽힘에 대한 패턴 비교를 통하여 손 모양을 인식한다.

  • PDF

신경망을 이용한 고신뢰성의 회귀분석 모델 (Regression Model With High Reliability by Using Neural Networks)

  • 조용현
    • 정보처리학회논문지B
    • /
    • 제8B권4호
    • /
    • pp.327-334
    • /
    • 2001
  • 본 논문에서는 기울기하강과 동적터널링이 조합된 학습알고리즘의 다층신경망을 이용한 고신회성의 회귀분석 모델을 제안하였다. 기울기하강은 빠른 수렴속도의 최적화가 가능하도록 하기 위함이고, 동적터널링은 국소최적해를 만났을 때 이를 벗어난 새로운 연결가중치를 설정하여 전역최적해로 수렴되도록 하기 위함이다. 또한 대용량의 입력 데이터를 통계적으로 독립인 특징들의 집합으로 변환시키는 주요성분분석 기법의 속성을 살려 학습데이터의 차원을 감소시킴으로서 고차원의 학습데이터에 따른 회귀분석 모델의 제약도 동시에 해결하였다. 제안된 기법의 신경망을 3개의 독립변수 패턴을 가진 암모니아 제조공정문제와 10개의 독립변수 패턴을 가진 자동차 연비문제에 각각 적용하여 시뮬레이션한 결과, 기존의 역전과 알고리즘의 신경망이나 주요성분분석에 의한 차원을 감소시키지 않은 학습패턴을 이용한 신경망보다 각각 더욱 우수한 학습성능과 회귀성능이 있음을 확인할 수 있었다. 또한 학습패턴의 영평균 정규화로 회귀용 신경망의 성능을 더욱 더 개선하였다.

  • PDF

능동 다중 템플레이트에 의한 저화질 패턴 분할 (Pattern Segmentation of Low-quality Images using Active Multiple Template)

  • 안인모;이기상;허학범
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2003년도 하계학술대회 논문집 D
    • /
    • pp.2555-2557
    • /
    • 2003
  • 본 논문에서는 열화된 이미지상에서의 자동 패턴 분할을 위해 농담 정규화 정합(NGC)법과 다중 템플레이트를 이용하여 검사 이미지내의 각 문자의 정합 계수치 합을 이용한 문자나 패턴을 자동으로 분할(segmentation)하는 알고리즘을 제안한다. 전통적인 NGC를 사용하는 검사 알고리즘은 기준 패턴의 기하학적인 level 값에 의해 계산되어 지기 때문에 검사 이미지의 획득이 불완전하다면 정합의 부독율(reject rate)은 높아진다. 제안한 알고리즘은 가시화가 좋지 않은 영상 회득 시 문자부와 배경부를 효과적으로 자동으로 분류하며 이미지 영역내의 정보와 정규화 된 상관관계를 이용하여 실제 영상에 적용시켜 제안된 알고리즘의 검증을 목표로 한다.

  • PDF