• 제목/요약/키워드: 정규식

검색결과 682건 처리시간 0.025초

조합형 한글 정규식 Java 라이브러리 설계 (A Design of the Java Library for Combined Hangul Regular Expression)

  • 정재용;우균
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.31-34
    • /
    • 2015
  • 현재의 한글 정규식은 완성형 한글에 맞춰 글자단위로 사용할 수밖에 없으므로 사용이 불편하다. 따라서 이러한 불편함을 해결하기 위해 자모단위로 처리 가능한 조합형 한글 정규식 Java 라이브러리를 설계하였다. 조합형 한글 정규식 Java 라이브러리를 통해서 단순히 '가'로 시작하는 글자가 아니라 'ㄱ'으로 시작하는 글자나, 종성이 없는 단어 등을 처리할 수 있으며 기존의 정규식 문법 또한 사용할 수 있다. 이를 위해서 초성, 중성, 종성 각각에 조건을 주는 규칙을 한글 정규식 문법에 추가하였으며, 기존의 Java 정규식 라이브러리와 해당 라이브러리에서 이용하는 유니코드 표현상에서의 한글 인코딩 특징을 이용하였다.

정규표현식 프로세서를 위한 호스트 인터페이스 설계 및 구현 (Design and Implementation of a Host Interface for a Regular Expression Processor)

  • 김종현;윤상균
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권2호
    • /
    • pp.97-103
    • /
    • 2017
  • 정규표현식 패턴 매칭을 고속으로 수행하기 위하여 하드웨어 기반의 정규표현식 매칭 회로들이 제시되었으며, 특히 보통 프로세서처럼 정규표현식에 대한 프로그램을 실행하여 패턴 매칭을 수행하는 정규표현식 프로세서가 제시되었다. 정규표현식 프로세서가 패턴 매칭을 수행하기 위해서는 명령어 메모리에 정규표현식 패턴에 대한 명령어가, 데이터 메모리에는 매칭 대상이 되는 데이터가 미리 저장되어야 한다. 정규표현식 프로세서를 호스트의 보조프로세서로 사용하려면 호스트에서 정규표현식 프로세서의 명령어 메모리와 데이터 메모리를 초기화하는 기능을 제공해야 하며 이를 위한 호스트 인터페이스가 필요하다. 본 논문에서는 Altera사의 DE1-SoC 보드에서 호스트와 정규표현식 프로세서 간의 인터페이스를 설계하였고, 이를 사용하기 위한 응용 프로그램 인터페이스도 구현하였다. 응용 프로그램에서 응용프로그램 인터페이스를 사용하여 정규표현식 프로세서를 이용한 패턴 매칭을 수행하여 호스트 인터페이스의 동작을 확인하였다.

문자클래스 매칭을 지원하는 정규표현식 매칭 프로세서 구조 (Regular Expression Matching Processor Architecture Supporting Character Class Matching)

  • 윤상균
    • 정보과학회 논문지
    • /
    • 제42권10호
    • /
    • pp.1280-1285
    • /
    • 2015
  • 고속 정규표현식 매칭을 수행하기 위한 여러 종류의 정규표현식 매칭 하드웨어 구조가 연구되었다. 특히 프로그램과 같이 패턴의 갱신이 쉽도록 범용 프로세서와 유사한 방식으로 정규표현식 매칭을 수행하는 ReCPU와 SMPU와 같은 정규표현식 프로세서가 연구되었다. 그렇지만 기존의 정규표현식 프로세서들은 문자클래스 매칭을 위한 별도의 기능을 제공하지 않아서 문자클래스 처리에 비효율적이다. 본 논문에서는 문자클래스 매칭을 지원하는 정규표현식 매칭 프로세서의 명령어 집합을 제시하고, 이에 대한 프로세서 구조를 설계 구현한다. 제시된 프로세서는 문자클래스, 문자 범위와 부정 문자클래스 처리 기능을 포함하고 있어서 문자클래스 매칭을 매우 효율적으로 처리할 수 있다.

음성인식 기반 리마인더를 위한 시간 표현 분석 기법 (Time Expression Analysis For Reminder Applications Using Speech Recognition)

  • 박재성;이상원;장재나;강상우
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.264-266
    • /
    • 2017
  • 본 연구는 리마인더 앱을 위한 효과적인 시간 표현 분석 방법을 제안한다. 시간 표현 분석을 위한 정규식 패턴을 이용하여 사용자 발화 텍스트로부터 시간 정보를 분석하고 시간 표현 유형에 따라 절대적 시간 정보로 변환한다. 제안한 방법은 정규식 패턴을 이용한 시간 표현 분석 기법으로 시스템의 유지 관리가 용이하고 정보량이 많은 패턴과의 매칭을 위해 효과적이다.

  • PDF

경로 식별자를 이용한 다중 정규경로 처리기법 (Processing of Multiple Regular Path Expressions using PID)

  • 김종익;정태선;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권4호
    • /
    • pp.274-284
    • /
    • 2002
  • XML에 대한 질의는 데이타 그래프 내 경로에 대한 질의를 기반으로 하며 그래프 내의 임의의 경로를 표시하기 위해 정규식을 사용한다. 일반적으로 의미있는 질의를 표현하기 위해서는 질의 내에 여러 개의 정규식을 포함하는 경우가 많다. 그럼에도 불구하고 기존의 연구는 주로 단일 정규식으로 이루어진 질의의 최적화 방법을 다루고 있다. 본 논문에서는 데이타 그래프를 탐색하지 않고 다중 정규 경로 질의를 처리할 수 있는 방을 제시한다. 본 논문에서는 다중 정규 경로를 효율적으로 처리하기 위해서 데이타 그래프 상의 임의의 두 노드 사이에 경로가 존재하는지를 직접 알 수 있는 방법인 경로 식별자를 제안하고 경로 식별자를 만드는 방법을 제공한다. 또한 본 논문에서 제안된 방법을 구현하여 그 성능에 대한 결과를 제공한다.

심층 패킷검사를 위한 정규표현식 패턴매칭 하드웨어 구조 (A Hardware Architecture of Regular Expression Pattern Matching for Deep Packet Inspection)

  • 윤상균;이규희
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권5호
    • /
    • pp.13-22
    • /
    • 2011
  • 최근의 네트워크 침입탐지 시스템들은 침입패턴을 나타내는 데 정규표현식을 사용하고 있으며 빠른 심층 패킷 검사를 위해서 하드웨어 기반의 패턴매칭이 필요하다. 하드웨어 기반 정규표현식 패턴매칭에 대한 많은 연구가 이루어졌으나 {10}과 같은 제한반복 연산자에 대한 구현은 제약이 있었다. 본 논문에서는 일반적인 정규표현식 서브패턴에 대한 제한반복을 더 낮은 하드웨어 복잡도로 구현할 수 있는 제한반복 블록 구조를 제시하였다. 제안된 제한반복 블록은 단일 문자, 고정길이 문자 뿐 만 아니라 일반적인 정규표현식 서브패턴의 제한반복 구현도 가능하다. 제안된 제한반복 블록 구조는 모든 제한반복을 펼치지 않고 구현할 수 있도록 하여 정규표현식 패턴매칭 하드웨어를 더 효율적으로 구현할 수 있도록 하였다.

음성인식 기반 리마인더를 위한 시간 표현 분석 기법 (Time Expression Analysis For Reminder Applications Using Speech Recognition)

  • 박재성;이상원;장재나;강상우
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.264-266
    • /
    • 2017
  • 본 연구는 리마인더 앱을 위한 효과적인 시간 표현 분석 방법을 제안한다. 시간 표현 분석을 위한 정규식 패턴을 이용하여 사용자 발화 텍스트로부터 시간 정보를 분석하고 시간 표현 유형에 따라 절대적 시간 정보로 변환한다. 제안한 방법은 정규식 패턴을 이용한 시간 표현 분석 기법으로 시스템의 유지 관리가 용이하고 정보량이 많은 패턴과의 매칭을 위해 효과적이다.

  • PDF

다중 정규 경로 질의 처리를 위한 효율적 기법 (An Efficient Technique for Evaluating Queries with Multiple Regular Path Expressions)

  • 정태선;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권3호
    • /
    • pp.449-457
    • /
    • 2001
  • 최근에 XML이 웹 상에서 문서 교환의 표준으로 등장하면서 XML로 표현된 데이터에 대한 질의 처리 분야가 주목받고 있다. 이때 XML 질의는 그래프로 표현된 데이터 그래프에서 특정 정규식으로 도달되는 객체를 찾는 정규 경로 질의 (regular path query)를 기반으로 한다. 그런데 사용자의 다양한 형태의 질의를 처리하기 위해서는 질의에 하나 이상의 정규 식을 가지는 질의의 처리가 필요함에도 기존의 연구 즉, 비정형 데이터 모델 하에서의 부를 이용한 질의 변환(query rewriting)이나, 질의 최적화 기법에서는 주로 단일 정규식으로 이 루어진 질의를 다루었다. 본 논문에서는 이러한 다중 정규식을 가지는 질의의 처리에서 1. 뷰의 몸체에서 질의 몸체로의 변수 매핑을 통한 질의 변환과정과 2. 변환된 질의의 각 조각 (conjunct)의 질의 결과를 효율적으로 구하고 결과를 조합하는 두 단계로 이루어진 효율적 인 질의 처리 기법을 제안한다. 제안하는 질의 변환 알고리즘이 안전성(soundness)을 가짐 을 보이고, 질의 처리 기법이 기존 질의 처리 방식에 비하여 효율적임을 보인다.

  • PDF

효율적인 정규 경로식 질의 처리를 위한 XML 저장 시스템 설계 (Design of an XML Document Storage System for Efficient Regular Path Expression Query Processing)

  • 김대일;김유성
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.121-124
    • /
    • 2002
  • 문서의 고정된 스키마 없이 사용될 수 있는 XML문서를 관계형 데이터베이스에 문서 자체의 구조 정보와 함께 효율적으로 저장하려는 연구가 계속되고 있다. 계층적인 형태의 XML 문서들을 구조 검색하기 위한 정규 경로식 질의들을 평면 구조의 관계형 데이터베이스에서 처리하기 위해서 많은 비용이 필요하게 된다. 따라서 본 논문에서는 다양한 정규 경로식 질의들을 질의의 특성에 알맞은 방법으로 처리하는 저장 모델과 질의 처리 모델을 제안한다. 제안된 모델은 정규 경로식 질의에 포함된 경로 연산자를 분석하여 부모-자식 관계가 아닌 조상-자손 관계 조사에는 $\theta$-조인을 이용하고, 부모-자식 관계 조사에는 동등(equi)-조인을 이용하는 SQL문으로 변환 처리하여 질의 처리 효율성을 높였다.

  • PDF

효율적인 XML 질의 처리를 위한 XQuery 질의의 정규화 (Normalization of XQuery Queries fur Efficient XML Query Processing)

  • 김서영;이기훈;황규영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.136-138
    • /
    • 2004
  • XML 이 웹 상에서의 정보 표현, 통합, 교환을 위한 표준이 됨에 따라 다양한 XML 질의 언어들이 제안되었으며, World Wide Web Consortium(W3C)은 XQery를 XML 질의 언어의 표준으로 권고하였다. XQuery는 SQL과 유사하게 중첩 질의를 허용하므로, 중첩된 XQuery 질의를 동일한 의미를 가지면서 보다 효율적으로 실행될 수 있는 질의로 변환하는 정규화 규칙들이 제안되었다. 그러나 제안된 정규화 규칙들은 제한적인 형태의 중첩 질의에만 적용되는 문제점을 가지고 있다 특히, FLWR 표현식의 where 절에 있는 중첩을 처리할 수 없다. 본 논문에서는 SQL 질의의 정규화 규칙들을 확장하여 FLWR 표현식의 모든 절에 나타나는 중첩을 처리할 수 있는 XQuery 질의의 정규화 규칙들을 제안한다 이를 위해 먼저, 상관과 집계의 유무에 따라 XQuery 질의의 중첩 유형을 분류하고, 각 유형 별로 정규화 규칙들을 제안한다 다음으로, 중첩된 XQuery 질의에 정규화 규칙들을 적용하는 세부 알고리즘을 제안한다.

  • PDF