• 제목/요약/키워드: String Matching

검색결과 101건 처리시간 0.022초

FPGA를 이용한 효율적 정규표현매칭 (Efficient Regular Expression Matching Using FPGA)

  • 이장행;이성원;박능수
    • 정보처리학회논문지C
    • /
    • 제16C권5호
    • /
    • pp.583-588
    • /
    • 2009
  • Network Intrusion Detection System(NIDS)는 네트워크를 통해 들어오는 패킷들을 모니터링 하고 분석하여 내부 시스템에 유해한 내용을 담고 있는 패킷을 탐지 하는 시스템이다. 이 시스템은 네트워크의 패킷을 놓치지 않고 분석할 수 있어야 하며, 예측 불허의 공격 방법들에 대해서는 새로운 법칙을 적용하여 방어할 수 있어야 한다. 이에 대응하여, 소프트웨어적 처리에 비해 높은 비교 성능과 재구성이 가능한 유연성을 제공하는 FPGA는 좋은 해결책이다. 그럼에도 불구하고, 고속 네트워크의 등장과 축적되는 공격 패턴들의 증가는 제한된 속도와 공간을 가지고 있는 FPGA에게 부담이 된다. 본 연구는 추가적인 자원 사용을 최소화하고 성능의 극대화를 가져오는 방식으로 접두어 공유 병렬 패턴매치 기법을 제시하고 설계하였다. 실험을 통하여 입력 문자열을 8bit에서 16bit로 증가할 때 성능이 두 배 향상이 되면서 구현을 위해 사용되는 자원은 평균 1.07배 증가하는 것을 확인할 수 있다.

Intracorporeal Esophagojejunostomy Using a Circular or a Linear Stapler in Totally Laparoscopic Total Gastrectomy: a Propensity-Matched Analysis

  • Kang, So Hyun;Cho, Yo-Seok;Min, Sa-Hong;Park, Young Suk;Ahn, Sang-Hoon;Park, Do Joong;Kim, Hyung-Ho
    • Journal of Gastric Cancer
    • /
    • 제19권2호
    • /
    • pp.193-201
    • /
    • 2019
  • Purpose: There is no consensus on the optimal method for intracorporeal esophagojejunostomy (EJ) in laparoscopic total gastrectomy (LTG). This study aims to compare 2 established methods of EJ anastomosis in LTG. Materials and Methods: A total of 314 patients diagnosed with gastric cancer that underwent LTG in the period from January 2013 to October 2016 were enrolled in the study. In 254 patients, the circular stapler with purse-string "Lap-Jack" method was used, and in the other 60 patients the linear stapling method was used for EJ anastomosis. After propensity score matching, 58 were matched 1:1, and retrospective data for patient characteristics, surgical outcome, and post-operative complications was reviewed. Results: The 2 groups showed no significant difference in age, body mass index, or other clinicopathological characteristics. After propensity score matching analysis, the linear group had shorter operating time than the circular group ($200.3{\pm}62.0$ vs. $244.0{\pm}65.5$, $P{\leq}0.001$). Early postoperative complications in the circular and linear groups occurred in 12 (20.7%) and 15 (25.9%, P=0.660) patients, respectively. EJ leakage occurred in 3 (5.2%) patients from each group, with 1 patient from each group needing intervention of Clavien-Dindo grade III or more. Late complications were observed in 3 (5.1%) patients from the linear group only, including 1 EJ anastomosis stricture, but there was no statistical significance. Conclusions: Both circular and linear stapling techniques are feasible and safe in performing intracorporeal EJ anastomosis during LTG. The linear group had shorter operative time, but there was no difference in anastomosis complications.

Analysis of Molecular Pathways in Pancreatic Ductal Adenocarcinomas with a Bioinformatics Approach

  • Wang, Yan;Li, Yan
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제16권6호
    • /
    • pp.2561-2567
    • /
    • 2015
  • Pancreatic ductal adenocarcinoma (PDAC) is a leading cause of cancer death worldwide. Our study aimed to reveal molecular mechanisms. Microarray data of GSE15471 (including 39 matching pairs of pancreatic tumor tissues and patient-matched normal tissues) was downloaded from Gene Expression Omnibus (GEO) database. We identified differentially expressed genes (DEGs) in PDAC tissues compared with normal tissues by limma package in R language. Then GO and KEGG pathway enrichment analyses were conducted with online DAVID. In addition, principal component analysis was performed and a protein-protein interaction network was constructed to study relationships between the DEGs through database STRING. A total of 532 DEGs were identified in the 38 PDAC tissues compared with 33 normal tissues. The results of principal component analysis of the top 20 DEGs could differentiate the PDAC tissues from normal tissues directly. In the PPI network, 8 of the 20 DEGs were all key genes of the collagen family. Additionally, FN1 (fibronectin 1) was also a hub node in the network. The genes of the collagen family as well as FN1 were significantly enriched in complement and coagulation cascades, ECM-receptor interaction and focal adhesion pathways. Our results suggest that genes of collagen family and FN1 may play an important role in PDAC progression. Meanwhile, these DEGs and enriched pathways, such as complement and coagulation cascades, ECM-receptor interaction and focal adhesion may be important molecular mechanisms involved in the development and progression of PDAC.

Fast, Flexible Text Search Using Genomic Short-Read Mapping Model

  • Kim, Sung-Hwan;Cho, Hwan-Gue
    • ETRI Journal
    • /
    • 제38권3호
    • /
    • pp.518-528
    • /
    • 2016
  • The searching of an extensive document database for documents that are locally similar to a given query document, and the subsequent detection of similar regions between such documents, is considered as an essential task in the fields of information retrieval and data management. In this paper, we present a framework for such a task. The proposed framework employs the method of short-read mapping, which is used in bioinformatics to reveal similarities between genomic sequences. In this paper, documents are considered biological objects; consequently, edit operations between locally similar documents are viewed as an evolutionary process. Accordingly, we are able to apply the method of evolution tracing in the detection of similar regions between documents. In addition, we propose heuristic methods to address issues associated with the different stages of the proposed framework, for example, a frequency-based fragment ordering method and a locality-aware interval aggregation method. Extensive experiments covering various scenarios related to the search of an extensive document database for documents that are locally similar to a given query document are considered, and the results indicate that the proposed framework outperforms existing methods.

XML 문서의 구조와 내용을 고려한 유사도 측정 (Similarity Measure based on XML Document's Structure and Contents)

  • 김우생
    • 한국멀티미디어학회논문지
    • /
    • 제11권8호
    • /
    • pp.1043-1050
    • /
    • 2008
  • XML(Extensible Markup Language)은 인터넷 상에서 데이터 표현과 교환을 위한 표준으로 자리 잡고 있다. 웹의 발전과 함께 XML문서들이 정보 검색, 문서 관리, 데이터 마이닝 등의 응용에서 폭 넓게 사용되면서 구조적으로 정보가 풍부한 이러한 문서들을 자동으로 처리하고 검색하는 기술들이 요구되고 있다. 본 연구에서는 XML 문서 의 구조와 내용을 고려하여 유사한 문서들을 검색하는 새로운 방법을 제안한다. XML 문서의 구조적 유사성은 간단한 스트링 매칭 기법으로 찾고, 문서 내용의 유사성은 문서 요소(element)들의 이름과 경로를 고려한 가중치를 통해 찾는 방법으로 전체의 시간 복잡도는 비교되는 두 문서의 크기에 선형적으로 비례한다.

  • PDF

GPU의 공유메모리를 활용한 확장편집거리 병렬계산 (Parallel Computation for Extended Edit Distances Using the Shared Memory on GPU)

  • 김영호;나중채;심정섭
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제4권7호
    • /
    • pp.213-218
    • /
    • 2015
  • 알파벳 ${\Sigma}$로 구성된 길이가 각각 m, n인 두 문자열 X, Y가 주어졌을 때, X, Y의 확장편집거리는 동적프로그래밍을 이용하여 O(mn) 시간과 공간을 계산할 수 있다. 최근 m개의 쓰레드를 이용하여 O(m+n) 시간과 O(mn) 공간을 사용하여 X, Y의 확장편집거리를 계산하는 병렬알고리즘이 제시되었다. 본 논문에서는 GPU의 공유메모리를 활용하여 수행시간을 개선한 병렬알고리즘을 제시한다. 실험 결과, 개선된 병렬알고리즘이 기존의 병렬알고리즘보다 약 19~25배 이상 빠른 수행시간을 보였다.

문화재 정보의 온톨로지 기반 검색시스템 (Ontology-Based Information Retrieval for Cultural Assets Information)

  • 백승재;천현재;이홍철
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권3호
    • /
    • pp.229-236
    • /
    • 2005
  • 시맨틱 웹(Semantic Web)은 정보자원의 효율적 검색, 통합, 재사용을 가능하게 한다. 현재의 웹 환경에서 사용되고 있는 키워드 검색방법은 단순한 문자열 일치 방법으로 인하여 정확한 검색결과에 한계가 있다. 이에 본 연구에서는 전통적인 키워드 검색에서의 나타난 문제점들을 해결할 방안으로 의미적인 연관성을 통한 온톨로지(Ontology) 검색방법을 제안하여 더욱 정확한 검색결과를 유도해 본다. 국내 문화재를 중심으로 하여 OWL기반의 온톨로지를 구축하였고 질의, 검색 방법으로는 RDQL 질의어와 Jena API를 사용하였다. 이와 더불어 온톨로지 속성(property)데이터를 데이터베이스에 저장하여 처리하는 방안을 제시한다.

  • PDF

Intel Xeon Phi 에서의 Aho-Corasick 알고리즘을 위한 메모리 친화적인 고성능 병렬화 (Memory-Efficient High Performance Parallelization of Aho-Corasick Algorithm on Intel Xeon Phi)

  • 쟌 느앗 프엉;정요상;이명호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.87-89
    • /
    • 2014
  • Aho-Corasick (AC) 알고리즘은 실시간 성능을 요하는 많은 응용 분야에 적용되는 스트링 매칭 알고리즘으로서, 한번에 여러 개의 패턴들을 동시에 매칭시키는 것이 가능하다. 본 논문에서는 Intel 의 Many Integrated Core (MICO 아키텍쳐인 Xeon Phi 칩 상에서 AC 알고리즘을 병렬화한다. 이를 위하여 AC 알고리즘에서 입력 데이터에 대하여 여러 개의 패턴들을 동시에 매칭시키는 데에 사용되는 Deterministic Finite Automaton 구조를 압축시키는 새로운 기법을 제안한다. 이 기법은 캐시 미스를 감소시켜서 XeonPhi 상에서 AC 알고리즘의 성능을 크게 향상시킨다.

분자구조 유사도를 활용한 약물 효능 예측 알고리즘 연구 (A Study on the Prediction of Drug Efficacy by Using Molecular Structure)

  • 정화영;송창현;조혜연;기재홍
    • 대한의용생체공학회:의공학회지
    • /
    • 제43권4호
    • /
    • pp.230-240
    • /
    • 2022
  • Drug regeneration technology is an efficient strategy than the existing new drug development process, which requires large costs and time by using drugs that have already been proven safe. In this study, we recognize the importance of the new drug regeneration aspect of new drug development and research in predicting functional similarities through the basic molecular structure that forms drugs. We test four string-based algorithms by using SMILES data and searching for their similarities. And by using the ATC codes, pair them with functional similarities, which we compare and validate to select the optimal model. We confirmed that the higher the molecular structure similarity, the higher the ATC code matching rate. We suggest the possibility of additional potency of random drugs, which can be predicted through data that give information on drugs with high molecular similarities. This model has the advantage of being a great combination with additional data, so we look forward to using this model in future research.

최소 공간관계를 이용한 효율적인 이미지 검색 (Efficient Image Retrieval using Minimal Spatial Relationships)

  • 이수철;황인준;변광준
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권4호
    • /
    • pp.383-393
    • /
    • 2005
  • 멀티미디어 데이타베이스에서 이미지를 검색하기 위해 공간관계를 이용하는 것은 비주얼한 인터페이스 시스템을 통해서 효율적으로 수행할 수 있다. 시스템에서 이미지의 객체들은 2D 스트링으로 표현되고, 이것은 이미지 내의 객체를 추상화 하는 방법으로 객체의 심볼릭 프로젝션을 통해서 생성된다. 그러나 2D 스트링 표현기법을 이용한 이미지 객체간의 공간관계는 정확하지 않기 때문에 3D 이미지를 검색할 때 정확도가 떨어진다. 이러한 문제점을 해결하기위해 본 논문에서는 3D 이미지를 위한 공간 연산자를 이용한 공간관계를 제안하고, 이미지의 공간관계에서 중복되는 부분을 제거하기 위해 여러 가지 추론규칙을 이용한다. 이러한 규칙을 기반으로 하는 추론기법은 내용을 이용해 이미지를 검색할 때 질의 처리 시스템에서 사용되고, 기존의 방법보다 정확도와 융통성이 높다.