• Title/Summary/Keyword: String matching

Search Result 102, Processing Time 0.026 seconds

Effective Highlighting Retrieval Results of Historical Documents (고전 문서의 효과적인 검색 결과 하이라이팅)

  • Jeong, Chang-Hoo;Choi, Yun-Soo;Kim, Kwang-Young;Seo, Jeong-Hyeon;Yoon, Hwa-Mook
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2006.11a
    • /
    • pp.543-546
    • /
    • 2006
  • In this paper, we introduce a method to effectively highlight retrieval results without impairing meaningful features after historical documents were digitized into XML format. Especially, making the best of the features of historical documents, we perform string matching for the highlighting. Also, considering the features of the XML document, we carry out various processes when highlighting tag is inserted.

  • PDF

Fingerprint Matching Algorithm using the String-Based MHC Detector Set (스트링기반 MHC 인식부 구성에 의한 지문 매칭 알고리즘)

  • 정재원;이동욱;심귀보;이민영
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2004.04a
    • /
    • pp.206-209
    • /
    • 2004
  • 사람의 지문은 그 인식성능과 종생불변성 및 만인부동성으로 인하여 신원인증을 위한 생채인식에서 가장 많이 이용되고 있다. 최근에는 지문인식의 신뢰성에 더하여, 그 인증속도가 지문인식을 각종 보안 어플리케이션에 응용하는데 있어서 매우 중요한 요소로 부각되고 있다. 본 논문에서는 생체면역계에서의 '자기-비자기' 구별과정에 착안한 빠르고 신뢰성 있는 지문인식 알고리즘을 제안한다. 제안한 매칭알고리즘은 지문영상으로부터 추출된 특징점과 방향성분에 기반하여 만들어지는 자기공간(self-space)에 기반하여 이루어지는 1차 매칭과, 특징점의 기하학적 구조에 의하여 구성되는 로컬구조(local structure)에 의하여 구성되는 로컬구조에 의해 수행되는 2차 매칭의 두 단계로 구성되어 인식의 신뢰성을 유지하면서 인증속도를 향상시켰다.

  • PDF

Retrieval Efficiency Analysis For Audio Data Indexing (오디오 데이터 인덱싱의 검색 효율 분석)

  • Cho, Yong-Choon;Lee, Bae-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.10b
    • /
    • pp.1297-1300
    • /
    • 2000
  • 본 논문에서는 멀티미디어 데이터 중에서 오디오 데이터의 검색을 위해 Wavelet 변환을 이용한 인덱싱 방법에 대해 서술한다. 오디오 데이터는 그 자신이 가지고 있는 특징 때문에 좋은 검색효율을 위한 인덱스를 구성하기가 까다롭다. 여기서 Wavelet을 이용한 인덱스는 데이터를 블록으로 나누지 않고 인덱싱 하고, 이 방법을 이용한 검색효율에 대해 서술한다. 즉 Wavelet의 마지막 단계의 고주파 부분과 저주파 부분에서 고주파 부분은 String Matching 기법으로 블록을 결정하고, 저주파 부분은 결정된 블록에 대해서 세부적인 비교를 한다. 실험은 적절한 비교 계수를 결정하기 위한 실험과, 질의 길이의 변화에 따른 검색율의 변화를 보여준다. 마지막 결론에서는 본 논문에서 제안한 방법을 이용한 발전방향과 응용에 대해서 서술한다.

  • PDF

String Matching without Buffer (버퍼를 이용하지 않는 스트링 매칭)

  • Kwak, Hu-Keun;Chung, Kyu-Sik
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07a
    • /
    • pp.325-327
    • /
    • 2005
  • 전 세계적으로 큰 피해를 주는 웜을 탐지하는 대표적인 방식으로 스트링 매칭을 이용한 방법이 있다. 스트링 매칭은 네트웍상의 패킷을 자신이 가진 시그니쳐(규칙)와 매칭을 해서 웜을 탐지하는 방법으로 동작하는데 매칭시에 필요한 버퍼(메모리)의 사용량으로 인한 단점을 가진다. 즉, 동시에 매칭해야 하는 패킷수가 늘어남에 따라 버퍼(메모리) 사용량도 급격하게 증가하고 버퍼링된 이전 데이터에 대한 매칭으로 속도 지연이 발생하는 단점을 가진다. 이에 본 논문에서는 기존 방식에 비해 적은 메모리 사용량 및 속도 향상을 가지는 버퍼를 이용하지 않는 스트링 매칭 방식을 제안한다. 제안된 방식은 기존 데이터에 대한 매칭 정보만을 기억하고 버퍼링을 하지 않는 방식으로 실험을 통해 기존 방식에 비해 적은 메모리 사용량 및 속도 향상을 가짐을 확인하였다.

  • PDF

Efficient Histogram Calculation for String Matching Occurrences Using Wavelet Trees (웨이블릿 트리를 이용한 문자열 매칭 위치의 효율적인 히스토그램 계산)

  • Kim, Sung-Hwan;Tak, Hae-Sung;Cho, Hwan-Gue
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2014.04a
    • /
    • pp.61-64
    • /
    • 2014
  • 문자열 매칭은 긴 텍스트 문자열 상에 짧은 질의 문자열이 나타나는 모든 위치를 찾는 문제이다. 텍스트 문자열이 고정되어 있는 경우에는 접미사 트리나 접미사 배열과 같은 자료구조를 이용하여 보다 효율적인 문자열 매칭을 수행할 수 있다. 이 때 사용자 인터페이스에 관련되어, 또는 다른 통계적 처리를 수행하기 위하여 주어진 질의 문자열의 출현 위치에 대한 히스토그램을 계산할 필요성이 있다. 그러나 질의 문자열의 출현 횟수가 많은 경우 각 출현 위치를 모두 순회하며 집계해야 하므로 시간적으로 매우 비효율적이다. 본 논문에서는 웨이블릿 트리를 이용하여 접미사 배열을 색인함으로써 히스토그램 계산에 있어서 질의 문자열의 출현 횟수와는 시간적으로 독립적인 집계 기법을 제안한다. 또한 실험을 통하여 질의 문자열의 출현 횟수가 많을수록 제안 기법의 성능이 우수함을 보인다.

Finding Approximate Covers of Strings (문자열의 근사커버 찾기)

  • Sim, Jeong-Seop;Park, Kun-Soo;Kim, Sung-Ryul;Lee, Jee-Soo
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.29 no.1
    • /
    • pp.16-21
    • /
    • 2002
  • Repetitive strings have been studied in such diverse fields as molecular biology data compression etc. Some important regularities that have been studied are perods, covers seeds and squares. A natural extension of the repetition problems is to allow errors. Among the four notions above aproximate squares and approximate periodes have been studied. In this paper, we introduce the notion of approximate covers which is an approximate version of covers. Given two strings P(|P|=m) and T(|T|=n) we propose and algorithm with finds the minimum distance t such that P is a t-approximate cover of T. The algorithm take O(m,n) time for the edit distance and $O(mn^2)$ time of finding a string which is an approximate cover of T is minimum distance is NP-complete.

Parallel Algorithms for Finding δ-approximate Periods and γ-approximate Periods of Strings over Integer Alphabets (정수문자열의 δ-근사주기와 γ-근사주기를 찾는 병렬알고리즘)

  • Kim, Youngho;Sim, Jeong Seop
    • Journal of KIISE
    • /
    • v.44 no.8
    • /
    • pp.760-766
    • /
    • 2017
  • Repetitive strings have been studied in diverse fields such as data compression, bioinformatics and so on. Recently, two problems of approximate periods of strings over integer alphabets were introduced, finding minimum ${\delta}-approximate$ periods and finding minimum ${\gamma}-approximate$ periods. Both problems can be solved in $O(n^2)$ time when n is the length of the string. In this paper, we present two parallel algorithms for solving the above two problems in O(n) time using $O(n^2)$ threads, respectively. The experimental results show that our parallel algorithms for finding minimum ${\delta}-approximate$ (resp. ${\gamma}-approximate$) periods run approximately 19.7 (resp. 40.08) times faster than the sequential algorithms when n = 10,000.

A Fast Recognition System of Gothic-Hangul using the Contour Tracing (윤곽선 추적에 의한 고딕체 한글의 신속인식에 관한 연구)

  • 정주성;김춘석;박충규
    • The Transactions of the Korean Institute of Electrical Engineers
    • /
    • v.37 no.8
    • /
    • pp.579-587
    • /
    • 1988
  • Conventional methods of automatic recognition of Korean characters consist of the thinning processing, the segmentation of connected fundamental phonemes and the recognition of each fundamental character. These methods, however require the thinning processing which is complex and time consuming. Also several noise components make worse effects on the recognition of characters than in the case of no thinning. This paper describes the extraction method of the feature components of Korean fundamental characters of the Gothic Korean letter without the thinning. We regard line-components of the contour which describes the character's external boundary as the feature-components. The line-component includes the directional code, the length and the start point in the image. Each fundamental character is represented by the string of directional codes. Therefore the recognition process is only the string pattern matching. We use the Gothic-hangul in the experiment. The ecognition rate is 92%.

Key Recovery Algorithm of Erroneous RSA Private Key Bits Using Generalized Probabilistic Measure (일반화된 확률 측도를 이용하여 에러가 있는 RSA 개인키를 복구하는 알고리즘)

  • Baek, Yoo-Jin
    • Journal of the Korea Institute of Information Security & Cryptology
    • /
    • v.26 no.5
    • /
    • pp.1089-1097
    • /
    • 2016
  • It is well-known that, if additional information other than a plaintext-ciphertext pair is available, breaking the RSA cryptosystem may be much easier than factorizing the RSA modulus. For example, Coppersmith showed that, given the 1/2 fraction of the least or most significant bits of one of two RSA primes, the RSA modulus can be factorized in a polynomial time. More recently, Henecka et. al showed that the RSA private key of the form (p, q, d, $d_p$, $d_q$) can efficiently be recovered whenever the bits of the private key are erroneous with error rate less than 23.7%. It is notable that their algorithm is based on counting the matching bits between the candidate key bit string and the given decayed RSA private key bit string. And, extending the algorithm, this paper proposes a new RSA private key recovery algorithm using a generalized probabilistic measure for measuring the consistency between the candidate key bits and the given decayed RSA private key bits.

A study on the design using characteristic the Joseon dynasty Dap-ho (조선시대 답호의 조형특성을 응용한 디자인 연구)

  • Yeom, Soon Jeong;Kim, Eun Jung
    • Journal of the Korea Fashion and Costume Design Association
    • /
    • v.21 no.1
    • /
    • pp.87-101
    • /
    • 2019
  • The sleeve is closely connected with activity in terms of costume. As a kind of overcoat, Dap-ho of the Joseon Dynasty is short-sleeved or sleeveless. Dap-ho, with simple sleeves is convenient for layering and taking off and since it is easily adjustable using a gusset, a slit, or coat string, and this can be applied to layered look-related designs. This study aims to suggest a design item, which sustains the existence of traditional costumes and facilitates diverse layered looks and co-ordination, using the formative elements of Dap-ho. For this study, theoretical backgrounds and relics of Dap-ho of the Joseon Dynasty were analyzed, based on the previous studies, ancient literature, "The Annals of the Joseon Dynasty", and relics preserved in museums. The analysis targeted nine relics that show the birth and death years and the constructive changes in shapes, colors, materials of Dap-ho. Formative elements of Dap-ho were applied to the designing and the manufacturing of clothes for middle-aged women in their fifties and the research conclusions are as follows. First, from a morphological perspective, the silhouette, gusset, slit, and the indirectly attached coat string of Dap-ho are good to be used as various design items for covering the body shapes of middle-aged women, and the short-sleeved or sleeveless type is convenient to be layered. Second, when it comes to the material, it is possible to emphasize a traditional image and practicality at the same time by mixing and matching the Hanbok cloth and cotton. Third, in relation to the colors, the coexistence-based color arrangement method considering the theory of Yin and Yang can be applied to modern clothes and this makes it possible to express a traditional image in a harmonious way.