• Title/Summary/Keyword: suffix

Search Result 149, Processing Time 0.026 seconds

Performance Analysis of Construction Algorithms for Compressed Suffix Arrays (압축된 써픽스 배열 구축 알고리즘의 성능 분석)

  • Park Chi-Seong;Jo Jun-Ha;Sim Jeong-Seop;Kim Dong-Kyue
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06a
    • /
    • pp.409-411
    • /
    • 2006
  • 써픽스 배열은 사전적 순서로 정렬된 써픽스들의 인덱스를 저장한 인덱스 자료구조로서, 긴 텍스트에서 반복되는 패턴 검색 시 효율적으로 사용 될 수 있다. 하지만 O($n\;log{\Sigma}$) 비트의 텍스트보다 큰 O(n log n) 비트 공간을 차지하기 때문에 대용량의 텍스트에 대해서는 큰 공간을 필요로 하는 문제점이 있다. 이를 해결하기 위해 압축된 써픽스 배열이 제안되었지만, 구축 시 이미 만들어진 써픽스 배열을 이용하기 때문에 실제 사용 공간을 줄이지는 못했다. 최근 써픽스 배열 없이 텍스트에서 직접 압축된 써픽스 배열을 구축할 수 있는 두 가지 알고리즘이 개발되었다. 본 논문에서는 이 두 가지 알고리즘을 구현한 후, 구축 시간과 사용 공간 등의 실험을 통해 기존의 써픽스 배열들과의 성능을 비교하고 분석한다.

  • PDF

A Study on Icongraphics and Minimalism in Design Expression (미니멀리즘적 디자인 표현과 아이콘그래픽스에 대한 고찰)

  • Chung, Jin Sook
    • Journal of Korea Society of Digital Industry and Information Management
    • /
    • v.8 no.2
    • /
    • pp.105-116
    • /
    • 2012
  • Minimalism combines the adjective 'minimal' and the suffix 'ism', and was first coined in the 1960s. Minimalism draws on the belief that when the use of artistic skills and adaptation is minimized and only the essentials or core is expressed, the discrepancy or distance between reality and art can be kept to a minimum; and thus, true reality can be achieved. To realize minimalism, artists creating paintings, sculptures and other forms of visual art eliminate unnecessary elements and strip objects to its essentials. And hence, most minimalist artwork used minimum amount of color and focused on expressing the geometric essence of objects. Such simplistic styles of minimalism can be seen today in various designs. Apple's iPod design and other product designs as well as graphic designs are just few of the examples. Drawing on the spirit of minimalism, Icongraphics pursues beauty and pleasure in the minimal use of color and form. And what lies beneath Icongraphics' artistic style is its pursuit of simplistic essentials, sending a strong message to the digitalized and complex lives of modern people.

Two Types of Complex Predicate Formation:Japanese Passive and Potential Verbs

  • Nakamura, Hiroaki
    • Proceedings of the Korean Society for Language and Information Conference
    • /
    • 2007.11a
    • /
    • pp.340-348
    • /
    • 2007
  • This paper deals with the complex verb formation of passive and potential predicates and syntactic structures projected by these verbs. Though both predicates are formed with the suffix -rare which has been assumed to originate from the same stem, they show significantly different syntactic behaviors. We propose two kinds of concatenation of base verbs and auxiliaries; passive verbs are lexically formed with the most restrictive mode of combination, while potential verbs are formed syntactically via more flexible combinatory operations of function composition. The difference in the mode of complex verb formation has significant consequences for their syntactic structures and semantic interpretations, including different combination with the honorific morphemes and subjectivization of arguments/adjuncts of base verbs. We also consider the case alternation phenomena and their implications for scope construals found in potential sentences, which can be accounted for in a unified manner in terms of the optional application of function composition.

  • PDF

A Zipper-based VDSL Modem with an Efficient Cyclic Extension (효율적 Cyclinc Extension을 갖는 Zipperqkdtlr의 VDSL 모뎀)

  • 위정욱
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.25 no.10B
    • /
    • pp.1793-1802
    • /
    • 2000
  • In this paper we propose an efficient implementation technique for cyclic extension in VDSL(Very High bit-rate Digital Subscriber Line) systems using Zipper duplexing and analyze its performances under typical telephone channel environments. In Zipper-based VDSL systems each DTM(discrete-multitone) block is appended by both cyclic prefix(CP) and cyclic suffix(CS). The CP is inserte to prevent both intersymbol interference (ISI) and iterchannel interference (ICI) while the CS is appended to ensure orthogonality between the upstream and downstream carriers thus preventing near-end crosstalk (NEXT). However in order to implement the CP in the transmitter side of the VDSL system an additional hardware is required to append the latter part of each DMT symbol to the beginning of the DMT symbol. In this paper we propose a VDSL system with Zipper duplexing using only CS to reduce hardware complexity (memory and processing delay) required for implementation of CP. It is shown by computer simulation that the proposed approach has the same capacity under typical channel environments as the previous Zipper-based VDSL system using both CP and CS. even with a significantly lower hardware complexity.

  • PDF

An Efficient Algorithm for Constructing Suffix Arrays for DNA String (DNA스트링에 효율적인 써픽스 배열 구축 알고리즘)

  • 조준하;박회진;김동규
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04a
    • /
    • pp.961-963
    • /
    • 2004
  • 써픽스 배열은 텍스트의 써픽스들을 사전적 순서대로 저장하여 검색을 효율적으로 할 수 있는 자료구조이다. 생물학에서의 DNA 스트링과 같이 긴 텍스트에 대해 써픽스 배열을 이용하면 빠르게 검색할 수 있다. 써픽스 배열은 유사한 자료구조인 써픽스 트리에 비해 적은 공간을 차지하기 때문에 생물학에서 사용하는 긴 텍스트의 처리에 유리하다. 최근, 텍스트에서 바로 써픽스 배열을 선형시간에 구축하는 알고리즘들이 발표되었다. 그러나 이들 알고리즘은 정수 문자집합을 위한 알고리즘들이었다. 본 논문에서는 고정길이 문자집합에 대해 써픽스 배열을 빠르게 구축하는 알고리즘을 소개한다. 그리고 실험을 통해서 DNA 스트링과 같은 고정길이 문자집합에 대해서 다른 알고리즘들과 구축시간을 비교하여 속도 향상이 있음을 보인다.

  • PDF

An Efficient Suffix Trie Index Structure for Genomic Databases (유전체 데이터베이스를 위한 효율적인 접미어 트라이 인덱스 구조)

  • Park, Jin-Man;Won, Jung-Im;Yoon, Jee-Hee;Park, Sang-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.05c
    • /
    • pp.1583-1586
    • /
    • 2003
  • DNA 시퀀스는 A, C, G, T 네 개의 문자로 구성된 매우 긴 시퀀스로 볼 수 있다. 고속으로 유사 DNA 시퀀스를 검색하기 위하여 인덱싱 기술을 이용하는 것이 일반적이다. 그러나 검색 대상의 유전체 데이터베이스는 그 크기가 매우 크며, 또한 지수 함수적으로 크기가 급속히 증가하고 있으므로, 기존의 인덱싱 기법을 그대로 적용할 경우, 실용성에 한계가 있다. 본 논문에서는 이와 같은 문제점을 해결할 수 있는 대규모 유전체 데이터베이스를 위한 효율적인 인덱싱 기법과 질의처리 기법을 제안한다. 기본 구조로서 접미어 트라이를 사용하며, 접미어 트리 인덱스 구조의 최대 단점인 인덱스 크기를 줄일 수 있는 데이터 압축 표현 방식을 제안한다. 또한 제안된 데이터 압축 표현 방식의 디스크 기반 인덱스 구성 알고리즘과 이를 활용한 부분 시퀀스 검색 알고리즘을 보이고, 그 저장 성능의 비교 평가결과를 보인다.

  • PDF

Discovering and Matching Elastic Rules in Sequence Databases (시퀀스 데이터베이스에서 유연 규칙의 탐사 및 매칭)

  • ;Wesley Chu
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.26 no.7A
    • /
    • pp.1162-1169
    • /
    • 2001
  • 유연 패턴은 시간 축으로 확장 및 수축할 수 있는 요소들의 순서화된 리스트이다. 유연 패턴은 서로 다른 샘플링 비율을 갖는 데이터 시퀀스들로부터 규칙들을 찾아내는데 유용하게 사용된다. 본 연구에서는 헤드(head: 규칙의 왼쪽 부분)와 바디(body: 규칙의 오른쪽 부분)가 모두 유연 패턴으로 구성된 규칙들을 신속하게 찾도록 하기 위하여 데이터 시퀀스로부터 서픽스 트리(suffix tree)를 구성한다. 이 서픽스 트리는 유연 규칙들의 압축된 표현이며, 타깃 헤드 시퀀스와 매치되는 규칙을 찾기 위한 인덱스 구조로서 사용된다. 만일, 매치되는 규칙을 찾을 수 없는 경우에는 규칙 완화(rule relaxation)의 개념을 이용한다. 클러스터 계층(cluster hierarchy)과 완화 오차(relaxation error)를 사용하여 타깃 헤드 시퀀스의 고유한 정보를 대부분 포함하고 있는 최소한으로 완화된 규칙을 찾는다. 다양한 실험을 통한 성능 평가를 통하여 제안한 기법의 우수성을 검증한다.

  • PDF

A study on the origin of Korean herbaeous Inandscape plant names -Focused on Plants named after Chinese and japanese- (한국 초본성 조경식물명에 관한 연구-중국명과 일본명에서 유래된 이름을 중심으로-)

  • Hwang, Joong-Lak;Lee, Ki-Eui;Shin, Woo-Kyun
    • Journal of the Korean Institute of Landscape Architecture
    • /
    • v.25 no.2
    • /
    • pp.20-30
    • /
    • 1997
  • This study compared Korean names of 449 herbaceous landscape plants with Chinese and Japanese names to identify the origin of their Korean names. The results were as follow ; 1. Korean herbaceous plants named after Chinese names were 71 species. They could be classified into 4 typical groups of their origin : plants named from slight or partial changes of Chinese names, plants with a prefix or suffix attached to Chinese names, plants having names translated from Chinese names, and plants with the same names as Chinese. 2. Korean herbaceous plants derived from Japanese names were 378 species. They also could be classified into 4 typical groups of their origin; plants with new names in partial combination of Japaneses and Korean names, plant having names directly translated from Japaneses names, plants with the same names as Japanese, and plants having names erroneously translated from Japaneses names.

  • PDF

Robust Quick String Matching Algorithm for Network Security (네트워크 보안을 위한 강력한 문자열 매칭 알고리즘)

  • Lee, Jong Woock;Park, Chan Kil
    • Journal of Korea Society of Digital Industry and Information Management
    • /
    • v.9 no.4
    • /
    • pp.135-141
    • /
    • 2013
  • String matching is one of the key algorithms in network security and many areas could be benefit from a faster string matching algorithm. Based on the most efficient string matching algorithm in sual applications, the Boyer-Moore (BM) algorithm, a novel algorithm called RQS is proposed. RQS utilizes an improved bad character heuristic to achieve bigger shift value area and an enhanced good suffix heuristic to dramatically improve the worst case performance. The two heuristics combined with a novel determinant condition to switch between them enable RQS achieve a higher performance than BM both under normal and worst case situation. The experimental results reveal that RQS appears efficient than BM many times in worst case, and the longer the pattern, the bigger the performance improvement. The performance of RQS is 7.57~36.34% higher than BM in English text searching, 16.26~26.18% higher than BM in uniformly random text searching, and 9.77% higher than BM in the real world Snort pattern set searching.

Comparison of Linear Time Suffix Array Construction Algorithms (선형 시간 접미사 배열 생성 알고리즘들의 비교)

  • 이성림;박근수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.496-498
    • /
    • 2003
  • 접미사 배열은 긴 문자열에 대해 효율적인 문자열 검색을 가능하게 하는 자료구조이다. 접미사 배열은 문자열의 접미사들의 사전식 정렬순서를 배열로 저장한다. 비슷한 효과를 가진 접미사 트리에 비해서 접미사 배열은 저장 공간을 적게 차지하기 때문에 생명정보과학의 염기 서열 등 큰 크기의 문자열의 처리에 더욱 유리하다. 본 논문에서는 2003년에 발표된 Ko-Aluru, K$\square$rkk$\square$inen-Sanders 및 기존의 Manber-Myers 등 세 개의 접미사 배열 생성 알고리즘들의 염기 서열 입력 자료에 대한 실행 시간 및 기억 장치 사용량을 실험을 통해 비교한다. 특히 Ko-Aluru와 K$\square$rkk$\square$inen-Sanders 알고리즘은 실행 시간 및 저장 공간의 이론적인 복잡도가 O(n)으로 동일하기 때문에 실험을 통해서 계산 복잡도에 숨어있는 상수를 비교한다. 실험 결과 K$\square$rkk$\square$inen-Sanders 알고리즘이 가장 효율적임을 보인다.

  • PDF