• 제목/요약/키워드: string structure

검색결과 135건 처리시간 0.03초

유사도 검색을 위한 데이터 재배열을 이용한 공간 효율적인 역 색인 기법 (A Space-Efficient Inverted Index Technique using Data Rearrangement for String Similarity Searches)

  • 임마누;김종익
    • 정보과학회 논문지
    • /
    • 제42권10호
    • /
    • pp.1247-1253
    • /
    • 2015
  • 유사도 검색에서는 효율적으로 유사성을 만족하는 문자열을 찾기 위해서 데이터에 대한 역 색인을 구축하여 이용한다. 일반적으로 기존의 기법들은 빠른 응답속도의 질의처리를 위해서 역 색인을 메모리에 상주시킨다. 하지만 구축된 역 색인은 그 크기가 매우 크다는 문제점을 가지고 있다. 따라서 데이터의 크기가 매우 큰 경우나 자원이 제약적인 환경에서는 역 색인을 이용한 질의처리가 불가능할 수 있다. 본 논문에서는 동일한 q-그램을 포함하는 문자열들이 서로 인접한 위치가 되도록 재배치시킨 후 해당 문자열들을 범위로 표현한다. 실험을 통하여 질의처리의 성능을 희생하지 않으면서도 색인의 크기가 줄어드는 것을 보인다.

Optical Emission Anisotropy in InP Aligned Quantum Dots

  • Shin, Y.H.;Kim, Yongmin;Song, J.D.;Choi, Subong
    • 한국진공학회:학술대회논문집
    • /
    • 한국진공학회 2014년도 제46회 동계 정기학술대회 초록집
    • /
    • pp.288.2-288.2
    • /
    • 2014
  • InP quantum dots were grown by using the molecular beam epitaxy technique. Quantum dots are connected and composed string-like one-dimensional structure due to the strain field along [110] crystal direction. Two prominent photoluminescence transitions from normal quantum dots and string-like one-dimensional structure were observed which show strong optical anisotropy along [1-10] and [110] crystal directions. Both peaks also showed blue-shift while rotating emission polarization from [1-10] to [110] direction. Such optical transition behaviors are the consequence of the valence band mixing caused by strain field along the [110] crystal direction.

  • PDF

스트링 B-트리를 이용한 게놈 서열 분석 시스템 (An Analysis System for Whole Genomic Sequence Using String B-Tree)

  • 최정현;조환규
    • 정보처리학회논문지A
    • /
    • 제8A권4호
    • /
    • pp.509-516
    • /
    • 2001
  • 생명 과학의 발전과 많은 게놈(genome) 프로젝트의 결과로 여러 종의 게놈 서열이 밝혀지고 있다. 생물체의 서열을 분석하는 방법은 전역정렬(global alignment), 지역정렬(local alignment) 등 여러 가지 방법이 있는데, 그 중 하나가 k-mer 분석이다. k-mer는 유전자의 염기 서열내의 길이가 k인 연속된 염기 서열로서 k-mer 분석은 염기서열이 가진 k-mer들의 빈도 분포나 대칭성 등을 탐색하는 것이다. 그런데 게놈의 염기 서열은 대용량 텍스트이고 k가 클 때 기존의 온메모리 알고리즘으로는 처리가 불가능하므로 효율적인 자료구조와 알고리즘이 필요하다. 스트링 B-트리는 패턴 일치(pattern matching)에 적합하고 외부 메모리를 지원하는 좋은 자료구조이다. 본 논문에서는 스트링 B-트리(string B-tree)를 k-mer 분석에 효율적인 구조로 개선하여, C. elegans 외의 30개의 게놈 서열에 대해 분석한다. k-mer들의 빈도 분포와 대칭성을 보여주기 위해 CGR(Chaotic Game Representation)을 이용한 가시화 시스템을 제시한다. 게놈 서열과 매우 유사한 서열 상의 어떤 부분을 시그니쳐(signature)라 하고, 높은 유사도를 가지는 최소 길이의 시그니쳐를 찾는 알고리즘을 제시한다.

  • PDF

문자열 부분검색을 위한 색인기법의 설계 및 성능평가 (Design and Performance Evaluation of an Indexing Method for Partial String Searches)

  • 강승헌;유재수
    • 한국정보처리학회논문지
    • /
    • 제6권6호
    • /
    • pp.1458-1467
    • /
    • 1999
  • 신장해슁이나 B+-트리와 같은 기존의 색인구조들은 문자열의 부분검색을 지원하지 못하거나 부분검색에 제약점을 가지고 있다. 최근 웹 환경에서 동작하는 정보검색 엔진들이 사용하는 역파일의 빠른 검색성능을 가지면서 문자열 부분검색을 효율적으로 지원하는 색인기법을 제안한다. 제안된 색인기법은 기본적으로 역파일 구조이며, 2음절 단위의 패턴으로 색인을 구성함으로써 문자열 부분검색을 지원한다. 제안된 색인기법의 특성을 분석하기 위해 제안된 방법의 성능을 다양한 환경에서 실험을 통하여 비교하고 분석한다. 또한 성능평가를 위해 기존의 역파일 기법, 요약 파일 기법들과 제안하는 색인기법의 분석적 모델을 검색시간과 저장공간 측면에서 세시하고, 그 모델을 기반으로 그들의 성능을 비교한다. 분석적 비교모델을 통한 성능비교 결과, 제안된 부분검색을 위한 색인기법은 저장공간의 오버헤드는 크지만 기존 요약 파일 기법에 비해 검색성능을 상당히 향상시킨다.

  • PDF

GPU을 이용한 다중 고정 길이 패턴을 갖는 DNA 시퀀스에 대한 k-Mismatches에 의한 근사적 병열 스트링 매칭 (Parallel Approximate String Matching with k-Mismatches for Multiple Fixed-Length Patterns in DNA Sequences on Graphics Processing Units)

  • 호 티엔 루안;김현진;오승록
    • 전기학회논문지
    • /
    • 제66권6호
    • /
    • pp.955-961
    • /
    • 2017
  • In this paper, we propose a parallel approximate string matching algorithm with k-mismatches for multiple fixed-length patterns (PMASM) in DNA sequences. PMASM is developed from parallel single pattern approximate string matching algorithms to effectively calculate the Hamming distances for multiple patterns with a fixed-length. In the preprocessing phase of PMASM, all target patterns are binary encoded and stored into a look-up memory. With each input character from the input string, the Hamming distances between a substring and all patterns can be updated at the same time based on the binary encoding information in the look-up memory. Moreover, PMASM adopts graphics processing units (GPUs) to process the data computations in parallel. This paper presents three kinds of PMASM implementation methods in GPUs: thread PMASM, block-thread PMASM, and shared-mem PMASM methods. The shared-mem PMASM method gives an example to effectively make use of the GPU parallel capacity. Moreover, it also exploits special features of the CUDA (Compute Unified Device Architecture) memory structure to optimize the performance. In the experiments with DNA sequences, the proposed PMASM on GPU is 385, 77, and 64 times faster than the traditional naive algorithm, the shift-add algorithm and the single thread PMASM implementation on CPU. With the same NVIDIA GPU model, the performance of the proposed approach is enhanced up to 44% and 21%, compared with the naive, and the shift-add algorithms.

절단검색을 지원하는 전자사전 구조 (An Electronic Dictionary Structure supporting Truncation Search)

  • 김철수
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제9권1호
    • /
    • pp.60-69
    • /
    • 2003
  • 역화일을 파일구조로 이용하는 정보 검색 시스템에서는 검색자가 검색할 분야의 완전 단어를 알고 있어야 검색이 가능하다. 그러나 검색자가 완전 단어가 아닌 단어의 부분 문자열을 알고 있는 경우가 많다. 이럴 경우 부분 문자열을 포함하는 색인어들을 검색할 수 있다면 관련 문서들을 검색할 수 있다. 또한 검색된 문헌 수가 너무 적을 경우 부분 문자열을 포함하는 단어를 색인어로 가지는 모든 문서들을 검색하기 위한 방법이 필요하다. 이런 요건들을 충족시키기 위해서는 사용자는 용어 절단 방법을 이용하여 질의어를 구성할 수 있어야 하고, 검색 시스템은 절단 검색을 지원할 수 있는 전자 사전이 필요하다. 본 논문에서는 절단검색을 효율적으로 지원할 수 있는 전자 사전 구조를 설계하고 구현한다. 이 전자 사전은 저장된 단어 수에 관계없이 주어진 한 개의 단어 검색 시간 및 역 문자열로 구성된 단어 검색 시간이 빠르고 일정하다. 절단검색을 효율적으로 지원하기 위하여 트라이 구조를 이용하였으며, 빠른 검색 시간을 지원하기 위해 배열을 이용한 방법을 사용하였다. 절단된 용어의 검색 과정에서 확장할 문자열의 길이를 최소화하여 검색 시간을 줄였다.

와일드카드 문자를 포함하는 스트링 데이터 사이의 포함관계 확인을 위한 효율적인 알고리즘 (An Effective Algorithm for Checking Subsumption Relation on String Data Containing Wildcard Characters)

  • 김도한;박희진;백은옥
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제32권9호
    • /
    • pp.475-482
    • /
    • 2005
  • 와일드카드 문자를 포함하는 스트링 데이타는 텍스트에 나타나는 특정 패턴을 표현하는 데에 사용될 수 있다. 임의의 두 패턴 사이의 포함 관계는 각 패턴과 매칭이 가능한 모든 스트링의 집합 사이의 포함관계로 나타낼 수 있으며, 포함 관계를 결정하는 것은 패턴이 나타내는 스트링의 집합을 중복성없이 표현하기 위해 필요하다. 본 논문에서는 이와 같이 패턴의 중복성을 판단하기 위해 와일드카드 문자를 포함하는 스트링 데이타 사이의 포함 관계를 결정하기 위한 효율적인 알고리즘을 제안한다. 먼저 기존의 접미사 트리 알고리즘을 단순하게 확장하여 와일드카드 문자를 포함하는 스트링 데이타 사이의 포함 관계를 확인할 수 있도록 하는 방법과 이러한 접미사 트리를 스트링 데이타의 각 위치 별로 나누어 구성하여 포함 관계를 확인하는 방법을 제안한다.

조류 중 원형실린더 형상 구조물의 거동감소를 위한 실험적 연구 (Experimental Study on Reducing Motion of Circular Cylinder in Currents)

  • 임재환;조효제;황재혁;김재희;이태경;최윤우;이민준;김영규
    • 한국해양공학회지
    • /
    • 제33권4호
    • /
    • pp.350-357
    • /
    • 2019
  • The development of marine technology is expected to increase the demand for marine plants because of increasing oil prices. Therefore, there is also expected to be an increase in the demand for cylindrical structures such as URF (umbilical, riser, flowline) structures and spars, which are used operating in various seas. However, a cylindrical structure experiences vortex induced motion (VIM) in a current. In particular, for risers and umbilicals, it is important to identify the characteristics of the VIM because interference between structures can occur. In addition, various studies have been conducted to reduce VIM because it is the cause of fatigue damage to structures. The helical strake, which was developed for VIM reduction, has an excellent VIM reduction performance, but is difficult to install on structures and has a negative effect on heave motion. Therefore, the purpose of this study was to supplement the shortcomings of the helical strake and develop a high-performance reduction device. In the reduction device developed in this study, a string is placed around the structure inside the flow, causing vibration. The vibration of this string causes a small turbulence in the flow field, reducing the VIM effect on the structure. Finally, in this study, the 2-DOF motion characteristics of models without a suppression device, models with a helical strake, and models with a string were investigated, and their reduction performances were compared through model tests.

처용무복포의 연구(I) -구조적 특징과 변천을 중심으로- (A Study on the Costumes of Ch'oyong Dance(I) - focus on the structure and change-)

  • 박진아;조우현
    • 한국의류학회지
    • /
    • 제21권1호
    • /
    • pp.129-143
    • /
    • 1997
  • This study is about'The Costumes of Ch'oyong dance. (namely Ch'oyong-mu-bok; 처용무복)': emphasis on its structure and change. 1 studied Akhakguebum (the book of music and dance; 낙학궤범), Eui-Gue-Do (a collection of a series of paintings showing the whole processes of the royal courtesies and ceremonies; 의궤도) and some genre painting (풍증화). 'The costumes of Ch'oyong-Dance'were composed of robe(의), pants-skirt(대) , outer-skirt (상) , scarf-string(천의·길경) , shirt(한삼) , hat with mask (사교·가면) , belt(대) and shoes (혜) . According to the position, the colours of robe(의) and pants-skirt(군) were different. What is called, it is'the Colour of Five-Position (오방색) .'The Costumes of choyong-Dance' can be divided three factors by its symbolic means; i. e. shamanism, buddhism and bureaucratism. The pants-skirt(군), outer-skirts(상), scarf · string(천의·길경) and mask are considered as shamanic factor. However, the scarf(천의) , string(길경) and patterns(만화)which are decorated with many lotus patterns enclosed with vine are considered as buddhistic factor. And the hat (사모) , robe(의) , outer-skirt(상) , belt(대) and shoes(잔) are considered as bureaucratic factor. Ch'oyong is endowed with some power by these factors, and its symbolic means became stronger and enlarged by 'the Colour of five-position'. As time goes, the forms and details of robe had been changed noticeable; sleeve-width, neck-line and patterns. The shamanic, buddhistic and bureaucratic factors are reduced. These changes were derived from the changes of Ch'oyong·Dance. On the ground of the shape of mask and round-neckline robe(단영) , someone has an opinion that Ch'oyong is an aribian. However, according to this study, Ch'oyonh is Korean traditional thing; round-neckline robe already existed and settled in Silla dynasty and Ch'oyong-mask symbolized shamanic power.

  • PDF

Force monitoring of Galfan cables in a long-span cable-truss string-support system based on the magnetic flux method

  • Yuxin Zhang;Xiang Tian;Juwei Xia;Hexin Zhang
    • Structural Monitoring and Maintenance
    • /
    • 제10권3호
    • /
    • pp.261-281
    • /
    • 2023
  • Magnetic flux sensors are commonly used in monitoring the cable force, but the application of the sensors in large diameter non-closed Galfan cables, as those adopted in Yueqing Gymnasium which is located in Yueqing City, Zhejiang Province, China and is the largest span hybrid space structure in the world, is seldom done in engineering. Based on the construction of Yueqing Gymnasium, this paper studies the cable tension monitoring using the magnetic flux method across two stages, namely, the pre-calibration stage before the cable leaves the rigging factory and the field tension formation stage of the cable system. In the pre-calibration stage in the cable factory, a series of 1:1 full-scale comparative tests were carried out to study the feasibility and relability of this kind of monitoring method, and the influence on the monitoring results of charging and discharging voltage, sensor location, cable diameter and fitting method were also studied. Some meaningful conclusions were obtained. On this basis, the real-time cable tension monitoring system of the structure based on the magnetic flux method is established. During the construction process, the monitoring results of the cables are in good agreement with the data of the on-site pressure gauge.The work of this paper will provide a useful reference for cable force monitoring in the construction process of long-span spatial structures.