• 제목/요약/키워드: sequence information

검색결과 4,003건 처리시간 0.031초

최대 자기 상관값이 3인 4진 수열 (Quaternary Sequence with Maximum Autocorrelation of 3)

  • 장지웅;김상효;임대운
    • 한국통신학회논문지
    • /
    • 제34권2C호
    • /
    • pp.158-162
    • /
    • 2009
  • 본 논문에서는 우수한 상관값을 갖는 새로운 4진 수열의 생성법을 제안한다. 새로운 4진 수열은 이상적인 자기상관 특성을 갖는 이진 수열과 역 Gray 사상을 이용하여 생성하며 0이 아닌 위상차에서 갖는 자기 상관 값의 최대 크기는 3이다. 새로운 4진 수열은 2진 수열의 형태에 하나의 허수부를 갖는 근사 이진 수열의 형태를 가지므로 균형성이 크게 어긋나나 문자열의 합은 0에 매우 근사한 형태를 갖는다.

시퀀스 요소 기반의 유사도를 이용한 시퀀스 데이터 클러스터링 (Mining Clusters of Sequence Data using Sequence Element-based Similarity Measure)

  • 오승준;김재련
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2004년도 추계학술대회
    • /
    • pp.221-229
    • /
    • 2004
  • Recently, there has been enormous growth in the amount of commercial and scientific data, such as protein sequences, retail transactions, and web-logs. Such datasets consist of sequence data that have an inherent sequential nature. However, only a few of the existing clustering algorithms consider sequentiality. This study presents a method for clustering such sequence datasets. The similarity between sequences must be decided before clustering the sequences. This study proposes a new similarity measure to compute the similarity between two sequences using a sequence element. Two clustering algorithms using the proposed similarity measure are proposed: a hierarchical clustering algorithm and a scalable clustering algorithm that uses sampling and a k-nearest neighbor method. Using a splice dataset and synthetic datasets, we show that the quality of clusters generated by our proposed clustering algorithms is better than that of clusters produced by traditional clustering algorithms.

  • PDF

Binary Sequence Family for Chaotic Compressed Sensing

  • Lu, Cunbo;Chen, Wengu;Xu, Haibo
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권9호
    • /
    • pp.4645-4664
    • /
    • 2019
  • It is significant to construct deterministic measurement matrices with easy hardware implementation, good sensing performance and good cryptographic property for practical compressed sensing (CS) applications. In this paper, a deterministic construction method of bipolar chaotic measurement matrices is presented based on binary sequence family (BSF) and Chebyshev chaotic sequence. The column vectors of these matrices are the sequences of BSF, where 1 is substituted with -1 and 0 is with 1. The proposed matrices, which exploit the pseudo-randomness of Chebyshev sequence, are sensitive to the initial state. The performance of proposed matrices is analyzed from the perspective of coherence. Theoretical analysis and simulation experiments show that the proposed matrices have limited influence on the recovery accuracy in different initial states and they outperform their Gaussian and Bernoulli counterparts in recovery accuracy. The proposed matrices can make the hardware implement easy by means of linear feedback shift register (LFSR) structures and numeric converter, which is conducive to practical CS.

모양 시퀀스 기술자를 이용한 효과적인 동작 표현 및 검색 방법 (Efficient Representation and Matching of Object Movement using Shape Sequence Descriptor)

  • 최민석
    • 정보처리학회논문지B
    • /
    • 제15B권5호
    • /
    • pp.391-396
    • /
    • 2008
  • 동영상에서 객체의 움직임은 동영상의 내용을 분석하는데 중요한 요소로 작용한다. 따라서 움직임 정보를 이용하여 동영상 내용을 분석하고 검색하기 위한 많은 방법들이 제안되었다. 그러나 대부분의 방법들은 객체 자체의 동작 보다는 움직임의 방향이나 경로를 분석하는 쪽으로 치중되었다. 본 논문에서는 객체의 움직임에 의한 모양 변화를 이용하여 객체의 동작을 표현하고 비교하기 위한 모양 시퀀스 기술자(descriptor)를 제안한다. 객체의 움직임 정보는 입력된 이미지 시퀀스에서 객체 영역을 추출하여 연속된 2차원 모양 정보로 표현되고, 각각의 2차원 모양 정보는 모양 기술자를 이용하여 1차원 모양 특징 값으로 변환된다. 순서에 따라 배열된 모양 기술자들을 시간 축으로 주파수 변환한 후 저주파영역의 계수를 취하여 모양 시퀀스 기술자를 얻게 된다. 실험을 통하여 제안된 방법이 객체의 동작 정보를 매우 효과적으로 표현 및 비교 가능하여 내용 기반 동영상 검색, 동작 인식 등의 인지적 관점의 움직임 분석 응용에 적용 가능함을 보였다.

연관규칙과 순차패턴을 이용한 프로세스 마이닝 (A Process Mining using Association Rule and Sequence Pattern)

  • 정소영;권수태
    • 산업경영시스템학회지
    • /
    • 제31권2호
    • /
    • pp.104-111
    • /
    • 2008
  • A process mining is considered to support the discovery of business process for unstructured process model, and a process mining algorithm by using the associated rule and sequence pattern of data mining is developed to extract information about processes from event-log, and to discover process of alternative, concurrent and hidden activities. Some numerical examples are presented to show the effectiveness and efficiency of the algorithm.

UML 다이어그램을 위한 다이어그램 레포지토리의 정보구조화 (Information Structuring of Diagram Repository for UML Diagrams)

  • 김윤호
    • 한국정보통신학회논문지
    • /
    • 제23권12호
    • /
    • pp.1588-1595
    • /
    • 2019
  • 본 논문에서는 UML 다이어그램에 대응되는 코드 생성을 위하여 요구되는 정보를 저장하기 위한 레포지토리를 구축하는 방법을 제시한다. 객체 지향 프로그래밍에서는 객체 간의 상호 작용이 핵심이므로, UML 다이어그램들 중에서 클래스 다이어그램과 시퀀스 다이어그램에 대해서 논의를 전개한다. 클래스 다어어그램을 기반으로 실행 시간에 객체가 상호 동작하는 절차를 보이는 시퀀스 다이어그램으로부터 상응하는 코드를 생성하게 되며, 이를 위해서는 코드생성에 필요한 정보를 추출하여 정보 저장소인 레포지토리를 구축하여야 한다. 따라서 본 논문에서는 시퀀스 다이어그램의 메시지 유형을 다섯 개로 분류하고 이들로부터 각각의 레포지토리를 구성하기 위하여 필요한 항목과 그 값에 대한 정보를 추출하여 구조적으로 정보를 저장하는 방법을 제시한다. 시퀀스 다이어그램은 이들 메시지들로 구성되므로, 각 메시지에 대한 구조화된 레포지토리를 순차적으로 수집하여 최종적인 레포지토리를 구성한다.

셀룰라 오토마타 기반의 수축-삽입 수열의 분석 (Analysis of Shrunken-Interleaved Sequence Based on Cellular Automata)

  • 최언숙;조성진
    • 한국정보통신학회논문지
    • /
    • 제14권10호
    • /
    • pp.2283-2291
    • /
    • 2010
  • 스트림 암호시스템에 사용되는 불규칙 시각 제어 생성기인 수축수열 생성기는 두 개의 LFSR(Linear Feedback Shift Register)로 구성되며 이 생성기에 의해 생성되는 수열은 비선형수열임이 알려져 있다. 두 개의 최대길이를 갖는 90/150 셀룰라 오토마타 기반의 비선형수열 생성기는 각 셀에서 동일한 특성다항식을 갖는 의사 난수열을 효과적으로 생성할 수 있으므로 LFSR에 의해 생성되는 수열에 비하여 주기와 선형복잡도가 높은 비선형수열을 생성할 수 있다. 본 논문은 이러한 비선형수열에 대한 분석으로 90/150 셀룰라 오토마타 기반의 수축-삽입수열(shrunken-interleaved sequence)을 다룬다. 셀룰라 오토마타 기반의 비선형수열 생성기에 의해 생성되는 수축-삽입수열을 삽입수열로 분석이 가능함을 보이고 출력 수열의 일부를 알 때 알려지지 않은 새로운 출력 수열의 일부를 효과적으로 재구성하는 알고리즘을 제안한다.

콜러스터링 분기를 이용한 다중 서열 정렬 알고리즘 (A Multiple Sequence Alignment Algorithm using Clustering Divergence)

  • 이병일;이종연;정순기
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권5호
    • /
    • pp.1-10
    • /
    • 2005
  • 다중 서열 정렬(multiple sequence alignment, MSA)은 단백질과 핵산 서열들의 분석에 필요한 가장 중요한 도구이다. 생물학적인 서열들은 그들 사이의 유사성과 차이점을 보여주기 위하여 각각의 서열들을 수직적으로 정렬한다. 본 논문에서는 클러스터링 분기를 이용하여 두 그룹의 서열들 사이에서 정렬을 수행하는 효율적인 그룹 정렬 방법을 제안하였다. 제안한 알고리즘(Multiple Sequence Alignment using Clustering Divergence : CDMS)은 하향식 발견 방법인 트리 형태의 병합을 위해 클러스터링 방법으로 구축하였다. 클러스터링 방법은 가장 긴 거리를 가지는 서열을 두 개의 클러스터로 나눌 수 있다는 것에 기초하였다. 제안한 새로운 서열 정렬 알고리즘은 기존의 Clustal W알고리즘 보다 질적 향상과 처리 시간 단축 O($n^{3} L^{2}$)이 기대된다.

  • PDF

이진 낮은 상관 구역 수열군을 이용한 새로운 4진 낮은 상관 수열군의 생성법 (A New Construction of Quaternary LCZ Sequence Set Using Binary LCZ Sequence Set)

  • 장지웅;김상효;임대운
    • 한국통신학회논문지
    • /
    • 제34권1C호
    • /
    • pp.9-14
    • /
    • 2009
  • 본 논문에서는 매개 변수가 (N,M,L,1)인 특정 성질을 가진 이진 낮은 상관 구역 수열균(LCZ sequence)를 이용하여 매개 변수가 (2N,2M,L,2)인 4진 낮은 상관 수열군을 생성하는 방법을 제시한다. 본 논문에서 이용하는 이진 낮은 상관 수열군은 balance property를 가지고 있어야 하며, 주기 N이 $N{\equiv}3$ mod 4이어야 하고, 특정한 상관 특성을 가져야 한다. 새로 제안된 생성법은 특정 성질을 가진 이진 낮은 상관 수열군을 이용하여 이진 낮은 상관 수열군을 생성한 Kim, Jang, No, and Chung의 생성법을 응용한 것이다.

An Efficient Approach to Mining Maximal Contiguous Frequent Patterns from Large DNA Sequence Databases

  • Karim, Md. Rezaul;Rashid, Md. Mamunur;Jeong, Byeong-Soo;Choi, Ho-Jin
    • Genomics & Informatics
    • /
    • 제10권1호
    • /
    • pp.51-57
    • /
    • 2012
  • Mining interesting patterns from DNA sequences is one of the most challenging tasks in bioinformatics and computational biology. Maximal contiguous frequent patterns are preferable for expressing the function and structure of DNA sequences and hence can capture the common data characteristics among related sequences. Biologists are interested in finding frequent orderly arrangements of motifs that are responsible for similar expression of a group of genes. In order to reduce mining time and complexity, however, most existing sequence mining algorithms either focus on finding short DNA sequences or require explicit specification of sequence lengths in advance. The challenge is to find longer sequences without specifying sequence lengths in advance. In this paper, we propose an efficient approach to mining maximal contiguous frequent patterns from large DNA sequence datasets. The experimental results show that our proposed approach is memory-efficient and mines maximal contiguous frequent patterns within a reasonable time.