• 제목/요약/키워드: Sequence analysis

검색결과 6,391건 처리시간 0.032초

Sequence Selectivity of DNA Alkylation by Adozelesin and Carzelesin

  • Yoon, Jung-Hoon;Lee, Chong-Soon
    • Archives of Pharmacal Research
    • /
    • 제21권4호
    • /
    • pp.385-390
    • /
    • 1998
  • Adozelesin and carzelesin are synthetic analogues of the extremely potent antitumor antibiotic CC-1065, which alkylates N3 of adenine in a consensus sequence $5^1$-(A/T)(A/T)$A^*$ ($A^*$ is the site of alkylation). We have investigated the DNA sequence selectivity of adozelesin and carzelesin by thermally ind ced DNA strand cleavage assay using radiolabeled restriction DNA fragments. An analysis of alkylation patterns shows that the consensus sequences for carzelesin and adozelesin have been found to be $5^1$-(A/T)(A/T)$A^*$ and $5^1$-(A/F)(G/C)(A/T)$A^*$. A new consensus sequence, $5^1$-(A/T)(A/T)$CA^*$, has been observed to display an additional alkylation site for adozelesin but not for carzelesin. These results indicate that the pattern of sequence selectivity induced by carzelesin is similar but not identical to those induced by adozelosin.

  • PDF

Binary Sequence Family for Chaotic Compressed Sensing

  • Lu, Cunbo;Chen, Wengu;Xu, Haibo
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권9호
    • /
    • pp.4645-4664
    • /
    • 2019
  • It is significant to construct deterministic measurement matrices with easy hardware implementation, good sensing performance and good cryptographic property for practical compressed sensing (CS) applications. In this paper, a deterministic construction method of bipolar chaotic measurement matrices is presented based on binary sequence family (BSF) and Chebyshev chaotic sequence. The column vectors of these matrices are the sequences of BSF, where 1 is substituted with -1 and 0 is with 1. The proposed matrices, which exploit the pseudo-randomness of Chebyshev sequence, are sensitive to the initial state. The performance of proposed matrices is analyzed from the perspective of coherence. Theoretical analysis and simulation experiments show that the proposed matrices have limited influence on the recovery accuracy in different initial states and they outperform their Gaussian and Bernoulli counterparts in recovery accuracy. The proposed matrices can make the hardware implement easy by means of linear feedback shift register (LFSR) structures and numeric converter, which is conducive to practical CS.

Physiological and Phylogenetic Analysis of Burkholderia sp. HY1 Capable of Aniline Degradation

  • Kahng, Hyung-Yeel;Jerome J. Kukor;Oh, Kye-Heon
    • Journal of Microbiology and Biotechnology
    • /
    • 제10권5호
    • /
    • pp.643-650
    • /
    • 2000
  • A new aniline-utilizing microorganism, strain HY1 obtained from an orchard soil, was characterized by using the BIOLOG system, an analysis of the total cellular fatty acids, and a 16S rDNA sequence. Strain HY1 was identified as a Burkholderia species, and was designated Burkholderia sp. HY1. GC and HPLC analyses revealed that Burkholderia sp. HY1 was able to degrade aniline to produce catechol, which was subsequently converted to cis,cis-muconic acid through an ortho-ring fission pathway under aerobic conditions. Strain HY1 exhibited a drastic reduction in the rate of aniline degradation when glucose was added to the aniline media. However, the addition of peptone or nitrate to the aniline media dramatically accelerated the rate of aniline degradation. A fatty acid analysis showed that strain HY1 was able to produce lipids 16:0 2OH, and 11 methyl 18:1 ${\omega}7c$ approximately 3.7-, 2.2-, and 6-fold more, respectively, when grown on aniline media than when grown on TSA. An analysison the alignment of a 1,435 bp fragment. A phylogenetic analysis of the 16S rDNA sequence based on a 1,420 bp multi-alignment sowed of the 16s rDNA sequence revealed that strain HY1 was very closely related to Burkholderia graminis with 95% similarity based that strain HY1 was placed among three major clonal types of $\beta$-Proteobacteria, including Burkholderia graminis, Burkholderia phenazinium, and Burkholderia glathei. The sequence GAT(C or G)${\b{G}}$, which is highly conserved in several locations in the 16S rDNA gene among the major clonal type strains of $\beta$-Proteobacteria, was frequently replaced with GAT(C or G)${\b{A}}$ in the 16S rDNA sequence from strain HY1.

  • PDF

셀룰라 오토마타 기반의 수축-삽입 수열의 분석 (Analysis of Shrunken-Interleaved Sequence Based on Cellular Automata)

  • 최언숙;조성진
    • 한국정보통신학회논문지
    • /
    • 제14권10호
    • /
    • pp.2283-2291
    • /
    • 2010
  • 스트림 암호시스템에 사용되는 불규칙 시각 제어 생성기인 수축수열 생성기는 두 개의 LFSR(Linear Feedback Shift Register)로 구성되며 이 생성기에 의해 생성되는 수열은 비선형수열임이 알려져 있다. 두 개의 최대길이를 갖는 90/150 셀룰라 오토마타 기반의 비선형수열 생성기는 각 셀에서 동일한 특성다항식을 갖는 의사 난수열을 효과적으로 생성할 수 있으므로 LFSR에 의해 생성되는 수열에 비하여 주기와 선형복잡도가 높은 비선형수열을 생성할 수 있다. 본 논문은 이러한 비선형수열에 대한 분석으로 90/150 셀룰라 오토마타 기반의 수축-삽입수열(shrunken-interleaved sequence)을 다룬다. 셀룰라 오토마타 기반의 비선형수열 생성기에 의해 생성되는 수축-삽입수열을 삽입수열로 분석이 가능함을 보이고 출력 수열의 일부를 알 때 알려지지 않은 새로운 출력 수열의 일부를 효과적으로 재구성하는 알고리즘을 제안한다.

인삼 모상근 프로테옴 데이터 분석 : 인삼 EST database와의 통합 분석에 의한 단백질 동정 (Proteome Data Analysis of Hairy Root of Panax ginseng : Use of Expressed Sequence Tag Data of Ginseng for the Protein Identification)

  • 권경훈;김승일;김경욱;김은아;조건;김진영;김영환;양덕춘;허철구;유종신;박영목
    • Journal of Plant Biotechnology
    • /
    • 제29권3호
    • /
    • pp.161-170
    • /
    • 2002
  • 인삼 모상근의 프로테옴 분석에 의해 얻은 질량분석 스펙트럼 데이터는 MALDI/TOF/MS에서 얻는 질량 스펙트럼과 ESI/Q-TOF/MS에서 얻는 탄뎀 질량 스펙트럼으로 구분된다. 질량 스펙트럼은 단백질이 효소에 의해 분해된 펩타이드들의 분자량 정보를 제공하며, 탄뎀 질량 스펙트럼에서는 아미노산 단위로 분해된 절편 단백질의 분자량으로부터 아미노산 서열을 결과로 얻는다. 펩타이드의 아미노산 서열을 BLAST로 검색하면 유사한 단백질을 GenBank에서 검색할 수 있다. 이러한 단백질 동정 방법은 완전한 유전체 서열이 알려진 생물체의 경우 높은 정확도로 단백질을 동정할 수 있으나, 그렇지 않은 경우는 유사한 단백질이 데이터베이스에 존재하지 않아 분석이 용이하지 않다. 본 연구에서는 질량 스펙트럼 및 절편 단백질의 아미노산 서열을 EST (expressed sequence tag) 서열과 비교하여 프로테옴 데이터와 일치하는 EST 서열을 찾아내고 이를 BLAST검색에 의해 단백질 동정에 활용하였다. ESI/Q-TOF/MS 에서 얻은 아미노산 서열은 길이는 짧지만 데이터의 신뢰도가 높으므로 EST 서열과의 연관 관계를 밝힘으로써 단백질에 대한 정보를 보완할 수 있었다. ESI/Q-TOF/MS에서 얻은 펩타이드의 아미노산 서열을 EST 서열과 비교한 결과 90%의 아미노산 서열이 EST DB에서 발견되었다. NCBI의 nr 데이터베이스에서 아미노산 서열을 검색하여 찾은 단백질이 68%임에 비하여, 인삼 EST 서열에 의한 검색이 22% 더 많은 결과를 얻었다. MALDI/TOF/MS의 질량 스펙트럼에서 nr 데이터베이스로 검색한 결과와 인삼 EST 데이터베이스를 검색한 결과가 일치하는 경우는 47개 중 9개인 19%에 불과하여, 탄뎀 질량 분석으로 아미노산 서열을 얻지 않고, 단지 질량 스펙트럼으로부터 단백질을 동정하는 방법으로는 단백질 동정의 정확한 결과를 기대하기 어려움을 확인하였다.

구매의도 생성 순서와 구매실현 순서의 역전 현상을 감안한 확장된 순차분석 방법론 (An Investigation on Expanding Traditional Sequential Analysis Method by Considering the Reversion of Purchase Realization Order)

  • 김민석;김남규
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제22권3호
    • /
    • pp.25-42
    • /
    • 2013
  • Recently various kinds of Information Technology services are created and the quantities of the data flow are increase rapidly. Not only that, but the data patterns that we deal with also slowly becoming diversity. As a result, the demand of discover the meaningful knowledge/information through the various mining analysis such as linkage analysis, sequencing analysis, classification and prediction, has been steadily increasing. However, solving the business problems using data mining analysis does not always concerning, one of the major causes of these limitations is there are some analyzed data can't accurately reflect the real world phenomenon. For example, although the time gap of purchasing the two products is very short, by using the traditional sequencing analysis, the precedence relationship of the two products is clearly reflected. But in the real world, with the very short time interval, the precedence relationship of the two purchases might not be defined. What was worse, the sequence of the purchase intention and the sequence of the purchase realization of the two products might be mutually be reversed. Therefore, in this study, an expanded sequencing analysis methodology has been proposed in order to reflect this situation. In this proposed methodology, the purchases that being made in a very short time interval among the purchase order which might not important will be notice, and the analysis which included the original sequence and reversed sequence will be used to extend the analysis of the data. Also, to some extent a very short time interval can be defined as the time interval, so an experiment were carried out to determine the varying based on the time interval for the actual data.

택시 기종점 빈번 순차 패턴 분석 (Frequent Origin-Destination Sequence Pattern Analysis from Taxi Trajectories)

  • 이태영;전승배;정명훈;최연웅
    • 대한토목학회논문집
    • /
    • 제39권3호
    • /
    • pp.461-467
    • /
    • 2019
  • IoT (Internet of Things) 기술과 위치기반 기술의 발전은 대용량의 이동데이터를 급속하게 생성하고 있다. 대용량 이동 데이터의 분석은 도시 이동의 흐름 및 교통 계획 등에 활용되고 있다. 본 연구에서는 불규칙한 공간적 및 시간적 해상도의 택시 승차 정보로부터 빈번 승차 패턴을 분석하였다. 택시 승차 지점을 중심으로 군집 분석을 실시한 후 군집분석에 기반한 영역을 기준으로 순차패턴 분석을 적용하여 택시 승차 지점이 빈번하게 일어나는 패턴을 분석하였다. 실험용 데이터는 서울특별시 택시 운행 정보로부터 아침 출근 시간인 7시부터 9시 사이의 승차 정보를 분석하였다. 분석 결과는 아침 출근 시간대에 가장 빈도가 높게 발생하는 승차 순차 패턴은 강남 지역 안에서 많이 발생하였으며 지역과의 연계에 있어서는 강남으로부터 서울 시청 지역으로의 이동이 많이 발생하였다. 또한 본 연구는 순차 패턴 분석을 위한 기본 단위로 행정동 경계를 기준으로 분석하였다. 하지만 행정동 경계 기반의 분석은 지역간의 이동 패턴을 찾기가 어려웠다. 본 연구 결과는 향후 택시 공차율 감소와 도시 흐름관리를 위하여 활용할 수 있을 것으로 사료된다.

콜러스터링 분기를 이용한 다중 서열 정렬 알고리즘 (A Multiple Sequence Alignment Algorithm using Clustering Divergence)

  • 이병일;이종연;정순기
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권5호
    • /
    • pp.1-10
    • /
    • 2005
  • 다중 서열 정렬(multiple sequence alignment, MSA)은 단백질과 핵산 서열들의 분석에 필요한 가장 중요한 도구이다. 생물학적인 서열들은 그들 사이의 유사성과 차이점을 보여주기 위하여 각각의 서열들을 수직적으로 정렬한다. 본 논문에서는 클러스터링 분기를 이용하여 두 그룹의 서열들 사이에서 정렬을 수행하는 효율적인 그룹 정렬 방법을 제안하였다. 제안한 알고리즘(Multiple Sequence Alignment using Clustering Divergence : CDMS)은 하향식 발견 방법인 트리 형태의 병합을 위해 클러스터링 방법으로 구축하였다. 클러스터링 방법은 가장 긴 거리를 가지는 서열을 두 개의 클러스터로 나눌 수 있다는 것에 기초하였다. 제안한 새로운 서열 정렬 알고리즘은 기존의 Clustal W알고리즘 보다 질적 향상과 처리 시간 단축 O($n^{3} L^{2}$)이 기대된다.

  • PDF

Out of Sequence Measurement 환경에서의 MPDA 성능 분석 (The Performance Analysis of MPDA in Out of Sequence Measurement Environment)

  • 서일환;임영택;송택열
    • 대한전기학회논문지:시스템및제어부문D
    • /
    • 제55권9호
    • /
    • pp.401-408
    • /
    • 2006
  • In a multi-sensor multi-target tracking systems, the local sensors have the role of tracking the target and transferring the measurements to the fusion center. The measurements from the same target can arrive out of sequence called the out-of-sequence measurements(OOSMs). Out-of-sequence measurements can arise at the fusion center due to communication delay and varying preprocessing time for different sensor platforms. In general, the track fusion occurs to enhance the tracking performance of the sensors using the measurements from the sensors at the fusion center. The target informations can wive at the fusion center with the clutter informations in cluttered environment. In this paper, the OOSM update step with MPDA(Most Probable Data Association) is introduced and tested in several cases with the various clutter density through the Monte Carlo simulation. The performance of the MPDA with OOSM update step is compared with the existing NN, PDA, and PDA-AI for the air target tracking in cluttered and out-of-sequence measurement environment. Simulation results show that MPDA with the OOSM has compatible root mean square errors with out-of-sequence PDA-AI filter and the MPDA is sufficient to be used in out-of-sequence environment.

효율적인 1차원 클러스터 기반의 시퀀스 등화기를 위한 최적의 훈련 시퀀스 구성 알고리즘 (An Algorithm of Optimal Training Sequence for Effective 1-D Cluster-Based Sequence Equalizer)

  • 강지혜;김성수
    • 한국전자파학회논문지
    • /
    • 제15권10호
    • /
    • pp.996-1004
    • /
    • 2004
  • 1차원 클러스터 기반의 시퀀스 등화기(1-D CBSE)는 시퀀스 등화기(MLSE)가 갖는 계산상의 복잡성을 효율적으로 해결하고 비선형 채널에서의 뛰어난 성능 개선을 가져온다. 본 논문에서는 다중 경로 페이딩 채널 추정에 대응하는 1-D CBSE의 클러스터 중심을 추정하기 위한 향상된 훈련 시퀀스 구성 기법을 제안하였다. 새로이 제안된 등화기는 기존의 방식에서 갖는 문제점을 해결하고, 보다 짧은 길이의 훈련 시퀀스를 이용함으로써 대역폭 효율을 증대시키는 향상된 결과를 가져왔다. 제안된 알고리즘의 우수성은, 기존의 방법과 제안된 최적의 훈련시퀀스를 적용한 1-D클러스터 기반의 새로운 중심 추정을 통한 방법을 비교를 통하여 보였다. 특히, 컴퓨터 시뮬레이션에 의한 심볼 에러율(SER)에 기반을 둔 비교 분석을 통하여 살펴보았다.