• 제목/요약/키워드: sequence databases

검색결과 226건 처리시간 0.018초

Sequence Analysis of Hypothetical Proteins from Helicobacter pylori 26695 to Identify Potential Virulence Factors

  • Naqvi, Ahmad Abu Turab;Anjum, Farah;Khan, Faez Iqbal;Islam, Asimul;Ahmad, Faizan;Hassan, Md. Imtaiyaz
    • Genomics & Informatics
    • /
    • 제14권3호
    • /
    • pp.125-135
    • /
    • 2016
  • Helicobacter pylori is a Gram-negative bacteria that is responsible for gastritis in human. Its spiral flagellated body helps in locomotion and colonization in the host environment. It is capable of living in the highly acidic environment of the stomach with the help of acid adaptive genes. The genome of H. pylori 26695 strain contains 1,555 coding genes that encode 1,445 proteins. Out of these, 340 proteins are characterized as hypothetical proteins (HP). This study involves extensive analysis of the HPs using an established pipeline which comprises various bioinformatics tools and databases to find out probable functions of the HPs and identification of virulence factors. After extensive analysis of all the 340 HPs, we found that 104 HPs are showing characteristic similarities with the proteins with known functions. Thus, on the basis of such similarities, we assigned probable functions to 104 HPs with high confidence and precision. All the predicted HPs contain representative members of diverse functional classes of proteins such as enzymes, transporters, binding proteins, regulatory proteins, proteins involved in cellular processes and other proteins with miscellaneous functions. Therefore, we classified 104 HPs into aforementioned functional groups. During the virulence factors analysis of the HPs, we found 11 HPs are showing significant virulence. The identification of virulence proteins with the help their predicted functions may pave the way for drug target estimation and development of effective drug to counter the activity of that protein.

Comparative chloroplast genomics and phylogenetic analysis of the Viburnum dilatatum complex (Adoxaceae) in Korea

  • PARK, Jongsun;XI, Hong;OH, Sang-Hun
    • 식물분류학회지
    • /
    • 제50권1호
    • /
    • pp.8-16
    • /
    • 2020
  • Complete chloroplast genome sequences provide detailed information about any structural changes of the genome, instances of phylogenetic reconstruction, and molecular markers for fine-scale analyses. Recent developments of next-generation sequencing (NGS) tools have led to the rapid accumulation of genomic data, especially data pertaining to chloroplasts. Short reads deposited in public databases such as the Sequence Read Archive of the NCBI are open resources, and the corresponding chloroplast genomes are yet to be completed. The V. dilatatum complex in Korea consists of four morphologically similar species: V. dilatatum, V. erosum, V. japonicum, and V. wrightii. Previous molecular phylogenetic analyses based on several DNA regions did not resolve the relationship at the species level. In order to examine the level of variation of the chloroplast genome in the V. dilatatum complex, raw reads of V. dilatatum deposited in the NCBI database were used to reconstruct the whole chloroplast genome, with these results compared to the genomes of V. erosum, V. japonicum, and three other species in Viburnum. These comparative genomics results found no significant structural changes in Viburnum. The degree of interspecific variation among the species in the V. dilatatum complex is very low, suggesting that the species of the complex may have been differentiated recently. The species of the V. dilatatum complex share large unique deletions, providing evidence of close relationships among the species. A phylogenetic analysis of the entire genome of the Viburnum showed that V. dilatatum is a sister to one of two accessions of V. erosum, making V. erosum paraphyletic. Given that the overall degree of variation among the species in the V. dilatatum complex is low, the chloroplast genome may not provide a phylogenetic signal pertaining to relationships among the species.

메타게놈 서열에 존재하는 보존적인 전사와 번역 인자를 이용한 ORF 예측 (Prediction of ORFs in Metagenome by Using Cis-acting Transcriptional and Translational Factors)

  • 정대은;김근중
    • KSBB Journal
    • /
    • 제25권5호
    • /
    • pp.490-496
    • /
    • 2010
  • 미생물은 지구상에 약 $5\;{\times}\;10^{30}$ 정도의 개체가 존재하며, 350~550 Pg (1Pg = 1015g)의 탄소, 85~130 Pg의 질소, 9~14 Pg의 인 등, 지구상의 어떠한 생물 종보다 거대한 양의 원소를 포함하고 있다. 또한 이러한 미생물과 생태계를 구성하는 다른 유기체나 무기물과의 관계가 지속적으로 밝혀지고 있다. 이러한 연구들의 기본적인 목표는 상호작용에 중요한 인자들의 규명 (대표적으로 유전자)하는 것이기 때문에, 염색체에 존재하는 true ORF의 검색과 확인은 가장 중요한 기본 수단이 된다. 그러나 다양한 미생물로 구성된 환경 유전체는 기존 정보로 검색 가능한 비율을 정확하게 유추할 수 없기에 많은 어려움이 있다. 이렇게 경계가 불분명한 자료의 검색을 위해서는 보다 많은 정보를 필요 (training이나 space를 규정하기 위한 보다 많은 유전자 서열)로 하며, 다른 검색 방법이나 기법들이 추가적으로 개발되어야 할 것이다. 이러한 방법의 대안으로써, 미생물의 유전자간 서열에 존재하는 전사/번역인자의 보존성에 근거한 검색방법은 개량 여하에 따라 광범위한 적용 범위를 지닐 것이다. 현 수준에서도 조합 탐색, 즉 기존의 방법과 혼용하거나 기존의 방법을 보완하는 과정으로 충분한 가치를 지니고 있다. 이러한 추정은, 기존의 ORF 중심의 발굴 결과와 전혀 일치되지 않는 경우에서부터 90% 이상 일치하는 등의 결과로서 확인하였다. 일치 되지 않는 많은 경우가 BLASTing으로 검색되지 않는 새로운 ORF를 포함하기 때문이다.

Development of a 3-D Immersion Type Training Simulator

  • Jung, Young-Beom;Park, Chang-Hyun;Jang, Gil-Soo
    • KIEE International Transactions on Power Engineering
    • /
    • 제4A권4호
    • /
    • pp.171-177
    • /
    • 2004
  • In the current age of the information oriented society in which we live, many people use PCs and are dependant on the databases provided by the network server. However, online data can be missed during the occurrence of a blackout and furthermore, power failure can greatly effect Power Quality. This has resulted in the trend of using interruption-free live-line work when trouble occurs in a power system. However, 83% of the population receives an electric shock experience when a laborer is performing interruption-free live-line work. In the interruption-free method, education and training problems have been pinpointed. However, there are few instructors to implement the necessary training. Furthermore, the trainees undergo only a short training period of just 4 weeks. In this paper, to develop a method with no restrictions on time and place and to ensure a reduction in the misuse of materials, immersion type virtual reality (or environment) technology is used. The users of a 3D immersion type VR training system can interact with the system by performing the equivalent action in a safe environment. Thus, it can be valuable to apply this training system to such dangerous work as 'Interruption-free live-line work exchanging COS (Cut-Out-Switch)'. In this program, the user carries out work according to instructions displayed through the window and speaker and cannot perform other tasks until each part of the task is completed in the proper sequence. The workers using this system can utilize their hands and viewpoint movement since they are in a real environment but the trainee cannot use all parts and senses of a real body with the current VR technology. Despite these weak points, when we consider the trends of improvement in electrical devices and communication technology, we can say that 3D graphic VR application has high potentiality.

부호화와 정보 엔트로피에 기반한 심방세동 (Atrial Fibrillation: AF) 패턴 분석 (Atrial Fibrillation Pattern Analysis based on Symbolization and Information Entropy)

  • 조익성;권혁숭
    • 한국정보통신학회논문지
    • /
    • 제16권5호
    • /
    • pp.1047-1054
    • /
    • 2012
  • 심방세동(Atrial Fibrillation:AF)은 각종 심장질환에서 비교적 빈번히 발생하는 부정맥으로 알려져 있으며, 그 발병률은 연령의 증가와 더불어 점차 증가한다. 전통적으로 심방세동을 검출하는 방법은 시간 영역 분석법과 주파수 영역분석법이 대부분이었다. 하지만 심전도 신호는 잡음의 영향을 많이 받는 환경에서 검출의 정확도가 떨어지며, 시간 주파수 영역 분석법은 RR 간격에 따라 변화하는 불규칙적 리듬에 관한 정보를 정확하게 얻지 못하는 단점이 있다. 본 연구에서는 부호화와 정보 엔트로피에 기반한 AF 패턴 분석 방법을 제안한다. 이를 위해 먼저 RR 간격 데이터를 차분 분할 방식을 통해 부호 서열화 한 후 그 리듬에 대한 패턴을 분석하고 이를 샤논의 정보 엔트로피를 통해 복잡도를 정량화하여 심방세동을 검출하였다. 성능 평가를 위해 10부터 100까지의 문턱값에 따른 엔트로피를 통해 복잡도를 분석하였으며 MIT-BIH 심방세동 데이터베이스를 이용하여 실험하였다.

시간간격을 고려한 시간관계 규칙 탐사 기법 (Discovering Temporal Relation Rules from Temporal Interval Data)

  • 이용준;서성보;류근호;김혜규
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권3호
    • /
    • pp.301-314
    • /
    • 2001
  • 데이터마이닝은 대용량 데이터베이스에 내재된 유용한 지식을 탐사하는 기술로 정의된다. 데이터마이닝에 대한 연구가 진행되면서 순차 패턴, 유사 시계열 탐사, 시간 연관규칙 탐사 등과 같이 시간 값을 가진 데이터로부터 지식을 탐사하고자 하는 시간 데이터마이닝에 대한 연구가 수행되었다. 그러나 기존 연구는 트랜잭션의 발생 시점만을 가진 데이터를 다루고 있으며 시간 간격을 가진 데이터는 거의 고려하고 있지 않다. 실세계에서는 환자의 병력, 상품 구매 이력, 웹 로그 등과 같은 시간간격을 가진 다양한 데이터가 존재하며 이로부터 여러 유용한 지식을 찾아낼 수 있다. Allen은 시간간격 데이터 사이에 발생할 수 있는 시간 관계와 시간 관계를 구할 수 있는 시간간격 연산자를 정의하였다. 본 논문에서는 Allen의 정의를 기반으로 시간간격 데이터로부터 시간관계 규칙을 효율적으로 탐사하기 위한 새로운 데이터마이닝 기법을 제안하였다. 이 기법은 발생 시점을 가진 시간 데이터를 시간간격 데이터로 요약하여 일반화하는 전처리 알고리즘과 시간간격 데이터로부터 시간관계 규칙을 생성하는 규clr 탐사 알고리즘으로 구성된다. 이 기법은 기존 데이터마이닝 기법에서 찾지 못하는 유용한 시간 규칙을 탐사할 수 있다.

  • PDF

위치 기반 서비스를 위한 이동 객체의 시간 패턴 탐사 기법 (Temporal Pattern Mining of Moving Objects for Location based Services)

  • 이준욱;백옥현;류근호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권5호
    • /
    • pp.335-346
    • /
    • 2002
  • 위치 기반 서비스는 이동중인 사용자에게 위치와 관련된 정보를 제공한다. 최소한의 자원으로 사용자에게 유용한 정보를 개인화하여 제공하는 것은 위치 기반 서비스가 가져야 할 필수적인 기능이다. 이 기능은 데이타 마이닝을 통해 실현될 수 있다. 하지만 기존의 데이터 마이닝 연구는 시간 및 공간 속성을 동시에 고려하고 있지 않다. 따라서 시간에 따라 공간 위치 속성이 변경되는 특성을 갖는 위치 기반 서비스의 대상에는 적절하지 않다. 이 논문에서는 시간 및 공간 속성을 가지는 이동 객체의 위치 데이타로부터 유용한 시간 패턴을 탐사하기 위한 새로운 데이타 마이닝 기법을 제안하였다. 평면 상에서 좌표로 표현되는 이동 객체의 위치 정보를 일반화하기 위하여 contains와 같은 공간 연산을 사용하였다. 또한 이동 패턴 탐사 시 실제 유효한 시퀀스를 만들기 위해 객체의 위치 사이에 시간 제약조건을 적용하였다. 이렇게 생성된 이동 객체 위치의 시퀀스로부터 빈발 이동 시퀀스를 구하여 시간 패턴을 생성하였다. 제안한 기법은 기존과는 다른 시, 공간적 접근을 취함으로써 시간과 공간 의미가 중요시되는 위치 기반 서비스에 적합한 새로운 유형의 지식을 제공할 수 있다.

큐보이드 전위트리를 이용한 빙산질의 처리 (Iceberg Query Evaluation Technical Using a Cuboid Prefix Tree)

  • 한상길;양우석;이원석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권3호
    • /
    • pp.226-234
    • /
    • 2009
  • 무한한 데이터 스트림을 저장하는 것은 거의 불가능하기 때문에 데이터 스트림 환경에서 빙산질의를 수행하기 위해서는 새로운 데이터 구조와 알고리즘이 요구된다. 본 논문에서는 데이터 스트림 환경에서 빙산질의를 처리하기 위해 전위트리 구조에 기반한 규보이드 전위트리(Euboid prefix tree)를 제안한다. 큐보이드 전위트리는 빙산질의에 사용된 그룹항목으로 이루어진 항목집합만을 트리에서 관리하므로 전위트리보다 적은 메모리를 사용한다. 1-항목 관리를 통해서 빈발하지 않은 항목을 트랜잭션에서 제거함으로써 갱신 시 불필요하게 소요되는 시간을 줄일 수 있다. 또한 다중 빙산질의에서 공통적으로 사용된 그룹속성에 따라 노드를 공유함으로써 적은 메모리를 사용하여 효율적으로 다중 빙산질의를 처리할 수 있는 방법을 제안한다. 큐보이드 전위트리는 무한히 연속적으로 생성되는 데이터에 대하여 빙산질의를 처리하는데 있어서 메모리 사용량과 처리시간을 효과적으로 줄이며, 이를 여러 실험을 통해 확인하였다.

확장된 구조적 워크플루우 스키마에서 워크플로우 임계 경로의 결정 (Finding the Workflow Critical Path in the Extended Structural Workflow Schema)

  • 손진현;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권2호
    • /
    • pp.138-147
    • /
    • 2002
  • 워크플로우에서 임계 경로의 개념은 워크플로우 자원 및 시간 관리 등과 같이 워크플로우의 여러 분야에서 유용하게 활용될 수 있다는 면에서 중요하다. 그럼에도 불구하고 지금까지 임계 경로에 대한 연구가 많이 이루어지지 않았다. 이는 워크플로우에서의 제어 흐름 구조는 기존의 전형적인 그래프 혹은 네트워크 보다 더 복잡한 구조를 가지고 있기 때문이다. 본 논문에서는 먼저 복잡한 업무 흐름을 워크플로우로 표현할 수 있도록 지원하는 다양한 워크플로우 제어 구성 자들을 정의한다. 그리고 이를 기반으로 정의된 구조적 워크플로우 스키마에서 임계 경로를 결정하는 방법을 제안한다.

이동 객체 데이터베이스에서 빈발 시퀀스 패턴 탐색 (Discovery of Frequent Sequence Pattern in Moving Object Databases)

  • ;이범주;류근호
    • 정보처리학회논문지D
    • /
    • 제15D권2호
    • /
    • pp.179-186
    • /
    • 2008
  • 위치 기반 장치의 발전과, GIS 기능의 확장 그리고 위치 정보기술들의 정확성과 가용성이 증가함에 따라서 위치 기반 서비스들의 새로운 영역에 대한 새로운 가능성이 나타나게 되었다. 데이터의 시간과 공간 형태에 따라서 정의되는 Relationship에 기인하여 시공간 데이터 마이닝 영역에서 공간에 대한 지식 검색이 증가할 경우 매우 큰 문제에 직면한다. 이 논문에서는 모바일 환경에서 시공간 패턴 마이닝을 위한 알고리즘들을 제안한다. 이동 패턴들은 All_MOP와 Max_MOP 두 개의 알고리즘을 활용하여 생성된다. 이 알고리즘들은 먼저 모든 빈발 패턴들을 탐사한 후 오직 최대의 빈발 패턴만을 탐사한다. 아울러, 제안한 기법과 기존의 DFS_MINE 기법의 수행 시간 비교를 통하여 제안한 기법이 수행시간에서 다소 우수한 것을 나타낸다. 이러한 제안접근법은 관광 서비스, 교통 서비스 등과 같은 위치 기반 서비스 등에 활용할 수 있다.