• 제목/요약/키워드: NCBI (National Center for Biotechnology Information)

검색결과 46건 처리시간 0.024초

Patome: Database of Patented Bio-sequences

  • Kim, SeonKyu;Lee, ByungWook
    • Genomics & Informatics
    • /
    • 제3권3호
    • /
    • pp.94-97
    • /
    • 2005
  • We have built a database server called Patome which contains the annotation information for patented bio-sequences from the Korean Intellectual Property Office (KIPO). The aims of the Patome are to annotate Korean patent bio-sequences and to provide information on patent relationship of public database entries. The patent sequences were annotated with Reference Sequence (RefSeq) or NCBI's nr database. The raw patent data and the annotated data were stored in the database. Annotation information can be used to determine whether a particular RefSeq ID or NCBI's nr ID is related to Korean patent. Patome infrastructure consists of three components­the database itself, a sequence data loader, and an online database query interface. The database can be queried using submission number, organism, title, applicant name, or accession number. Patome can be accessed at http://www.patome.net. The information will be updated every two months.

연체동물 전용 서열 블라스트 서버구축 (Construction of BLAST Server for Mollusks)

  • 이용석;조용훈;김대수;김대원;김민영;최상행;연제오;변인선;강보라;정계헌;박홍석
    • 한국패류학회지
    • /
    • 제20권2호
    • /
    • pp.165-169
    • /
    • 2004
  • 본 연구를 통해서 http://chimp.kribb.re kr/mollusks 에 연체동물 전용 서열 BLAST 데이터베이스가 구축되었다. 예비실험을 통해 본 결과와 마찬가지로 연체동물을 대상으로 한 유전자 정보만을 매우 빠른 속도로 얻을 수 있었다. 본 시스템을 사용하여 앞으로 많은 연구가 진행되어질 연체동물 유전자 연구 및 EST 연구에 많은 도움이 되리라고 사료된다.

  • PDF

Extended latex proteome analysis deciphers additional roles of the lettuce laticifer

  • Cho, Won-Kyong;Chen, Xiong-Yan;Rim, Yeong-Gil;Chu, Hyo-Sub;Jo, Yeon-Hwa;Kim, Su-Wha;Park, Zee-Yong;Kim, Jae-Yean
    • Plant Biotechnology Reports
    • /
    • 제4권4호
    • /
    • pp.311-319
    • /
    • 2010
  • Lettuce is an economically important leafy vegetable that accumulates a milk-like sap called latex in the laticifer. Previously, we conducted a large-scale lettuce latex proteomic analysis. However, the identified proteins were obtained only from lettuce ESTs and proteins deposited in NCBI databases. To extend the number of known latex proteins, we carried out an analysis identifying 302 additional proteins that were matched to the NCBI non-redundant protein database. Interestingly, the newly identified proteins were not recovered from lettuce EST and protein databases, indicating the usefulness of this hetero system in MudPIT analysis. Gene ontology studies revealed that the newly identified latex proteins are involved in many processes, including many metabolic pathways, binding functions, stress responses, developmental processes, protein metabolism, transport and signal transduction. Application of the non-redundant plant protein database led to the identification of an increased number of latex proteins. These newly identified latex proteins provide a rich source of information for laticifer research.

Computational analysis of SARS-CoV-2, SARS-CoV, and MERS-CoV genome using MEGA

  • Sohpal, Vipan Kumar
    • Genomics & Informatics
    • /
    • 제18권3호
    • /
    • pp.30.1-30.7
    • /
    • 2020
  • The novel coronavirus pandemic that has originated from China and spread throughout the world in three months. Genome of severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2) predecessor, severe acute respiratory syndrome coronavirus (SARS-CoV) and Middle East respiratory syndrome coronavirus (MERS-CoV) play an important role in understanding the concept of genetic variation. In this paper, the genomic data accessed from National Center for Biotechnology Information (NCBI) through Molecular Evolutionary Genetic Analysis (MEGA) for statistical analysis. Firstly, the Bayesian information criterion (BIC) and Akaike information criterion (AICc) are used to evaluate the best substitution pattern. Secondly, the maximum likelihood method used to estimate of transition/transversions (R) through Kimura-2, Tamura-3, Hasegawa-Kishino-Yano, and Tamura-Nei nucleotide substitutions model. Thirdly and finally nucleotide frequencies computed based on genomic data of NCBI. The results indicate that general times reversible model has the lowest BIC and AICc score 347,394 and 347,287, respectively. The transition/transversions bias for nucleotide substitutions models varies from 0.56 to 0.59 in MEGA output. The average nitrogenous bases frequency of U, C, A, and G are 31.74, 19.48, 28.04, and 20.74, respectively in percentages. Overall the genomic data analysis of SARS-CoV-2, SARS-CoV, and MERS-CoV highlights the close genetic relationship.

품질 정보와 퍼지 추론 기법을 이용한 DNA 염기 서열 배치 알고리즘 (A DNA Sequence Alignment Algorithm Using Quality Information and a Fuzzy Inference Method)

  • 김광백
    • 지능정보연구
    • /
    • 제13권2호
    • /
    • pp.55-68
    • /
    • 2007
  • 분자 생물학(computational molecular biology) 분야에서 DNA 염기 서열 배치 알고리즘은 다양한 방법으로 개선되어 왔다. 본 논문에서는 기존의 DNA 염기의 품질 정보(quality information)를 이용한 DNA 염기 서열 배치 방법을 개선하기 위하여 퍼지 논리 시스템(fuzzy logic system)과 DNA 염기 서열 단편의 특징을 적용한 품질 정보와 퍼지 추론 기법을 이용한 DNA 염기 서열 배치 알고리즘을 제안한다. 기존의 알고리즘은 Needleman-Wunsch가 제안한 전역 배치 알고리즘에 각 DNA 염기의 품질 정보를 적용하여 DNA 염기 서열 배치 점수를 계산하였다. 그러나 전체 DNA 염기의 품질 정보를 이용하여 계산하기 때문에 DNA 염기 말단 부분의 품질이 낮은 경우에는 DNA 염기 서열 배치 점수를 계산하는 과정에서 오차가 발생한다. 본 논문에서는 기존의 품질 정보를 이용한 알고리즘을 개선하여 DNA 염기 서열의 말단 부위의 품질이 낮은 경우에도 정확히 서열을 배치할 수 있도록 한다. 또한 DNA 염기 서열 단편의 길이와 낮은 품질의 DNA 염기 빈도를 퍼지 논리 시스템에 적용하여 DNA 염기 서열 배치 점수를 계산하는데 적용되는 매핑 점수 인자(parameter)를 동적으로 조정한다. 제안된 알고리즘의 성능 평가를 위해 NCBI(National Center for Biotechnology Information)의 실체 유전체 데이터를 받아 성능을 분석한 결과, 제안된 알고리즘이 기존의 품질 정보만을 이용한 알고리즘 보다 DNA 염기 서열 배치에 있어서 효율적임을 확인하였다.

  • PDF

생명정보 분야 웹사이트 서비스에 대한 비교.분석에 관한 연구 (A Comparative Analysis of Bioinformation Website Services)

  • 안부영;이응봉
    • 정보관리연구
    • /
    • 제40권1호
    • /
    • pp.157-181
    • /
    • 2009
  • 전 세계적으로 정보기술이 발달하고 인간유전체사업이 종료됨에 따라 대용량 생명과학과 정보기술이 접목된 생명정보학(Bioinformatics, 바이오인포매틱스)이 등장하여 지속적으로 발전하고 있다. 이러한 학문의 발전과 더불어 생명정보서비스를 위한 웹사이트가 구축되어 생명과학 연구자들에게 제공되고 있다. 전 세계의 수많은 생명정보서비스 웹사이트 중에서 연구자들이 가장 많이 활용하는 대표적인 웹사이트로는 우리나라의 포항공과대학교 생물학연구전문정보센터(BRIC), 한국과학기술정보연구원 바이오인포매틱스센터(CCBB), 한국생명공학연구원 국가생물자원정보관리센터(KOBIC), 미국의 국립생명공학정보센터(NCBI), 유럽의 생물정보학연구소(EBI), 일본의 DNA데이터은행(DDBJ) 등이 있다. 본 논문에서는 위의 6개 웹사이트의 콘텐트 현황 및 기능을 조사하여 비교.분석하였다. 또한 웹사이트를 이용하는 생명과학 연구자를 대상으로 이용현황 및 요구사항에 관하여 설문조사를 실시하였다.

KUGI: A Database and Search System for Korean Unigene and Pathway Information

  • Yang, Jin-Ok;Hahn, Yoon-Soo;Kim, Nam-Soon;Yu, Ung-Sik;Woo, Hyun-Goo;Chu, In-Sun;Kim, Yong-Sung;Yoo, Hyang-Sook;Kim, Sang-Soo
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2005년도 BIOINFO 2005
    • /
    • pp.407-411
    • /
    • 2005
  • KUGI (Korean UniGene Information) database contains the annotation information of the cDNA sequences obtained from the disease samples prevalent in Korean. A total of about 157,000 5'-EST high throughput sequences collected from cDNA libraries of stomach, liver, and some cancer tissues or established cell lines from Korean patients were clustered to about 35,000 contigs. From each cluster a representative clone having the longest high quality sequence or the start codon was selected. We stored the sequences of the representative clones and the clustered contigs in the KUGI database together with their information analyzed by running Blast against RefSeq, human mRNA, and UniGene databases from NCBI. We provide a web-based search engine fur the KUGI database using two types of user interfaces: attribute-based search and similarity search of the sequences. For attribute-based search, we use DBMS technology while we use BLAST that supports various similarity search options. The search system allows not only multiple queries, but also various query types. The results are as follows: 1) information of clones and libraries, 2) accession keys, location on genome, gene ontology, and pathways to public databases, 3) links to external programs, and 4) sequence information of contig and 5'-end of clones. We believe that the KUGI database and search system may provide very useful information that can be used in the study for elucidating the causes of the disease that are prevalent in Korean.

  • PDF