• 제목/요약/키워드: 유전자 데이터베이스

검색결과 182건 처리시간 0.024초

생물정보시스템을 이용한 Local Animal BLAST Search System 구축 (Development of Local Animal BLAST Search System Using Bioinformatics Tools)

  • 김병우;이근우;김효선;노승희;이윤호;김시동;전진태;이지웅;조용민;정일정;이정규
    • Bioinformatics and Biosystems
    • /
    • 제1권2호
    • /
    • pp.99-102
    • /
    • 2006
  • BLAST(Basic Local Alignment Search Tool)는 서열 데이터베이스 탐색을 위하여 가장 많이 사용되는 프로그램이다. 전체 서열간의 최적 글로벌 정렬을 수행하는 대신에 지역적 유사성이 있는 부분을 찾아 서열 짝짓기를 수행하는 특징을 갖는다. 일반적인 연구자들은 서열 상동성 검색을 위해 NCBI에 접속하여 웹 브라우저를 통해 온라인으로 BLAST를 수행하게 되는데, 이 경우 사용자 각각의 네트워크 환경이나 입력할 데이터양에 따른 검색속도의 지연 및 제한 등과 같은 여러 문제에 부딪히게 되고, 또한 보안유지가 필요한 서열 데이터의 유출 가능성이 존재한다. 그러므로 대량의 서열 데이터에 대하여 빠르고 안전하게 BLAST 상동성 검색이 가능한 Local BLAST 검색 시스템의 필요성이 증대되고 있다. 본 연구에서는 NCBI의 Genbank에서 공개된 동물의 발현 유전자 단편들(ESTs)에 대한 데이터를 이용하여 소, 돼지, 닭, 등의 경제형질과 연관된 유용 유전자만을 추출하여 이들만으로 구성된 새로운 데이터베이스를 구축하였고, 또한 이들을 사용할 수 있는 새로운 검색시스템을 개발하였다 자체 제작한 Perl script를 사용하여 필요한 데이터를 축종별로 추출 하여 새로운 DB를 구축하였으며 이 속에는 소의 경우 650,046개, 돼지의 경우 368,120개, 닭의 경우 693,005개의 발현 유전자 단편들(ESTs)이 포함된다. 또한 이들 DB 분석이 가능한 Local Animal BLAST Web 검색시스템(http://bioinfo.kohost.net)을 고성능 병렬 PC Cluster 시스템과 연동하도록 자체 구축함으로써 본 시스템이 보다 효율적인 생물정보학 연구수행이 기여할 것으로 기대된다.

  • PDF

하이브리드 균형 표본 유전 알고리즘과 극한 기계학습에 기반한 암 아류형 분류기 (Cancer subtype's classifier based on Hybrid Samples Balanced Genetic Algorithm and Extreme Learning Machine)

  • ;;최용수
    • 디지털콘텐츠학회 논문지
    • /
    • 제17권6호
    • /
    • pp.565-579
    • /
    • 2016
  • 본 논문에서는 극한 기계학습을 이용하는 하이브리드 균형 표본 유전자 알고리즘(hSBGA-ELM)을 기반으로 한 새로운 암 아류형 분류자를 제안하였다. 제안 된 암 아류형 분류자는 정확한 암 아류형 분류기 설계를 위해 공개 전체암지도 (Global Cancer Map)로부터 15063개의 유전자 발현 데이터를 사용합니다. 제안된 방법에서는 14가지(유방암, 전립선 암, 폐암, 대장 암, 림프종, 방광, 흑색 종, 자궁, 백혈병, 신장, 췌장, 난소, 중피종 및 CNS)의 암 아류형을 효율적으로 분류합니다. 제안 된 hSBGA-ELM은 유전자 선택 절차 및 암 아류형 분류를 하나의 프레임 워크로 단일화 한다. 제안 된 하이브리드 균형 표본 유전 알고리즘은 GCM 데이터베이스에서 이용 가능한 16,063 개의 유전자로부터 암 아류형 분류를 담당하는 축소된 강인 유전자 셋을 찾는다. 선택/축소된 유전자 세트는 익스트림 기계학습을 이용하여 암 아류형 분류기를 구성하는데 사용된다. 결과적으로, 크기가 축소된 강인 유전자 집합이 제안하는 암 아류형 분류기의 안정된 일반화 성능을 보장하게 한다. 제안 된 hSBGA-ELM은 암에 관여하는 것으로 예측되는 95개의 유전자를 발견하였으며 기존의 암 아류형 분류기와의 비교를 통해 제안 된 방법의 효율을 보여준다.

유전자 알고리즘을 이용한 최적의 분산 데이터베이스 시스템 설계 (The Optimal Distributed Database System Design Using the Genetic Algorithm)

  • 고석범;윤성대
    • 한국정보처리학회논문지
    • /
    • 제7권9호
    • /
    • pp.2797-2806
    • /
    • 2000
  • 최근에 정보네트워크 사용자의 급증에 따라 DDS(Distributed Database System)는 VAN(Value Added Network)상에서 구현되었다. DDS는 지역적으로 분산된 작업환경에서 중앙집중식 데이터베이스 구축보다 여러 측면에서 장점이 있으나 불합리한 설계는 컴퓨터 및 네트워크 자원의 비효율적 사용에 의한 비용의 증가와 데이터 유지를 위한 복잡도의 증가를 야기한다. DDS 설계시 각 사이트에서 적절한 컴퓨터를 선택하는 문제와 단편화된 데이터를 적절한 사이트에 할당하는 문제가 중요하다. VAN 상에서 컴퓨터 선택과 데이터 파일의 할당은 응답대기시간(waited response time)과 투자비용(investment cost)의 상관관계를 반드시 고려하여 결정되어야 하므로, 본 논문에서는 각 컴퓨터와 파일의 할당의 영향에 따라 두 목적함수의 상관관계를 고려한다. 특히, 응답대기 시간에 대한 보다 실제적인 평가를 위해 M/M/1 큐잉 시스템을 기초로 하여 설계한다. 제안된 설계모델은 경험적 탐색법 중의 하나인 유전자 알고리즘(Genetic Algorithm)의 적용을 통해 효율적인 해의 탐색을 시도하고 제안된 수학적 모델과 알고리즘의 성능 검토를 위해 모의실험 및 결과분석을 한다.

  • PDF

Testis-specific transcripts in the chicken

  • Kim, Duk-Kyung
    • 한국가금학회:학술대회논문집
    • /
    • 한국가금학회 2005년도 제22차 정기총회 및 학술발표회
    • /
    • pp.53-59
    • /
    • 2005
  • 본 연구에서는 닭의 정소 및 정자에 대한 기능 유전체 연구를 위한 자원을 확보할 수 있도록 정소 특이적유전자로 예상되는 후보 염기서열을 분석하였다. TIGR Gallus gallus Gene Index 상의 데이터베이스에서 닭의 정소에서만 나타나는 것으로 공개된 EST 염기서열을 검색하여 나온 총 292개의 서열을 선택하였으며, 이와 같이 선별된 서열들에 대하여 닭의 정소와 난소를 포함한 다양한 조직에서 전사체의 발현을 검증하였다. 결과에서, 총 292개의 염기서열 중 110개가 정소 특이적인 발현을 나타내었다. Tentative consensus sequence (TC) 상에서 집합된 EST의 수와 정소 특이적으로 발현하는 TCs의 수 사이의 상관관계는 발견되지 않았다. Gene Ontology 데이터베이스 용어를 이용하여 분류한 결과에서는 정소특이적인 TC는 닭의 전체 TC를 분류한 것과 비교하면 catalytic activity (Molecular Functionbranch)의 카테고리에 많은 수의 TC가 포함된 것으로 나타났다. 본 연구의 결과는 닭의 정소 특이적 유전자에 대한 연구와 그 기능 분석을 보다 더욱 촉진시킬 수 있을 것이다.

  • PDF

유전자 알고리즘이 적용된 USRP 2를 이용한 인지무선 시스템 구현 (Implementation of Cognitive Radio System with Genetic Algorithm Using USRP 2)

  • 용슬바로;장성진;이인선;김재명
    • 한국위성정보통신학회논문지
    • /
    • 제7권1호
    • /
    • pp.39-47
    • /
    • 2012
  • 현재의 주파수 분배상황을 살펴보면 대부분의 주파수 대역이 고정 할당되어 있으며 특히 무선통신 환경에 가장 적합한 저주파 대역은 거의 사용할 여지가 없다. 이에 인지무선 기술은 무선통신환경에서 주파수 부족 문제를 해결하고 주파수 활용도를 높이기 위한 중요한 기술로 대두되고 있다. 본 논문에서는 SDR (Software Define Radio)플랫폼인 USRP (Universal Software Radio Peripheral) 보드와 SDR 개발 툴킷인 GNU Radio를 이용하여 실제 인지무선(Cognitive Radio : CR) 시스템에서 데이터를 송, 수신하였다. 구체적으로 스펙트럼 센싱 기술을 이용하여 면허 사용자의 주파수 사용 여부를 감지하여 이 정보를 데이터베이스로 넘겨준다. 정보를 넘겨받은 데이터베이스에서는 유전자 알고리즘을 이용하여 최적의 송신전력과 대역폭, 채널 정보를 인지무선 기기에 보내어 주어 인지무선 기기가 면허 사용자에게 아무런 간섭을 주지 않고 데이터 통신을 할 수 있도록 하였다.

miRNA, PPI, 질병 정보를 이용한 마이크로어레이 데이터 통합 모델 설계 (Integrated Model Design of Microarray Data Using miRNA, PPI, Disease Information)

  • 하경식;임진묵;김홍기
    • 한국지능시스템학회논문지
    • /
    • 제22권6호
    • /
    • pp.786-792
    • /
    • 2012
  • 마이크로어레이는 수만 가지 이상의 DNA 또는 RNA를 기판위에 배열해 놓은 것이며 이 기술을 이용하여 대량의 유전자 발현을 탐색할 수 있게 되었다. 그렇지만 마이크로어레이는 실험자가 탐색하려는 특정 표현형에 대해서 설계된 실험방법을 이용하므로 제한된 숫자의 유전자 발현만을 관찰할 수 있다. 본 논문에서는 MicroRNAs(miRNAs)와 Protein-Protein Interaction(PPI) 정보를 포함하고 있는 데이터베이스를 활용하여 마이크로어레이 데이터의 의미적 확장 방법을 제시하고자 한다. 또한 Online Mendelian Inheritance in Man(OMIM) 및 International Statistical Classification of Diseases and Related Health Problems, $10^{th}$ Revision(ICD-10)을 이용하여 질병 간 유전적 공통점 파악을 시도하였다. 이러한 접근방법을 통하여 새로운 생물학적 시각을 제공할 수 있을 것으로 기대된다.

한국인 비증후군성 구순구개열 환자의 OFC1 유전자의 서열 분석 (Sequencing analysis of the OFC1 gene on the nonsyndromic cleft lip and palate patient in Korean)

  • 김성식;손우성
    • 대한치과교정학회지
    • /
    • 제33권3호
    • /
    • pp.185-197
    • /
    • 2003
  • 비증후군성 구순구개열을 발생시키는 주요유전자로 추측이 되는 OFC1 유전자(위치 염색체 6p24.3)의 한국인에서 나타나는 특성을 연구하였다. 3대에 걸쳐서 처음으로 비증후군성 구순구개열이 나타난 40 명의 환자(남자 20명, 여자 20명, 평균 나이 : 14.2세)와 3대에 걸쳐서 비증후군성 구순구개열을 포함한 어떤 선천성 기형도 나타나지 않았던 정상 성인 40명 (남자 20명, 여자 20명, 평균 나이 : 25.6세)을 연구 대상으로 하였다. 중합효소 연쇄 반응법을 이용하여 OFC1 유전자를 분리 증폭한 후, 염기 서열 분석을 통해서 대립유전자형을 밝히고, BLAST 와 Pedant-Pro 데이터베이스를 이용하여 단백질의 상동성 검색을 수행하였으며, 그 결과는 다음과 같다. 1. OFC1 유전자는 'CA' 연쇄반복서열을 가진 극소위성 표지자로 밝혀졌다. 2. 환자군과 대조군의 OFC1 유전자의 특별한 차이는 발견되지 않았다. 3. 한국인에서 나타난 'CA' 연쇄반복서열의 형태는 'ABI linkage map 2'의 TA(CA)11TA(CA)10과는 달리, TA(CA)n의 형태를 띄었으며, 연쇄반복의 수는 17회에서 26회로 다양하게 나타났다. 4. 'CA' 연쇄반복서열의 횟수에 따라서, 9가지의 대립유전자형이 발견되었으며, 나타나는 빈도는 환자군과 대조군에서 유사하였다. 5. 'ABI linkage map 2'의 'CA' 연쇄반복서열 사이의 염기서열 T가 한국인에서는 C로 치환되어 있었지만, ORF예측을 하였을 때 예상되는 아미노산의 배열 차이는 관찰되지 않았다. 6. 한국인 OFC1 유전자의 염기서열로 예측되는 단백질을 알아보기 위하여 BLAST 검색을 한 결과, Telomerase reverse transcriptase(TERT, locus 5p15.33, NCBI Genome Annotation ; NT023089)와 Nucleotide binding protein 2(NBP2, locus 17q22, NCBI Genome Annotation; NT010783)가 유사한 구조를 가지는 단백질로 밝혀졌다. 7. Pedant-Pro 데이터베이스로 단백질 구조의 상동성 검색을 한 결과, OFC1 유전자는 적어도 하나의 transmembrane region과 non-gloular region을 가지는 구조로 밝혀졌다.

마이크로어레이를 이용한 애기장대 AtERF71/HRE2 전사인자의 하위 유전자 분석 (Analysis of Putative Downstream Genes of Arabidopsis AtERF71/HRE2 Transcription Factor using a Microarray)

  • 석혜연;이선영;우동혁;박희연;문용환
    • 생명과학회지
    • /
    • 제22권10호
    • /
    • pp.1359-1370
    • /
    • 2012
  • 애기장대에서 AtERF71/HRE2는 핵에서 전사인자로 작용하여 하위 유전자의 발현을 증가시키는 역할을 수행함으로써 저산소와 삼투 스트레스 반응에 관여할 것으로 여겨지는 유전자이다. 본 연구에서는 AtERF71/HRE2에 의해 직, 간접적으로 발현이 조절되는 하위 유전자를 알아보기 위해 AtERF71/HRE2 과발현체를 대상으로 마이크로어레이 실험을 수행하였다. 야생형에 비해 AtERF71/HRE2 과발현체에서 발현이 2배 이상 증가한 기능이 알려진 유전자는 AtERF71/HRE2 자신을 제외하고 161개였다. 161개 유전자 중 전사인자와 DNA-결합 단백질 등과 같은 전사조절자가 24개로 확인되어, AtERF71/HRE2는 하위 전사조절 유전자의 발현 조절을 통해 더 많은 유전자의 발현을 조절하는 상위 전사인자로서의 기능을 가질 것으로 추정되었다. 161개 유전자 중 15개 유전자를 대상으로 RT-PCR을 수행하여 마이크로어레이 결과의 신뢰성을 검증하였다. Genevestigator 데이터베이스 분석 결과, 161개 유전자 중 51개 유전자는 저산소 및 삼투 스트레스에 의해 발현이 증가하는 것으로 확인되었다. RT-PCR 분석 결과 AtERF71/HRE2 과발현체에서 발현이 증가한 15개 유전자 중 3개 유전자가 저산소에 의해 발현이 증가하였고, 다른 3개 유전자가 삼투 스트레스에 의해 발현이 증가하였으며, 이러한 결과는 이들 유전자가 AtERF71/HRE2에 의해 매개되는 저산소 또는 고염 스트레스 신호전달의 하위 유전자일 수 있음을 의미한다. 또한 본 연구의 마이크로어레이 분석 결과는 AtERF71/HRE2가 저산소 및 삼투 스트레스 반응뿐만 아니라 다른 환경 스트레스 반응과 식물 발달 조절에도 관여할 수 있음을 시사한다.

픽프라이머 : 유전자 목표 구간 탐색 모듈을 포함한 프라이머 제작 그래픽 프로그램 (Pickprimer: A Graphic User Interface Program for Primer Design on the Gene Target Region)

  • 정희;문정환;이성찬;유희주
    • 원예과학기술지
    • /
    • 제29권5호
    • /
    • pp.461-466
    • /
    • 2011
  • 유전 육종 연구를 위해 연구자들은 실험 목적에 따라 다양한 종류의 프라이머를 제작해야 한다. 인터넷 상에서 다양한 공용 프로그램이 이용되고 있으나 많은 경우 사용자 편의성이 낮기 때문에 유전자의 구조를 고려하여 프라이머를 디자인하기 위해서는 시간과 노력이 소요된다. 본 연구에서는 엑손과 인트론 지역을 시각적으로 구별하면서 손쉽게 프라이머를 제작할 수 있는 프로그램인 Pickprimer를 개발하였다. 이 프로그램은 공용 프로그램인 Spidey와 Primer3 프로그램의 소스 코드를 결합한 후 그래픽 인터페이스를 추가하여 사용자가 유전자의 구조를 예측하고 이를 바탕으로 프라이머를 손쉽게 제작할 수 있게 했다. 입력 정보는 공용 데이터베이스에서 내려 받은 서열을 복사-붙임하여 이용할 수 있게 하였으며, 유전자의 구조를 그림으로 표현하고 동시에 엑손과 인트론 서열을 구별할 수 있게 했다. 이 프로그램을 이용하여 배추의 단일 카피 유전자에 대한 24 쌍의 프라이머를 디자인하고 6개 고정 품종을 대상으로 PCR과 전기영동 실험을 수행한 결과 제작한 모든 프라이머 쌍이 명확한 단일 밴드를 성공적으로 증폭시켰다. 이 프로그램은 분자표지의 개발뿐만 아니라 유전자 기능 연구 등 다양한 종류의 유전 육종 실험에 유용하게 이용될 수 있을 것으로 기대된다.

한우 cDNA 라이브러리에서 발현된 ESTs의 기능분석 (Functional Analysis of Expressed Sequence Tags from Hanwoo (Korean Cattle) cDNA Libraries)

  • 임다정;변미정;조용민;윤두학;이승환;신윤희;임석기
    • Journal of Animal Science and Technology
    • /
    • 제51권1호
    • /
    • pp.1-8
    • /
    • 2009
  • 본 연구는 한우의 지방, 간, 등심조직에서 유전자 염기서열을 확보하여 생산된 57,598개의 유전자 발현단편 데이터의 기능규명을 실시하였다. 유전자 발현단편 서열은 Assembly 과정을 통하여 unique한 서열인 4,759 contigs와 7,587 singletons을 확보하였으며, 얻어진 전사체를 이용하여 NCBI의 non-redundant 단백질 데이터베이스에 대하여 서열유사성 검색 (BLAST)을 하여 유전자의 기능을 예측할 수 있었다. 또한 기능에 대한 모호성을 확실히 하기 위해 Gene Ontology 용어를 사용하여 한우의 세 조직에서 확보된 서열들의 생물학적 특성을 기술하였다. Gene Ontology 는 모든 기능이 계층적으로 표현되어 있기 때문에, 각 계층에 대하여 유의적인 기능 여부를 확인하기 위하여 통계 분석인 Pearson's chi-square test를 실시하여 통계적으로 유의한 기능들을 산출할 수 있었다. 그 결과, Molecular function, Biological process, Cellular component 각각의 GO category에서 13, 16, 8개의 유의적인 GO terms이 검출되었다. 또한, 한우의 세 조직에 대하여 조직특이적 유전자의 존재여부를 판단하기 위하여 Audic's test를 실시하여 세 조직에서 각각 조직특이적으로 발현되는 유전자들을 검출할 수 있었다. 이러한 생물정보학적 방법들을 사용하여 한우의 세 조직에서 발현된 대량의 서열들에 대한 기능을 예측할 수 있었으며, 통계 검증을 통하여 유의적으로 검출된 유전자들은 추후에 실험적 검증을 실시하여 충분한 정보를 확보할 수 있을 것으로 사료된다.