• 제목/요약/키워드: 서열

검색결과 3,677건 처리시간 0.031초

PC-Cluster 기반 병렬형 유전자 서열 검색 시스템의 개발 및 성능 평가 (Development and Performance Evaluation of Parallel Sequence Analysis System on PC-Cluster)

  • 신용원;박정선
    • 대한의용생체공학회:의공학회지
    • /
    • 제25권6호
    • /
    • pp.617-621
    • /
    • 2004
  • 최근 들어 유전자 서열의 생산량 증가에 비례하여 유전자 발현 마이크로 칩과 같은 새로운 분석방법과 기술들이 도입되면서 연구자들이 매일 수천개의 서열을 효율적으로 분석해야 할 필요성이 증대되고 있다. 이러한 생명공학분야의 급속한 발전은 대용량 유전자 서열에 대한 빠른 분석이 가능한 컴퓨팅 자원을 요구하고 있으나 IT 인프라에 대한 막대한 투자비용으로 인해 관련 연구기관에서 쉽게 이들 컴퓨팅 자원을 도입하지 못하고 있는 실정이다. 본 연구에서는 저가의 PC서버를 고속의 네트워크로 연결한 PC 클러스터를 활용하여 시스템의 안정성과 신뢰성을 보장함과 동시에 범용성을 지닌 병렬형 유전자 서열 검색 시스템을 구축하였다. 이러한 효율적인 시스템 구축을 통해 생물정보 데이터베이스 및 서열 검색 시스템을 제공하고, 대용량 서열 데이터베이스의 검색 시간을 단축하였다.

근사 알고리즘을 이용한 순차패턴 탐색 (Searching Sequential Patterns by Approximation Algorithm)

  • 산사볼트가람라흐차;황영섭
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권5호
    • /
    • pp.29-36
    • /
    • 2009
  • 서열데이터베이스에 있는 자주 발현하는 부분 서열을 패턴으로 찾아내는 순차패턴 탐색은 넓은 응용 분야를 가지는 중요한 데이터 마이닝 문제이다. DNA 서열에서 순차패턴이 모티프가 될 수 있으므로 DNA 서열에서 순차패턴을 찾는 것을 연구하였다. 대부분의 기존 마이닝 방법은 순차패턴의 정의에 따라 정확한 정합에 주력하여 노이즈가 있는 환경이나 실제 문제에서 발생하는 부정확한 데이터에 대하여 제대로 작동하지 않을 수 있다. 이러한 문제가 생물 데이터인 DNA 서열에서 자주 나타난다. 이러한 문제를 다루기 위한 근사 정합 방법을 연구하였다. 본 연구의 아이디어는 자주 발생하는 패턴을 근사 패턴이라 부르는 그룹으로 분류할 수 있다는 관찰에서 기반을 둔다. 기존의 Prefixspan 알고리즘은 주어진 긴 서열에서 순차패턴을 잘 찾을 수 있다. 본 연구는 Prefixspan 알고리즘을 개선하여 유사한 순차패턴을 찾을 수 있게 하였다. 실험 결과는 PreFixSpan보다 제안한 방법이 패턴 길이가 4일 때, 근사 순차패턴의 빈도가 5배 높아짐을 보였다.

고래회충 연구를 위한 웹기반 데이터베이스 구축 (Construction of Web-Based Database for Anisakis Research)

  • 이용석;백문기;조용훈;강세원;이재봉;한연수;차희재;유학선;옥미선
    • 생명과학회지
    • /
    • 제20권3호
    • /
    • pp.411-415
    • /
    • 2010
  • 본 연구에서는 Anisakis 연구를 위하여 웹을 기반으로 하는 데이터베이스를 리녹스 Cent OS 시스템이 설치된 Xeon 3.2 GHz cpu의 인텔 서버플랫폼 ZSS130 (삼성) 서버에 구축하였다. 운영체제를 설치한 후에 common gate interface(cgi) 기반의 웹서버 (http://www.anisakis.org)를 구축하고 NCBI에서 제공하는 WebBLAST 프로그램을 설치하였다. Anisakis 연구를 위한 웹기반 데이터베이스를 다음과 같은 순서로 구축하였다. 우선 회충목에 속하는 각종 서열(염기서열/ 아미노산서열, EST 서열, 미토콘드리아 Genome 서열)들을 멀티파스타 형식으로 다운로드 하였다. 다음으로NCBI에서 제공하는 formatdb 프로그램을 통하여 BLAST 검색이 가능하도록 데이터베이스화 하였으며 모든 염기서열들과 EST 서열들을 TGICL 프로그램을 통하여 clustering 및 assembing을 하였다. 그리고 NLS (Nuclear Localization Signal) 예측을 위해 EST 서열들은 Genscan 프로그램과 Emboss sixpack 프로그램을 사용하여 아미노산으로 변환하였다. 또한 벡터 서열과 E. coli 서열, 그리고 반복 서열들을 서버에 구축하여 서열들의 오염을 확인할 수 있게 하였다. 본 웹데이터베이스 서버의 구축을 통해 고래회충 및 회충목의 염기서열과 일치하는 서열을 자체 BLAST를 통해 매우 빠른 속도로 추출 할 수 있었으며, cDNA나 genomic DNA 라이브러리를 구축할 때 라이브러리의 상태를 쉽게 확인 할 수 있게 되었다. 또한 Clustering Res. 인터페이스를 통해 SNPs 연구 수행 시 매우 쉽게 실험용 시발체를 제작할 수 있으며 기 구축된 cDNA library의 활용을 annotated EST를 통해 극대화 시킬 수 있어 고래회충 관련 분자생물학적 연구에 도움이 될 것으로 기대된다.

인삼 모상근 프로테옴 데이터 분석 : 인삼 EST database와의 통합 분석에 의한 단백질 동정 (Proteome Data Analysis of Hairy Root of Panax ginseng : Use of Expressed Sequence Tag Data of Ginseng for the Protein Identification)

  • 권경훈;김승일;김경욱;김은아;조건;김진영;김영환;양덕춘;허철구;유종신;박영목
    • Journal of Plant Biotechnology
    • /
    • 제29권3호
    • /
    • pp.161-170
    • /
    • 2002
  • 인삼 모상근의 프로테옴 분석에 의해 얻은 질량분석 스펙트럼 데이터는 MALDI/TOF/MS에서 얻는 질량 스펙트럼과 ESI/Q-TOF/MS에서 얻는 탄뎀 질량 스펙트럼으로 구분된다. 질량 스펙트럼은 단백질이 효소에 의해 분해된 펩타이드들의 분자량 정보를 제공하며, 탄뎀 질량 스펙트럼에서는 아미노산 단위로 분해된 절편 단백질의 분자량으로부터 아미노산 서열을 결과로 얻는다. 펩타이드의 아미노산 서열을 BLAST로 검색하면 유사한 단백질을 GenBank에서 검색할 수 있다. 이러한 단백질 동정 방법은 완전한 유전체 서열이 알려진 생물체의 경우 높은 정확도로 단백질을 동정할 수 있으나, 그렇지 않은 경우는 유사한 단백질이 데이터베이스에 존재하지 않아 분석이 용이하지 않다. 본 연구에서는 질량 스펙트럼 및 절편 단백질의 아미노산 서열을 EST (expressed sequence tag) 서열과 비교하여 프로테옴 데이터와 일치하는 EST 서열을 찾아내고 이를 BLAST검색에 의해 단백질 동정에 활용하였다. ESI/Q-TOF/MS 에서 얻은 아미노산 서열은 길이는 짧지만 데이터의 신뢰도가 높으므로 EST 서열과의 연관 관계를 밝힘으로써 단백질에 대한 정보를 보완할 수 있었다. ESI/Q-TOF/MS에서 얻은 펩타이드의 아미노산 서열을 EST 서열과 비교한 결과 90%의 아미노산 서열이 EST DB에서 발견되었다. NCBI의 nr 데이터베이스에서 아미노산 서열을 검색하여 찾은 단백질이 68%임에 비하여, 인삼 EST 서열에 의한 검색이 22% 더 많은 결과를 얻었다. MALDI/TOF/MS의 질량 스펙트럼에서 nr 데이터베이스로 검색한 결과와 인삼 EST 데이터베이스를 검색한 결과가 일치하는 경우는 47개 중 9개인 19%에 불과하여, 탄뎀 질량 분석으로 아미노산 서열을 얻지 않고, 단지 질량 스펙트럼으로부터 단백질을 동정하는 방법으로는 단백질 동정의 정확한 결과를 기대하기 어려움을 확인하였다.

3종의 페루산 entomopathogenic fungi의 전자현미경적 구조와 ITS1, 5.8S ribosomal RNA gene, ITS2의 염기서열 다양성 (Comparison of scanning electron microscopic structures and nucleotide sequences variation of ITS1, 5.8S ribosomal RNA gene and ITS2 region in three Peruvian entomopathogenic fungal isolates)

  • 한상훈;남성희;이희삼;여주홍
    • 한국잠사곤충학회지
    • /
    • 제51권2호
    • /
    • pp.137-141
    • /
    • 2013
  • ITS 1, 2, 5.8S ribosomal RNA gene 염기서열 분석과 주사전자현미경 구조 분석을 통해 3종의 페루산 곤충병원성진균들의 동정을 수행하고자 하였다. 이를 위해 두개의 ITS 부위와 5.8S rRNA gene 부위를 포함하는 PCR product를 증폭하여 염기서열 분석을 수행하였으며 분석된 염기서열을 이용하여 NCBI의 BLAST를 이용하여 가장 높은 상동성을 보이는 종들의 ITS1-5.8S-ITS2 염기서열 정보와 비교분석을 위한 근연종들의 염기서열 정보를 다운로드하여 neighbor joining 분석을 수행하였다. 이를 통해 5.8S rRNA 유전자 염기서열은 속 수준에서도 거의 차이를 보여주지 않을 정도로 매우 안정적으로 보존되어 있음을 확인할 수 있었으며 종간 구분이 모호한 결과를 보여주었다. 그와 반대로 ITS 부위의 염기서열은 종에 매우 특이적임을 확인할 수 있었으며, 비교분석에 사용된 Beauveria bassiana strain 간의 차이는 확인할 수 없었다. ITS 염기서열 분석결과를 뒷받침하고자 곤충병원성 진균류의 동정을 위한 분류 key로 사용되는 미세구조 관찰을 위해 주사전자현미경 관찰과 광학현미경 관찰을 통해 B. bassiana 및 Lecanicillium attenuatum의 전형적 구조를 관찰할 수 있었다.

한국에서의 고초균 유전체 연구: Bacillus subtilis 염색체상 180$^{\circ}$-185$^{\circ}$-부위 53 kb DNA 단편의 염기서열 분석 (The Bacillus subtilis Genome Sequencing Project in Korea: Sequence Analysis of the 53 kb DNA Fragment at 180$^{\circ}$-185$^{\circ}$- of B. subtilis 168 Chromosome)

  • 김사열;최수근;정영미;신병식;박승환
    • 한국미생물·생명공학회지
    • /
    • 제26권1호
    • /
    • pp.23-33
    • /
    • 1998
  • 고초균 유전체 전체 염기서열을 밝히는 연구가 1997년 5월에 종료되어 전체 4,214,810bp의 염기서열이 SubtiList 데이터베이스에 공식적으로 입력되었다. 과제의 진행은 약 8년 동안 국제적인 협력에 의하여 이루어져 왔으며, 유럽의 25개 연구팀, 일본의 7개 연구팀, 두 개의 회사 연구팀 그리고 한국의 본 연구팀이 참여했다. 고초균 유전체 염기서열 해독을 위한 국제협력과제의 일환으로 본 연구팀은 odhA 유전자(181 $^{\circ}$) 상류지역 53, 289bp 부위의 염기서열을 해독하였다. 할당된 부위의 양 끝 부분에 위치한 sspC와 odhA 유전자의 알려진 염기 서열을 시점으로하여, plasmid rescue와 long-range PCR 방법을 써서 염색체 DNA 단편을 획득하였다. 본 연구팀이 염기서열을 밝힌 염색체 DNA 부위에는 이미 보고된 9개 유전자(sspC, cge cluster, orfE5, orfRMl 및 odhA)를 포함하여 모두 65개의 ORF가 들어 있음이 밝혀졌다. 이 부위에서 얻은 흥미로운 결과 중 하나는 인트론으로 여겨지는 한 ORF의 발견인데 세균의 염색체 상에서 인트론이 발견된 예는 흔치 않다. DNA복제 종결 단백질의 결합이 예상되는 염기서열이 세 곳에서 새로이 발견되었는데 이 역시 흥미로운 결과이다. 한편 이 부위 전체의 염기서열 해독을 통하여 기존의 유전자 지도상에 실제와는 매우 다르게 표시되어 온 여러 유전자들의 위치를 바로잡을 수 있었다.

  • PDF

$\varepsilon$-다중목적함수 진화 알고리즘을 이용한 DNA 서열 디자인 (DNA Sequence Design using $\varepsilon$ -Multiobjective Evolutionary Algorithm)

  • 신수용;이인희;장병탁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권12호
    • /
    • pp.1217-1228
    • /
    • 2005
  • 최근 들어 DNA 컴퓨팅이 활발하게 연구되면서, DNA 컴퓨팅에서 가장 기본적이고도 중요한 DNA 서열 디자인 문제가 부각되고 있다. 기존의 연구에서 DNA 서열 디자인 문제를 다중목적 최적화 문제로 정의하고, elitist non-dominated sorting genetic algorithm(NSGA-II)를 이용하여 성공적으로 DNA 서열을 디자인하였다. 그런데, NSGA-II는 계산속도가 느리다는 단점이 있어서, 이를 극복하기 위해 본 논문에서는 $\varepsilon$-다중목적함수 진화알고리즘(r-Multiobjective evolutionary algorithm, $\varepsilon$-MOEA)을 DNA 서열 디자인에 이용하였다. 우선, 두 알고리즘의 성능을 보다 자세히 비교하기 위해서 DTLZ2 벤치 마크 문제에 대해서 적용한 결과, 목적함수의 개수가 작은 경우에는 큰 차이가 없으나, 목적함수의 개수가 많을 경우에는 $\varepsilon$-MOEA가 NSGA-II에 대해서 최적해를 찾는 정도(Convergence)와 다양한 해를 찾는 정도 (diversity)에 있어서 각각 $70\%,\;73\%$ 향상된 성능을 보여주었고, 또한 최적해를 찾는 속도도 비약적으로 개선되었다. 이러한 결과를 바탕으로 기존의 DNA 서열 디자인 방법론으로 디자인된 DNA 서열들과 7-순환외판원 문제 해결에 필요한 DNA 서열을 NSGA-II와 $\varepsilon$-MOEA로 재디자인하였다. 대부분의 경우 $\varepsilon$-MOEA가 우수한 결과를 보였고, 특히 7-순환외판원 문제에 대해서 NSGA-II와 비교하여 convergence와 diversity의 측면에서 유사한 결과를 2배 이상 빨리 발견하였고, 동일한 계산 시간을 이용해서는 $22\%$ 정도 보다 다양하게 해를 발견하였으며, $92\%$ 우수한 최적해를 발견하는 것을 확인하였다.

미토콘드리아 COI 유전자 서열의 다형성과 반수체형에 근거한 한국산 붉바리(Epinephelus akaara)의 유전적 구조와 계통 유연관계 (Genetic Structure and Phylogenetic Relationship of Red Spotted Grouper (Epinephelus akaara) Based on the Haplotypes and Polymorphisms of Mitochondrial COI Gene Sequences)

  • 한상현;이영돈;백혜자;오홍식;노충환
    • 생명과학회지
    • /
    • 제24권6호
    • /
    • pp.626-632
    • /
    • 2014
  • 한국산 붉바리 집단에서 유전적 구조와 계통 유연관계를 mtDNA COI 유전자 서열의 다형성을 이용하여 조사하였다. COI 유전자 서열을 결정하였고 기존에 보고된 서열들과 비교하였다. 본 연구를 통해 결정된 COI 서열들은 기존에 보고된 EF607565에 대하여 99.1-99.8%의 동일성을 나타내었다. 전체 20가지의 haplotype들이 발견되었고, 한국산 붉바리 집단은 19가지의 haplotype을 나타내었다. 이들 중 Hap_03과 Hap_08은 각각 제주도와 중국-특이적인 COI 서열들을 보였다. 반면, Hap_07은 한국에서 채집된 시료들과 홍콩과 대만에서 보고된 기록 등 여러 COI 서열들을 포함하였다. COI haplotype들의 다형성에 근거한 계통 유전학적 분석을 통해 작성된 NJ tree는 Epinephelus 속 내에서 단계통적인 분지양상을 나타내었고, 이는 붉바리 집단들이 공통의 모계 선조에서 진화한 것임을 나타내었다. 또한 중국해에서 보고된 COI 서열만을 포함하였던 Hap_08은 NJ tree의 중앙부에서 위치하였고, Hap_07의 서열들과도 근연의 관계임을 보여주었다. 이 결과는 중국산 붉바리 역시 동아시아의 다른 집단들과 모계적으로 연관되어있음을 보여주었다. 결과적으로, 동아시아 붉바리 집단들은 모계적으로 연관되어있을 뿐만 아니라 공통의 진화 역사를 공유하고 있으며 여전히 동아시아 해류(Kuroshio 해류)에 의해 영향을 받는 집단이라고 할 수 있다. 본 연구는 붉바리의 유전적 구조와 계통 유연관계를 이해하는 데 도움을 줄 수 있으며, 인공증식과 산업화에 관련된 연구에 있어 중요한 역할을 담당할 것으로 기대된다.

불안수준 및 일시적 유발정서가 서열정보 어휘처리에 미치는 효과 (An Effect for Sequential Information Processing by the Anxiety Level and Temporary Affect Induction)

  • 김충명
    • 한국산학기술학회논문지
    • /
    • 제20권4호
    • /
    • pp.224-231
    • /
    • 2019
  • 본 연구는 불안 및 정상그룹을 대상으로 서열성을 판단하는 인지과제 수행과정에서, 유발된 배경정서와 내재된 불안 수준이 과제처리에 미치는 영향을 밝히고자 하였다. 어휘 간 관계정보 중 서열판단 과제에서의 피험자 내 변인으로 유발정서 유형(기쁨, 분노, 슬픔 및 통제) 및 인지과제 처리유형(숫자서열 및 크기서열)을, 피험자 간 변인으로는 일반 대학생 중 벡 불안척도 검사를 통해 분리된 불안여부로 설정한 후 반응시간 및 오류율의 차이를 분석하였다. 자극의 제시와 반응의 수집은 DmDx5를 활용하였다. 실험결과, 집단 간 반응의 차이가 확인되었고 불안그룹이 과제유형에 관계없이 모든 정서유발 조건에서 정상그룹에 비해 더 느린 반응시간과 더 높은 오류율을 보였다. 그리고 정서유형에 관계없이 두 서열과제에서도 지체응답 경향을 보였다. 다음으로 정서유발 및 서열과제 효과를 통해 정서 및 과제 특정적인 반응경향을 확인하였는데, 슬픔조건이 타 정서보다 빠른 반응을 보였으며, 숫자서열 조건이 크기서열 조건보다 더 빨랐다. 이는 그룹별 그리고 과제유형별 인지과제 처리경향은 물론, 수반되는 정서유형에 따른 응답경향의 차이를 확인해 줌으로써 정서-인지 관련 행동에서의 기저의 배경정서가 처리과정에 주요 요인이 될 수 있음을 시사하는 결과라 하겠다.