• 제목/요약/키워드: 서열

검색결과 3,688건 처리시간 0.032초

단백질 서열의 상동 관계를 가중 조합한 단백질 이차 구조 예측 (Prediction of Protein Secondary Structure Using the Weighted Combination of Homology Information of Protein Sequences)

  • 지상문
    • 한국정보통신학회논문지
    • /
    • 제20권9호
    • /
    • pp.1816-1821
    • /
    • 2016
  • 단백질은 대부분의 생물학적 과정에서 중대한 역할을 수행하고 있으므로, 단백질 진화, 구조와 기능을 알아내기 위하여 많은 연구가 수행되고 있는데, 단백질의 이차 구조는 이러한 연구의 중요한 기본적 정보이다. 본 연구는 대규모 단백질 구조 자료로부터 단백질 이차 구조 정보를 효과적으로 추출하여 미지의 단백질 서열이 가지는 이차 구조를 예측하려 한다. 질의 서열과 상동관계에 있는 단백질 구조자료내의 서열들을 광범위하게 찾아내기 위하여, 탐색에 사용하는 프로파일의 구성에 질의 서열과 유사한 서열들을 사용하고 갭을 허용하여 반복적인 탐색이 가능한 PSI-BLAST를 사용하였다. 상동 단백질들의 이차구조는 질의 서열과의 상동 관계의 강도에 따라 가중되어 이차 구조 예측에 기여되었다. 이차 구조를 각각 세 개와 여덟 개로 분류하는 예측 실험에서 상동 서열들과 신경망을 동시에 사용하여 93.28%와 88.79%의 정확도를 얻어서 기존 방법보다 성능이 향상되었다.

차세대 염기서열 분석기법과 생물정보학 (Next Generation Sequencing and Bioinformatics)

  • 김기봉
    • 생명과학회지
    • /
    • 제25권3호
    • /
    • pp.357-367
    • /
    • 2015
  • 매우 빠른 속도로 발전하고 있는 차세대 염기서열 분석 플랫폼과 최신 생물정보학적 분석도구들로 말미암아, 1,000달러 이하의 가격으로 인간 유전체 염기서열을 해독하고자 하는 궁극적인 목표가 조만간 곧 실현될 수 있을 것 같다. 차세대 염기서열 분석 분야의 급속한 기술적 진전은 NGS 데이터의 분석과 관리를 위한 통계적 방법과 생물정보학적 분석도구들에 대한 수요를 꾸준히 증대시키고 있다. NGS 플랫폼이 상용화되어 쓰이기 시작한 초창기부터, NGS 데이터를 분석하고 해석하거나, 가시화 해주는 다수의 응용프로그램이나 도구들이 개발되어 활용되어 왔다. 그러나, NGS 데이터의 엄청난 범람으로 데이터 저장, 데이터 분석 및 관리 등에 있어서 해결해야 할 많은 문제들이 부각되고 있다. NGS 데이터 분석은 단편서열과 참조서열간의 서열정렬, 염기식별, 다형성 발견, 쌍단편 서열이나 비쌍단편 서열 등을 이용한 어셈블리 작업, 구조변이 발견, 유전체 브라우징 등을 본질적으로 포함한다. 본 논문은 주요 차세대 염기서열 결정기술과 NGS 데이터 분석을 위한 생물정보학적 분석도구들에 대해 개관적으로 소개하고자 한다.

미생물 동정을 위한 프로브와 프라이머 고안 시스템의 개발 (Development of Primer and Probe Design System for Microbial Identification)

  • Park, Jun-Hyung;Kang, Byeong-Chul;Park, Hee-Kyung;Jang, Hyun-Jung;Song, Eun-Sil;Lee, Seung-Won;Kim, Hyun-Jin;Kim, Cheol-Min
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2004년도 The 3rd Annual Conference for The Korean Society for Bioinformatics Association of Asian Societies for Bioinformatics 2004 Symposium
    • /
    • pp.21-28
    • /
    • 2004
  • 모든 생명체의 genetic information에는 보존적 염기서열과 다형적 염기서열이 존재한다. 다형적 염기서열과 보존적 염기서열은 하나의 종(species)을 감별하거나, 여러 종류의 종을 동시에 감별할 수 있는 genotyping의 표지자로 각각 이용될 수 있다. 본 논문은 병원성 감염질환 세균, 식중독 유발 세균, 생물의약품 오염 유발 세균 및 환경오염 세균 등 세균의 존재 유무와 속과 종 감별을 위해 대부분 세균 종의 보존적 염기서열과 다형적인 염기서열을 포함하고 있는 23S rDNA 유전자의 표적 염기 서열로부터 고안된 세균 특이적(bacterial-specific), 속 특이적(genus-specific), 종 특이적(species-specific) 올리고 뉴클레오티드프로브와 프라이머를 디자인하는 시스템을 소개한다. 시스템을 통해서 얻어진 프로브와 프라이머들은 PCR을 통한 검증단계를 거쳐서 디자인 결과의 정확성을 확인하였다. 본 시스템의 이용으로 프로브와 프라이머를 디자인하는데 몇 주가 소요되는 시간을 몇 일 내로 줄일 수 있었으며, 체계적인 데이터의 관리로 결과의 정확성을 높일 수 있었다.

  • PDF

정수형 변환을 이용한 DNA 서열 검색 알고리즘 (A DNA Sequence Search Algorithm Using Integer Type Transformation)

  • 윤경오;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.357-359
    • /
    • 2012
  • 초 고성능 바이오 서열 분석 장비 기술의 발달로 대량의 바이오 정보가 쏟아져 나오고 있으며, 바이오산업의 발달로 개인별 유전체 정보에 의한 맞춤의학의 시대가 도래되고 있다. 수많은 서열에 대한 분석에는 많은 저장장치 및 주기억장치가 필요하므로 슈퍼컴퓨터 급의 서버와 대량의 데이터를 빠르게 처리할 수 있는 프로그램이 필요하다. 이러한 분석에는 염기서열 일치 검색과 이를 기반으로 하는 Alignment와 Assembly 분석이 있으며, 이를 수행하는 기존의 알고리즘 및 대부분의 프로그램들은 염기서열을 문자열로 취급하고, 해쉬 인덱스 테이블, Brujin 그래프의 사용, 버러우즈 휠러 변환(BWT) 등의 기법을 활용하여 효율적인 분석을 도모하였다. 본 논문에서는 염기서열을 문자열이 아닌 k-mer 묶음의 정수형 하나로 변환하여 검색함으로써 저장 공간의 크기를 약 28% 이상으로 줄이고 형 변환 상태에서의 검색을 수행할 수 있는 알고리즘을 제안한다. Assembly 분석 프로그램인 CalcGen 프로그램을 개발하여 본 알고리즘의 효용성 및 효율성을 실험을 통해 검증하였다. 이 연구의 결과는 향후 대량의 유전체 염기서열의 효율적 분석과 저장 및 처리에 또 하나의 새로운 접근 방법을 제안하는데에 그 의미를 둘 수 있다.

생태학의 통계적 서열화 방법 비교에 관한 연구 (A Comparison Study for Ordination Methods in Ecology)

  • 고현석;전명식;정형철
    • 응용통계연구
    • /
    • 제28권1호
    • /
    • pp.49-60
    • /
    • 2015
  • 군생태학에서 종, 장소 그리고 환경변수의 관계를 시각적으로 보기 위해 대응분석, 정준대응분석 등 다양한 서열화방법들을 사용한다. Ter Braak (1986), Jackson 등 (1991), Parmer (1993) 등은 고유값 및 거리그래프를 이용하여 서열화방법들을 비교하고 있는데, 이 방법들은 조사된 데이터에 근거하고 있기 때문에, 모집단과 행렬도의 관계를 보여주지는 못한다. 따라서, 본 논문에서는 행렬도에 모집단 정보의 표현정도를 측정하는 방법을 소개하고, 이를 활용하여 서열화방법들을 객관적으로 비교하였다. 비교결과, 정준대응분석은 대응분석과 유사한 정분류율을 유지하면서도 환경정보를 이차원 공간에 표현할 수 있는 장점을 지닌 분석임을 확인하였다.

SeqWeB: SOA 기반의 서열 주해 시스템 (SeqWeB: Sequence Annotation System based on SOA)

  • 남성혁;정태성;김태경;유재수;조완섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (B)
    • /
    • pp.1-6
    • /
    • 2007
  • 서열을 분석하고, 기능을 예측하는 서열 주해는 생명 현상 규명을 위한 필수 과정이다. 서열 주해는 다수 응용 프로그램간 상호 연계를 통한 복잡한 처리 과정을 거쳐 이루어진다. 현재 사용자는 다양한 응용 프로그램들 중 적합한 응용 프로그램을 선택한 후, 운영환경에 맞도록 설치하고, 사용법을 익혀야 한다. 또한 각 프로그램들의 연계를 위해 입출력 데이터 형식을 변환해야 하는 불편함이 있다. 이를 위해 자동화된 솔루션들이 개발되고 있지만, 각 단계별 프로그램들이 강결합(tightly coupled)되어 있어 유연성(flexibility)이 떨어지고, 기능의 확장 및 변경에 어려움이 있다. 본 논문에서는 기존 시스템들의 한계를 극복하기 위하여 SOA (Service Oriented Architecture) 기반의 서열 주해 시스템인 SeqWeB을 제안한다. SeqWeB은 서열 주해에 필요한 7개의 응용 프로그램(Phred, cross_match, RepeatMasker, ICAtools, Phrap, CAP3, Blast)들을 웹 서비스 기술을 통해 단위 서비스로 개발하고, BPM 기법을 이용하여 통합하였다. SeqWeB은 각 응용 프로그램간 상호 운용성을 높이기 위하여 XML 형식의 입/출력 데이터를 사용하며, SOA 기반의 시스템 통합으로 각 응용 프로그램들을 약결합(loosely coupled)하여 시스템의 확장 및 변경이 용이하다. 또한 웹을 기반으로 하는 다양한 조합의 서열 주해 솔루션 제공이 가능한 특징이 있다.

  • PDF

대용량 DNA서열 처리를 위한 서픽스 트리 생성 알고리즘의 개발 (Suffix Tree Constructing Algorithm for Large DNA Sequences Analysis)

  • 최해원
    • 한국산업정보학회논문지
    • /
    • 제15권1호
    • /
    • pp.37-46
    • /
    • 2010
  • 서픽스 트리는 데이터의 내부구조를 자세히 나타내고 선형시간 탐색이 가능한 효과적인 자료구조로서 DNA 서열분석 등에 유용하다. 그러나 서열을 서픽스 트리로 구축하는 경우 트리의 크기가 원본의 최소 30배 이상으로 커지므로 테라바이트(TB)급의 대용량 DNA 서열의 경우에 메모리상의 응용은 매우 어려운 문제점이 있다. 이에 본 논문에서는 디스크를 이용한 대용량 DNA의 서픽스 트리 응용기법을 제시한다. 이때 DNA 서열구조를 고려한 서픽스 트리 선형 탐색 특성 유지를 보장한다. 이를 검증하기 위하여 9G Byte의 유전자 단편 서열을 이용해 424G Byte의 서픽스 트리를 디스크에 구축한 다음, 임의의 질의 서열에 대해 KMP알고리즘과 비교한 결과 질의 응답시간에서 우수한 성능을 보였다.

다중서열정렬에 기반한 종의 차이 (Differences between Species Based on Multiple Sequence Alignment Analysis)

  • 권혁주;김상진;김근무
    • 한국전자통신학회논문지
    • /
    • 제19권2호
    • /
    • pp.467-472
    • /
    • 2024
  • 다중서열정렬(MSA : multiple sequence alignment)은 다양한 생명체에서 같은 기능을 하는 여러 개의 단백질 서열이나 핵산 서열을 한 번에 모아서 서로 정렬하는 방법이다. 바이오파이썬을 이용하여 인간이 다른 동물과 어떻게 다른지 조사하였다. 대표적인 다중서열정렬 알고리즘인 clustalW는 열의 위치별로 정렬된 정도를 비교한다. 또한, 웹로고와 계통수를 만들어서 보존서열을 가시화하여 이해도를 향상한다. 인간과 다른 동물의 차이점을 확인하는 예를 제시하고 바이오파이썬을 활용도를 제시한다.

Multiplex PCR과 Conformation Sensitive Gel Electrophoresis를 이용한 혈우병B F9 유전자 돌연변이 직접 진단법 (Direct detection of hemophilia B F9 gene mutation using multiplex PCR and conformation sensitive gel electrophoresis)

  • 유기영;김희진;이광철
    • Clinical and Experimental Pediatrics
    • /
    • 제53권3호
    • /
    • pp.397-407
    • /
    • 2010
  • 목 적 : F9 유전자는 혈우병B의 병인 유전자이다. 기존의 RFLP를 이용한 연관분석은 정보제공율이 55.6%에 불과하였다. 직접 염기서열 분석법은 98%의 돌연변이를 진단할 수 있지만, 고가의 비용이 든다. 본 연구는 F9 유전자를 대상으로 돌연변이의 선별검사로써 mPCR-CSGE를 사용하고, 이후 특정 유전자 부위만을 염기서열 분석하여 mPCR-CSGE의 유용성을 확인하기 위해 고안되었다. 방 법 : 연구대상은 비혈연 관계인 27명의 혈우병B 환자였다. 직접염기서열 분석법은 독립된 다른 기관에서 시행하였고, mPCR-CSGE 선별 후 염기서열 분석법은 본 연구자의 기관에서 시행되었다. 직접 염기서열 분석법의 결과가 참고치가 되어 mPCR-CSGE 선별 후 염기서열 분석법을 정확성, 경제성, 신속성, 편이성 측면에서 비교하였다. 두가지 방법으로 진단이 되지 않는 환자에게는 MLPA를 이용하여 돌연변이를 발견하였다. 결 과 : 직접 염기서열 분석법으로 26명(96.3%)의 환자에서 돌연변이를 확인할 수 있었다. mPCR-CSGE 선별 후 염기서열 분석법으로는 23명(85.2%)의 환자에서 돌연변이를 찾아낼 수 있었다. 1명의 환자는 MLPA로써 돌연변이를 확인할 수 있었다. 27명의 환자에게 21개의 독립적인 돌연변이가 있었다. mPCR-CSGE 선별 후 염기서열 분석법은 직접 염기서열 분석법에 비해 비용은 55.7%로 줄일 수 있었으나, 실험 단계는 더욱 복잡하였고, 시간도 하루가 더 걸렸으며, 세심한 실험상의 주의가 필요하였다. 결 론 : mPCR-CSGE 선별 후 염기서열 분석법은 85.2%의 높은 돌연변이 선별력을 보이고, 직접 염기서열 분석법의 57.7%의 비용만 소모하였으나, 실험과정에 세한 주의가 요구되었으며, 노동집약적이고, 실험 시간도 하루가 더 소요되었다.

품질 정보와 퍼지 추론 기법을 이용한 DNA 염기 서열 배치 알고리즘 (A DNA Sequence Alignment Algorithm Using Quality Information and a Fuzzy Inference Method)

  • 김광백
    • 지능정보연구
    • /
    • 제13권2호
    • /
    • pp.55-68
    • /
    • 2007
  • 분자 생물학(computational molecular biology) 분야에서 DNA 염기 서열 배치 알고리즘은 다양한 방법으로 개선되어 왔다. 본 논문에서는 기존의 DNA 염기의 품질 정보(quality information)를 이용한 DNA 염기 서열 배치 방법을 개선하기 위하여 퍼지 논리 시스템(fuzzy logic system)과 DNA 염기 서열 단편의 특징을 적용한 품질 정보와 퍼지 추론 기법을 이용한 DNA 염기 서열 배치 알고리즘을 제안한다. 기존의 알고리즘은 Needleman-Wunsch가 제안한 전역 배치 알고리즘에 각 DNA 염기의 품질 정보를 적용하여 DNA 염기 서열 배치 점수를 계산하였다. 그러나 전체 DNA 염기의 품질 정보를 이용하여 계산하기 때문에 DNA 염기 말단 부분의 품질이 낮은 경우에는 DNA 염기 서열 배치 점수를 계산하는 과정에서 오차가 발생한다. 본 논문에서는 기존의 품질 정보를 이용한 알고리즘을 개선하여 DNA 염기 서열의 말단 부위의 품질이 낮은 경우에도 정확히 서열을 배치할 수 있도록 한다. 또한 DNA 염기 서열 단편의 길이와 낮은 품질의 DNA 염기 빈도를 퍼지 논리 시스템에 적용하여 DNA 염기 서열 배치 점수를 계산하는데 적용되는 매핑 점수 인자(parameter)를 동적으로 조정한다. 제안된 알고리즘의 성능 평가를 위해 NCBI(National Center for Biotechnology Information)의 실체 유전체 데이터를 받아 성능을 분석한 결과, 제안된 알고리즘이 기존의 품질 정보만을 이용한 알고리즘 보다 DNA 염기 서열 배치에 있어서 효율적임을 확인하였다.

  • PDF