• 제목/요약/키워드: 서열화

검색결과 428건 처리시간 0.028초

Hitting Set 문제를 이용한 Next Generation Sequencing Read의 효율적인 처리 (Efficient Processing of Next Generation Sequencing Reads Using Hitting Set Problem)

  • 박태원;김소라;최석문;조환규;이도훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(B)
    • /
    • pp.466-469
    • /
    • 2011
  • 최근에 등장한 Next Generation Sequencing(NGS)은 전통적인 방법에 비해 빠르고 저비용으로 대용량의 시퀀스 데이터를 이용한 차세대 시퀀싱 기술을 말한다. 이렇게 얻은 NGS 데이터를 분석하는 단계 중에서 alignment 단계는 시퀀서에서 얻은 대량의 read를 참조 염기서열에 맵핑하는 단계로 NGS 데이터 분석의 가장 기본이면서 핵심인 단계이다. alignment 도구는 긴 참조 염기서열을 색인화해서 짧은 read를 빠르게 맵핑하는 용도로 사용된다. 현재 많이 사용되고 있는 일반적인 alignment 도구들은 입력데이터에 대한 별도의 전처리 과정이 없으며 나열된 read를 순차적으로 맵핑하는 단순한 구조를 가지고 있다. 본 논문은 NGS 데이터의 특징 중에 특히 read간의 중복성이 존재하고 이를 이용한 read의 효율적 공통부분 서열을 찾는다. 중복이 가능한 read의 공통부분서열과 read의 관계를 그래프 이론의 Hitting Set 문제로 모델링하고 여러 read가 포함하는 공통 부분서열을 사용해서 alignment 단계의 효율을 높일 수 방법을 제안한다.

맞춤의학 시대의 개인 유전체 서열의 해독과 스마트한 이용 (Individual Genome Sequences and Their Smart Application In Personalized Medicine)

  • 김동민;정해영;김일철;원용관
    • 스마트미디어저널
    • /
    • 제2권4호
    • /
    • pp.34-40
    • /
    • 2013
  • 다양하고 빠른 차세대 유전체 서열 분석기를 사용한 개인 유전체 분석은 생명과학 연구뿐만 아니라 질병의 진단과 치료를 포함하는 의학 분야까지 새로운 지평을 열고 있다. 저렴한 비용으로 읽혀진 개인 유전체 서열은 통합 과정을 거쳐 유전체 이상을 점검할 수 있고, 얻어진 서열 데이터는 유전자 변이성 연구, 유전체 발현 연구, 후성유전학적 연구, 유전체 주석화 등에 이용될 수 있다. 개인 유전체 데이터는 생물학적 연구 결과와 임상 연구 데이터를 연계하여 질환 위험도의 예측과 맞춤 치료에 이용할 수 있게 되었다. 개인 맞춤의학 시대에 전문적 데이터와 일반인 사용자의 간극을 메우기 위해 스마트 미디어 기기와 같은 적극적인 인터페이스의 개발이 시급하다.

  • PDF

HPC 환경의 대용량 유전체 분석을 위한 염기서열정렬 성능평가 (Evaluation of Alignment Methods for Genomic Analysis in HPC Environment)

  • 임명은;정호열;김민호;최재훈;박수준;최완;이규철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권2호
    • /
    • pp.107-112
    • /
    • 2013
  • 인간 유전체 지도 완성 후 NGS 기술의 발달로 대용량 유전체 데이터 분석에 대한 요구가 증대하였다. NGS 데이터는 대용량의 단편서열로 구성되므로 효과적인 분석을 위해 고성능 컴퓨팅 기술의 지원이 요구된다. 본 연구에서는 HPC 환경에서 NGS 데이터로부터 SNP를 탐색하는 유전체 분석 파이프라인을 구축하였다. 각 분석 단계의 CPU 이용률 분석을 통해 분석 단계 중 서열 정렬 단계가 연산 작업의 비율이 가장 높은 것을 확인하고, 공개된 병렬화 서열 정렬 도구들의 성능을 분석하여 유전체 분석를 위한 매니코어 프로세서의 활용 가능성을 확인하였다.

지하매설물 중 도시가스 지하배관에 대한 위험성 서열화 분석 (Risk Ranking Analysis for the City-Gas Pipelines in the Underground Laying Facilities)

  • 고재선;김효
    • 한국화재소방학회논문지
    • /
    • 제18권1호
    • /
    • pp.54-66
    • /
    • 2004
  • 본 논문은 도시 가스 지하배관의 위험관리체계를 유지하는데 필요한 요소들 중 배관의 위험성평가에 적절한 기법을 제안하고, 그 평가결과에 근거하여 가장 비용-효과가 큰 배관 유지관리방안을 찾아내는데 그 목적이 있다. 본 연구에서 제안된 지하배관의 위험성서열화의 접근방법은 세 가지 측면에서 행하여졌는데, 첫째는 RBI(Risk Based Inspection)으로서 배관의 위험도에 영향을 주는 주변인구조건, 관의 크기 및 두께. 사용시간 등을 기준으로 일차적 평가를 함으로서 노출위험도의 높고 낮음을 정성적으로 평가하였고, 둘째는 Scoring System으로서 매설된 배관의 환경적인 요소에 기초하여 점수화하여 구체적으로 위험도를 서열화 하였다. 셋째로는 THOMAS 이론으로부터 대상배관의 누출빈도를 정량화 하였다. 그 결과 도시 가스 대상배관의 노출위험도는 대략 중간이상의 값을 갖는 것으로 나타났으며, 제안된 SPC기법을 적용하여 위험성을 평가한 결과, 대상배관의 부식위험성 점수 값이 허용범위(30-70)에 골고루 분포하는 것으로 보아 설정된 평가기준이 실제배관에 대해 상대적인 부식위험성을 잘 서열화 됨을 알 수 있었다. 또한 THOMAS모델을 적용한 평가결과로서의 Score값은 배관의 길이를 포함한 여러 치수들에 무관한 환경요인에 관련된 값인 반면, 기본누출빈도는 배관의 길이를 포함해서 다른 치수들에 비례함을 보여주고 있다. 그 결과 점수 값이 상대적으로 적은 배관구간(상대적으로 위험성이 낮은 구간)도 배관길이가 훨씬 더 크다면 누출발생빈도가 더 높은 값을 갖는다는 것을 알 수 있었다. 또한 대상 파이프라인의 허용위험수용범위는 전체 누출 빈도 값인 최대 1.00E-01/yr로부터 최소 2.50E-02의 영역을 나타내고 있어 이에 상응되는 높은 Consequence를 수용 가능한 영역으로 낮추는 조치가 필요함을 보여주고 있고, 종합파손확률에 대해 사용시간을 회기 분석법(Regression Analysis)으로 예측한 결과, 이에 대한 방정식을 유추할 수 있었고, 그에 대한 결과가 대상 파이프라인의 사용 년 수인 11년에서 13년으로 나타나 실제 대상배관들의 연령과 거의 일치함을 알 수 있었다. 따라서 본 연구에서 제안된 위험성 서열화 접근방법은 실제적으로 지하배관의 유지관리를 하는데 있어서 매우 효율적으로 적용될 수 있을 것으로 사료된다.

고래회충 연구를 위한 웹기반 데이터베이스 구축 (Construction of Web-Based Database for Anisakis Research)

  • 이용석;백문기;조용훈;강세원;이재봉;한연수;차희재;유학선;옥미선
    • 생명과학회지
    • /
    • 제20권3호
    • /
    • pp.411-415
    • /
    • 2010
  • 본 연구에서는 Anisakis 연구를 위하여 웹을 기반으로 하는 데이터베이스를 리녹스 Cent OS 시스템이 설치된 Xeon 3.2 GHz cpu의 인텔 서버플랫폼 ZSS130 (삼성) 서버에 구축하였다. 운영체제를 설치한 후에 common gate interface(cgi) 기반의 웹서버 (http://www.anisakis.org)를 구축하고 NCBI에서 제공하는 WebBLAST 프로그램을 설치하였다. Anisakis 연구를 위한 웹기반 데이터베이스를 다음과 같은 순서로 구축하였다. 우선 회충목에 속하는 각종 서열(염기서열/ 아미노산서열, EST 서열, 미토콘드리아 Genome 서열)들을 멀티파스타 형식으로 다운로드 하였다. 다음으로NCBI에서 제공하는 formatdb 프로그램을 통하여 BLAST 검색이 가능하도록 데이터베이스화 하였으며 모든 염기서열들과 EST 서열들을 TGICL 프로그램을 통하여 clustering 및 assembing을 하였다. 그리고 NLS (Nuclear Localization Signal) 예측을 위해 EST 서열들은 Genscan 프로그램과 Emboss sixpack 프로그램을 사용하여 아미노산으로 변환하였다. 또한 벡터 서열과 E. coli 서열, 그리고 반복 서열들을 서버에 구축하여 서열들의 오염을 확인할 수 있게 하였다. 본 웹데이터베이스 서버의 구축을 통해 고래회충 및 회충목의 염기서열과 일치하는 서열을 자체 BLAST를 통해 매우 빠른 속도로 추출 할 수 있었으며, cDNA나 genomic DNA 라이브러리를 구축할 때 라이브러리의 상태를 쉽게 확인 할 수 있게 되었다. 또한 Clustering Res. 인터페이스를 통해 SNPs 연구 수행 시 매우 쉽게 실험용 시발체를 제작할 수 있으며 기 구축된 cDNA library의 활용을 annotated EST를 통해 극대화 시킬 수 있어 고래회충 관련 분자생물학적 연구에 도움이 될 것으로 기대된다.

대학평가의 제문제

  • 구병림
    • 대학교육
    • /
    • 통권84호
    • /
    • pp.106-114
    • /
    • 1996
  • 대학을 평가하여 그 사회적 신뢰나 책무성을 강화시키면서도 기관의 통합성과 생산성을 높이는 데 기여해야 할 평가제도는 그 긍정적 측면이나 성과와 함께 많은 위험이나 부작용도 수반하므로 어떤 사업보다도 신중하고 차원 높은 접근이 전제된다. 대학평가가 성공적으로 수행되려면 다음과 같은 전제조건이 충족되어야 한다. 즉, 대학평가의 주체는 바로 대학사회 자신이며 대교협의 평가가 합법적 공신력을 갖고, 대학의 다양성을 존중하여 평가기준이나 척도를 마련해야 하며, 물량적 측면보다 질이 강조되어야 하고, 평가과정의 합리화와 피평가대학의 적극적.자발적 참여가 수반되어야 하며, 대학 서열화는 어떠한 경우에도 금기시해야 하고, 평가결과를 재정지원의 기준으로 삼는 차원낮은 활용을 삼가해야 할 것이다.

  • PDF

잡종 기원 녹보리똥나무와 큰보리장나무의 형태학적 및 분자적 다양성 분석 및 평가 (Analysis and evaluation of morphological and molecular polymorphism in the hybridization of Elaeagnus ×maritima and E. ×submacrophylla)

  • 장영종;손동찬;이강협;이정현;박범균
    • 식물분류학회지
    • /
    • 제53권2호
    • /
    • pp.126-147
    • /
    • 2023
  • 녹보리똥나무와 큰보리장나무는 형태적 특성에 기반하여 잡종 분류군으로 제안된 바 있으나, 이에 대한 분류학적 실체가 불명확하다. 본 연구에서는 녹보리똥나무와 큰보리장나무의 잡종 기원을 밝히기 위하여 현장 조사와 표본관에 소장된 표본을 검토하여 형태적 특징을 관찰하였으며, 핵리보솜 구간(internal transcribed spacer, 5S non-transcribed spacer)과 엽록체 구간(matK)의 염기서열을 비교·분석하였다. 형태적 특징을 관찰한 결과, 녹보리똥나무는 보리장나무와, 큰보리똥나무는 통영볼레나무와 형태적으로 유사성을 보였으나, 분자 분석 결과, 녹보리똥나무는 핵리보솜 구간에서 보리장나무와 보리밥나무의 서열의 혼성화가 관찰되었다. 큰보리장나무는 다양한 양상이 관찰되었는데, 일부 개체는 핵리보솜 구간에서 통영볼레나무와 보리밥나무의 서열의 혼성화가, 엽록체 구간에서는 보리밥나무 서열이 관찰되었다. 다른 개체는 핵리보솜 구간에서는 보리밥나무의 서열을 보였으나, 엽록체 구간에서는 통영볼레나무의 서열이 관찰되어 핵과 엽록체간 불일치를 보였다. 일부 개체는 통영볼레나무와 보리밥나무의 중간형을 보였으나, 핵리보솜과 엽록체 구간 모두 보리밥나무 서열이 관찰되었다. 이러한 결과는 두 종이 잡종기원이며, 부모종 또는 잡종 개체간 교배가 빈번히 일어나는 것을 시사한다.

고성능 컴퓨팅 환경에서 유전체 서열 분석 벤치마크 (A Genomes Analysis Benchmark in High Performance Computing)

  • 최재훈;정호열;박수준;최완
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(A)
    • /
    • pp.30-32
    • /
    • 2012
  • 본 논문에서는 고성능 컴퓨팅 환경에서 유전체 서열 분석 도구들을 벤치마크 하기 위한 시스템을 개발하고 실제 유전체 데이터를 이용하여 성능을 비교하였다. 이 벤치마크 시스템은 유전체 분석 파이프라인 절차에 따라 다양한 분석 도구들을 CPU 멀티 코어와 GPU 매니 코어 환경에서 선택적으로 구동할 수 있도록 지원한다. 따라서, 서로 다른 환경에서 수행된 다양한 유전자 분석 도구의 성능을 실제 유전체 서열 데이터를 이용하여 비교하고 시각화할 수 있다.

전산 클로닝을 위한 Clustered EST 데이터베이스 구축 (Buliding Clustered EST database for In Silico Cloning)

  • 이진관;최은선;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.105-108
    • /
    • 2001
  • cDNA(complementary DNA)를 복제(cloneing)하여 염기 서열화 한 EST(Expressed Sequence Tag) 데이터는 여러 생물체들의 염기서열 정보들과 비교를 통해 유사점을 찾거나 기능적 부위 검색을 통해 유전자 기능을 추정한 수 있어 기능 유전체 연구에 많이 사용되고 있다. EST 데이터를 식물은 특정종(Species)별로, 동물의 경우 종의 조직별로 클러스터링 함으로써 아직 알려지지 않은 종의 유전자를 밝혀낼 수 있음은 물론 유전자의 발현에 따른 단백질의 기능도 알아낼 수 있다. 따라서 이 논문에서는 NCBI에서 flatfile 형태로 제공하는 EST 데이터를 분석하여 관계형 데이터베이스로 모델링하고 구축하였다. 또한 EST 데이터의 효율적인 사용을 위하여 데이터를 특정 종의 조직별로 클러스터링하여 제공하는 시스템을 설계하고 구현하였다.

  • PDF

지문법과 서열정렬법을 결합한 다단계 정렬 방법의 문서 유사도 비교 (A method for comparing documents using fingerprinting and sequence alignment.)

  • 서종규;옥창석;조환규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.576-579
    • /
    • 2012
  • 문서유사도를 비교하는 방법은 지문법과 서열 정렬법이 널리 알려져 있다. 지문법은 계산속도가 빠른 대신 정확도가 떨어지며, 서열정렬법은 계산속도가 느린 대신 정확도가 높다. 다단계 정렬은 두 방법의 비중을 조절하여 문서 유사도를 비교할 수 있는 방법으로, 각 방법의 장점을 얻으면서 단점을 보완하도록 고안되었다[1]. 이 논문에서는 다단계 정렬방법에 대해 설명하고, 다단계정렬 방법에서 발생 가능한 단편화 문제를 제거하여 정확도를 향상시키는 방법에 대해 소개한다.