• 제목/요약/키워드: 기가 시퀀싱

검색결과 12건 처리시간 0.028초

학습 객체 시퀀싱을 위한 컨텐츠 패키지 메타데이터 생성기 (Generator of Content Package Metadata for Learning Object Sequencing)

  • 국선화;박복자;정영식
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 추계학술발표대회(하)
    • /
    • pp.897-900
    • /
    • 2003
  • 본 논문에서는 SCORM 기반 시퀀싱 모델을 기반으로 학습객체의 구조에 대한 정보, 학습자에게 학습 객체를 어떻게 전달할 지를 결정하는 규칙 등을 포함하고 있는 컨텐츠 구조를 제시하고 학습 컨텐츠의 재사용과 공유가 가능하고 동일한 학습 컨텐츠에 서로 다른 교수법을 적용하여 교육의 효과를 달리할 수 있도록 시퀀싱을 위한 컨텐츠 패키지 메타데이터 생성기를 개발한다. 또한 학습자 정보 트래킹을 위한 SCO(Sharable Content Object)함수를 부착하여 학습 객체가 SCORM RTE(Run-Time Environment)와 통신 할 수 있도록 PIF(Package Interchange File)로 자동 패키징 시킨다.

  • PDF

레퍼런스 시퀀스의 특성을 고려한 HLA 영역에서의 CNVR 탐지 (CNVR Detection Reflecting the Properties of the Reference Sequence in HLA Region)

  • 이종근;홍동완;윤지희
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권6호
    • /
    • pp.712-716
    • /
    • 2010
  • 본 논문에서는 레퍼런스 시퀀스에 기가 시퀀싱데이터를 매핑하여 얻어지는 커버리지 데이터를 이용한 모양 기반의 단위반복변이 영역 (CNVR) 추출 방식을 제안한다. 제안하는 CNVR 검색 알고리즘은 후보 영역 추출 단계와 후처리 단계로 이루어진다. 후보 영역 추출 단계에서는 추출하고자 하는 CNV의 모양을 입력 변수로 조절하여 다양한 높이 및 크기를 갖는 CNV 후보 영역을 추출한다. 다음, 후처리 단계에서는 레퍼런스 시퀀스와 기가 시퀀싱 데이터에 포함되어 있는 시퀀싱 에러 문제를 보완하기 위하여, 레퍼런스 시퀀스의 에러 영역 보정, GC-content 영역 보정 등의 정제 과정을 거친 후, 최종 CNVR을 추출한다. 제안된 방식의 유용성을 보이기 위하여 "1000 게놈 프로젝트"에 의하여 공개된 실 데이터를 이용한 다양한 실험을 수행하였으며, DGV를 이용하여 추출된 CNVR의 정확도를 검증하였다. 실험 결과에 의하면 제안된 방식은 HLA 영역에 존재하는 반복되거나 결실되는 다양한 모양의 CNV를 효율적으로 검출하였다.

정렬된 리드의 통계적 분석을 기반으로 하는 CNV 검색 알고리즘 (A CNV detection algorithm based on statistical analysis of the aligned reads)

  • 홍상균;홍동완;윤지희;김백섭;박상현
    • 정보처리학회논문지D
    • /
    • 제16D권5호
    • /
    • pp.661-672
    • /
    • 2009
  • 인간의 유전체 서열에는 유전체 단위반복변위(copy number variation, CNV)를 포함하는 다양한 유전적 구조 변이(genetic structural variation)가 존재하며, 이는 기능적으로 질병에 대한 감수성, 치료에 대한 반응, 유전적 특성 등과 밀접한 관련이 있다. 본 논문에서는 기가 시퀀싱(giga sequencing)의 결과 산출되는 대량의 짧은 길이의 DNA 서열 데이터를 이용한 새로운 CNV 검색 방식을 제안한다. 제안하는 알고리즘에서는 레퍼런스 시퀀스에 DNA 서열 데이터를 서열 정렬시켜 각 레퍼런스 시퀀스의 위치에 대한 서열 데이터의 출현 빈도 정보를 얻은 후, 출현 빈도 정보의 패턴을 분석하여 통계적 유의성을 갖는 1kbp 이상의 연속 영역을 CNV 후보 영역으로 추출한다. 또한 제안된 알고리즘을 효율적으로 지원하기 위한 서열 정렬 방식에 대한 비교 및 분석을 수행한다. 제안된 기법의 유용성을 규명하기 위하여 다양한 실험을 수행하였다. 실험 결과에 의하면, 제안된 기법은 비교적 낮은 커버리지의 기가 시퀀싱 데이터를 이용하여 반복되거나 결실되는 다양한 형태의 CNV 영역을 효율적으로 검출하며, 또한 작은 사이즈의 CNV 영역에서부터 큰 사이즈의 CNV 영역까지 다양한 크기의 CNV 영역을 효율적으로 검출 할 수 있는 것으로 나타났다.

16S 앰플리콘 시퀀싱 기반 한라마 출생시와 이유기의 분변 미생물 비교 분석 (Comparison of Fecal Microbiota between Birth and Weaning of Halla Horses Using 16S rRNA Gene Amplicon Sequencing)

  • 이종안;강용준;최재영;신상민;신문철
    • 생명과학회지
    • /
    • 제32권12호
    • /
    • pp.1005-1012
    • /
    • 2022
  • 본 연구는 한라마 출생시와 이유기의 분변 미생물 조성과 다양성 차이에 대해 16S 앰플리콘시퀀싱 데이터 분석을 통해 수행하였다. 출생시에 Proteobacteria (35.7%)가, 이유기에는 Firmicutes (45.6%)가 문 수준에서 가장 우점하는 미생물로 확인되었다. 속 수준에서는 출생시에 Escherichia (19.7%), Clostridium (14.0%)가 우점종으로 관측되었으며, 이유기에는 Fibrobacter (6.6%)가 가장 높게 분포하고 있었다. 다양성(α-diversity) 분석 결과 이유기에 풍부도와 균등도 지표들이 통계적으로 유의한 수준에서 높게 나타났다. PCoA 분석을 수행한 결과 출생시와 이유기 미생물 군집 특성(β-diversity)은 속 수준과 종 수준에서 두개의 그룹으로 명확히 구분되었다. 미생물 분포에 대한 통계적 유의성 검증을 위해 세 가지 Jensen-Shannon, Bray-Curtis, Unifrac의 distance metric를 이용해 PERMANOVA 분석을 수행한 결과 통계적 유의성(q<0.001)을 보이며 조성 차이가 있었다. 출생시와 이유기 특성을 대표하는 미생물 마커 선발을 위해 LEfSe 분석을 수행하였다. 속 수준에서 출생시에 장내 질환을 유발할 가능성이 있는 Escherichia, Bacteroides, Clostridium, Methylobacterium 등이 우점하였으며, 이유기에는 섬유소 분해에 관여하는 Fibrobacter가 상대적으로 많이 분포하였다. 본 연구를 통해 승용마로 가치가 높은 한라마의 출생시와 이유기의 미생물 조성 및 다양성 차이에 대한 결과를 제시하였으며 성장단계별 질병예방 및 영양소 흡수에 관여하는 미생물 구명을 위한 기초자료로 활용될 수 있을 것으로 기대한다.

CNV 영역 검색 알고리즘 (A CNV Detection Algorithm)

  • 홍상균;홍동완;윤지희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.356-359
    • /
    • 2008
  • 최근 생물정보학 분야에서 인간 유전체에 존재하는 CNV(copy number variation)에 관한 연구가 주목 받고 있다. CNV 영역은 1kbp-3Mbp 사리의 서열이 반복되거나 결실되는 변이 영역으로 정의된다. 우리는 선행연구에서 기가 시퀀싱(giga sequencing)의 결과 산출되는 DNA 서열조각인 리드(read)를 레퍼런스 시퀀스에 서열 정렬하여 CNV 영역을 찾아내는 새로운 CNV 검색 방식을 제안하였다. 후속 연구로서 본 논문에서는 DNA 서열에 존재하는 repeat 영역 문제를 해결하기 위한 새로운 방안을 제안하고, 리드의 출현 빈도 정보를 분석하여 CNV 영역을 찾아내는 CNV 영역 검색 알고리즘을 보인다. 제안된 알고리즘 Gaussian 분포를 갖는 출현 빈도 정보로부터 통계적 유의성을 갖는 영역을 추출하여 CNV 영역후보로 하고, 다음 경제 과정을 거쳐 최종의 CNV 영역을 추출한다. 성능 평가를 위하여 프로토타임 시스템을 개발하였으며, 시뮬레이션 실험을 수행하였다. 실험 결과에 의하여 제안된 방식은 반복되거나 결실되는 형태의 CNV 영역을 효율적으로 검출하며, 또한 다양한 크기의 CNV 영역을 효율적으로 검출할 수 있음을 입증한다.

정보 공유를 위한 BSML 기반의 생물학 데이터 변환기 (The Biological Data Converter based on BSML for Sharing Information)

  • 김영억;정광수;정영진;차효성;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.37-39
    • /
    • 2004
  • 현재 생물학 연구실에서 시퀀싱 실험을 통해 생성되거나 또는 공개용 생물 데이터베이스로부터 획득된 유전체 및 단백질 정보는 각각 이질적인 데이터형식을 사용하고 있다. 이 때문에, 생물정보를 분석하여 상호간의 정보를 효율적으로 사용하기 위해서는 공통된 형식의 데이터 표준화작업이 필수적이다. 그리고 이러한 이질적 데이터 형식에 대한 표준화 연구의 미비로 인하여 플랫 파일간의 정보공유에 어려움을 겪고 있다. 따라서, 이 논문에서는 다양한 유전체 및 단백질 정보를 관리.공유하기 위해 이질적인 포맷간의 맵핑 과정을 통하여 BSML(Bioinformatic Sequence Markup Language) 형태로 변환하고, 이를 객체관계형 데이터베이스(Object Relational DataBase)에 저장하는 시스템을 개발하였다. 그리고, 개발된 시스템은 생물정보 데이터의 표준화를 위해 개발된 XML(Extend Markup Language) 기반의 BSML을 이용함으로써 효율적으로 생물학 데이터들 간의 정보를 공유할 수 있으며, 개인 생물학 데이터베이스 구축이나 다양한 생물학적 데이터를 통합 관리하는 시스템에서 유용하게 쓰일 수 있다.

  • PDF

Seed기반의 short read aligner 구현에 관한 연구

  • 지민근;김정규;이강만
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.1107-1109
    • /
    • 2019
  • 차세대 게놈 시퀀싱(NGS) 기술이 발전하면서 방대하게 축적된 유전체 데이터를 분석하기 위해 다양한 시퀀스 정렬 연구가 진행되고 있다. 시퀀스 정렬 중 잘 알려진 BLAST에서는 휴리스틱 기반의 시퀀스 정렬을 수행하여 긴 리드 시퀀스에 대해 속도와 안정성이 보장되지만 짧은 리드 시퀀스에 대해서는 성능이 저하되는 문제가 있다. 이 문제를 해결하기 위해 본 논문에서는 레퍼런스 시퀀스와 쿼리 시퀀스를 Seed 기반으로 분리하여 정렬을 수행한다. 최종적으로는 contig를 추출하고 레퍼런스-쿼리간 유효한 contig만 선별하여 빠르게 짧은 리드 시퀀스들의 정렬을 수행할 수 있는 정렬기를 구현하고자 한다.

유전자의 기능분류를 위한 클러스터링 알고리즘 연구 (Research for clustering algorithm for the functional classification of genes)

  • 한석현;이강만
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1149-1151
    • /
    • 2015
  • 차세대 유전정보 분석기 시퀀서의 개발은 양질의 시퀀싱 데이터를 증가시켰다. 수많은 유전정보는 유전자 분석의 새로운 연구 방향을 제시하였다. 본 논문은 유전자 분석 중에서 기존의 유전정보를 활용하여 유전자의 기능예측을 하고자 한다. 클러스터링 알고리즘의 정확도를 높이기 위해서 본 논문에서는 데이터 유사성 조절이 가능한 클러스터링 알고리즘을 적용하였다. 그 결과 데이터 유사성 조절을 할 경우에 그렇지 않을 경우보다 유전자 기능 예측의 정확도가 높아졌다. 따라서 제안된 데이터 유사성 조절 기법은 유전자 기능을 예측하는 방법에 정확도를 높일 수 있을 것으로 기대된다.

임상적으로 진단된 다발성 골단이형성증 1례 (A Clinically Diagnosed Case of Multiple Epiphyseal Dysplasia)

  • 김선자;조성윤;김진섭;허림;권영희;이지은;심종섭;김옥화;진동규
    • 대한유전성대사질환학회지
    • /
    • 제15권1호
    • /
    • pp.49-54
    • /
    • 2015
  • 다발성 골단이형성증은 비교적 흔한 골이형성증으로 소아기에 관절통과 관절 강직, 뒤뚱거리면 걸어가는 보행 및 일부에서 경한 저신장을 특징으로 하며 영상의학적 검사에서는 여러 관절에서 골단의 불규칙한 소견과 골화 지연을 보인다. 본 증례 환자는 임상적, 영상의학적으로 다발성 골단이형성증을 진단 할 수 있었으며 환자의 넓적다리 관절 영상 검사는 MATN3 유전자 변이를, 무릎 관절 영상 검사는 COMP 유전자 변이를 시사하였기에 MATN3과 COMP 유전자 변이에 대해 시퀀싱(sequencing)을 하였으나, 변이는 발견되지 않았다. 이후 엑솜시퀀싱(exomesequencing)을 시행하였으나, 기존에 다발성 골단이형성증과 관련이 있는 것으로 알려진 유전자에 대한 변이가 발견되지 않았다. 본 증례와 같이 임상적, 영상의학적으로 다발성 골단이형성증으로 진단가능 하였으나 분자유전학적으로 기존에 알려진 변이 유전자가 발견되지 않은 환자들을 위해 추가적인 연구가 필요할 것으로 보인다.