• Title/Summary/Keyword: 기가 시퀀싱

Search Result 12, Processing Time 0.049 seconds

Generator of Content Package Metadata for Learning Object Sequencing (학습 객체 시퀀싱을 위한 컨텐츠 패키지 메타데이터 생성기)

  • 국선화;박복자;정영식
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2003.11b
    • /
    • pp.897-900
    • /
    • 2003
  • 본 논문에서는 SCORM 기반 시퀀싱 모델을 기반으로 학습객체의 구조에 대한 정보, 학습자에게 학습 객체를 어떻게 전달할 지를 결정하는 규칙 등을 포함하고 있는 컨텐츠 구조를 제시하고 학습 컨텐츠의 재사용과 공유가 가능하고 동일한 학습 컨텐츠에 서로 다른 교수법을 적용하여 교육의 효과를 달리할 수 있도록 시퀀싱을 위한 컨텐츠 패키지 메타데이터 생성기를 개발한다. 또한 학습자 정보 트래킹을 위한 SCO(Sharable Content Object)함수를 부착하여 학습 객체가 SCORM RTE(Run-Time Environment)와 통신 할 수 있도록 PIF(Package Interchange File)로 자동 패키징 시킨다.

  • PDF

CNVR Detection Reflecting the Properties of the Reference Sequence in HLA Region (레퍼런스 시퀀스의 특성을 고려한 HLA 영역에서의 CNVR 탐지)

  • Lee, Jong-Keun;Hong, Dong-Wan;Yoon, Jee-Hee
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.16 no.6
    • /
    • pp.712-716
    • /
    • 2010
  • In this paper, we propose a novel shape-based approach to detect CNV regions (CNVR) by analyzing the coverage graph obtained by aligning the giga-sequencing data onto the human reference sequence. The proposed algorithm proceeds in two steps: a filtering step and a post-processing step. In the filtering step, it takes several shape parameters as input and extracts candidate CNVRs having various depth and width. In the post-processing step, it revises the candidate regions to make up for errors potentially included in the reference sequence and giga-sequencing data, and filters out regions with high ratio of GC-contents, and returns the final result set from those candidate CNVRs. To verify the superiority of our approach, we performed extensive experiments using giga-sequencing data publicly opened by "1000 genome project" and verified the accuracy by comparing our results with those registered in DGV database. The result revealed that our approach successfully finds the CNVR having various shapes (gains or losses) in HLA (Human Leukocyte Antigen) region.

A CNV detection algorithm based on statistical analysis of the aligned reads (정렬된 리드의 통계적 분석을 기반으로 하는 CNV 검색 알고리즘)

  • Hong, Sang-Kyoon;Hong, Dong-Wan;Yoon, Jee-Hee;Kim, Baek-Sop;Park, Sang-Hyun
    • The KIPS Transactions:PartD
    • /
    • v.16D no.5
    • /
    • pp.661-672
    • /
    • 2009
  • Recently it was found that various genetic structural variations such as CNV(copy number variation) exist in the human genome, and these variations are closely related with disease susceptibility, reaction to treatment, and genetic characteristics. In this paper we propose a new CNV detection algorithm using millions of short DNA sequences generated by giga-sequencing technology. Our method maps the DNA sequences onto the reference sequence, and obtains the occurrence frequency of each read in the reference sequence. And then it detects the statistically significant regions which are longer than 1Kbp as the candidate CNV regions by analyzing the distribution of the occurrence frequency. To select a proper read alignment method, several methods are employed in our algorithm, and the performances are compared. To verify the superiority of our approach, we performed extensive experiments. The result of simulation experiments (using a reference sequence, build 35 of NCBI) revealed that our approach successfully finds all the CNV regions that have various shapes and arbitrary length (small, intermediate, or large size).

Comparison of Fecal Microbiota between Birth and Weaning of Halla Horses Using 16S rRNA Gene Amplicon Sequencing (16S 앰플리콘 시퀀싱 기반 한라마 출생시와 이유기의 분변 미생물 비교 분석)

  • Lee, Jongan;Kang, Young-Jun;Choi, Jae-Young;Shin, Sang-Min;Shin, Moon-Cheol
    • Journal of Life Science
    • /
    • v.32 no.12
    • /
    • pp.1005-1012
    • /
    • 2022
  • This study was conducted to investigate the taxonomic composition and diversity of fecal microbiota between birth and weaning stages of Halla horses using 16S rRNA gene amplicon sequencing analysis. Proteobacteria (35.7%) and Firmicutes (45.6%) were identified as the most common phylum in birth and weaning, respectively. Escherichia (19.7%) and Clostridium (14.0%) were observed as the most dominant genus in birth, and Fibrobacter (6.6%) was the highest in weaning. The results of α-diversity showed that the richness and evenness in microbial communities were statistically significant (p<0.001) in birth and weaning. The results of β-diversity indicated that the birth and weaning stages were clearly divided into two groups at the genus and species levels. Permutational multivariate analysis of variance (PERMANOVA) showed that the microbiota composition differences between birth and weaning were statistically significant (q<0.001). A linear discriminant analysis effect (LEfSe) was performed to select taxonomic makers between the birth and weaning stages. On the genus level, Escherichia, Bacteroides, Clostridium, and Methylobacterium were relatively abundant at birth, whereas Fibrobacter was more abundant at weaning. We expect that this research can be utilized as basic data in the identification of microbial communities involved in disease prevention and nutrient absorption in Halla horses.

A CNV Detection Algorithm (CNV 영역 검색 알고리즘)

  • Sang-Kyoon Hong;Dong-Wan Hong;Jee-Hee Yoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.11a
    • /
    • pp.356-359
    • /
    • 2008
  • 최근 생물정보학 분야에서 인간 유전체에 존재하는 CNV(copy number variation)에 관한 연구가 주목 받고 있다. CNV 영역은 1kbp-3Mbp 사리의 서열이 반복되거나 결실되는 변이 영역으로 정의된다. 우리는 선행연구에서 기가 시퀀싱(giga sequencing)의 결과 산출되는 DNA 서열조각인 리드(read)를 레퍼런스 시퀀스에 서열 정렬하여 CNV 영역을 찾아내는 새로운 CNV 검색 방식을 제안하였다. 후속 연구로서 본 논문에서는 DNA 서열에 존재하는 repeat 영역 문제를 해결하기 위한 새로운 방안을 제안하고, 리드의 출현 빈도 정보를 분석하여 CNV 영역을 찾아내는 CNV 영역 검색 알고리즘을 보인다. 제안된 알고리즘 Gaussian 분포를 갖는 출현 빈도 정보로부터 통계적 유의성을 갖는 영역을 추출하여 CNV 영역후보로 하고, 다음 경제 과정을 거쳐 최종의 CNV 영역을 추출한다. 성능 평가를 위하여 프로토타임 시스템을 개발하였으며, 시뮬레이션 실험을 수행하였다. 실험 결과에 의하여 제안된 방식은 반복되거나 결실되는 형태의 CNV 영역을 효율적으로 검출하며, 또한 다양한 크기의 CNV 영역을 효율적으로 검출할 수 있음을 입증한다.

The Biological Data Converter based on BSML for Sharing Information (정보 공유를 위한 BSML 기반의 생물학 데이터 변환기)

  • 김영억;정광수;정영진;차효성;류근호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.37-39
    • /
    • 2004
  • 현재 생물학 연구실에서 시퀀싱 실험을 통해 생성되거나 또는 공개용 생물 데이터베이스로부터 획득된 유전체 및 단백질 정보는 각각 이질적인 데이터형식을 사용하고 있다. 이 때문에, 생물정보를 분석하여 상호간의 정보를 효율적으로 사용하기 위해서는 공통된 형식의 데이터 표준화작업이 필수적이다. 그리고 이러한 이질적 데이터 형식에 대한 표준화 연구의 미비로 인하여 플랫 파일간의 정보공유에 어려움을 겪고 있다. 따라서, 이 논문에서는 다양한 유전체 및 단백질 정보를 관리.공유하기 위해 이질적인 포맷간의 맵핑 과정을 통하여 BSML(Bioinformatic Sequence Markup Language) 형태로 변환하고, 이를 객체관계형 데이터베이스(Object Relational DataBase)에 저장하는 시스템을 개발하였다. 그리고, 개발된 시스템은 생물정보 데이터의 표준화를 위해 개발된 XML(Extend Markup Language) 기반의 BSML을 이용함으로써 효율적으로 생물학 데이터들 간의 정보를 공유할 수 있으며, 개인 생물학 데이터베이스 구축이나 다양한 생물학적 데이터를 통합 관리하는 시스템에서 유용하게 쓰일 수 있다.

  • PDF

Seed기반의 short read aligner 구현에 관한 연구

  • Ji, Mingeun;Kim, Jeongkyu;Yi, Gangman
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.10a
    • /
    • pp.1107-1109
    • /
    • 2019
  • 차세대 게놈 시퀀싱(NGS) 기술이 발전하면서 방대하게 축적된 유전체 데이터를 분석하기 위해 다양한 시퀀스 정렬 연구가 진행되고 있다. 시퀀스 정렬 중 잘 알려진 BLAST에서는 휴리스틱 기반의 시퀀스 정렬을 수행하여 긴 리드 시퀀스에 대해 속도와 안정성이 보장되지만 짧은 리드 시퀀스에 대해서는 성능이 저하되는 문제가 있다. 이 문제를 해결하기 위해 본 논문에서는 레퍼런스 시퀀스와 쿼리 시퀀스를 Seed 기반으로 분리하여 정렬을 수행한다. 최종적으로는 contig를 추출하고 레퍼런스-쿼리간 유효한 contig만 선별하여 빠르게 짧은 리드 시퀀스들의 정렬을 수행할 수 있는 정렬기를 구현하고자 한다.

Research for clustering algorithm for the functional classification of genes (유전자의 기능분류를 위한 클러스터링 알고리즘 연구)

  • Han, Seok-Hyeon;Yi, Gangman
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.10a
    • /
    • pp.1149-1151
    • /
    • 2015
  • 차세대 유전정보 분석기 시퀀서의 개발은 양질의 시퀀싱 데이터를 증가시켰다. 수많은 유전정보는 유전자 분석의 새로운 연구 방향을 제시하였다. 본 논문은 유전자 분석 중에서 기존의 유전정보를 활용하여 유전자의 기능예측을 하고자 한다. 클러스터링 알고리즘의 정확도를 높이기 위해서 본 논문에서는 데이터 유사성 조절이 가능한 클러스터링 알고리즘을 적용하였다. 그 결과 데이터 유사성 조절을 할 경우에 그렇지 않을 경우보다 유전자 기능 예측의 정확도가 높아졌다. 따라서 제안된 데이터 유사성 조절 기법은 유전자 기능을 예측하는 방법에 정확도를 높일 수 있을 것으로 기대된다.

A Clinically Diagnosed Case of Multiple Epiphyseal Dysplasia (임상적으로 진단된 다발성 골단이형성증 1례)

  • Kim, Sun-Ja;Cho, Sung Yoon;Kim, Jinsup;Huh, Rimm;Kwun, Younghee;Lee, Jieun;Shim, Jongsup;Kim, Ok-Hwa;Jin, Dong-Kyu
    • Journal of The Korean Society of Inherited Metabolic disease
    • /
    • v.15 no.1
    • /
    • pp.49-54
    • /
    • 2015
  • Multiple epiphyseal dysplasia (MED) is one of the more common skeletal dysplasias. MED is characterized by joint pain and stiffness, a waddling gait, and/or mild short stature in childhood. Radiographic findings include delayed and irregular ossification of the epiphyses in multiple joints. Mutations in at least six different genes (COMP, MATN3, COL9A1, COL9A2, COL9A3, and DTDST) can cause MED, and it can be either dominant or recessive inheritance. Molecular diagnosis is important for accurate prognosis and genetic counselling. COMP mutation is the most common form of MED in Western. But, MATN3 mutation was reported as the most common type of MED in Korea. Here, we describe a boy who was diagnosed as MED by clinical and radiological features. Hip radiograph of the patient was suggested MATN3 mutation. But knee radiograph was suggested COMP mutation. MATN3 and COMP mutations direct sequencing, but were no mutation. So we tested whole exome sequencing, but significant variant was not detected as known MED six genes mutations. The patient was diagnosed as having MED clinically and radiologically. Further study to identify the other responsible genes for MED is needed.