• Title/Summary/Keyword: 유전체 분석

Search Result 1,196, Processing Time 0.042 seconds

Seed기반의 short read aligner 구현에 관한 연구

  • Ji, Mingeun;Kim, Jeongkyu;Yi, Gangman
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.10a
    • /
    • pp.1107-1109
    • /
    • 2019
  • 차세대 게놈 시퀀싱(NGS) 기술이 발전하면서 방대하게 축적된 유전체 데이터를 분석하기 위해 다양한 시퀀스 정렬 연구가 진행되고 있다. 시퀀스 정렬 중 잘 알려진 BLAST에서는 휴리스틱 기반의 시퀀스 정렬을 수행하여 긴 리드 시퀀스에 대해 속도와 안정성이 보장되지만 짧은 리드 시퀀스에 대해서는 성능이 저하되는 문제가 있다. 이 문제를 해결하기 위해 본 논문에서는 레퍼런스 시퀀스와 쿼리 시퀀스를 Seed 기반으로 분리하여 정렬을 수행한다. 최종적으로는 contig를 추출하고 레퍼런스-쿼리간 유효한 contig만 선별하여 빠르게 짧은 리드 시퀀스들의 정렬을 수행할 수 있는 정렬기를 구현하고자 한다.

Method of Image Similarity Analysis Using Sequence Alignment of Colors (색상 서열 비교를 통한 영상의 유사도 분석 기법)

  • Jung, In-Joon;Woo, Gyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.04a
    • /
    • pp.426-429
    • /
    • 2011
  • 영상처리를 이용한 영상간의 유사도 비교 기법은 영상의 검색 및 영상의 자동 인식 등을 위한 연구로 최근 각광받고 있다. 최근 영상 처리 기법은 화소의 질적 향상 및 처리시간 최적화, 효율적인 특정 요소의 추출 등 다양한 방법으로 시도되고 있다. 특히, 영상의 유사도 비교는 유사 영상 검색과 같은 경우에 많이 쓰인다. 영상의 유사도를 비교하기 위한 기법으로는 영상 데이터의 특징에 따라 대상 영역을 여러 영역으로 나누는 영역분할 기법과 군집화, 퍼지, 유전자 알고리즘 등이 있다. 본 논문에서는 영상을 HSV 색공간으로 변환한 후 색상 값에 대하여 전역 정렬 기법을 사용하는 유사도 측정 방법을 제시한다. 전역 정렬 기법은 유전자 서열 비교 기법 중 하나로서 두 유전체의 유사도를 측정하는데 사용된다. 유사도 측정 효율을 높이기 위해 색상 값을 8단계로 양자화하여 영상의 서열을 생성하였다. 실험결과 제시한 방법을 영상 회전이나 대칭, 글자 삽입 등의 간단한 연산에 크게 영향을 받지 않는 것으로 드러났다.

A CNV Detection Algorithm (CNV 영역 검색 알고리즘)

  • Sang-Kyoon Hong;Dong-Wan Hong;Jee-Hee Yoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.11a
    • /
    • pp.356-359
    • /
    • 2008
  • 최근 생물정보학 분야에서 인간 유전체에 존재하는 CNV(copy number variation)에 관한 연구가 주목 받고 있다. CNV 영역은 1kbp-3Mbp 사리의 서열이 반복되거나 결실되는 변이 영역으로 정의된다. 우리는 선행연구에서 기가 시퀀싱(giga sequencing)의 결과 산출되는 DNA 서열조각인 리드(read)를 레퍼런스 시퀀스에 서열 정렬하여 CNV 영역을 찾아내는 새로운 CNV 검색 방식을 제안하였다. 후속 연구로서 본 논문에서는 DNA 서열에 존재하는 repeat 영역 문제를 해결하기 위한 새로운 방안을 제안하고, 리드의 출현 빈도 정보를 분석하여 CNV 영역을 찾아내는 CNV 영역 검색 알고리즘을 보인다. 제안된 알고리즘 Gaussian 분포를 갖는 출현 빈도 정보로부터 통계적 유의성을 갖는 영역을 추출하여 CNV 영역후보로 하고, 다음 경제 과정을 거쳐 최종의 CNV 영역을 추출한다. 성능 평가를 위하여 프로토타임 시스템을 개발하였으며, 시뮬레이션 실험을 수행하였다. 실험 결과에 의하여 제안된 방식은 반복되거나 결실되는 형태의 CNV 영역을 효율적으로 검출하며, 또한 다양한 크기의 CNV 영역을 효율적으로 검출할 수 있음을 입증한다.

Inheritance Study of Male Sterile Transformants Containing Pollen-specific Promoter and Diphtheria Toxin A Gene (수술특이프로모터와 디프테리아 독성 유전자에 의한 웅성불임 형질전환체의 후대 유전분석)

  • Park, Young-Doo;Kim, Hyun-Uk;Park, Beom-Seok;Jin, Yong-Moon
    • Horticultural Science & Technology
    • /
    • v.18 no.3
    • /
    • pp.342-347
    • /
    • 2000
  • The objectives of this study were to investigate the genetic and phenotypic features of male sterile transformants by pollen-specific expression of diphtheria toxin gene and to find out inheritance patterns of transgene to the next generation. When backcrossed (BC) progenies were tested for expression of kanamycin resistance ($Km^R$), 9 lines out of 13 lines, except 4 lines ($BC_{1}5-13,\;BC_{1}5-23,\;BC_{1}5-28,\;BC_{1}5-32$), showed the ratio of $Km^R$ to kanamycin sensitive ($Km^S$), from 1:30 to all $Km^S$. As a result, they were much lower than Mendelian segregation of a dominant gene. To determine whether male sterility is a heritable and stable trait, 5 male sterile plants ($BC_{1}5-13,\;BC_{1}5-14,\;BC_{1}5-23,\;BC_{1}5-32,\;BC_{1}5-33$ lines) which had different transgene copy numbers were backcrossed as female parents with pollens from wild type. To confirm the existence of the DTx-A gene in the genome of the progenies, PCR was conducted using specific primers of the DTx-A coding region. A PCR band of 428 bp was obtained from each generation, which is the predicted size of the DTx-A gene fragment. Trangenes were inherited to the next $BC_4T_0$ progenies and showed male sterility, however, based on the copy numbers of DTx-A gene male sterile plants did not show predicted ratio. When male sterile plants were backcrossed with fertile plants, fruit capsule sizes and seed settings were relatively reduced from those of selfing wild type plants. The fruit sizes and seed settings were reduced in proportion to the increase in the copy number of DTx-A gene.

  • PDF

Investigation of Conserved Genes in Microorganism (미생물의 보존적 유전자 탐색)

  • Lee Dong-Geun;Lee Jae-Hwa;Lee Sang-Hyeon;Ha Bae-Jin;Shim Doo-Hee;Park Eun-Kyung;Kim Jin-Wook;Li Hua-Yue;Nam Chun-Suk;Kim Nam Young;Lee Eo-Jin;Back Jin-Wook;Ha Jong-Myung
    • Journal of Life Science
    • /
    • v.15 no.2 s.69
    • /
    • pp.261-266
    • /
    • 2005
  • To figure out conserved genes in 66 microbial species and measuring the degree of conservation, analyses based on COG (Clusters of Orthologous Groups of proteins) algorithm were applied. Sixty-six microbial genomes, including three eukaryotes, hold 63 conserved orthologs in common. The majority $(82.5\%)$ of the conserved genes was related to translation, meaning the importance of protein in living creatures. Ribosomal protein S12 (COG0048) and L14 (COG0093) were more conserved genes than others from the distance value analysis. Phylogenetically related microbes grouped in genome analysis by average and standard deviation of 63 conserved genes. The 63 conserved genes, found in this research, would be useful in basic research and applied ones such as antibiotic development.

DNA 검사기법을 이용한 PSE육 생산 돼지 진단

  • Kim, Hye-Jeong;Sin, Seong-Cheol;Chae, Ji-Seon;Choe, Eun-Ju;Kim, Hui-Seon;Kim, Hyeon-Seok;Jeong, Gu-Yong;Jeong, Ui-Ryong
    • Proceedings of the Korean Society for Food Science of Animal Resources Conference
    • /
    • 2004.05a
    • /
    • pp.177-180
    • /
    • 2004
  • 본 연구는 PCR-RFLP 및 PCR-SSCP 기법을 이용하여 PSE 돈육을 생산하는 PSS 돼지 유전자 진단 기술을 개발하고 이를 이용한 국내 종돈 및 교잡 비육돈의 PSS 유전자 출현 빈도를 파악하고자 수행하였다. 돼지 PSS의 원인이 되는 ryanodine receptor 유전자의 단일염기 돌연변이 $C{\rightarrow}T$ ; $Arg\;{\rightarrow}\;Cys$)를 포함하는 134 bp 영역을 PCR로 증폭한 후 RFLP 및 SSCP 기법으로 분석한 결과 동형접합체의 정상(N/N), 이형접합체의 잠재성 개체 (N/n) 그리고 돌연변이 유전자를 동형접합체 상태로 갖는 PSS 감수성 개체(n/n)에 각각 특이적인 유전자형이 검출되었다. 특히, PCR-SSCP기법을 이용한 RYR1 유전자 돌연변이 검출 방법은 보다 신속 간편하면서도 상대적으로 분석비용이 저렴한 정확성이 높은 PSS 돼지 진단기술로서 대규모 돼지집단검색이나 RFLP 방법으로 판정이 불확실한 시료의 재검에 효율적으로 이용할 수 있을 것으로 판단된다.

  • PDF

Design of MAHA Supercomputing System for Human Genome Analysis (대용량 유전체 분석을 위한 고성능 컴퓨팅 시스템 MAHA)

  • Kim, Young Woo;Kim, Hong-Yeon;Bae, Seungjo;Kim, Hag-Young;Woo, Young-Choon;Park, Soo-Jun;Choi, Wan
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.2 no.2
    • /
    • pp.81-90
    • /
    • 2013
  • During the past decade, many changes and attempts have been tried and are continued developing new technologies in the computing area. The brick wall in computing area, especially power wall, changes computing paradigm from computing hardwares including processor and system architecture to programming environment and application usage. The high performance computing (HPC) area, especially, has been experienced catastrophic changes, and it is now considered as a key to the national competitiveness. In the late 2000's, many leading countries rushed to develop Exascale supercomputing systems, and as a results tens of PetaFLOPS system are prevalent now. In Korea, ICT is well developed and Korea is considered as a one of leading countries in the world, but not for supercomputing area. In this paper, we describe architecture design of MAHA supercomputing system which is aimed to develop 300 TeraFLOPS system for bio-informatics applications like human genome analysis and protein-protein docking. MAHA supercomputing system is consists of four major parts - computing hardware, file system, system software and bio-applications. MAHA supercomputing system is designed to utilize heterogeneous computing accelerators (co-processors like GPGPUs and MICs) to get more performance/$, performance/area, and performance/power. To provide high speed data movement and large capacity, MAHA file system is designed to have asymmetric cluster architecture, and consists of metadata server, data server, and client file system on top of SSD and MAID storage servers. MAHA system softwares are designed to provide user-friendliness and easy-to-use based on integrated system management component - like Bio Workflow management, Integrated Cluster management and Heterogeneous Resource management. MAHA supercomputing system was first installed in Dec., 2011. The theoretical performance of MAHA system was 50 TeraFLOPS and measured performance of 30.3 TeraFLOPS with 32 computing nodes. MAHA system will be upgraded to have 100 TeraFLOPS performance at Jan., 2013.

Design and Implementation of Memory-Centric Computing System for Big Data Analysis

  • Jung, Byung-Kwon
    • Journal of the Korea Society of Computer and Information
    • /
    • v.27 no.7
    • /
    • pp.1-7
    • /
    • 2022
  • Recently, as the use of applications such as big data programs and machine learning programs that are driven while generating large amounts of data in the program itself becomes common, the existing main memory alone lacks memory, making it difficult to execute the program quickly. In particular, the need to derive results more quickly has emerged in a situation where it is necessary to analyze whether the entire sequence is genetically altered due to the outbreak of the coronavirus. As a result of measuring performance by applying large-capacity data to a computing system equipped with a self-developed memory pool MOCA host adapter instead of processing large-capacity data from an existing SSD, performance improved by 16% compared to the existing SSD system. In addition, in various other benchmark tests, IO performance was 92.8%, 80.6%, and 32.8% faster than SSD in computing systems equipped with memory pool MOCA host adapters such as SortSampleBam, ApplyBQSR, and GatherBamFiles by task of workflow. When analyzing large amounts of data, such as electrical dielectric pipeline analysis, it is judged that the measurement delay occurring at runtime can be reduced in the computing system equipped with the memory pool MOCA host adapter developed in this research.

Analysis of Indoor Channel Modeling in Millimeter-Wave Band (밀리미터파 대역의 실내 채널 모델링 분석)

  • Lee, Won-Hui;Pyo, Seongmin
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.16 no.4
    • /
    • pp.53-58
    • /
    • 2016
  • A ray tracing method to analyze the propagation channel characteristics for a millimeter-wave indoor wireless communication system is presented. Reflected rays from planar as well as rough surfaces are included. Transmitted rays though a thin dielectric slab are considered. Maps representing received power levels and RMS delay spread from a transmitter in a rectangular room are shown. The received power levels in the empty room for bottom's roughness factors of 0 and 0.13 are represented. The simulation results are well consistent with the calculation of Friis equation with reflection coefficient. Any size of furniture the shape of plane form can be positioned anywhere in the room.