• 제목/요약/키워드: 시퀀싱

검색결과 127건 처리시간 0.03초

고성능컴퓨터의 고신뢰도보장을 위한 이중(Duplex) 시스템의 작업 할당/시퀀싱 기법 연구 (A Task Scheduling to Minimize the Effect of Coincident Faults in a Duplex Controller Computer with Time Constraints)

  • 임한승;김학배
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1999년도 하계학술대회 논문집 G
    • /
    • pp.2882-2884
    • /
    • 1999
  • 본 연구는 시스템의 신뢰도(reliability)를 향상시키기 위해 사용되는 이중(Duplex) 시스템에서 EMI(전자기파 간섭현상) 같은 원인에 의한 동시 발생적(coincident) 고장의 영향을 최소화하는 기법을 제안하고 신뢰성 있는 고성능 컴퓨터를 위한 운영체계 및 H/W 구조의 설계와 최적 평가에 기여하는데 그 목적이 있다. 이중 시스템에 동시 발생적 고장이 일어나면 두 개의 모듈이 고장의 영향을 받게 되므로 고장 포용능력을 상실하게 된다. 이 같은 영향을 최소화하기 위해서 같은 작업들을 가능한 한 다른 시간대로 중복 수행하도록 시퀀싱(sequencing) 및 스케줄링(scheduling) 함으로써 동시발생적 고장으로 야기되는 전체 작업의 고장 결과를 피할 수 있다 또한 실시간 시스템에서 작업들은 기본적으로 수행이 완료되어야 할 시간적 제약(hard deadline)을 지니고 있으므로. 이러한 엄격한 마감시한 내에서 모든 작업을 완수하고 기본조건을 만족시키고자 한다.

  • PDF

개별화 학습 지원을 위한 학습객체 기본 구조 설계 (Design of LO's Basic Structure for supporting Individualized Learning)

  • 홍지영;정영식;송기상
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.553-555
    • /
    • 2003
  • e-Learning 컨텐트 설계에 있어 객체지향기법에 근간한 학습객체 기반 설계에 많은 관심이 모아지고 있다. 학습객체는 기존의 컨텐트가 하나의 커다란 덩어리로 이루어져 있어 동일한 내용에 관해서도 많은 코스들이 생성되었던 재사용성의 문제를 해결하며 상호운용성, 접근성. 내구성 등의 잇점을 제시하고 있다. 이러한 학습객체는 레고모형에 비유되어 각각의 학습자마다 서로 다른 조합의 코스를 제공한다고 하지만, 현재의 시퀀싱된 형태는 CBT 수준의 분기수준에 머물러 있다. 본 연구에서는 개별화 학습을 지원할 수 있는 시퀀싱 설계를 위하여 학습객체 구조의 관점에서 접근하며, 이러한 학습 설계에 기초가 되는 학습객체의 기본 구조를 제안하고자 한다.

  • PDF

RNA-Seq 정렬 알고리즘의 동향 (Recent Trends in RNA-Seq Alignment Algorithms)

  • 유승학;최민석;윤성로
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.669-671
    • /
    • 2014
  • High Throughput Sequencing (HTS) 기술의 발달로 인해 시퀀싱 비용이 감소함에 따라 다양한 분야에서 이를 활용한 융합 연구가 활발하게 진행되고 있다. HTS 기술에서 가장 중요한 부분은 수백만개의 short read 들을 표준유전체 (reference genome)에 정렬시키는 것인데 RNA 시퀀싱 (RNA-Seq) 의 경우 RNA splicing 으로 인해 일반적인 aligner 로 처리가 불가능하다. 복잡한 RNA-Seq 정렬 문제를 해결하기 위해 그동안 다양한 알고리즘들이 제안되어 왔다. 본 논문에서는 RNA-seq 정렬분야에서 잘 알려진 알고리즘들과 최신 알고리즘들을 살펴봄으로써 RNA-seq 정렬 알고리즘의 동향을 살펴보고자 한다.

단세포 RNA 시퀀싱 데이터를 위한 가중변수 스펙트럼 군집화 기법 (One-step spectral clustering of weighted variables on single-cell RNA-sequencing data)

  • 박민영;박세영
    • 응용통계연구
    • /
    • 제33권4호
    • /
    • pp.511-526
    • /
    • 2020
  • 단세포 RNA 시퀀싱 데이터(single-cell RNA-sequencing data, 이하 단세포 RNA 데이터)는 세포 조직으로부터 추출한 각 단세포 별 유전자의 신호를 기록한 데이터로, 세포 간의 이질성을 파악하는 것을 주요 목적으로 한다. 그러나 단세포 RNA 데이터는 샘플링 및 기술적인 한계로 인해 결측비율이 높고, 노이즈가 크다. 이러한 이유 때문에 기존의 군집화 방법을 적용하는 데에 한계가 존재한다. 본 논문에서는 단세포 RNA 데이터 분석에서 모티브를 얻어 스펙트럼 군집화(spectral clustering) 기반의 방법을 제안한다. 특히 유사도 행렬(similarity matrix) 계산에서 유전자 별로 가중치를 부여하여 기존의 단세포 데이터 분석 방법과 차별화하였다. 제안하는 군집화 방법은 유전자별 가중치를 부여함과 동시에 세포를 군집화한다. 군집화는 반복 알고리즘을 통해 제안하는 비볼록식(non-convex optimization)을 풀어 진행한다. 또한 실데이터 적용과 시뮬레이션을 통해 제안하는 군집화 방법이 기존의 방법보다 군집을 잘 구분하는 것을 보인다.

Illumina를 이용한16S rRNA 기반 미생물생태분석에서 분변의 동결건조에 의한 인공적인 시퀀스 생성 감소효과 (Freeze-drying feces reduces illumina-derived artefacts on 16S rRNA-based microbial community analysis)

  • 김정만;운노타쯔야
    • Journal of Applied Biological Chemistry
    • /
    • 제59권4호
    • /
    • pp.299-304
    • /
    • 2016
  • PCR 산물을 이용한 시퀀싱방법 중 Illumina 플랫폼으로 시퀀싱을 수행하면 100개 이상의 인위적인 시퀀스가 생겨나며, 그러한 인위적으로 형성되는 시퀀스에 의해 Operational taxonomic units를 기반으로 한 미생물생태 변화 및 네트워크 분석에 영향을 미친다. 이러한 문제점이 있음에도 불구하고 분변미생물생태를 분석하는데 Illumina에서 제공하고 있는 시퀀싱을 주된 방법으로 사용하고 있으며, 또한 그러한 시퀀스 기반의 분변미생물 생태분석 결과는 분변샘플상태(i.e., 분변 보관 기간, 분변양, 분변의 신선도)에 따라 상이하게 나타난다. 본 연구에서는 분변샘플의 동결건조가 시퀀스 데이터의 퀄리티를 향상시키는지 관해 조사하였으며, 이를 통해 분변샘플에 동결건조처리는 전체적인 미생물생태구조를 변화시키지는 않지만 인위적으로 형성되었을 가능성이 있는 시퀀스의 수를 감소시키는 것으로 확인되었다. 따라서, 분변으로부터 DNA를 추출하기 이전에 동결건조처리하는 방법을 Illumina 기반의 분변미생물생태분석에 사용하는 것을 권장한다.

암 유전자 배열에서 체세포 돌연변이 발견을 위한 유전자형 조사 시스템 (Genotype-Calling System for Somatic Mutation Discovery in Cancer Genome Sequence)

  • 박수영;정채영
    • 한국정보통신학회논문지
    • /
    • 제17권12호
    • /
    • pp.3009-3015
    • /
    • 2013
  • 차세대 시퀀싱(NGS)은 암에서 전사체 싱글 뉴클레오티드 변형 발견과 모든 지놈 발견을 가능하게 한다. 어느 한 위치에서 배열된 다수의 짧은 리드 시퀀스로부터 개인의 유전자형을 결정하는 가장 기초적인 방법이다. Byesian 알고리즘은 사후 유전자형 확률을 사용하여 파라미터 추정한다. 또 다른 방법인 EM 알고리즘은 최대 가능성 추정 방법을 사용해서 관측된 데이터에서 파라미터를 추정한다. 본 논문에서는 새로운 유전자형 조사 시스템을 제안하고 시퀀싱 에러 비율과 체세포 돌연 변이 상태 그리고 유전자형 확률의 사후 추정치에 관한 샘플 크기(S = 50, 100, 500)의 영향을 비교 분석하였다. 그 결과 작은 샘플 크기 50에서도 Byesian 알고리즘을 사용하여 추정한 파라미터가 EM 알고리즘 보다 더 정확하게 실제 파라미터에 근접하였다.

파이로시퀀싱을 이용한 상업용 전통누룩의 미생물 군집분석 (Microbial community analysis of commercial nuruk in Korea using pyrosequencing)

  • 박지희;김성건;이용재;정장호
    • 한국식품과학회지
    • /
    • 제50권1호
    • /
    • pp.55-60
    • /
    • 2018
  • 과거 전통방식으로 제조되는 4가지 상업용 시판누룩들을 파이로시퀀싱 방법을 이용하여 미생물군집을 확인하였다. 누룩시료의 진균류 총 유효 sequencing read수는 14,800이였으며 후속 quality trimming, denoising와 chimera removal와 같은 작업을 통해 얻은 평균 sequence read의 수는 3,494이였다. 진균류의 phylum 수준에서 SH, JJ, SS 시료에서는 자낭균류가 우세한 것으로 확인되었으나 SJ는 접합균류가 우세하였다. 발효력과 관계가 있는 것으로 알려진 Saccharomycopsis속 효모분포는 제조과정에서 상대적으로 발효시간이 길었던 SH와 SS의 경우에서 더 많았다. 세균류의 파이로시퀀싱결과 유효 sequencing read수는 31,485이였으며 평균 sequence read는 7,871이였다. 세균의 phylum 수준에서는 모든 시료에서 Firmicutes문이 우세한 것으로 분석되었다. SH의 경우 주로 Lactobacillus속, Leuconostoc속, 기타 Pediococcus속과 이를 포함하는 Lactobacillales목과 Leuconostocaceae과 등 젖산균들이 우세균주로 분포하였다. JJ와 SJ의 경우, 각각 Staphylococcus속과 Bacillus속이 우세균으로 나타났다.

구간형 데이터 검정법을 이용한 유전자 탐색에 관한 연구 (A Study on Gene Search Using Test for Interval Data)

  • 이성건
    • Journal of the Korean Data Analysis Society
    • /
    • 제20권6호
    • /
    • pp.2805-2812
    • /
    • 2018
  • 본 연구는 생명정보학(bio-informatics) 분야 중, 특정 병에 관련된 유전자 위치를 찾고자 DNA 시퀀싱(DNA sequencing) 방법을 이용한 메틸화(methylation) 데이터의 분석에 관한 것이다. 반복적인 시퀀싱 과정을 통해 도출되는 메틸화 여부 자료를 비율로 표현한 메틸화 점수는 0과 1사이의 값을 가지게 된다. 이러한 데이터에 집단별 메틸화 점수의 차이를 검토하기 위해 t-검정을 단순히 적용하는 것은 정규분포의 가정에 위배된다. 또한 메틸화 점수 생성과정에서 시퀀싱의 반복수에 따라 결과가 달라 질 수 있으므로 이러한 오차를 고려해서 분석할 수 있는 방법도 필요하다. 이에 본 논문에서는 메틸화 데이터를 하나의 숫자 데이터가 아닌 불확실성을 포함하는 구간형(interval) 데이터로 변환하여 분석하는 심볼릭 데이터 분석(symbolic data analysis) 및 구간형 K-S 검정법을 적용하였다. 또한 구간형 데이터로 변환하는 과정에서 정규분포를 이용하지 않고 베타분포를 이용하여 메틸화 점수의 특성을 반영하여 분석할 수 있게 하였다. 자료분석을 위하여 174명의 실제 암환자 및 정상인들의 DNA 시퀀싱 데이터를 이용하여 제안한 방법의 성질을 살펴보았다. t-검정은 위치모수에 관한 검정만 가능한 반면, 구간형 K-S 통계량은 구간자료에 대해 위치모수뿐만 아니라 분포함수의 이질성에 검정할 수 있으므로 t-검정이 놓칠 수 있는 유의미한 유전자 위치를 찾아낼 수 있음을 확인하였다.

PDA기반의 사칙연산학습 운영시스템 설계 및 개발 (Design and Development of Arithmetic Operating Learning Management System based on PDA)

  • 정광식;손경아
    • 컴퓨터교육학회논문지
    • /
    • 제12권3호
    • /
    • pp.53-62
    • /
    • 2009
  • 정보통신 기술의 발달로 다양한 교수매체가 등장함에 따라 교수매체에 적합한 콘텐츠 제공이 학습의 중요한 요소로 주목받고 있는 가운데, 특히 PDA와 같은 이동통신 학습 환경에 대한 학습자 요구가 꾸준히 증가하고 있다. 본 논문은 초등학생들의 수학 학습(사칙연산)을 보조하기 위한 이동 학습단말기로서의 PDA 매체를 이용한 학습콘텐츠 설계 기법, 즉 학습 콘텐츠 내에서의 학습 시퀀싱 모델과 학습 콘텐츠사이의 학습 시퀀싱 모델을 설계하였다. 그리고 이를 PDA에서 구현하고, 이를 지원해주는 학습운영시스템을 설계하고 개발하였다. 또한 PDA를 학습 보조 단말기로 활용할 수 있는 실질적인 학습 서비스를 구현하였다. 대한 요약을 기술하시면 됩니다.

  • PDF

A MA-plot-based Feature Selection by MRMR in SVM-RFE in RNA-Sequencing Data

  • Kim, Chayoung
    • 한국정보기술학회논문지
    • /
    • 제16권12호
    • /
    • pp.25-30
    • /
    • 2018
  • 유전자 규정 네트워크 (GRN)에 RNA-시퀀싱 데이터를 활용할 때, 해당 유전자와 환경과의 상호 작용에 의해서 생기는 형질들 중에서 연관성이 높은 유전자로 GRN을 구성하는 것은 상당히 어려운 일이다. 본 연구에서는 Big-Data의 RNA-시퀀싱 자료들로, 지지 벡터 머신 회귀 특징 추출(SVM-RFE) 에 근거하여, 연관성이 높은 유전자(maximum-relevancy)는 추출하고, 연관성이 낮은 유전자(minimum-redundancy)는 제거하는 MRMR 필터 방법을 집중도 의존 정규화(intensity-dependent normalization, DEGSEQ)에 기반 하여 데이터의 정밀성을 높여, 소수 연관성 높은 유전자만 판별해 내는 방법을 사용한다. 제안한 방법은 R 언어 패키지를 사용하여 편리함과 동시에, 다른 기존의 방법을 비교하였을 때, Big-Data의 시간 활용도를 높이면서, 동시에 높은 연관성 있는 유전자만을 잘 추출해 냄을 확인하였다.