• 제목/요약/키워드: 서열정렬

검색결과 105건 처리시간 0.027초

다중 관계 그래프를 이용한 유전체 보존영역의 계층적 시각화와 개략적 전사 annotation 도구 (Rough Computational Annotation and Hierarchical Conserved Area Viewing Tool for Genomes Using Multiple Relation Graph.)

  • 이도훈
    • 생명과학회지
    • /
    • 제18권4호
    • /
    • pp.565-571
    • /
    • 2008
  • 생물정보학의 발전으로 다양한 형태의 생물정보가 컴퓨터 프로그램에 의해 양산되고 있다. 단순한 서열간의 비교나 작은 규모의 자료를 처리하기 보다는 다각화된 정보와 대규모의 생물정보를 취급하고 있다. 그 중에서 시각화와 annotation를 위한 도구개발은 지난 10년간 많은 연구가 되고 있는 분야이다. 그럼에도 일반화된 도구 개발은 생물정보의 다양성과 사용자 요구의 다양화로 인해 매우 어렵다. 본 논문에서는 유전체간 알려진 정보와 다중 관계 그래프를 이용하여 이를 annotation하고 시각화하는 GenoVA 시스템을 제안한다. 다중 정렬을 위한 몇 개의 프로그램이 존재하지만 그 방법들이 서열내의 복잡성 때문에 많은 정보가 누락된다. 따라서 제안된 방법에서는 pairwise alignment를 확장하여 모든 유전체간 비교를 통해 연관성 도출한다. 유전체간 보존되는 영역의 빈도수와 BLAST 점수가 높은 것을 블록노드라 하고 이들 간의 연관관계를 다중 관계 그래프로 표현하였다. 또한 GenoVA는 알려진 정보, COG, 유전자를 시각화하고 다중 관계 그래프의 한 영역을 중심으로 클러스터링된 경로를 계층적으로 보여주었다. 이때 누락되거나 알려지지 않은 유전자나 다른 annotation정보 추출할 수 있다. 본 논문의 실험을 위해 열 개의 박테리아 유전체가 사용되었고 시각화와 annotation을 위한 자료로 활용하였다. GenoVA는 새로운 유전체에 대한 개략적이고 전산적 annotation을 직관적이고 편리하게 제공한다.

도시부 경로자료를 이용한 통행의 공간적 규칙성 분석 (Analysis of Spatial Trip Regularity using Trajectory Data in Urban Areas)

  • 이수진;장기태
    • 한국ITS학회 논문지
    • /
    • 제17권6호
    • /
    • pp.96-110
    • /
    • 2018
  • 최근 정보통신기술의 발달로 다양한 통행 정보 수집이 용이해지면서, 신규 교통정보 생성에 대한 연구가 주목받고 있다. 그 중 수요 및 교통량에 대한 추정 및 예측은 교통 운영에 필수적인 주요 지표 중 하나로, 특정 지점 혹은 구간의 통행 패턴이 반복됨을 전제로 한다. 기존에는 이러한 통행 규칙성을 증명하기 위해 설문 방식을 사용하였으나, 해당 방식은 높은 비용과 응답자 기억에 의존하는 응답으로 높은 정확도를 확보하기에는 한계가 있었다. 최근 ETC시스템, 스마트카드 등의 방법으로 통행데이터 수집이 용이해지면서, 다양한 시각에서 통행 규칙성을 규명하고자 하는 연구가 진행되고 있다. 본 연구에서는 대구광역시의 대규모 경로형 데이터를 분석하여 개별통행자가 여러 날에 걸쳐 공간적으로 유사한 통행사슬을 형성하는 것을 확인하였다. 이를 위하여 공간적 통행 유사성을 새롭게 정의하며, 서열정렬 알고리즘인 Dynamic Time Warping을 이용하여 일별 통행사슬 간 공간적 차이를 산정한다. 또한 산출된 공간적 통행 규칙성을 통해 고정적 교통수요 추정의 지표 및 교통서비스로의 활용방안을 논 하고자 한다.

돼지 SLA class III 영역 내 C4B 및 BAT2의 cSNP 동정 및 이를 이용한 유전자형 분석 (cSNP Identification and Genotyping from C4B and BAT2 Assigned to the SLA Class III Region)

  • 김재환;임현태;서보영;이상호;이재봉;유채경;정은지;전진태
    • Journal of Animal Science and Technology
    • /
    • 제49권5호
    • /
    • pp.549-558
    • /
    • 2007
  • C4B 및 BAT2는 SLA class III 영역에 존재하며, 최근 들어 사람의 질병과의 연관성이 보고되고 있다. GenBank database로부터 수집된 사람과 마우스의 C4B 및 BAT2의 CDS를 염기정렬하여 상동성이 높은 부분에서 primer를 제작한 후 RT-PCR 및 RACE-PCR을 수행하여 돼지 C4B 및 BAT2 유전자의 CDS 서열을 결정하였다. 염기서열이 결정된 돼지 C4B와 BAT2의 CDS 길이가 각각 5226 bp와 6501 bp로 나타났다. 이들 각각의 CDS 및 아미노산 서열을 사람 및 마우스와 비교한 결과 CDS는 76~87%, 아미노산 서열은 72~90%의 상동성을 보였으며, C4B가 BAT2에 비해 다소 낮게 나타났다. 두 유전자에서 나타나는 cSNP를 분석하기 위해서 exon 영역을 증폭하기 위한 primer를 제작하였으며, 돼지 6품종을 대상으로 direct sequencing을 실시하였다. 그 결과 C4B로부터 4개, BAT2로부터 3개의 cSNP가 확인되었다. 또한 7개의 cSNP 중 C4B의 C4248T를 제외한 6개의 cSNP에 의해서 아미노산 치환이 발생하였다. 동일한 DNA를 사용하여 7개의 cSNP를 대상으로 Multiplex-ARMS 방법을 사용하여 유전자형 분석을 실시한 결과 direct sequencing 결과와 일치하였다. Multiplex-ARMS 방법의 재현성을 재확인하기 위해 무작위로 2개의 DNA 시료를 선택하여 direct sequencing과 Multiplex-ARMS 분석을 실시하여 유전자형이 일치함을 다시 확인하였다. 따라서 본 연구에서 확인된 7개의 cSNP는 SLA class III 지역의 haplotype 분석을 위한 기초 자료로 사용될 수 있으며, Multiplex- ARMS 기법은 이종장기 개발에 필수적인 SLA 전체 영역 내 유전자들의 유전자형 분석을 위한 효율적인 분석방법이라고 사료된다.

한국산 좀개구리밥속(개구리밥과)의 분류학적 실체에 대한 재고 (A Taxonomic Reconsideration of the Genus Lemna L. (Lemnaceae) in Korea)

  • 김용인;심상인;박진희
    • 한국환경생태학회지
    • /
    • 제31권4호
    • /
    • pp.349-364
    • /
    • 2017
  • 좀개구리밥속(Lemna L.)이 속하는 개구리밥과(Lemnaceae Martinov)는 다년생 초본으로, 5속 약 40종이 극 지방을 제외한 전세계에 널리 분포한다. 좀개구리밥속 식물은 피자식물 중 크기가 가장 작고 형태가 단순한 부유성의 단자엽수생식물로 영양번식이 매우 빨라 약 3일마다 배로 증가하는 특성을 보여 수환경 오염 피해 평가나 독성 시험에 이용되는 등 유용성이 큰 식물로 평가되고 있다. 우리나라의 좀개구리밥속 종 분포에 대해서는 학자별로 다른 학명을 쓰기도 하였으나 1종이 존재하는 것으로 여러 학자들이 보고해 왔다. 본 연구에서는 한국산 좀개구리밥속 식물에서 관찰된 외부 형태적 변이에 주목하여, 2종 이상일 가능성을 염두에 두고 그 실체를 규명하고자 분자계통학적 방법으로 연구를 수행하였다. 전국적으로 분포하는 좀개구리밥속 식물 37개체군의 엽록체 DNA atpF-H 구간 염기서열을 결정한 결과, 염기서열 길이는 463-483bp인 것으로 확인되었고 37개체군의 염기서열을 정렬한 길이는 488bp였으며, 47개 뉴클레오티드지점에서 변이가 나타났다. 한국산 좀개구리밥속 식물 37개체군의 엽록체 DNA atpF-H 구간 염기서열은 크게 두 개의 유형으로 나누어졌으며, 계통분석 결과에서도 최대절약계통수에서 두 개의 clade로 나누어졌고, 그 중 한 clade는 두 개의 subclade로 다시 나누어졌다. 이는 현재까지 우리나라에 1종만 분포한다고 알려진 것과는 다른 결과로 최소 2개 이상 분류군(L.aequinoctialis, L.minor)이 국내에 분포한다는 것을 의미한다.

정보 알고리즘 기반 아리랑의 계통도 및 상관관계 분석 (Correlation Analysis of the Arirangs Based on the Informatics Algorithms)

  • 김학용
    • 한국콘텐츠학회논문지
    • /
    • 제14권4호
    • /
    • pp.407-417
    • /
    • 2014
  • 우리 민족의 대표적인 민요이면서 동시에 유네스코 인류무형문화유산인 아리랑을 정보알고리즘 기법을 도입하여 후렴구를 중심으로 계통도를 분석하고 아리랑들 사이의 상관관계는 본문 단어중심으로 분석하였다. 아리랑의 계통도 분석은 생명체의 진화관계를 분석하는 알고리즘인 다중서열정렬 기법을 사용하였다. 분석한 아리랑 106개 중에서 38개 아리랑이 빠른 템포를 가지고 있었으며, 나머지 68개 아리랑이 느린 템포를 가지고 있었다. 이를 바탕으로 후렴구 기반 아리랑 계통도를 완성하였다. 아리랑 본문 단어는 아리랑에 있는 단어와 아리랑 제목을 노드로 하는 bipartate네트워크를 구축하고 이들로부터 73개 아리랑 및 104개의 핵심 단어를 추출하였다. 먼저, 이 데이터를 바탕으로 쌍대비교분석 기법을 사용하여 아리랑들 사이의 상관관계를 분석하였다. 또한, 네트워크 연결계수가 1인 노드를 단계적으로 제거하여 핵심네트워크를 구축한 다음 네트워크 기반으로 아리랑들 사이의 상관관계를 분석하였다. 그동안 아리랑을 어원 중심의 인문과학이나 음률적인 접근을 통하여 아리랑의 어원, 계통도, 상관관계를 분석하려는 연구가 있었다. 본 연구에서는 이러한 시도를 벗어나 과학적 접근방법인 정보알고리즘을 사용하여 아리랑을 분석함으로써 세계적인 문화유산의 위상을 한층 더 높이고 객관적인 결과를 통해서 아리랑의 대중화 및 세계화의 기틀을 마련함에 있어 그 방법론을 제시하였다.

점 행렬을 이용한 새로운 부분 영상 검색 기법 (A Novel Sub-image Retrieval Approach using Dot-Matrix)

  • 김준호;강경민;이도훈
    • 한국산학기술학회논문지
    • /
    • 제13권3호
    • /
    • pp.1330-1336
    • /
    • 2012
  • 영상 검색 방법은 텍스트 기반, 내용 기반, 영역 기반 영상 검색, 부분 영상 검색 방법 등 다양한 연구가 이루어지고 있다. 그 중에 부분 영상 검색은 질의 영상을 포함하는 대상 영상을 찾는 문제이다. 본 논문에서는 생물정보학에서 사용하는 점 행렬 방법을 이용한 새로운 부분 영상 검색 방법을 제안한다. 점 행렬은 두 DNA 서열 간에 유사도를 시각화하는 방법으로써 영상 검색에 적용하여 두 영상 간에 유사도를 비교하는 문제로 재정의한다. 이 알고리즘을 적용하기 위해서 이차원 배열 정보인 영상을 일차원 명암도 영상으로 변환한다. 두 일차원 명암도 영상을 정렬하여 생성된 점 행렬을 이용하여 부분 영상 후보 영역을 생성한다. 실험에는 10 개의 대상 영상과 대상 영상의 부분을 복사한 영상, 축소한 영상, 확대한 영상으로 5종류의 질의 영상을 사용하였다.

분자 세포 유전학 기법에 응용되는 영상 처리 기술 (Image Analysis Algorithms for Comparative Genomic Hybridization)

  • 김대석;유진성;이진우;김종원;문신용;최영민
    • 대한의용생체공학회:학술대회논문집
    • /
    • 대한의용생체공학회 1998년도 추계학술대회
    • /
    • pp.66-69
    • /
    • 1998
  • Comparative Genomic Hybridization (CGH)은 세포 내 특정 DNA 서열 이상을 염색체상에 보여주는 중요한 분자 세포 유전학 기법이다. CGH 기법에서는 세포 분열 중기의 염색체에서 준비한 형광 비율 영상의 정량적 분석을 위해서 Digital 영상 처리 기술이 쓰여야 한다. 본 논문에서는 최근 연구 개발된 영상 처리 algorithm들이 어떻게 CGH 기법에 쓰이는 지를 소개하려 한다. 각 염색체의 형광 비율 profile를 평균하기 위해, 염색체 영상의 이원화, 염색체 영상 뼈대 변환(skeletonization), 뼈대 정보의 변수화와 영상 명암의 재추출을 통한 굽은 염색체 영상 펴기 등이 언구되었다. 개발된 algorithm 들은 바이오메드랩 사의 ChIPS 핵형 정렬 시스템에 구현했다.

  • PDF

공격그룹 분류 및 예측을 위한 네트워크 행위기반 악성코드 분류에 관한 연구 (Research on Malware Classification with Network Activity for Classification and Attack Prediction of Attack Groups)

  • 임효영;김완주;노홍준;임재성
    • 한국통신학회논문지
    • /
    • 제42권1호
    • /
    • pp.193-204
    • /
    • 2017
  • 인터넷 시스템의 보안은 백신을 최신으로 업데이트하고, 신종 악성코드를 탐지해 내는 능력에 달려있다. 하지만, 급변하는 인터넷 환경과 더불어, 악성코드는 끊임없이 변종을 만들어내고 더욱 지능적으로 진화하고 있어 현재 운용중인 시그니쳐 기반 탐지체계로 탐지되지 않는다. 따라서, 본 연구에서는 악성코드의 네트워크 행위 패턴을 추출하여 DNA 서열 유사도를 비교하여 활용하는 유사 시퀀스 정렬 알고리즘을 적용하여 악성코드를 분류하는 기법을 제안한다. 제안한 기법을 실제 네트워크에서 수집된 악성코드 샘플 766개에 적용하여 유사도를 비교한 결과 40.4%의 정확도를 얻었다. 이는 코드나 다른 특성을 배제하고 악성코드의 네트워크 행위만으로 분류했다는 점을 미루어 볼 때 앞으로 더 발전 가능성이 있을 것으로 기대된다. 또한 이를 통해 공격그룹을 예측하거나 추가적인 공격을 예방할 수 있다.

Genotyping-by-sequencing 기법을 이용한 사시나무(Populus davidiana) 유전연관지도 작성 및 양적형질 유전자좌 탐색 (Construction of Genetic Linkage Map and Identification of Quantitative Trait Loci in Populus davidiana using Genotyping-by-sequencing)

  • 김수비;김양길;이다영;이혜진;강규석
    • 한국산림과학회지
    • /
    • 제112권1호
    • /
    • pp.40-56
    • /
    • 2023
  • 사시나무속 수종은 생장이 빠르고 우수한 탄소흡수 능력을 보여주며, 환경정화 효과가 큰 수종으로 이상기후 및 환경오염 문제에 대응하는 기후적응성 품종개발 및 육종집단 조성에 적합하다. 따라서 유전연관지도 작성 및 양적형질 유전자좌 탐색을 통하여 포플러 육종을 신속하게 진행할 수 있을 것이다. 본 연구에서는 차세대 염기서열 분석기술 방법인 genotyping-by-sequencing 기법을 이용해 인공교배 차대에 대한 고밀도 유전연관 지도를 작성하였다. 또한 사시나무의 수고와 근원경 생장 그리고 해충피해에 대한 회복력 형질을 조사하여 유전연관지도에 위치한 양적형질 유전자좌를 탐색하였다. 서울대학교 학술림에 조성된 사시나무 4년생 육종집단(오대19 × 봉현4 인공교배 차대집단)에서 수고 및 근원경 생장을 조사하였으며, 식엽성 해충인 꼬마버들재주나방 유충의 피해를 받은 후 이에 대해 회복 능력을 조사하였다. 잎 시료의 DNA 추출 후 5개 microsatellite 마커를 이용하여 유전자형을 확인하였으며 친자로 확인된 개체만을 연구재료로 사용하였다. 친자 확인이 완료된 시료의 DNA는 제한효소를 이용해 절단하였으며, 이렇게 얻은 DNA 조각들은 GBS 라이브러리로 제작하여 염기서열을 분석하였다. 분석된 결과는 Populus trichocarpa를 참조유전체로 하여 정렬하였다. 정렬된 SNP 마커는 총 58,040개였으며, 그 가운데 17,755개의 SNP 마커를 유전연관지도 작성에 사용하였다. 유전연관지도는 19개의 연관군으로 나누어졌으며, 전체 길이는 2,129.54 cM으로 나타났다. 조사된 세 가지 형질에 대한 양적형질 유전자좌 분석을 실시한 결과, 수고와 근원경 생장과 연관된 양적형질 유전자좌는 찾을 수 없었으나 전장유전체연관연구(GWAS)를 통하여 4번 연관군(염색체)에 해충피해 회복력과 관련이 있을 것으로 추정되는 유전자를 확인하였다.

돼지 Melanocortin Receptor 1(MC1R) 대립유전자 3의 신규 유전변이 탐색 (Detection of Novel Genetic Variations of the MG1R * 3 Allele in Pig(Sus scrofa))

  • 조인철;정용환;정진관;성필남;오운용;고문석;김병우;이정규;전진태
    • Journal of Animal Science and Technology
    • /
    • 제46권1호
    • /
    • pp.1-6
    • /
    • 2004
  • 본 연구는 MCIR$^*$3 allele의 돼지에 있어서 유전적 변이를 관찰하기 위하여 수행하였다. 일반적으로 흑모색 바탕에 백색반점이나 백색띠를 갖고 있는 돼지의 MCIR 유전자의 유전자형은 E$^{D2}$로 나타낸다. 우성 백색계통의 E$^P$ 유전자형은 우성 흑모색 계통의 E$^{D2}$ 유전자와 frameshift mutation 관계가 있다. 돼지 MCIR 전체 번역지역을 증폭하기 위하여 oligonucleotide primer률 제작하여 PCR을 수행 하였다. 그 결과 길이가 963${\sim}$966 base pairs인 돼지 MCIR 유전자의 전체번역지역을 포함하는 산물을 얻었다. 이들 번역부위의 염기서열 결정하고 이들을 Clusta1 W 프로그램을 이용하여 정렬한 결과 23번 코돈{nt68)에서 Hampshire와 제주 재래혹돈은 염기 시토신(cytosine)이 3 개 그리고 Birl‘shire의 경우 염기 시토신(cytosine)이 2개 결실되어 있었다. 그 외에 3개의 missense mutations과 하나의 frameshift mutation이 발견되었다.