• 제목/요약/키워드: 유전자 분류

검색결과 744건 처리시간 0.027초

Apriori-Genetic 알고리즘을 이용한 베이지안 자동 문서 분류 (Bayesian Automatic Document Categorization Using Apriori-Genetic Algorithm)

  • 고수정;이정현
    • 정보처리학회논문지B
    • /
    • 제8B권3호
    • /
    • pp.251-260
    • /
    • 2001
  • 기존의 베이지안 문서 분류는 문서의 특징 표현에 있어서 단어간의 의미를 정확하게 반영하지 못하는 문제점이 있다. 이러한 문제점을 해결하기 위해, 본 논문에서는 Apriori-Genetic 알고리즘을 이용한 베이지안 문서 분류 방법을 제안한다. Apriori 알고리즘은 단어간의 의미를 반영한 연관 단어의 형태로 문서의 특징을 추출하며 추출된 연관 단어로 연관 단어 지식베이스를 구축한다. Aprrori 알고리즘만으로 연관 단어 지식베이스를 구축할 경우, 지식베이스 안에 부적당한 연관 단어가 포함된다. 따라서 문서 분류의 정확도가 낮아지는 단점이 있다. 이러한 단점을 보완하기 위해, Genetic 알고리즘을 이용하여 연관 단어 지식베이스를 최적화하는 방법을 사용한다. 베이지안 확률을 이용하는 분류자는 최적화된 연관 단어 지식베이스를 기반으로 문서를 클래스별로 분류한다. Apriori-Genetic 알고리즘을 이용한 베이지안 문서 분류의 성능을 평가하기 위해, Apriori 알고리즘을 이용한 베이지안 문서 분류 방법, 역문헌빈도를 사용한 베이지안 문서 분류 방법, 기존의 단순 베이지안 분류 방법과 비교하였다.

  • PDF

동적 시소러스와 GA을 이용한 개별화된 E-Mail1 분류시스템 (PECS) (Personalized I-Mail Classification System Using Dynamic Thesaurus and Genetic Algorithm)

  • 안희국;노희영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.472-474
    • /
    • 2002
  • 본 논문에서는 전자메일을 사용자 적합도(선호도)를 기준으로 분류하기 위한 구조를 제안한다. 분류는 1차 분류와 2차 분류로 나눠지는데, 1차 분류에서는 사용자 적합도를 판단하기 위해 사용자 관련 정보로부터 동적 시소러스를 구축하고, 구축된 시소러스와의 비교를 통해 사용자에게 유용한 메일인지 아닌지를 결정하고, 2차 분류에서는 사용자가 지정한 폴더키워드를 중심으로 사용자 시소러스로부터 유전자 알고리즘을 이용해 추출한 키워드들과의 적합도 비교를 통해서 특정 폴더로의 분류가 이뤄지게 된다 테스트에는 메일 정보값(Mail Information Word)을 추출하기 위해 HAM(Hangup Analysys Module)을 포함하는 메일정보추줄 에이전트를 사용하였고, mail의 subject와 본문(body)로부터 추출된 16개의 word정보와 시소러스 적합도 정보, 분류 적합도 정보를 하나의 데이터구조로 사용하였다. 이러한 통할된 시스템 구조와 data structure를 이용해 mail을 사용자의 선호도에 따라. 1차와 2차에 걸친 분류시 분류가 사용자 선호도에 근접하게 이루어 질 수 있음을 확인하였다.

  • PDF

ISSR 분자 마커를 이용한 왕대속 대나무의 유전적 다양성 및 계통 관계 (Genetic Diversity and Phylogenetic Relationship of Genus Phyllostachys by ISSR Markers)

  • 이송진;허만규;허홍욱
    • 생명과학회지
    • /
    • 제17권11호
    • /
    • pp.1482-1487
    • /
    • 2007
  • ISSR분자 마커를 이용하여 왕대속 대나무의 유연관계를 분석 실시하였다. 전세계적으로 왕대속에 속하는 4종은 경제학적, 생태학적으로 중요한 식물 자원중 하나이다. 총 11개의 ISSR 프라이머 중 9개의 프라이머에서 증폭이 일어 났으며 총 64개의 밴드를 확인 할 수 있었다. ISSR분석결과 왕대속 4종의 대나무에서 70.49%인 43개의 다형현상이 나타났다. 4개의 분류군으로 분류된 왕대속 대나무의 집단내 다양성(Hs)은 0.092,집단간 다양성(Gst)은 0.499로 나타났다. 각 종에 대한 유전자 유동(Nm)은 0.559로 나타났다. 따라서 왕대속에 속하는 4종의 유전자 유동(Nm)은 아주 낮음을 알 수 있었다 4종의 분류군에 대한 유전자 다양성(Ht)은 0.291로 낮게 나타났으며 ISSR 마커로 명확하게 그들은 분류가 되었다. 또한 왕대속의 4종은 단일계통임을 확인할 수 있었다.

한우 태아기 6, 9개월령 등심 조직의 전사체 분석을 통한 근생성 및 지방생성 관여 유전자 발굴 (Transcriptome Analysis of Longissimus Tissue in Fetal Growth Stages of Hanwoo (Korean Native Cattle) with Focus on Muscle Growth and Development)

  • 정태준;정기용;박원철;손주환;박종은;채한화;권응기;안준상;;이지웅;임다정
    • 생명과학회지
    • /
    • 제30권1호
    • /
    • pp.45-57
    • /
    • 2020
  • 동물의 근섬유는 배아기와 태아기를 거치며 형성하게 되며 출생 후에는 상처 치유를 위한 것 외에 근섬유 수를 늘리는 순수한 근섬유 형성은 없으며, 이미 존재하고 있는 근섬유의 비대로 근육의 성장이 이뤄진다. 따라서 태아기의 근육의 성장과 발달이 성체의 근육량 및 조성에 미치는 영향이 매우 크며 이 시기에 발현되는 유전자 및 기능을 구명하는 것은 최종적으로 육질, 육량에 개선시키기 위한기초 자료로 활용될 수 있을 것이다. 하지만 한우에서의 연구는 전무한 실정이다. 본 연구는한우 태아기 성장 단계별 근육의 성장과 발달에 관여하는 유전자를 찾기 위한 전사체 분석을 수행하였다. 한우 태아기 6, 9개월령 등심 조직 시료에서 생산한 전사체 자료를 대상으로 DESeq2와 edgeR을 활용하여 성장단계별 유전자의 발현량을 분석하여 차등발현유전자군을 추출했으며, 2개 소프트웨어서 공통적으로 추출된 유전자군(6개월령 특이 발현 유전자 913개, 9개월령 특이 발현 유전자 233개)을 차등발현유전자로 구명 하였다. 차등발현유전자군으로 분류하였다. 차등발현유전자군을 활용하여공발현 유전자 네트워크 분석을 구성하였으며, 유사한 발현 양상을 보이는 유전자들을 그룹화하여 6개월령 특이 발현 유전자군 5개, 9개월령 특이 발현 유전자군 2개의 모듈로 분류했다. 각 모듈은 Gene Ontology (GO) 및 KEGG pathway 분석으로 유의한 기능을 확인하였다. 그 결과, 한우 태아기 6, 9개월령 특이 발현 유전자 네트워크 중, 근육과 지방생성 대사회로와 관련된 2개의 모듈에 대해 네트워크 내에 허브 유전자를 선정할 수 있었다. STRING을 활용하여 단백질 상호작용 네트워크를 구성하고, MCC (maximal clique centrality) 점수를 활용하여 상위 10%의 유전자들을 공발현 분석의 모듈내 허브 유전자로 선정하였다. 그 결과 6개월령 특이 발현 유전자군의 모듈에서는 axin1(AXIN1) 유전자, 9개월령 특이 발현 유전자군 모듈에서는 succinate-CoA ligase ADP-forming beta subunit(SUCLA2) 유전자가 허브 유전자로 확인되었다. AXIN1 유전자는 선행 연구를 통해 6개월령에서 9개월령으로 넘어가면서 근섬유 수의 증식이 억제되고 지방생성이 활발히 이뤄지는 것에 핵심적인 역할을 하는 것으로 추정할 수 있었다. 또한, 시트르산 회로의 중요 요소인 SUCLA2 유전자는 소의 태아기 지방 조직 성장단계에 따라 유전자의 발현이 증가된다는 보고에 따라, 지방 대사와 관련된 유전자임을 알 수 있었다. 추후 한우 태아기 6, 9개월령에 특이적으로 발현된 유전자들을 대상으로 근육 및 지방 형성 관련 기능을 검증하는 후속 연구가 필요할 것이다.

임상가검물에서 분리한 Methicillin내성 Staphylococcus aureus의 분자역학적 연구 (Epidemiological Studies on the Methicillin Resistant Staphylococcus aureus Isolated from Clinical Samples)

  • Yang-Hyo Oh;Min-Jung Kim
    • 대한의생명과학회지
    • /
    • 제5권2호
    • /
    • pp.135-145
    • /
    • 1999
  • 임상가검물에서 생화학 검사와 항생제 감수성 검사를 통하여 45주의 Staphylococcu aureus를 분리하여 역학적 연구를 위한 형별 분류로써 항생제 감수성 검사, bacteriophage typing,효소중합 연쇄반응 등을 실시하였으며, methicillin 내성과 관련이 있는 mecA 유전자를 검출 및 역학적 변별력이 있는 가변지역의 중합효소증폭반응을 실시하여, 약제 내성과 관련된 구조 유전자의 발현 양상을 비교하여 특정 유전자 배열의 상동성을 밝히고자 하였다. 45주의 Staphylococcus aureus중에서 mecA 유전자 양성주는 30주였으며, 그 중에서 26주가 methicillin에 내성을 보였다. 약제 내성양상에 따라 9개의 antibiogram으로 분류되었으며, SA6을 제외한 균주에서 penicillin, oxacillin, gentamicin 및 chloramphenicol 에서는 높은 내성을 보였으며, SAl3, SAl4 및 SA27에서는 rifampin에 내성을 보였다. 27주에서 bacteriophage 형별 분류가 가능하였으며, Iytic group III가 12주로 가장 많았다. mecA 유전자와 mec관련 가변부위의 polymerase chain reaction을 실시한 결과 모든 methicillin resistant Staphylococcus aureus 에서는 533 bp의 증폭 band가 관찰되었으나, methicillin 감수성 균주에서는 증폭된 band가 관찰되지 않았다. mec관련 가변부위의 polymerase chain reaction에서는 200 bp에서 600 bp사이에 분포하여 4개의 유형으로 분류되었으며, 410bp인 C형이 10균주로 가장 많았다. C형 가변부위의 DNA sequence에서 40 bp가 반복되는 dru sequence를 관찰할 수 있었으며, 이러한 dru sequence는 4 unit가 직접적으로 중복됨을 알 수 있었다.

  • PDF

포섭 구조기반 OVR SVM 결합을 통한 다중부류 암 분류 (Multi-class Cancer Classification by Integrating OVR SVMs based on Subsumption Architecture)

  • 홍진혁;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.37-39
    • /
    • 2006
  • 지지 벡터 기계(Support Vector Machine; SVM)는 기본적으로 이진분류를 위해 고안되었지만, 최근 다양한 분류기 생성전략과 결합전략이 고안되어 다중부류 분류에도 적용되고 있다. 본 논문에서는 OVR(One-Vs-Rest) 전략으로 생성된 SVM을 NB(Naive Bayes) 분류기를 이용하여 동적으로 구성함으로써, OVR SVM을 이용한 다중부류 분류 시스템에서 자주 발생하는 동점을 효과적으로 해결하는 방법은 제안한다. 이 방법을 유전발현 데이터를 이용한 다중부류 암 분류에 적용하였는데, 고차원의 데이터로부터 NB 분류기 구축에 유용한 유전자를 선택하기 위해 Pearson 상관계수를 사용하였다. 14개의 암 유형과 16,063개의 유전발현 수준을 가지는 대표적인 다중부류 암 분류 데이터인 GCM 암 데이터에 적용하여 제안하는 방법의 유용성을 확인하였다.

  • PDF

쌀 저장 단백질 프롤라민 유전자 암호 분석 (Codon usage analysis of rice prolamine genes)

  • 이태호;김주곤;남백희
    • Applied Biological Chemistry
    • /
    • 제36권6호
    • /
    • pp.525-532
    • /
    • 1993
  • 쌀의 주요 저장 단백질중의 하나인 알콜용해성 프롤라민의 성질을 분석하고 이들을 동정하기 위하여 유전자 database로부터 얻은 17개의 프롤라민 유전자의 염기서열을 상호비교 분석하였다. 유전자로부터 유추된 단백질 서열의 다중분석결과 프롤라민들은 계통발생적으로 type에서 type IV의 4개의 군으로 크게 분류할 수 있었다. 이러한 분류는 아미노산 서열 중간과 카복실 말단쪽의 짧은 결손에 의해 여러 형태의 아미노산 서열에 의한 것임을 알 수 있었다. 1군에서 4군까지의 군들은 meththionine과 cysteine과 같은 황을 포함하는 아미노산이 각각 1, 4, 10, 30%로 구성된 특징을 보여 주었다. 또한 각 군들은 등전점이 9.2, 8.2, 6.7, 7.4인 각군별로 매우 상이한 등전점을 나타내었다. 아울러 GC3s에 대한 유효 암호수(effective codon number, Nc)와 우선 암호수(preferred codon number)의 분석과 상관 그래프를 통해서 프롤라민 유전자들의 군별 전이 효율의 차이가 현저하여 프롤라민 생산 수준의 군별차이의 가능성을 제시하였다.

  • PDF

개인유전자정보에 따른 맞춤형 영양 및 운동관리시스템의 질병 예측 인덱스 (Disease Prediction Index of Customized Nutrition And Exercise Management Services Based On Personal Genetic Information)

  • 서영우;주문일;허경혜;김희철
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 추계학술대회
    • /
    • pp.602-604
    • /
    • 2017
  • 인간의 수명이 늘어남에 따라 사람들은 건강하게 오래살고 싶은 욕구가 생기게 되었다. 특히 한국은 빠른 속도로 고령화 사회에 진입하였고, 고령화에 따른 질병의 증가로 의료비의 부담으로 이어졌다. 의료비 부담을 줄이기 위해 병의 치료보다는 예측과 예방이 중요하다. 개인의 유전자 정보를 측정하여 질병의 예측 및 예방을 할 수 있다. 개인의 유전자정보를 이용하기 위해서 한국인 질병과 표현형의 유전요인 발굴에 최적화된 SNP(80만개)과 GWAS를 통해 한국인의 유전정보를 파악하고 특정 집단의 유전적(체질적) 특성으로 각 개인의 유전자 정보를 분석한다. 본 논문은 특정 만성질환(비만, 당뇨 또는 심혈관계)집단을 분류할 수 있도록 분류 인덱스를 개발한다. 만성질환에 따른 맞춤식단 및 운동 관리를 위한 건강관리 서비스를 개발하고자한다.

  • PDF