• 제목/요약/키워드: 유전자 데이터베이스

검색결과 182건 처리시간 0.026초

GA에 의한 특징 선택에 따른 Support Vector Machines을 이용한 얼굴 인식 (Face Identification using Support Vector Machines with Features Set extracted by Genetic Algorithm)

  • 이경희;변혜란
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.458-460
    • /
    • 2000
  • 본 논문에서는 유전자 알고리즘(GA)과 Support Vector Machine(SVM)을 결합하여 사용한 얼굴 인식 시스템을 제안한다. 기존의 SVM을 이용한 얼굴 인식 연구에서는 얼굴 전체 영상을 SVM의 입력벡터로 사용하는데 반해, 본 연구에서는 GA를 이용하여 얼굴 영상 중에서 개인별로 식별 능력이 우수한 특징들만을 선택하여 이를 SVM의 입력벡터로 사용한다. 조명, 표정, 안경 착용 등 다양한 변화가 있는 Yale 얼굴 데이터베이스를 사용하여 실험한 결과, 얼굴 전체 영상을 사용한 경우보다 더 좋은 인식률을 보였다. 또한 제안된 방법에 의한 얼굴 인식 시스템은 각 개인별로 식별력이 우수한 특징들만을 저장하므로, 얼굴인식 시스템을 구성하기 위해 저장될 정보의 양이 현저하게 감소하게 된다.

  • PDF

바이오인포매틱스 도구 통합을 위한 워크플로우 기반의 멀티에이전트 시스템 (A Workflow-Based Multiagent System for Integrating Bioinformatics Tools)

  • 손봉기;이건명;황경순;김영창
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.850-852
    • /
    • 2003
  • 이 논문에서는 여러 가지 도구를 논리적인 순서로 사용함으로써 이루어지는 작업을 워크플로우로 보고, 이러한 관점에서 바이오인포매틱스 도구를 통합하는 새로운 멀티에이전트 시스템을 제안한다. 제안한 시스템은 기존의 도구를 랩퍼 에이전트로 구현하고, 에이전트간의 통신은 XML 형식의 메시지로 이루어진다. 수신 에이전트는 송신 에이전트가 전송하는 정보를 명시적으로 알리지 않고도 메시지로부터 필요한 정보를 추출할 수 있다. 제안한 시스템의 이러한 특징은 바이오인포매틱스 도구와 데이터베이스의 통합을 용이하게 한다. 또한, 제안한 시스템에서는 워크플로우를 여러 가지 제어 구조를 이용하여 정의할 수 있으며. 워크플로우 진행을 모니터링할 수 있는 기능을 제공한다. 제안한 시스템의 가용성을 보이기 위해 박테리아 Sphingomonas Chungbukensis DJ77 의 유전자 주해(gene annotation) 작업에 제안한 시스템을 적용하여 구현하고 있다.

  • PDF

가중치를 갖는 문자의 개수를 서명으로 이용한 DNA 인덱스 구조 (A DNA Index Structure Using Signature by Weighted Number of Characters)

  • 김우철;민준기;박상현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.337-339
    • /
    • 2004
  • 우리는 대규모의 유전자 데이터베이스에서 원하는 패턴을 빠르고 정확하게 찾고 싶어한다 하지만 지금까지 나온 대부분의 검색방법들은 인덱스의 크기를 실제 데 이 터 보다 훨씬 크게 만들어 사용해왔다. 그런 방법들은 기하급수적으로 증가하고 있는 데 이 터를 처 리 하는 데는 비효율적이다. 따라서 인덱스 크기를 실제 데이터보다 작게 만들면서도 원하는 패턴을 빨리 찾을 수 있는 효율적 인 방법 이 필요하다. 이렇게 하기 위해서는 일정한 크기의 데이터를 작은 크기의 데이터로 줄인 후, 이 데이터를 이용하여 인덱스를 만들어야 한다. 이 논문에서는 일정한 크기의 문자열(=윈도우)을 작은 크기의 숫자들(=서명)로 표현해서 인덱스를 구축한 후, 이를 이용해 우리가 원하는 패턴을 최소한의 디스크 접근을 통해 빠르게 찾을 수 있는 방법을 제시한다.

  • PDF

특수 목적견으로서의 품성 및 능력 관련 유전자들에 관한 생물정보학적 분석 (Bioinformatic Analysis of the Canine Genes Related to Phenotypes for the Working Dogs)

  • 권윤정;어정우;최봉환;최유리;김정안;김다희;김태헌;성환후;김희수
    • 생명과학회지
    • /
    • 제23권11호
    • /
    • pp.1325-1335
    • /
    • 2013
  • 특수 목적견(구조견, 군견, 안내견 및 탐지견)은 집중력, 소유욕, 대담성 등을 기반으로 한 훈련시험을 통해 선별된다. 최근 특수견으로서의 특수한 능력 및 품성에 대해 유전적인 정보가 중요한 인자로 다뤄지고 있다. 본 연구에서는 특수견으로서의 개의 특수한 능력 및 품성과 관련된 유전자들의 분자적인 특징을 고찰하고자 하였다. 이전 연구에서 보고된 24개의 유전자(AR, BDNF, DAT, DBH, DGCR2, DRD4, MAOA, MAOB, SLC6A4, TH, TPH2, IFT88, KCNA3, TBR2, TRKB, ACE, GNB1, MSTN, PLCL1, SLC25A22, WFIKKN2, APOE, GRIN2B, PIK3CG)를 선택하여 품성, 후각, 운동 및 학습능력 관련 유전자, 네 가지 카테고리로 분류하였다. 본 연구에서는 생물학적인 기법을 이용하여 이 유전자들의 염색체상의 위치, 유전자들 간의 네트워크를 통한 상호관계를 조사하였으며, 어떤 생물학적 기능과 관련이 있는지 Gene Ontology 분석과 데이터베이스를 기반으로 in silico 발현 양상을 살펴보았다. 또한 이전 연구를 통하여 품성 관련 유전자들의 다양한 유전적 다형성에 대한 보고를 조사하였다. 본 연구는 특수 견으로서 주요하게 고려되는 개의 고유한 능력 및 품성 관련된 유전자에 대해 분자적 특징을 제시하고 있다. 이 후보 유전자들은 개의 특수한 표현형과의 관계를 밝힐 수 있는 연구의 기초자료로서 이용될 수 있을 뿐만 아니라 핵심적인 유전인자로 응용되어 신속하고 정확한 특수견 선발에 기여할 수 있을 것으로 전망된다.

Genbank 분석을 통한 이종의 콘텐츠 연계 방안 설계 (Design of Heterogeneous Content Linkage Method by Analyzing Genbank)

  • 안부영;이명선;김지영;오충식
    • 한국콘텐츠학회논문지
    • /
    • 제10권6호
    • /
    • pp.49-54
    • /
    • 2010
  • 유전자 서열정보는 그 양이 방대하고 다양하기에 DB 구축 및 분석을 위하여 고성능 컴퓨터 및 정보기술 기법이 필요하다. 그래서 컴퓨터를 활용하여 생물학적 데이터를 수집, 관리, 저장, 평가, 분석하는 연구분야인 생명정보학이라는 학문이 지속적으로 발전하고 있다. 이런 생명정보학 발전에 발맞추어 한국과학기술정보연구원(KISTI)에서는 정보기술 기반 생명정보 인프라를 구축하여 생명과학 연구자들에게 제공하고 있다. 본 논문에서는 생명정보 DB 중에서 전세계 연구자들이 가장 많이 이용하는 유전자 DB인 Genbank의 reference 필드를 분석하여 한국과학기술정보연구원(KISTI)의 과학기술정보 통합서비스인 NDSL (http://NDSL.kr)과의 연계 방안을 제안하고자 한다. 이를 위하여 NCBI FTP 사이트에서 Genbank 데이터를 수집하여 Genbank 텍스트 파일을 유전자 기본정보와 참고정보로 나누어 DB로 재구축하였으며 Genbank reference 필드에서 논문 및 특허 정보 추출을 통한 새로운 테이블을 생성하였고, KISTI의 논문 DB (http://scholar.ndsl.kr), 특허 DB (http://patent.ndsl.kr)와의 연계 방안을 제시하였다.

인간태아의 뇌로부터 유래된 cDNA liberary에서 내생레트로바이러스 HERV-W pol 유전자의 동정과 계통 (Identification and phylogenetic analysis of the human endogenous retrovirus HERV-W pol in cDNA library of human fetal brain)

  • Kim, Heui-Soo;Jeon, Seung-Heui;Yi, Joo-Mi;Kim, Tae-Hyung;Lee, Won-Ho
    • 생명과학회지
    • /
    • 제13권3호
    • /
    • pp.291-297
    • /
    • 2003
  • 인간 내생 레트로바이러스 HERV-W는 다발성 경화증 환자로부터 탐지된 MSRV와 연루되어 있다. 인간 태아의 뇌로부터 유래된 cDNA library를 이용하여 PCR법으로 2개의 HERV-W 패밀리(HWP-FB10과 HWP-FB12)를 동정하고 분석하였다. 그들은 HERV-W (accession no. AF009668)와 89%의 염기서열의 유사성을 보였다. Pol 유전자를 아미노산의 서열로 분석해 본 결과 점돌연변이 또는 삽입/결실로 말미암아 frameshift 및 종결코돈을 나타내었다. 유전자정보의 데이터베이스를 이용하여 HERV-W 패밀리간의 분자계통분류도를 작성해 본 결과 HWP-FB10은 인간의 염색체 7q21-22로부터 유래된 AC000064와 매우 가깝게 관련되어 있음을 시사하였다. 이들의 새로운 HERV-W pol 패밀리가 이웃하는 어떤 유전자와 상호 연결되어 있으며, 어떠한 기능을 수행하는지에 대한 전망에 대해 토의하였다.

원핵생물 1,309종에 분포된 COGs (Clusters of Orthologous Groups of proteins) 연구 (Investigation of COGs (Clusters of Orthologous Groups of proteins) in 1,309 Species of Prokaryotes)

  • 이동근;이상현
    • 생명과학회지
    • /
    • 제31권9호
    • /
    • pp.834-839
    • /
    • 2021
  • 저자들은 이전에 711개의 원핵생물에서 COG (Clusters of Orthologous Groups of proteins)를 분석한 결과를 보고하였다. COG 데이터베이스는 2020년에 1,309개의 원핵생물 게놈들을 사용하여 대폭 업데이트되었다. 이에 COG와 원핵생물 측면에서 업데이트된 4,877개의 COG를 구성하는 3,455,853개의 단백질들에 대한 분석 결과를 보고한다. 각 원핵생물이 보유한 COG 종류의 수는 97에서 2,281개의 사이였으며, 평균은 1,430.0개이고 표준편차는 414.2개였다. 문(phylum) 수준에서 보유 COG의 평균 수는 Mollicutes가 497.86개로 최소였고, Cyanobacteria가 1,642.90개로 최대였다. 가장 높은 보유 COG 개수를 가진 상위 10개 종은 모두 Proteobacteria였으며, 하위 10개 중 9개는 시험관 내에서 배양할 수 없는 Candidatus 구성원이었다. 각 COG에 속하는 단백질의 수는 2개에서 22,048개 사이였으며, 상위 11위 COG들은 12,000개 이상의 단백질을 포함하였다. 상위 11개 중 5개는 DNA에 결합하고 유전자 발현에 관여하는 COG로, 원핵생물에서 유전자 발현 조절의 중요성을 알 수 있었다. COG 데이터 베이스는 게놈에 포함된 유전자를 식별하고 균주 개선을 위한 유전자를 선택하는 데 사용할 수 있어 많은 활용이 기대된다.

국내 고래류 불법포획의 특징 및 단속방안 연구 (Study on the characteristics of Dormestic Illegal Whaling and Measures for Crackdown)

  • 윤현경;김진선;김세인;김준수;추민규
    • 한국콘텐츠학회논문지
    • /
    • 제22권10호
    • /
    • pp.554-562
    • /
    • 2022
  • 인류 기술의 발전은 고래자원 고갈로 이어졌으며, 고래자원의 보존과 포경산업의 질서 있는 발전을 위해 국제포경위원회가 설립되었다. 상업포경 모라토리엄이 발효 이후 고래고기 등의 국제거래는 전면 금지되었다. 그러나 국내의 경우 혼획된 고래는 유통이 가능하여 포획 시 경제적 이득 때문에 선박을 불법으로 개조하여 조직적으로 활동하고 있다. 이에 적극적으로 단속하고 있지만 불법포획 및 유통을 막기에는 부족한 실정이다. 이러한 불법포획 및 유통을 막기 위해서는 항공전력과 경비함을 이용한 입체적인 단속이 효과적이며, 나포된 포획선과 선원들을 신속히 분리하여 증거인멸을 방지해야 한다. 투명한 유통을 위해서는 국립수산과학원의 고래 DNA 데이터베이스를 기반으로 한 법과학 기관의 DNA를 활용한 고래 종판별 및 개체식별 등의 관련기술 고도화가 필요하다. 이에 해양경찰연구센터에서는 관련된 국가R&D연구과제를 직접 수행하고 있으며, 고래혈흔에 특이적으로 반응하는 신속검사 키트 개발 및 증거물 이송팩을 제작·배포하여 고래 관련 증거물에 대한 현장 감식 효율을 높이고 감정 기술 고도화를 위한 연구를 진행중이다.

상염색체 열성 지대형 근이영양증 환자로부터 TTN 유전자의 복합 이형접합성 대립유전자의 분리 (Identification of Compound Heterozygous Alleles in a Patient with Autosomal Recessive Limb-Girdle Muscular Dystrophy)

  • 최희지;이수빈;권혜미;최병옥;정기화
    • 생명과학회지
    • /
    • 제31권10호
    • /
    • pp.913-921
    • /
    • 2021
  • 고관절과 어깨의 점진적인 근육 약화를 특징으로 하는 지대형 근이영양증(limb-girdle muscular dystrophy: LGMD)은 우성 및 열성 유전을 모두 보여주며, TTN을 비롯한 많은 유전자가 발병과 관련된 것으로 알려져 있다. 본 연구는 40대 중반의 늦은 발병을 나타낸 상염색체 열성 LGMD 및 심방 조동의 증상을 가진 한 남성 환자의 유전적 원인을 규명하기 위해 수행되었다. 전장 엑솜 서열분석을 수행하여 환자로부터 TTN 유전자의 복합 이형 접합성 변이의 대립유전자를 동정하였다. 한 대립유전자는 [c.24124G>T (p.V8042F)]의 단일 변이를 보였지만, 다른 대립유전자는 [c.29222G>C (p.R9741P) + c.67490A>G (p.H22497R) + c.75376C>T (p.R25126C)]의 세 변이로 구성된 단상형이었다. 대립유전자 중 p.V8042F는 어머니로부터 유전된 반면, 다른 단상형 대립유전자는 아버지로부터 유전된 것으로 추정되었다. 본 연구에서 분리된 TTN 변이들은 공공 인간 유전체 데이터베이스(1,000 Genomes, gnomAD 및 KRGDB)에서 보고되지 않았거나 매우 낮은 빈도로 보고되었다. 대부분의 변이들은 고도로 보존된 면역글로불린 또는 피브로넥틴 도메인에 위치했으며, 일부 in silico 분석에 의해 병원성인 것으로 예측되었다. TTN 거대 단백질은 근육 조립, Z-라인에서 힘 전달, I-밴드에서 안정 장력 유지에 중요한 역할을 한다. 결론적으로, 우리는 이러한 이형접합성 복합 돌연변이의 이중 대립유전자가 LGMD 표현형의 유전적 원인으로서 작용할 수 있을 것으로 제시한다.

PowerPC를 이용한 저궤도 위성용 탑재소프트웨어 개발환경에 대한 연구 (A Study on the Development Environment for Flight Software using PowerPC)

  • 이재승;최종욱;김대영;이종인;김학정
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (3)
    • /
    • pp.514-516
    • /
    • 2004
  • 위성의 개발을 위해서는 오랜 개발기간과 많은 예산, 축적된 기술이 요구된다. 또한 위성에는 다양한 분야의 기술이 사용되어지기 때문에 각 서브시스템마다 독자적인 개발환경을 구축할 필요가 있다. 특히 위성의 찌어. 임무수행 및 지상과의 통신 등을 담당하는 탑재소프트웨어는 위성의 용도 및 목적에 따라 개발환경이 크게 달라진다. 실시간 운영체제는 무엇을 사용하는지, 개발 및 검증을 위한 도구로 어떤 프로그램을 사용하는지, 내외부의 인터페이스는 어떠한 방식으로 수행할지, 새로운 기능의 CPU나 하드웨어에 대한 제어 등 위성의 탑재소프트웨어를 개발하기 위해서는 많은 검토 항목들이 고려되어야 한다. 새로운 위성을 개발할 경우 신기술의 적용과 새로운 시스템위성시스템의 검증 및 개발을 위한 개발검증장비가 요if되며, 위성시스템의 변경 때마다 개발검증장비를 새로이 구축하게 되면 많은 기간과 막대한 비용이 위성개발 시마다 소요된다. 위성선진국에서는 다양한 위성의 개발 시 비용절감 및 개발기간 단축을 위하여 범용위성용 개발검증장비를 개발하여 이용하고 있는 추세이다. 국내에서는 다목적실용위성 1호가 발사되어 성공적으로 임무를 수행하고 있으며 다목 실용위성 2호가 개발되어 현재 통합 및 조립시험이 진행 중이다. 그러나 새로운 위성시스템의 사전 검증 및 신기술의 적용을 위한 범용위성 시스템 테스트베드에 대한 기술은 미비한 실정이다. 이러한 범용위성용 개발검증장비의 기반기술을 확보하기 위하며 현재 위성전자전산시스템 개발검증장비에 대한 연구가 수행되고 있다. 본 논문에서는 현재 수행되고 있는 PowerPC를 이용한 위성 탑재소프트웨어 개발검증시스템의 설계 및 개발현황에 대하여 소개한다.이스는 실험정보가 저장된 데이터베이스, 분석결과가 저장된 데이터베이스, 그리고 유전자 정보 탐색을 위한 데이터베이스로 분류해 데이터를 효율적으로 관리할 수 있게 하였다. 본 시스템은 LiNUX를 운영체계로 하고 데이터베이스는 MYSQL로 하여 JSP, Perl. 통계처리 언어인 R로 구현되었다.프트웨어를 사용하지 않고도 국내의 순수 솔루션인 리눅스 기반의 LonWare 3.0 다중 바인딩 기능을 통해 저 비용으로 홈 네트워크 구성 관리 서버 시스템 개발에 대한 비용을 줄일 수 있다. 기대된다.e 함량이 대체로 높게 나타났다. 점미가 수가용성분에서 goucose대비 용출함량이 고르게 나타나는 경향을 보였고 흑미는 알칼리가용분에서 glucose가 상당량(0.68%) 포함되고 있음을 보여주었고 arabinose(0.68%), xylose(0.05%)도 다른 종류에 비해서 다량 함유한 것으로 나타났다. 흑미는 총식이섬유 함량이 높고 pectic substances, hemicellulose, uronic acid 함량이 높아서 콜레스테롤 저하 등의 효과가 기대되며 고섬유식품으로서 조리 특성 연구가 필요한 것으로 사료된다.리하였다. 얻어진 소견(所見)은 다음과 같았다. 1. 모년령(母年齡), 임신회수(姙娠回數), 임신기간(姙娠其間), 출산시체중등(出産時體重等)의 제요인(諸要因)은 주산기사망(周産基死亡)에 대(對)하여 통계적(統計的)으로 유의(有意)한 영향을 미치고 있어 $25{\sim}29$세(歲)의 연령군에서, 2번째 임신과 2번째의 출산에서 그리고 만삭의 임신 기간에, 출산시체중(出産時體重) $3.50{\sim}3.99kg$사이의 아이에

  • PDF