• 제목/요약/키워드: 유전자 데이터베이스

검색결과 182건 처리시간 0.03초

Fisher Criterion을 이용한 Gene Set Enrichment Analysis 기반 유의 유전자 집합의 검출 방법 연구 (Identifying Statistically Significant Gene-Sets by Gene Set Enrichment Analysis Using Fisher Criterion)

  • 김재영;신미영
    • 전자공학회논문지CI
    • /
    • 제45권4호
    • /
    • pp.19-26
    • /
    • 2008
  • Gene set enrichment analysis (GSEA)는 두 개의 클래스를 가지는 마이크로어레이 실험 데이터 분석을 위해 생물학적 특징을 기반으로 구성된 다양한 유전자-집합 중에서 두 클래스의 발현값들이 통계적으로 중요한 차이를 나타내는 유의한 유전자-집합을 추출하기 위한 분석 방법이다. 특히, 유전자에 대한 다양한 생물학적인 정보를 지닌 유전자 주석 데이터베이스(Cytogenetic Band, KEGG pathway, Gene Ontology 등)를 이용하여 마이크로어레이 실험에 사용된 전체 유전자 중 특정 기능을 가지는 유전자들을 그룹화하여 다양한 유전자-집합을 발굴하고, 각 유전자-집합 내에서 두 클래스간에 발현값의 차이를 참조하여 유의한 유전자들을 결정하여, 이를 기반으로 통계적으로 유의한 유전자-집합들을 최종 검출하는 방법이다. 본 논문에서는 GSEA 분석 과정에서 현재 주로 사용되고 있는 signal-to-noise ratio 기반 유전자 서열화(gene ranking) 방법 대신에, Fisher criterion을 이용한 유전자 서열화 방법을 적용함으로써 기존의 GSEA 방법에서 추출하지 못한 생물학적으로 의미 있는 새로운 유의 유전자-집합을 추출하는 방법을 제안하고자 한다. 또한, 제안한 방법의 성능을 고찰하기 위하여 공개된 Leukemia 관련 마이크로어레이 실험 데이터 분석에 적용하였으며, 기존의 알려진 결과와 비교 분석함으로써 제안한 방법의 유용성을 검증하고자 하였다.

바이오인포매틱스 인프라 구축

  • 손현석
    • 지식정보인프라
    • /
    • 통권12호
    • /
    • pp.52-57
    • /
    • 2003
  • 바이오인포매틱스 시스템은 생명공학, 의학, 약학 등의 바이오인포매틱스 관련 산.학.연 연구자들의 연구개발의 기반이 되는 대용량의 생물정보를 효율적으로 저장하는 데이터베이스 구축 및 운영에 필요한 검색 처리 및 분석 시스템을 구축하는 정보인프라로서 21세기 가장 각광 받는 분야로 자리잡고있다. 최근 기하급수적으로 증가하고 있는 유전정보와 특정그룹이나 개인별 유전자 변화와 질병 감수성과의 관계 및 특정 질병과 관련된 유전자에 대한 생물학적 2차, 3차 분석정보 등 바이오인포매틱스 연구의 확대 필요성이 증가하고 있으나, 대부분의 생명공학 관련 산.학.연 연구자들은 연구분야에 적합한 IT기술을 적용할 수 있는 적절한 방법을 보유하고 있지못한 실정이다.

  • PDF

분류시스템의 분류 규칙 발견을 위한 유전자 알고리즘 (Genetic Algorithm to find Classification Rule for Classifier Systems)

  • 김대희;박상호
    • 한국산업정보학회논문지
    • /
    • 제9권4호
    • /
    • pp.16-25
    • /
    • 2004
  • 분류시스템은 현재의 유용한 규칙들로부터 새로운 규칙들을 만들어 가기 위해 학습하는 규칙 기반 시스템이다. 본 논문에서는 방대한 데이터베이스에서 유용한 정보를 얻는 분류시스템의 분류 규칙 발견을 위한 유전자 알고리즘 을 제안하였다. 제안된 방법을 자동차 보험문제에 적용하여 제안된 유전자 알고리즘 기반 분류시스템의 성능을 평가하였다.

  • PDF

생물정보학에서 사용자 그룹핑 기법을 이용한 서열 정렬 방법 (Sequence Alignment Scheme Using User Grouping for Bioinformatics)

  • 김민준;김재훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (A)
    • /
    • pp.13-15
    • /
    • 2002
  • 생물정보학 관련 프로그램들은 대부분 인터넷을 통해서 많은 생물학자, 생화학자 들에게 생물 정보 검색 및 처리 서비스를 제공한다. 이런 서비스를 제공하는 많은 프로그램들은 데이터베이스로부터 유전자 등의 데이터를 검색하고 처리한다. 이때 각각 클라이언트의 요청마다 매번 데이터베이스의 검색을 수행한다면 많은 시간이 걸리게 된다. 또한 서버에 과부하를 초래하여 응답시간이 길어질 수 있다. 본 논문에서는 서버의 과부하와 응답시간을 줄이기 위해 사용자의 요청을 그룹화하여 일정 시간 간격으로 일괄 처리하는 방법을 제안한다.

  • PDF

에이전트를 이용한 사용자 중심의 개인용 생물학 검색시스템 (User-Centric Personal Biological Retrieval System Using Agents)

  • 김영억;정광수;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.76-78
    • /
    • 2005
  • 생명정보 분야의 발전과 더불어 과거 축적되어 온 방대한 양의 생물학 데이터들이 이질적인 형태로 데이터베이스화 되어있다 특히, 인간게놈프로젝트의 완료 후에 유전자 및 단백질의 기능을 밝히기 위한 지노믹스 및 프로테오믹스 연구가 활발해졌다. 새로운 생물학적 과정을 탐색하기 위해서는 기존에 존재하는 생물학 데이터베이스의 데이터를 수집하기 위한 기술적인 검색 능력이 필요하다. 전산지식이 부족한 대부분의 생물학자들은 공개용 데이터베이스로부터 필요한 정보를 획득하는데 어려움을 격고 있다. 각 분야의 생물학자들이 공개용 데이터베이스로부터 자신의 분야에 관련된 데이터를 검색?추출하는 작업을 수월하게 해 줄 검색 시스템이 필요하다. 따라서, 에이전트를 이용하여 공개용 데이터베이스로부터 정보를 수집하는 사용자 중심의 개인용 검색시스템을 제안하고자 한다. 또한, 검색시스템을 이용하여 생물학자가 지노믹스와 프로테오믹스의 실험적인 접근을 위해 원하는 많은 양의 특정 도메인의 데이터를 검색하고 질의된 결과를 개인 컴퓨터에 2차 데이터베이스를 만들어 저장한다. 사용자에 의해 생성된 특정 분야의 도메인인 2차 데이터베이스를 통해 데이터의 접근의 편리성과 생물학 정보의 분석의 용이성을 얻을 수 있다.

  • PDF

BSML 기반의 유전자 데이터베이스와 변환기의 구축 (Development of Bioinformatic Database and Converting Tools based on BSML)

  • 윤애란;이수정;이희전;용환승
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.638-640
    • /
    • 2003
  • 최근 바이오인포매틱스 분야의 발전에 따라 방대한 양의 유전체 데이터에 대한 연구가 진행되고 있으며, 이러한 데이터를 효율적으로 다루기 위해 다양한 형태의 파일과 데이터베이스들이 사용되고 있다. 하지만 표준화의 미비로 인하여 데이터의 관리와 변환에 어려움이 많다. 본 논문에서는 이러한 문제점을 해결하기 위하여 바이오인포매틱스 데이터를 다루기 위한 표준으로 다양한 XML 포맷들 중에서 BSML(Bioinformatic Sequence Markup Language)을 채택하고, Genbank 파일을 변환하여 관계형 데이터베이스에 저장하는 모듈을 개발한다. 또한 관계형 데이터베이스 형태의 유전체 데이터를 BSML 형태로, Genbank 파일 형태를 BSML 형태로 그리고 AGAVE(Architecture for Genomic Annotation)파일 형태를 BSML 형태로 변환하는 변환기롤 개발하고자 한다.

  • PDF

비침윤성 방광암 환자의 재발 예측을 위한 유전자 선택 기법 비교 (Comparison of Gene Selection Method for Prediction of Non-muscle Bladder Cancer Recurrence)

  • 이경석;박현우;박수호;윤석중;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.87-89
    • /
    • 2013
  • 이 논문에서는 비침윤성 방광암 환자의 재발 예측을 위해 마이크로어레이 데이터에서 최적의 속성 부분 집합을 찾고 이를 비교 평가한다. 정보 이득(information gain)을 통해 구한 상위 40개, 80개, 100개의 속성 집합과 FCBF(fast correlation based filter) 알고리즘을 적용하여 구한 최적의 속성 부분집합을 SVM 분류 모델에 적용하여 정확도를 비교 평가한 결과 정보 이득을 적용한 상위 100개 속성 부분집합의 분류 정확도가 가장 높게 나왔으며, FCBF 알고리즘을 적용한 속성 집합은 비교적 적은 속성을 사용하면서 이와 비슷한 분류 정확도를 보임을 확인할 수 있었다.

신원확인 유전자정보은행 설립을 둘러싼 쟁점 연구 (Social Issues Arising from the Establishment of a National DNA Database)

  • 김병수
    • 과학기술학연구
    • /
    • 제3권2호
    • /
    • pp.83-104
    • /
    • 2003
  • 최근 질병관련 영역 못지않게 유전정보 이용이 눈에 띄게 증가하고 있는 분야가 개인식별 영역이다. 일부 국가에서는 범죄자유전자은행이 구축되어 운영되고 있으며, 군대, 이민국 등에서도 유전정보를 이용하고 있다. 국내에서도 이미 90년대 중반부터 친자확인, 사체확인, 범죄수사에 활용되고 있고 수사기관들은 신원확인을 위한 유전자정보은행을 준비하고 있다. 그런데 질병과 관련된 유전자 검사에 대한 높은 관심과는 달리 유전정보를 개인식별에 이용하는 것에 대해서는 사회적 관심이 별로 높지 않고 법적 윤리적 논의 또한 부족한 상황이다. 그러나 유전정보를 신원확인에 이용하는 과정에서도 개인의 프라이버시 침해, 유전정보의 오남용, 국가의 시민 감시체계확장 등 다양한 문제가 발생할 수 있다. 특히 유전자 감식을 개별적으로 사용하는데 그치지 않고 이를 데이터베이스로 구축할 경우 더욱 다양한 문제들이 발생할 수 있다. 본 논문에서는 그 동안 사회적으로 잘 알려지지 않았던 신원확인 유전자정보은행(DNA databank)의 추진 현황과 사회적 쟁점을 국내 논의 중심으로 살펴보고자 한다. 이를 위해 유전정보의 특징과 수사기관이 추진하고 신원확인 유전자정보은행에 대해서 살펴본다. 이어서 유전자정보은행 구축으로 인해 발생할 수 있는 사회적 문제를 검토해 본 후 논쟁이 건설적으로 이루어지기 위한 방안을 모색한다.

  • PDF

총 스트레치 최소화를 위한 분할 가능 리퀘스트 흐름 스케줄링 (Minimizing the Total Stretch when Scheduling Flows of Divisible Requests without Interruption)

  • 윤석훈
    • 한국전자거래학회지
    • /
    • 제20권1호
    • /
    • pp.79-88
    • /
    • 2015
  • 웹 서버나 데이터베이스 서버와 같은 컴퓨터 서버들은 연속적으로 리퀘스트 스트림을 받는다. 이런 서버들은 유저들에게 최선의 서비스를 제공하기 위해 리퀘스트들을 스케줄링하여야 한다. 이 논문은 분할 가능 리퀘스트들을 스케줄링할 때 총 스트레치를 최소화하기 위해 혼합 유전자 알고리즘을 제안한다. 리퀘스트의 스트레치는 리퀘스트가 시스템에 머무는 시간에 대한 반응 시간의 비율로 정의된다. 혼합 유전자 알고리즘은 유전자 알고리즘의 활용과 탐구 능력를 개선하기 위해 시드 선택과 개발의 아이디어를 도입하였다. 혼합 유전자 알고리즘과 유전자 알고리즘의 성능을 비교하기 위하여 광범한 컴퓨터 실험이 실행되었다.

노화 관련 유전자의 후성유전학적 특성 분석 (Epigenetic Characterization of Aging Related Genes)

  • 류제운;이상철;유재수;김학용
    • 한국콘텐츠학회논문지
    • /
    • 제13권8호
    • /
    • pp.466-473
    • /
    • 2013
  • 유전자 염기서열의 직접적인 변화 대신 염기의 수정 또는 변형을 통해 유전자 발현이 조절되는 후성유전은 크게 DNA 메틸화(methylation), 히스톤 변형(modification), ncRNA(non-coding RNA)에 의해 제어가 가능하다. 본 연구에서는 후성유전을 이해하기 위해 노화 관련 유전자를 대상으로 데이터베이스를 구축하고, DNA 메틸화를 중심으로 후성 유전학적 특성을 분석하였다. 유전자의 upstream 부위와 프로모터(promoter) 부위에 있는 CpG island(CGI)에 메틸화가 될 경우 유전자 발현을 억제하기 때문에 CGI를 중심으로 전체 유전자 그룹과 노화 관련 유전자 그룹간의 분포도를 비교 분석하였다. 또한 메틸화와 관련된 CGI로부터 얻은 메틸화 관련 motif 패턴을 이용하여 노화 유전자와의 관계를 분석하였다. 노화 관련 유전자의 CGI 분포는 전사인자 결합자리의 분포와 일치하였다. 본 연구에서 제공하는 DNA 메틸화 중심의 후성유전학적 정보는 노화 관련 유전자의 조절과 노화를 이해하는데 도움이 될 것으로 사료된다.