• 제목/요약/키워드: 바이오 인포메틱스

검색결과 9건 처리시간 0.056초

DNA Microarray 발현정보에 대한 생물학적 정보처리에 관한 연구 (A Study of a Biological Information Processing for DNA Microarray Expression Data)

  • 조영임;정현철
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2007년도 추계학술대회 학술발표 논문집
    • /
    • pp.149-152
    • /
    • 2007
  • 본 논문은 바이오 인포메틱스의 분야를 간단히 소개하고 기능유전체학에서 microarray 실험에 대한 통계적 방법론을 살펴보고자 한다. 또한 DNA chip 설계와 생물학적 특정에 대해 살펴보고 각 분야에서 적용되는 통계적 방법을 연구분석 해보고자 한다.

  • PDF

바이오 인포메틱스를 이용한 웹 페이지 분석 기법에 관한 연구 (A Study on Web Pages Analysts Technique based on Bioinformatics)

  • 윤효근;이상용
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.97-99
    • /
    • 2001
  • 대부분의 정보검색 과정들은 웹 페이지의 분석에 따라 검색 로봇을 이용한 검색기법, 카테고리를 이용한 색인 DB를 검색기법, 메타 태그를 이용한 검색기법을 사용하고 있다. 그러나 이러한 기법을 통하여 원하는 정보를 얻을 경우 정확도가 떨어지는 정보가 검색되어 사용자는 다시 한번 검색된 목록들을 확인해야 하는 경우가 발생한다. 본 논문은 다양한 형태의 웹 페이지에 대하여 바이오 인포메틱스 기술을 적용하여 분석, 사용자에게 필요로 하는 정보를 보다 정확하게 제공하는 기법을 제안한다.

  • PDF

그리드를 이용한 바이오 인포메틱스 응용 클라이언트 설계 (Design of Bioinformatics Application using Grid)

  • 유승범;신동규;신동일
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.364-366
    • /
    • 2002
  • 최근 생명공학 분야에서는 IT와 BT가 결합하는 새로운 패러다임의 컴퓨팅 환경이 구축되고 있다. 이에 게놈 프로젝트 결과 분석해야 하는 데이터의 양은 엄청나게 증가하고 있다. 그러한 데이터를 처리하기 위해서는 대규모 저장장치 외에 슈퍼컴퓨터 급의 고성능 컴퓨터가 필요하게 되었다. 그러한 데이터를 처리하기 위해서는 대규모 저장장치 외에 슈퍼컴퓨터 급의 고성능 컴퓨터가 필요하게 되었으며, 바이오 인포메틱스 분야를 지원하기 위해서는 대규모 하드웨어 뿐만 아니라 데이터베이스, 데이터 마이닝 등의 소프트웨어 기술로 인해 그리드 환경을 요구하게 되었다. 이에 본 논문에서는 그리드 환경에서 분산된 수많은 생물학 데이터베이스에 쉽게 접근할 수 있는 통합 환경으로 응용 클라이언트를 제시할 것이다.

  • PDF

XPath 질의 처리를 적용한 단백질 데이터 통합 관리시스템 구축 (Building a Integrated Protein Data Management System Using the XPath Query Process)

  • 차효성;정광수;정영진;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.103-105
    • /
    • 2004
  • 최근 바이오 인포매틱스 분야의 발전에 따라 방대한 양의 유전체 데이터에 대한 연구가 진행되고 있으며, 이러한 데이터를 효율적으로 다루기 위해 다양한 형태의 파일과 데이터베이스들이 사용되고 있다. 하지만 표준화의 미비로 인하여 데이터의 관리 및 변환에 어려움이 많다. 따라서 이 논문에서는 시퀀싱을 통해 생성된 유전체 및 단백질 서열 데이터의 통합 저장 관리를 위해 서열 정보의 편집, 저장 및 검색과 서열 파일 포맷 변환을 수행하는 서열 정보관리 시스템의 구현을 목적으로 한다. 이러한 요구사항을 만족시키기 위해 바이오 인포메틱스 데이터를 다루기 위한 표준으로 BSML(Bioinformatic Sequence Markup Language)을 채택하고 이질적 플랫파일들은 DTD를 기반으로 BSML 스키마로 통합 및 저장한다. 그리고 객체 관계 데이터베이스 특성을 적용하여 XML 문서를 보다 쉽게 저장 관리하고 범위 또는 구조적 질의에 효율적인 XPath 질의 처리를 위한 시스템을 개발하였다.

  • PDF

단백질 이차구조의 검색을 위한 클러스터링된 세그먼트 인덱싱 (Clustered Segment Indexing for Searching on the Secondary Structure of Protein)

  • 서민구;박상현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.298-300
    • /
    • 2004
  • 바이오 인포메틱스에서의 데이터 검색은 DNA와 단백질 시퀀스에 대해서 주로 이루어지며, 지금까지의 연구는 주로 DNA와 단백질 1차 구조의 검색에 대해 이루어졌다. 단백질 2차구조는 1차구조 내 인접한 아미노산들의 공간적인 배열을 나타내며. 단백질의 기능을 예측하는데 중요한 3차구조의 지역적 아미노산의 특성을 나타낸다. 따라서 2차구조에 대한 검색은 단백질의 기능을 이해하는데 매우 중요한 역할을 한다[1]. 이 논문에서는 단백질 2차구조 및 질의 문자열을 세그먼트 단위로 나누고 검색하는 r41의 방법을 개선하여 세그먼트를 조합한 클러스터 구조 및 Look Ahead를 사용해 Exact Matching 및 Wildcard Matching 질의를 효율적으로 처리할 수 있는 기법을 제시한다.

  • PDF

Etherboot 기반의 CGRID 구축과 서열분석에의 적용 (CGRID construction based on Etherboot technology and its utilization to sequence analysis)

  • 김태경;조완섭
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권6호
    • /
    • pp.195-208
    • /
    • 2005
  • 최근 생물학 분야에서 실험 도구의 발달 및 컴퓨터 기술의 도입으로 생물 데이터가 폭발적으로 증가하고 있다. 대량의 생물 데이터로부터 의미 있는 정보를 추출하는 것은 매우 중요한 문제이다. 서열비교는 유전자 및 단백질 기능 예측을 하기 위해 사용되는 가장 기본적인 분석방법이다. 하지만, 급격히 증가하는 대량의 서열데이터에 대하여 처리시간 또한 많이 소요된다. 본 논문에서는 이러한 성능상의 한계를 극복하고 기존 미들웨어 방식의 그리드를 보완하기 위하여 하드웨어 기반의 그리드인 CGRID (Chungbuk national university GRID)를 제안하고 서열비교에 적용한다. 하드웨어 기반의 그리드 방식은 기존의 방식과는 달리 모든 작업노드에 반복적으로 프로그램 설치를 할 필요가 없으므로 그리드 구축, 유지 및 관리가 용이하다. 27대의 PC로 구성된 CGRID에서 89종의 오솔로그 데이터베이스 구축 시간을 33주에서 1주일로 단축하였다. 또한, 실험을 통하여 CGRID에서 PC의 수가 증가함에 따라 시스템의 성능이 비례하여 향상됨을 확인하였다.

  • PDF

맵리듀스에서 데이터의 유용성을 이용한 데이터 분할 기법 (Data Partitioning on MapReduce by Leveraging Data Utility)

  • 김종욱
    • 한국멀티미디어학회논문지
    • /
    • 제16권5호
    • /
    • pp.657-666
    • /
    • 2013
  • 현대사회는 소셜 미디어, 비즈니스, 바이오 인포메틱스 같은 다양한 응용프로그램에서 지속적으로 생산되어 지고 있는 수많은 데이터의 빠른 유입으로 특징지어 지고 있다. 이에 따라 폭발적으로 증가하고 있는 대규모 데이터를 보다 효율적으로 분석하고 처리 할 수 있는 방법이 그 어느 때보다 강조 되고 있다. 지난 몇 년간 학계에서는 배치 지향 시스템 (batch oriented system) 환경 내에서 병렬 처리를 효과적으로 지원할 수 있는 맵리듀스 기법이 활발히 연구 되어 왔으며, 맵리듀스 기법은 다양한 분야에서 성공적으로 사용되고 있다. 그러나 이 기법은 데이터의 상대적 유용성 (data utility)을 고려하지 않기 때문에, 멀티미디어 응용프로그램 사용자의 특성 (즉, 높은 혹은 낮은 스코어를 가지는 몇몇 결과물에 관심을 가지는 사용자들의 특성)으로 인하여 효과적인 성능을 보여 주지 못하고 있다. 따라서 본 논문에서는 이러한 문제점을 해소하기 위해, 맵리듀스 상에서의 데이터 분할 방식을 제안한다. 또한, 제안된 분할 방식에 대한 성능 실험을 통하여 우리가 제안하는 데이터 분할 방식이 기존 방식보다 성능 향상을 자져올 수 있음을 보여준다.

무선 애드 혹 네트워크에서 효과적인 메시지 전달을 위한 Directional Partial Dominant Pruning 알고리즘 (The directional partial dominant pruning algorithm for efficient message forwarding in an wireless ad-hoc network)

  • 한인구;임기욱;이정현
    • 한국산업정보학회논문지
    • /
    • 제14권2호
    • /
    • pp.16-22
    • /
    • 2009
  • 이동 애드 혹 네트워크에 있어서 브로드캐스팅을 실현할 때에 전달 메시지가 과중하게 중복 발생하는 것을 줄이기 위해 메시지를 수신하고 전달하는 역할을 맡는 전탈 노드들을 in-fly 형태로 지정하도록 하는 기법 중 가장 실용적인 것으로는 PDP(Partial Dominant Pruning) 기법[1]을 들 수 있다 본 논문에서는 PDP를 확장하여 방향성 안테나를 이용하는 애드 혹 네트워크에 있어서 전달 노드들의 수는 물론, 이때 수반되는 안테나 요소 수를 동시에 줄이도록 하는 확장된 DPDP (Directional PDP) 기법을 제안한다. 시뮬레이션을 통해 사용 안테나 요소 수(K)가 증가함에 따라 선정되는 전달 노드의 수는 전 방향 안테나를 사용하는 경우에 비해 다소 증가하지만 안테나 요소 별 평균 전달 노드 수와 노드 별 메시지 중복수신 수에서는 모두 PDP 기법에 비해 우수함을 보였다.

고성능 BLAST구현을 위한 E-Cluster 기반 데이터 분할 및 질의 라우팅 기법 (A Physical Data Design and Query Routing Technique of High Performance BLAST on E-Cluster)

  • 김태경;조완섭
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권2호
    • /
    • pp.139-147
    • /
    • 2009
  • BLAST는 생명정보학 분야에서 가장 많이 사용하는 도구이다. 이 도구는 입력서열을 기존 서열 데이터베이스와 신속히 비교하고 그 기능을 예측한다. 생물학자는 BLAST를 이용하여 실험의 범위, 시간과 비용을 줄일 수 있다. 하지만, 서열 데이터 양이 급격히 증가함에 따라 그 처리 시간도 같이 증가하여 성능개선 방안이 필요하다. 본 논문에서는 대용량 BLAST처리 성능 향상을 위한 PC 기반의 클러스터 인프라 (E-Cluster)를 제시하고 이 기반에서 데이터베이스 분할기법 (Logical Partitioning)과 질의 라우팅 기법(Intra-Query)을 제안한다. 제안된 시스템을 평가하기 위해 다양한 길이의 서열들과 NR 데이터베이스와 비교하여 응답시간(Response Time), 성능 향상(Speedup), 효율(Efficiency) 관점에서 평가한다. 본 실험을 통해 기존 SMP, Cluster, 그리드 기반의 BLAST 시스템보다 성능, 효율이 뛰어남을 확인하였고, 특히 제안한 시스템의 최대 효율은 600%로 매우 높았다.