• 제목/요약/키워드: 바이오 데이터

검색결과 1,361건 처리시간 0.028초

XPath 질의 처리를 적용한 단백질 데이터 통합 관리시스템 구축 (Building a Integrated Protein Data Management System Using the XPath Query Process)

  • 차효성;정광수;정영진;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.103-105
    • /
    • 2004
  • 최근 바이오 인포매틱스 분야의 발전에 따라 방대한 양의 유전체 데이터에 대한 연구가 진행되고 있으며, 이러한 데이터를 효율적으로 다루기 위해 다양한 형태의 파일과 데이터베이스들이 사용되고 있다. 하지만 표준화의 미비로 인하여 데이터의 관리 및 변환에 어려움이 많다. 따라서 이 논문에서는 시퀀싱을 통해 생성된 유전체 및 단백질 서열 데이터의 통합 저장 관리를 위해 서열 정보의 편집, 저장 및 검색과 서열 파일 포맷 변환을 수행하는 서열 정보관리 시스템의 구현을 목적으로 한다. 이러한 요구사항을 만족시키기 위해 바이오 인포메틱스 데이터를 다루기 위한 표준으로 BSML(Bioinformatic Sequence Markup Language)을 채택하고 이질적 플랫파일들은 DTD를 기반으로 BSML 스키마로 통합 및 저장한다. 그리고 객체 관계 데이터베이스 특성을 적용하여 XML 문서를 보다 쉽게 저장 관리하고 범위 또는 구조적 질의에 효율적인 XPath 질의 처리를 위한 시스템을 개발하였다.

  • PDF

Visual Cell : 바이오세포 이미지 빅데이터를 위한 이미지 분석 및 시각적 검색 시스템 (Visual Cell : Image Analysis and Visual Retrieval System for Biology Cell Image Bigdata)

  • 박범준;조선화;이수안;신지운;유혁상;김진호
    • 한국빅데이터학회지
    • /
    • 제4권1호
    • /
    • pp.53-61
    • /
    • 2019
  • 주변 세포의 구조적, 생화학적 지지체를 제공하는 세포 외 기질은 세포의 분열과 분화 등을 좌우하는 세포생리 조절인자이다. 바이오 분야에서는 3차원 조직공학 지지체인 스캐폴드를 제작하고, 제작한 스캐폴드에 줄기세포를 배양해 동물에 이식해 조직 재생력을 평가한다. 이는 조직 내 콜라겐과 같은 구성성분에 좌우된다. 따라서 조직 내 구성성분의 포함율 및 분포를 파악하는 것이 매우 중요한데, 이에 관한 데이터를 염색된 조직 이미지의 색상을 분석함으로써 얻어낸다. 이때 이미지 수집부터 분석까지의 과정이 적지 않은 비용이 소모되고 있고, 수집되고 분석된 데이터를 연구 기관마다 상이한 포맷으로 관리하고 있다. 따라서 데이터 통합관리 및 분석결과 검색 등이 이루어지지 않고 있다. 본 논문에서는 관련 빅데이터를 통합적으로 관리할 수 있는 데이터베이스를 구축하고, 이 연구 분야에서 중요한 분석 척도인 색상을 기준으로 검색할 수 있는 바이오 이미지 통합 관리 및 검색 시스템을 제안한다.

  • PDF

병렬 컴퓨팅 기반의 유전체 분석 워크벤치 (Genomic Analysis Workbench Based on Parallelized Computing)

  • 선충현;이관수;박학수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.244-246
    • /
    • 2005
  • 최근 바이오 데이터 분석에는 데이터 양의 급격한 증가와 이에 따른 문제의 복잡성도 함께 증가하고 있다. 이 결과 다양한 분석 툴들의 유연한 조합과 고성능, 고처리 컴퓨팅이 가능한 분석 시스템이 절실히 요구되고 있다. 본 논문에서는 병렬 컴퓨팅 환경을 이용하고 워크플로우 기반에서 다양한 생물정보 분석 툴들을 자유롭게 조합하여 작업을 수행할 수 있는 바이오워크벤치를 소개한다. 바이오워크벤치 내에는 컴퓨팅 자원 및 작업정보에 대한 모니터링 툴, 각 툴 들과 데이터를 손쉽게 가공할 수 있도록 고안된 인터페이싱 툴 워크플로우 디자인 툴을 포함 하고 있다. 이 기능모듈을 활용함으로써 다양한 생물정보 분석 툴을 이용하는 과정에서 효율적인 분석을 수행을 지원하는 바이오 워크벤치의 기능 및 아키텍쳐을 제시한다.

  • PDF

그리드 환경을 위한 정형화된 웹 기반 데이터 검색 시스템 (Formalized Web-based Data Searching System for GRID Environment)

  • 이상근;황석찬;최재영;노경태
    • 정보처리학회논문지A
    • /
    • 제11A권1호
    • /
    • pp.75-80
    • /
    • 2004
  • 데이터베이스에 저장되어 있는 데이터를 그리드 시스템에서 사용하기 위해서는 먼저 시스템에 필요한 데이터를 수집하여 데이터베이스나 파일 시스템에 저장한 후, 데이터베이스의 데이터 및 그 인덱스를 관리하는 전용의 모듈을 별도로 구현하고, 그리드 시스템에 연동시켜야 한다. 웹 기반의 데이터 검색 시스템을 구현하여 데이터베이스에 있는 데이터들을 그리드 시스템에서 바로 사용할 수 있다면, 전용의 데이터 모듈 없이 그리드 시스템에서 바로 데이터를 처리할 수 있으므로, 보다 효율적이고 사용하기 쉬우며, 데이터베이스의 변경에 유연하게 대처한 수 있을 것이다. 본 논문에서는 웹 기반 데이터베이스의 데이터를 바로 그리드 시스템과 연계시켜 사용한 수 있는 검색 시스템을 제안한다. 이 검색 시스템을 이용하여 버추얼 스크리닝 작업을 수행하는 바이오 그리드 시스템에 적용하여 UB Grid (Universal Bio Grid)를 구축하였다. 개발자는 웹에서 제공되는 데이터론 그리드 시스템에 통합시키기 위한 시간과 노력을 줄일 수 있었으며, 사용자는 보다 쉽게 효율적으로 UB Grid 시스템을 사용한 수 있었다.

연구데이터 메타데이터의 품질과 연구데이터플랫폼의 활성화의 관계에서 동기부여 요인의 매개효과 연구 (A Study on the Mediating Effect of Motivation Factors between the Quality of Research Data Metadata and the Activation of Research Data Platform)

  • 박성은
    • 한국문헌정보학회지
    • /
    • 제57권3호
    • /
    • pp.325-350
    • /
    • 2023
  • 본 연구는 바이오 분야 연구데이터플랫폼인 K-BDS를 대상으로, 연구데이터 메타데이터의 품질이 연구데이터플랫폼의 활성화에 미치는 영향 및 이 관계에서 연구데이터플랫폼 이용에 관한 동기부여 요인의 매개효과를 밝히고자 하였다. 먼저 세 변인 간 구조적 관계를 구조방정식모형, 부트스트랩을 통해 분석하였으며 분석 결과, 연구자가 메타데이터의 품질에 대해 중요하다고 생각할수록 연구데이터플랫폼 이용의 동기부여 정도, 그리고 플랫폼의 활성화 의도가 높아지는 것으로 나타났다. 또한 동기부여 요인의 매개효과도 확인되었다. 추가적으로 각 변인의 하위요인간의 세부적인 구조를 회귀분석과 Sobel test를 통해 파악하였다. 그 결과 바이오 분야의 연구데이터 공유의 활성화를 위해서는 검색가능성을, 연구데이터 재이용의 활성화를 위해서는 발견가능성을 높이는 것이 가장 효과적이며, 인용가능성은 플랫폼의 활성화에 영향을 미치지 않는 것으로 나타났다. 따라서 플랫폼을 활성화하기 위해서는 우선적으로 메타데이터 품질을 향상시킴으로써 시스템적인 지원을 충분히 하는 것이 중요하며, 이를 통해 플랫폼에 대한 신뢰를 높이고 인용에 대한 혜택을 제도적으로 정착시켜 갈 필요가 있다는 시사점을 얻을 수 있다.

빅데이터 분석을 위한 임상 및 바이오 정보 통합 데이터베이스의 설계 (Design of an Integrated Database of Clinical and Bio Information for Big Data Analysis)

  • 임종태;류은경;김기연;김천중;윤수용;박선용;노연우;육미선;정지원;최기태;유석종;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2014년도 추계 종합학술대회 논문집
    • /
    • pp.299-300
    • /
    • 2014
  • 생명과학분야에서는 생명현상을 이해하기 위해 신호 전달 네트워크에 대한 연구가 진행되고 있다. 하지만 신호전달 네트워크와 임상 정보를 결합하여 질병관점에서 신호 전달 네트워크를 통합하고 결합하는 관점의 연구가 부족하다. 따라서 본 논문에서는 빅데이터 기술을 활용하여 임상 및 신호전달 정보를 연계 분석할 수 있는 시스템을 구축하고자 빅데이터 분석을 위한 임상 및 바이오 정보 통합 데이터베이스를 설계한다. 설계한 임상 및 바이오 정보 통합 데이터베이스는 빅데이터 분석 기술을 적용한 확장 분석 기법 및 통합 분석 시스템 개발에 활용할 수 있다.

  • PDF

K-means 알고리즘을 사용한 분산 바이오 데이터 통합화 (Integration of Distributed Biological Data using Modified K-means Algorithm)

  • 류병걸;신동규;신동일;정종일
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (B)
    • /
    • pp.32-35
    • /
    • 2007
  • Bioinformatics의 목표는 생물학적인 질의를 해결하는 것과 생물학자들이 수집된 데이터를 분석하고 검색을 하여 생물학자들이 정확한 일을 수행하는 것이다. 인터넷은 여러 조사 그룹의 데이터베이스에 동시에 접근가능한 수단을 제공했으나 이러한 분산 환경에서 많은 양의 데이터는 전송 시의 시간 지연 문제와 최종 검색시의 느린 검색 속도 문제를 나타낸다. 데이터 클러스터링은 데이터의 검색시 이러한 문제점을 해결하기 위하여 이용될 수 있는 방법이지만 단순 적용시에는 데이터의 양에 비례하는 실행 시간이 또 다른 문제를 발생시킨다. 본 논문에서는 바이오데이터의 효율적인 클러스터링을 위한 개선된 분산 클러스터링 시나리오와 이를 위해 수정된 K-means 알고리즘을 제시한다. 최종 실험 결과는 20% 이상 향상된 실행 속도를 보여준다.

  • PDF

구글 학술 검색 기반의 질병과 바이오마커 관계 분석 (Relation Analysis of Disease and Biomarker based on Google Scholar)

  • 오병두;김유섭
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.238-241
    • /
    • 2017
  • 본 논문에서는 구글 학술 검색 기반의 데이터를 이용하여 질병과 폐질환과 관련된 바이오마커 단어의 유사도를 계산하는 방법을 제안한다. 질병과 바이오마커의 유사도를 계산할 때, 각 단어의 구글 학술 검색의 검색 결과를 이용하였다. 이를 통해 폐질환 관련 바이오마커와 다른 질병간의 관계를 파악하고자 하며, 의료 전문가에게 폐질환 관련 바이오마커와 다른 질병간의 새로운 관계를 제시하고자 한다. 이러한 데이터를 이용하여 계산한 결과, Wor2Vec의 결과를 이용한 코사인 유사도의 결과와 상관 계수가 약 0.64로 상당히 높은 상관 관계를 확인할 수 있었다. 따라서 이 방법을 통해 질병과 바이오마커의 관계를 파악하고자 하였다. 또한 Word2Vec을 이용한 질병과 바이오마커 단어의 벡터 값과 단어 유사도 계산 방법의 결과를 이용한 Deep Neural Networks (DNNs) 모델을 구축하고자 하며, 이를 통해 자동적으로 유사도를 분석하고자 하였다.

  • PDF

구글 학술 검색 기반의 질병과 바이오마커 관계 분석 (Relation Analysis of Disease and Biomarker based on Google Scholar)

  • 오병두;김유섭
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.238-241
    • /
    • 2017
  • 본 논문에서는 구글 학술 검색 기반의 데이터를 이용하여 질병과 폐질환과 관련된 바이오마커 단어의 유사도를 계산하는 방법을 제안한다. 질병과 바이오마커의 유사도를 계산할 때, 각 단어의 구글 학술 검색의 검색 결과를 이용하였다. 이를 통해 폐질환 관련 바이오마커와 다른 질병간의 관계를 파악하고자 히며, 의료 전문가에게 폐질환 관련 바이오마커와 다른 질병간의 새로운 관계를 제시하고자 한다. 이러한 데이터를 이용하여 계산한 결과, Wor2Vec의 결과를 이용한 코사인 유사도의 결과와 상관 계수가 약 0.64로 상당히 높은 상관 관계를 확인할 수 있었다. 따라서 이 방법을 통해 질병과 바이오마커의 관계를 파악하고자 하였다. 또한 Word2Vec을 이용한 질병과 바이오마커 단어의 벡터 값과 단어 유사도 계산 방법의 결과를 이용한 Deep Neural Networks (DNNs) 모델을 구축하고자 하며, 이를 통해 자동적으로 유사도를 분석하고자 하였다.

  • PDF

이질형 바이오 데이터베이스 통합을 위한 개체-관련성 모델링 (Entity-Relationship Modeling for Integrating Heterogeneous Bio-databases)

  • 정진희;이도헌
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.69-72
    • /
    • 2001
  • 유전체 연구를 위해 구축된 바이오 데이터베이스는 해당 프로젝트의 목적에 따라 서로 다른 주체에 의해 독립적으로 구축되어 왔다. 그러나 바이오 데이터의 효과적인 판용을 위해서는 그러한 이질적인 바이오 데이터베이스의 정보를 상호 연계하여 분석한 필요성이 높아지고 있다. 본 논문에서는 대표적인 핵산 데이터베이스인 GenBank와 단백질 데이터베이스인 SWISS-PROT, 문헌 데이터베이스인 PubMed의 데이터 구조를 개체-관련성 도표로 각각 모델링한 후 합병하여, 핵산-단백질-문헌자료로 연계되는 정보를 통합 서비스할 수 있는 모델과 시스템 구조를 제시한다.

  • PDF