• Title/Summary/Keyword: 바이오 데이터

Search Result 1,367, Processing Time 0.034 seconds

Unification System for Analysis of DNA Sequence (DNA 서열 분석을 위한 통합 시스템)

  • Song, Young-Ohk;Chang, Duk-Jin
    • The Journal of the Korea Contents Association
    • /
    • v.11 no.3
    • /
    • pp.65-72
    • /
    • 2011
  • We stand at real world that some practical use method of gene information appears in succession by entrance on the stage of advanced techonlogy. As a lot of studies and development are achieved based on analysis of bio data, necessity of a tool that can help correct interpretation of data is required more and more in a lot of targets of bioinformatics to search new relation and information are established. In this paper, we are offered in existing I wish to offer user a more convenient study tool developing system that can supplement shortcomings of various tools for data analysis. So we've designed to offer in united environment that is not environment that is parted ORF driving out, bio information retrieval and work of similarity comparison lamp to work for bio data analysis and offers lacking consecutiveness in existing analysis system.

Building a Integrated Protein Data Management System Using the XPath Query Process (XPath 질의 처리를 적용한 단백질 데이터 통합 관리시스템 구축)

  • 차효성;정광수;정영진;류근호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.103-105
    • /
    • 2004
  • 최근 바이오 인포매틱스 분야의 발전에 따라 방대한 양의 유전체 데이터에 대한 연구가 진행되고 있으며, 이러한 데이터를 효율적으로 다루기 위해 다양한 형태의 파일과 데이터베이스들이 사용되고 있다. 하지만 표준화의 미비로 인하여 데이터의 관리 및 변환에 어려움이 많다. 따라서 이 논문에서는 시퀀싱을 통해 생성된 유전체 및 단백질 서열 데이터의 통합 저장 관리를 위해 서열 정보의 편집, 저장 및 검색과 서열 파일 포맷 변환을 수행하는 서열 정보관리 시스템의 구현을 목적으로 한다. 이러한 요구사항을 만족시키기 위해 바이오 인포메틱스 데이터를 다루기 위한 표준으로 BSML(Bioinformatic Sequence Markup Language)을 채택하고 이질적 플랫파일들은 DTD를 기반으로 BSML 스키마로 통합 및 저장한다. 그리고 객체 관계 데이터베이스 특성을 적용하여 XML 문서를 보다 쉽게 저장 관리하고 범위 또는 구조적 질의에 효율적인 XPath 질의 처리를 위한 시스템을 개발하였다.

  • PDF

Visual Cell : Image Analysis and Visual Retrieval System for Biology Cell Image Bigdata (Visual Cell : 바이오세포 이미지 빅데이터를 위한 이미지 분석 및 시각적 검색 시스템)

  • Park, Beomjun;Jo, Sunhwa;Lee, Suan;Shin, Jiwoon;Yoo, Hyuk Sang;Kim, Jinho
    • The Journal of Bigdata
    • /
    • v.4 no.1
    • /
    • pp.53-61
    • /
    • 2019
  • The extracellular matrix, which provides the structural and biochemical support of surrounding cells, is a cell physiological modulator that controls cell division and differentiation. In the bio sector, the company produces Scapold, a three-dimensional support for tissue engineering, and cultivates stem cells in the produced Scapold to be transplanted into animals to assess tissue regeneration. This depends on components such as collagen in the tissue. Therefore, it is very important to identify the inclusion rate and distribution of components in the tissue, and the data are obtained by analyzing the color of the dyed tissue image. The process from image collection to analysis is costly, and the data collected and analyzed are managed in different formats by different research institutions. Therefore, data integration management and analysis results search are not being performed. In this paper, we establish a database that can manage relevant bigdata in an integrated manner, and propose a bio-image integrated management and retrieval system that can be searched based on color, an important analytical measure in this field of study.

  • PDF

Genomic Analysis Workbench Based on Parallelized Computing (병렬 컴퓨팅 기반의 유전체 분석 워크벤치)

  • Sun Choong Hyun;Yi Gwan Su;Park Hark-Soo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.244-246
    • /
    • 2005
  • 최근 바이오 데이터 분석에는 데이터 양의 급격한 증가와 이에 따른 문제의 복잡성도 함께 증가하고 있다. 이 결과 다양한 분석 툴들의 유연한 조합과 고성능, 고처리 컴퓨팅이 가능한 분석 시스템이 절실히 요구되고 있다. 본 논문에서는 병렬 컴퓨팅 환경을 이용하고 워크플로우 기반에서 다양한 생물정보 분석 툴들을 자유롭게 조합하여 작업을 수행할 수 있는 바이오워크벤치를 소개한다. 바이오워크벤치 내에는 컴퓨팅 자원 및 작업정보에 대한 모니터링 툴, 각 툴 들과 데이터를 손쉽게 가공할 수 있도록 고안된 인터페이싱 툴 워크플로우 디자인 툴을 포함 하고 있다. 이 기능모듈을 활용함으로써 다양한 생물정보 분석 툴을 이용하는 과정에서 효율적인 분석을 수행을 지원하는 바이오 워크벤치의 기능 및 아키텍쳐을 제시한다.

  • PDF

Formalized Web-based Data Searching System for GRID Environment (그리드 환경을 위한 정형화된 웹 기반 데이터 검색 시스템)

  • Lee, Sang-keon;Hwang, Seog-chan;Choi, Jae-young;No, Kyoung-Tai
    • The KIPS Transactions:PartA
    • /
    • v.11A no.1
    • /
    • pp.75-80
    • /
    • 2004
  • To interact database data with GRID system, implementation and installation of data manipulation module which manipulates database data and its index is required. Developing a search system searching data on web-based database, and integrating it with grid system, it is possible that searching data on web and use it directly on GRID system without independent data module. So, we can build easy and effective grid system, and the system could have more flexible architecture adapting data change. In this paper, we propose a searching system which interacting web-based database with GRID systems. We integrated the searching system with a bio god system which runs virtual screening jobs. As a result, UB Grid (Universal Bio Grid) is constructed. Developer could reduce time and effort required to integrate web data to GRID system, and user could use UB Grid system easily and effectively.

A Study on the Mediating Effect of Motivation Factors between the Quality of Research Data Metadata and the Activation of Research Data Platform (연구데이터 메타데이터의 품질과 연구데이터플랫폼의 활성화의 관계에서 동기부여 요인의 매개효과 연구)

  • Seong-Eun Park
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.57 no.3
    • /
    • pp.325-350
    • /
    • 2023
  • This study focuses on the impact of research data metadata quality evaluation index on the revitalization of K-BDS, a research data platform in the bio field, and examines the mediating effect of motivation factors for utilizing the platform. The investigation employs a structural equation model analysis and bootstrap analysis to explore the interrelationships among the three variables. The findings demonstrate that researchers who prioritize the quality of metadata display higher motivation to use the research data platform, leading to an intention to activate the platform. The study also confirms the mediating effect of motivation factors. Moreover, a comprehensive understanding of the sub-factors within each variable is attained through regression analysis and Sobel test. The results highlight that enhancing searchability is crucial to activate research data sharing in the bio field, while improving discoverability is vital for research data reuse. Interestingly, the study reveals that citationability does not significantly impact platform activation. As a conclusion, to foster platform activation, it is imperative to provide systematic support by enhancing metadata quality. This improvement can not only increase trust in the platform but also institutionally solidify the benefits of citation.

Design of an Integrated Database of Clinical and Bio Information for Big Data Analysis (빅데이터 분석을 위한 임상 및 바이오 정보 통합 데이터베이스의 설계)

  • Lim, Jongtae;Ryu, Eunkyung;Kim, Kiyeon;Kim, Cheonjung;Yoon, Sooyong;Park, Sunyong;Noh, Yeonwoo;Yuk, Miseon;Jeong, Jiwon;Choi, Kitae;Yu, Seokjong;Yoo, Jaesoo
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2014.11a
    • /
    • pp.299-300
    • /
    • 2014
  • 생명과학분야에서는 생명현상을 이해하기 위해 신호 전달 네트워크에 대한 연구가 진행되고 있다. 하지만 신호전달 네트워크와 임상 정보를 결합하여 질병관점에서 신호 전달 네트워크를 통합하고 결합하는 관점의 연구가 부족하다. 따라서 본 논문에서는 빅데이터 기술을 활용하여 임상 및 신호전달 정보를 연계 분석할 수 있는 시스템을 구축하고자 빅데이터 분석을 위한 임상 및 바이오 정보 통합 데이터베이스를 설계한다. 설계한 임상 및 바이오 정보 통합 데이터베이스는 빅데이터 분석 기술을 적용한 확장 분석 기법 및 통합 분석 시스템 개발에 활용할 수 있다.

  • PDF

Integration of Distributed Biological Data using Modified K-means Algorithm (K-means 알고리즘을 사용한 분산 바이오 데이터 통합화)

  • Ryu, Byung-Gul;Shin, Dong-Kyoo;Shin, Dong-Il;Jeong, Jong-Il
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.06b
    • /
    • pp.32-35
    • /
    • 2007
  • Bioinformatics의 목표는 생물학적인 질의를 해결하는 것과 생물학자들이 수집된 데이터를 분석하고 검색을 하여 생물학자들이 정확한 일을 수행하는 것이다. 인터넷은 여러 조사 그룹의 데이터베이스에 동시에 접근가능한 수단을 제공했으나 이러한 분산 환경에서 많은 양의 데이터는 전송 시의 시간 지연 문제와 최종 검색시의 느린 검색 속도 문제를 나타낸다. 데이터 클러스터링은 데이터의 검색시 이러한 문제점을 해결하기 위하여 이용될 수 있는 방법이지만 단순 적용시에는 데이터의 양에 비례하는 실행 시간이 또 다른 문제를 발생시킨다. 본 논문에서는 바이오데이터의 효율적인 클러스터링을 위한 개선된 분산 클러스터링 시나리오와 이를 위해 수정된 K-means 알고리즘을 제시한다. 최종 실험 결과는 20% 이상 향상된 실행 속도를 보여준다.

  • PDF

Relation Analysis of Disease and Biomarker based on Google Scholar (구글 학술 검색 기반의 질병과 바이오마커 관계 분석)

  • Oh, Byoung-Doo;Kim, Yu-Seop
    • Annual Conference on Human and Language Technology
    • /
    • 2017.10a
    • /
    • pp.238-241
    • /
    • 2017
  • 본 논문에서는 구글 학술 검색 기반의 데이터를 이용하여 질병과 폐질환과 관련된 바이오마커 단어의 유사도를 계산하는 방법을 제안한다. 질병과 바이오마커의 유사도를 계산할 때, 각 단어의 구글 학술 검색의 검색 결과를 이용하였다. 이를 통해 폐질환 관련 바이오마커와 다른 질병간의 관계를 파악하고자 하며, 의료 전문가에게 폐질환 관련 바이오마커와 다른 질병간의 새로운 관계를 제시하고자 한다. 이러한 데이터를 이용하여 계산한 결과, Wor2Vec의 결과를 이용한 코사인 유사도의 결과와 상관 계수가 약 0.64로 상당히 높은 상관 관계를 확인할 수 있었다. 따라서 이 방법을 통해 질병과 바이오마커의 관계를 파악하고자 하였다. 또한 Word2Vec을 이용한 질병과 바이오마커 단어의 벡터 값과 단어 유사도 계산 방법의 결과를 이용한 Deep Neural Networks (DNNs) 모델을 구축하고자 하며, 이를 통해 자동적으로 유사도를 분석하고자 하였다.

  • PDF

Relation Analysis of Disease and Biomarker based on Google Scholar (구글 학술 검색 기반의 질병과 바이오마커 관계 분석)

  • Oh, Byoung-Doo;Kim, Yu-Seop
    • 한국어정보학회:학술대회논문집
    • /
    • 2017.10a
    • /
    • pp.238-241
    • /
    • 2017
  • 본 논문에서는 구글 학술 검색 기반의 데이터를 이용하여 질병과 폐질환과 관련된 바이오마커 단어의 유사도를 계산하는 방법을 제안한다. 질병과 바이오마커의 유사도를 계산할 때, 각 단어의 구글 학술 검색의 검색 결과를 이용하였다. 이를 통해 폐질환 관련 바이오마커와 다른 질병간의 관계를 파악하고자 히며, 의료 전문가에게 폐질환 관련 바이오마커와 다른 질병간의 새로운 관계를 제시하고자 한다. 이러한 데이터를 이용하여 계산한 결과, Wor2Vec의 결과를 이용한 코사인 유사도의 결과와 상관 계수가 약 0.64로 상당히 높은 상관 관계를 확인할 수 있었다. 따라서 이 방법을 통해 질병과 바이오마커의 관계를 파악하고자 하였다. 또한 Word2Vec을 이용한 질병과 바이오마커 단어의 벡터 값과 단어 유사도 계산 방법의 결과를 이용한 Deep Neural Networks (DNNs) 모델을 구축하고자 하며, 이를 통해 자동적으로 유사도를 분석하고자 하였다.

  • PDF