• Title/Summary/Keyword: 바이오데이터

Search Result 372, Processing Time 0.036 seconds

Development of Integrated Retrieval System of the Biology Sequence Database Using Web Service (웹 서비스를 이용한 바이오 서열 정보 데이터베이스 및 통합 검색 시스템 개발)

  • Lee, Su-Jung;Yong, Hwan-Seung
    • The KIPS Transactions:PartD
    • /
    • v.11D no.4
    • /
    • pp.755-764
    • /
    • 2004
  • Recently, the rapid development of biotechnology brings the explosion of biological data and biological data host. Moreover, these data are highly distributed and heterogeneous, reflecting the distribution and heterogeneity of the Molecular Biology research community. As a consequence, the integration and interoperability of molecular biology databases are issue of considerable importance. But, up to now, most of the integrated systems such as link based system, data warehouse based system have many problems which are keeping the data up to date when the schema and data of the data source are changed. For this reason, the integrated system using web service technology that allow biological data to be fully exploited have been proposed. In this paper, we built the integrated system if the bio sequence information bated on the web service technology. The developed system allows users to get data with many format such as BSML, GenBank, Fasta to traverse disparate data resources. Also, it has better retrieval performance because the retrieval modules of the external database proceed in parallel.

Genomic Analysis Workbench Based on Parallelized Computing (병렬 컴퓨팅 기반의 유전체 분석 워크벤치)

  • Sun Choong Hyun;Yi Gwan Su;Park Hark-Soo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.244-246
    • /
    • 2005
  • 최근 바이오 데이터 분석에는 데이터 양의 급격한 증가와 이에 따른 문제의 복잡성도 함께 증가하고 있다. 이 결과 다양한 분석 툴들의 유연한 조합과 고성능, 고처리 컴퓨팅이 가능한 분석 시스템이 절실히 요구되고 있다. 본 논문에서는 병렬 컴퓨팅 환경을 이용하고 워크플로우 기반에서 다양한 생물정보 분석 툴들을 자유롭게 조합하여 작업을 수행할 수 있는 바이오워크벤치를 소개한다. 바이오워크벤치 내에는 컴퓨팅 자원 및 작업정보에 대한 모니터링 툴, 각 툴 들과 데이터를 손쉽게 가공할 수 있도록 고안된 인터페이싱 툴 워크플로우 디자인 툴을 포함 하고 있다. 이 기능모듈을 활용함으로써 다양한 생물정보 분석 툴을 이용하는 과정에서 효율적인 분석을 수행을 지원하는 바이오 워크벤치의 기능 및 아키텍쳐을 제시한다.

  • PDF

Biomarker Detection on Aptamer-based Biochip Data by Potential SVM (Potential SVM을 이용한 압타머칩에서의 바이오마커 탐색)

  • Kim, Byoung-Hee;Kim, Sung-Chun;Zhang, Byoung-Tak
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10a
    • /
    • pp.22-27
    • /
    • 2006
  • 압타머칩은 혈청(serum) 내의 지정된 단백질의 상대적 양을 직접 측정할 수 있는 바이오칩으로서, 의학적 질병 진단에 유용하게 사용할 수 있는 툴이다. 압타머칩 데이터 분석에는 기존의 마이크로어레이 분석기법을 그대로 적용할 수 있다. 본 논문에서는 Potential SVM(PSVM)을 이용하여, 심혈관질환 샘플 기반의 압타머칩 데이터에서 바이오마커 후보 단백질을 선정한 결과를 정리한다. PSVM은 분류 알고리즘으로서 뿐만 아니라 자질 선택(feature selection)에서도 우수한 성능을 보이는 알고리즘으로 알려져 있다. 심혈관 질환의 단계에 따라 구분한 4개 클래스, 135개 샘플로 구성된 3K 압타머칩 데이터에 대해 PSVM을 적용하여 자질을 선택하고 분류성능을 측정한 결과, 마이크로어레이에서의 자질 선택에 많이 사용되는 Gain Ratio 기법과 비교하여 보다 적은 수의 단백질 정보로 보다 나은 분류 성능을 보임을 확인하였다. 더불어, PSVM을 이용해 선택한 단백질군을 심혈관 질환 진단을 위한 바이오마커 후보로 제시한다.

  • PDF

Design of Bioinformatics Application using Grid (그리드를 이용한 바이오 인포메틱스 응용 클라이언트 설계)

  • 유승범;신동규;신동일
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.364-366
    • /
    • 2002
  • 최근 생명공학 분야에서는 IT와 BT가 결합하는 새로운 패러다임의 컴퓨팅 환경이 구축되고 있다. 이에 게놈 프로젝트 결과 분석해야 하는 데이터의 양은 엄청나게 증가하고 있다. 그러한 데이터를 처리하기 위해서는 대규모 저장장치 외에 슈퍼컴퓨터 급의 고성능 컴퓨터가 필요하게 되었다. 그러한 데이터를 처리하기 위해서는 대규모 저장장치 외에 슈퍼컴퓨터 급의 고성능 컴퓨터가 필요하게 되었으며, 바이오 인포메틱스 분야를 지원하기 위해서는 대규모 하드웨어 뿐만 아니라 데이터베이스, 데이터 마이닝 등의 소프트웨어 기술로 인해 그리드 환경을 요구하게 되었다. 이에 본 논문에서는 그리드 환경에서 분산된 수많은 생물학 데이터베이스에 쉽게 접근할 수 있는 통합 환경으로 응용 클라이언트를 제시할 것이다.

  • PDF

Correlation Analysis of Cancer Biomarkers and COPD Using the Word Embedding (워드 임베딩을 이용한 COPD와 암 관련 바이오마커의 상관관계 분석)

  • Yoon, Byeong-Hun;Kim, Yu-Seop
    • Annual Conference on Human and Language Technology
    • /
    • 2017.10a
    • /
    • pp.251-254
    • /
    • 2017
  • 본 연구에서는 COPD와 기존에 연관이 있는 것으로 알려진 바이오마커 이외의 새로운 바이오마커를 찾고자 한다. Pubmed Data에서 선정한 암 관련 바이오마커를 추출하여 COPD와 암 관련 바이오마커의 관계를 파악하는 데이터로 사용한다. 그리고 워드 임베딩 모델 중 Word2vec을 사용하여 워드 임베딩 한다. 워드 임베딩한 K차원의 COPD와 암 관련 바이오마커를 t-SNE를 사용하여 시각화한다. 또한 코사인 유사도를 이용하여 COPD와 암 관련 바이오마커의 유사도를 측정한다. 그리고 코사인 유사도와 t-SNE 결과를 이용하여 COPD와 암 관련 바이오마커와의 상관관계를 파악할 수 있으며, 암 관련 바이오마커와 COPD 관련 바이오마커를 비교 하여 기존의 COPD와 연관이 있다고 알려진 바이오마커 이외의 새로운 바이오마커를 찾을 수 있다.

  • PDF

Correlation Analysis of Cancer Biomarkers and COPD Using the Word Embedding (워드 임베딩을 이용한 COPD와 암 관련 바이오마커의 상관관계 분석)

  • Yoon, Byeong-Hun;Kim, Yu-Seop
    • 한국어정보학회:학술대회논문집
    • /
    • 2017.10a
    • /
    • pp.251-254
    • /
    • 2017
  • 본 연구에서는 COPD와 기존에 연관이 있는 것으로 알려진 바이오마커 이외의 새로운 바이오마커를 찾고자 한다. Pubmed Data에서 선정한 암 관련 바이오마커를 추출하여 COPD와 암 관련 바이오마커의 관계를 파악하는 데이터로 사용한다. 그리고 워드 임베딩 모델 중 Word2vec을 사용하여 워드 임베딩 한다. 워드 임베딩한 K차원의 COPD와 암 관련 바이오마커를 t-SNE를 사용하여 시각화한다. 또한 코사인 유사도를 이용하여 COPD와 암 관련 바이오마커의 유사도를 측정한다. 그리고 코사인 유사도와 t-SNE 결과를 이용하여 COPD와 암 관련 바이오마커와의 상관관계를 파악할 수 있으며, 암 관련 바이오마커와 COPD 관련 바이오마커를 비교 하여 기존의 COPD와 연관이 있다고 알려진 바이오마커 이외의 새로운 바이오마커를 찾을 수 있다.

  • PDF

An efficient Bi-LSTM based method for outlier detection and correction in golf swing motion estimation (골프 스윙 모션 추정에서 Bi-LSTM 기반의 효율적인 이상치 검출 및 보정 기법)

  • Ju, Chan-Yang;Park, Ji-Sung;Oh, Gyeong-Su;Choi, Hyun-Jun;Lee, Dong-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.11a
    • /
    • pp.787-790
    • /
    • 2021
  • 본 논문에서는 최신 모션 인식 기술을 활용하여 골프 스윙 비디오에서 사람의 자세를 추정한 후 다양한 원인으로 오검출된 좌표들을 보정하여 자세 추정의 정확도를 높이는 방법을 제안한다. 기존의 사람 자세 추정 모델은 골프 스윙 데이터에서 오검출, 반전, 불안정성, 미검출의 문제를 보여 정확한 자세 추정을 어렵게 했다. 이를 해결하기 위하여 본 연구에서는 자세 추정시 발생하는 이상치 데이터들을 Bi-LSTM 으로 학습하고 골프 스윙의 특징을 고려한 간단한 규칙을 통하여 이상치 데이터를 효과적으로 검출하고 이를 보정하는 방법을 제안한다. 또한 다양한 실험과 분석을 통하여 제안하는 방법이 골프 스윙 모션에서 사람의 자세를 정확히 추정할 수 있음을 보인다.

The Development of QR-ID Card based on Biometric Data (바이오메트릭 데이터를 이용한 QR-ID 카드 개발)

  • Song, Kyu-hyun;Kim, Dong-hee;Yun, Sung-hyun
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2014.07a
    • /
    • pp.371-374
    • /
    • 2014
  • 현재 국내에서 사용되고 있는 신분 인증 시스템은 주민등록번호와 같은 개인 정보를 기반으로 인증을 수행하여, 프라이버시 침해 위협이 존재한다. 그 해결 방안으로 가상 ID를 이용하는 I-PIN과 e-ID 카드가 제안되었지만, 문제점은 ID와 패스워드만 알고 있다면 누구나 도용이 가능하고 오프라인에서 사용하는 플라스틱 카드의 경우 위 변조가 가능하다는 한계를 갖는다. 본 논문에서는 주민등록번호를 대체할 식별 데이터인 QR-ID를 생성하고, 이에 기반을 둔 QR-ID 카드를 제안한다. QR 코드는 인식기에 대한 제약이 적고 일부 데이터 조작만으로 새로운 QR 코드 생성이 가능하여 노출 시 새로운 ID로 갱신할 수 있으며, QR-ID는 소유자의 바이오메트릭 데이터로 암호화되어 타인이 복호화 할 수 없다.

  • PDF

A Study on Bio-inspired algorithm included BNP for Classification of Bio data (바이오 데이터 분류화를 위한 BNP 내장 생태계 모방 알고리즘에 대한 연구)

  • Choi, Ok-Ju;Meang, Boyeon;Lee, Minsoo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.04a
    • /
    • pp.294-297
    • /
    • 2009
  • 다방면적인 과학기술의 발달은 우리에게 대량의 데이터와 또한 새로운 영역으로의 접근 가능성을 열어주었다. 유전자 정보와 같은 대량의 정보를 다루는 시대가 열리면서 바이오 데이터를 분석하여 새로운 연관성과 정보를 찾아내는 바이오인포매틱스가 고부가가치 창출을 위한 학문으로 특히 부각되고 있다. 본 논문에서는 이러한 연구의 일환으로 보다 효율적인 바이오 데이터 분석을 위해 BNP에 내장된 생태계 모방 알고리즘의 특성을 연구하고, 이를 분류화에 접목시킨 방법에 대해 논하고자 한다.