Correlation Analysis of Cancer Biomarkers and COPD Using the Word Embedding

워드 임베딩을 이용한 COPD와 암 관련 바이오마커의 상관관계 분석

  • Yoon, Byeong-Hun (Department of Convergence Software, Hallym University) ;
  • Kim, Yu-Seop (Department of Convergence Software, Hallym University)
  • 윤병훈 (한림대학교, 융합소프트웨어 학과) ;
  • 김유섭 (한림대학교, 융합소프트웨어 학과)
  • Published : 2017.10.13

Abstract

본 연구에서는 COPD와 기존에 연관이 있는 것으로 알려진 바이오마커 이외의 새로운 바이오마커를 찾고자 한다. Pubmed Data에서 선정한 암 관련 바이오마커를 추출하여 COPD와 암 관련 바이오마커의 관계를 파악하는 데이터로 사용한다. 그리고 워드 임베딩 모델 중 Word2vec을 사용하여 워드 임베딩 한다. 워드 임베딩한 K차원의 COPD와 암 관련 바이오마커를 t-SNE를 사용하여 시각화한다. 또한 코사인 유사도를 이용하여 COPD와 암 관련 바이오마커의 유사도를 측정한다. 그리고 코사인 유사도와 t-SNE 결과를 이용하여 COPD와 암 관련 바이오마커와의 상관관계를 파악할 수 있으며, 암 관련 바이오마커와 COPD 관련 바이오마커를 비교 하여 기존의 COPD와 연관이 있다고 알려진 바이오마커 이외의 새로운 바이오마커를 찾을 수 있다.

Keywords