DOI QR코드

DOI QR Code

소셜 네트워크 서비스 데이터에서 Bi-LSTM 기반 약물 부작용 게시물 탐지 모델 연구

A Study on Bi-LSTM-Based Drug Side Effects Post Detection Model in Social Network Service Data

  • 이충천 (건양대학교 정보의학교실) ;
  • 이승희 (건양대학병원 헬스케어데이터사이언스센터) ;
  • 송미화 (세명대학교 스마트 IT 학부) ;
  • 이수현 (건양대학교 정보의학교실)
  • Lee, Chung-Chun (School of Biomedical Informatics, Konyang University) ;
  • Lee, Seunghee (Healthcare Data Science Center, Konyang University Hospital) ;
  • Song, Mi-Hwa (School of Smart IT, Semyung University) ;
  • Lee, Suehyun (School of Biomedical Informatics, Konyang University)
  • 발행 : 2022.05.17

초록

본 연구에서는 소셜 네트워크 서비스(Social Network Service, SNS) 데이터로부터 약물 부작용 게시글을 추출하기 위한 순환 신경망(Recurrent Neural Network, RNN) 기반 분류 모델을 제안한다. 먼저, 처방 빈도가 높으며 게시글을 많이 확보할 수 있는 케토프로펜 약물에 대하여 국내 최대 소셜 네트워크 플랫폼인 네이버 블로그와 카페의 게시글(2005 년~2020 년)을 확보하고 최종 3,828 건을 분석하였다. 결과적으로 케토프로펜에 대한 3 종(약물, 부작용, 불용어)의 렉시콘을 정의하였으며 이를 기반으로 Bi-LSTM 분류모델 기준 87%의 정확도를 얻었다. 본 연구에서 제안하는 모델은 SNS 데이터가 약물 부작용 정보 획득을 위한 기존 (전자의무기록, 자발적 약물 부작용 보고 시스템 등) 자료원에 대한 보완적 정보원이 되며, 개발된 Bi-LSTM 분류모델을 통해 약물 부작용 게시글 추출의 편리성을 제공할 것으로 기대된다.

키워드

과제정보

이 논문은 정부(보건복지부)의 재원으로 보건산업진흥원(KHIDI)의 Korea Health Technology R&D 프로젝트의 지원을 받아 수행된 연구임 (grant number: HI19C1310).