OCR 기반의 의약품 성분 정보 검색 시스템

OCR-Based Medicine Ingredient Information Retrieval System

  • 박진아 (인하대학교 소프트웨어융합공학과) ;
  • 박승보 (인하대학교 소프트웨어융합공학과)
  • Park, Jina (Dept. of Software Convergence Engineering, Inha University) ;
  • Park, Seungbo (Dept. of Software Convergence Engineering, Inha University)
  • 발행 : 2022.01.12

초록

본 논문에서는 의약품의 효율적인 구매와 안전한 복용, 또 의약품 성분에 대한 정보 전달을 위한 시스템을 제안한다. 이 시스템에서는 약품 후면을 촬영한 영상으로부터 이미지 프로세싱을 통해 이미지에서 관심영역을 설정한 뒤, OCR 엔진인 Tesseract-OCR을 사용하여 인식한 텍스트 데이터를 통해 약품 성분을 추출하며, 식품의약품안전처에서 제공하는 의약품 안전 사용 서비스(DUR) API와 네이버 의약품 사전 검색 결과를 이용해 관련 정보들을 읽어와 출력하도록 한다. 약품의 표준 서식을 따르는 이미지를 기준으로 백 개의 이미지를 이용해 테스트하여 65%의 검출 정확도를 보였다.

키워드

과제정보

이 논문은 2021년도 정부(교육부)의 재원으로 한국연구재단 4단계 두뇌한국(BK)21 사업 대학원 혁신 지원을 받아 수행된 연구임.