• 제목/요약/키워드: 입력데이터

검색결과 4,324건 처리시간 0.029초

유역정보 기반 Transformer및 LSTM을 활용한 다목적댐 일 단위 유입량 예측 (Prediction of multipurpose dam inflow utilizing catchment attributes with LSTM and transformer models)

  • 김형주;송영훈;정은성
    • 한국수자원학회논문집
    • /
    • 제57권7호
    • /
    • pp.437-449
    • /
    • 2024
  • 딥러닝을 활용하여 유역 특성을 반영한 유량 예측 및 비교 연구가 주목받고 있다. 본 연구는 셀프 어텐션 메커니즘을 통해 대용량 데이터 훈련에 적합한 Transformer와 인코더-디코더(Encoder-Decoder) 구조를 가지는 LSTM-based multi-state-vector sequence-to-sequence (LSTM-MSV-S2S) 모형을 선정하여 유역정보(catchment attributes)를 고려할 수 있는 모형을 구축하였고 이를 토대로 국내 10개 다목적댐 유역의 유입량을 예측하였다. 본 연구에서 설계한 실험 구성은 단일유역-단일훈련(Single-basin Training, ST), 다수유역-단일훈련(Pretraining, PT), 사전학습-파인튜닝(Pretraining-Finetuning, PT-FT)의 세 가지 훈련 방법을 사용하였다. 모형의 입력 자료는 선정된 10가지 유역정보와 함께 기상 자료를 사용하였으며, 훈련 방법에 따른 유입량 예측 성능을 비교하였다. 그 결과, Transformer 모형은 PT와 PT-FT 방법에서 LSTM-MSV-S2S보다 우수한 성능을 보였으며, 특히 PT-FT 기법 적용 시 가장 높은 성능을 나타냈다. LSTM-MSV-S2S는 ST 방법에서는 Transformer보다 높은 성능을 보였으나, PT 및 PT-FT 방법에서는 낮은 성능을 보였다. 또한, 임베딩 레이어 활성화 값과 원본 유역정보를 군집화하여 모형의 유역 간 유사성 학습 여부를 분석하였다. Transformer는 활성화 벡터가 유사한 유역들에서 성능이 향상되었으며, 이는 사전에 학습된 다른 유역의 정보를 활용해 성능이 개선됨을 입증하였다. 본 연구는 다목적댐별 적합한 모형 및 훈련 방법을 비교하고, 국내 유역에 PT 및 PT-FT 방법을 적용한 딥러닝 모형 구축의 필요성을 제시하였다. 또한, PT 및 PT-FT 방법 적용 시 Transformer가 LSTM-MSV-S2S보다 성능이 더 우수하였다.

국가 예방접종 인터넷정보시스템 개발을 위한 의원정보시스템의 예방접종 모듈 평가연구 (Evaluation on the Immunization Module of Non-chart System in Private Clinic for Development of Internet Information System of National Immunization Programme m Korea)

  • 이무식;이건세;이석구;신의철;김건엽;나백주;홍지영;김윤정;박숙경;김보경;권윤형;김영택
    • 농촌의학ㆍ지역보건
    • /
    • 제29권1호
    • /
    • pp.65-75
    • /
    • 2004
  • 현재 보건소를 중심으로 이루어지고 있는 예방접종 등록사업은 향후 전국의 민간의료기관에 확산 적용되어 공공보건의료기관과 민간의료기관이 상호 연계되고 데이터가 통합, 운영됨으로써 국가예방접종사업이 완성될 수 있다. 따라서 민간의료기관에 기반한 예방접종 사업의 정보화 추진에서의 발생할 수 있는 문제점들을 예측하고 이를 해결할 수 있는 성공전략을 개발하는 것은 매우 중요하다. 그 중에서도 민간의료기관이 Non-chart system의 예방접종 모듈을 분석하여 예방접종 전산화를 위한 기본적인 문제점과 개선방안을 도출하고 공공보건의료기관과의 통합적 연계운영을 위한 기초자료를 제공하는 것은 예방접종전산등 곡사업의 핵심사업과제중의 하나이다. 예방접종 정보관련 프로그램을 평가하기 위하여 현재 민간의료기관(내과, 소아과, 산부인과 및 가정의학과)에서 주로 사용하고 있는 4개 보험청구 및 진료기록관리 프로그램인 Non-chart system과 현재 보건소에서 사용하고 있는 예방접종등록정보 프로그램인 (주)포스테이터의 보건소정보시스템과 (주)미드컴퓨터의 예방접종등록시스템 두가지를 대상으로 하였다. 분석의 표준은 현재 보건소에서 사용하고 있는 예방접종 관련 소프트웨어를 중심으로 하여 민간의료기관의 예방접종관련 프로그램 및 관련 모듈을 분석하였다. 모듈의 분석은 보건소정보시스템 및 예방접종 등록 프로그램을 기본으로 하여 예방접종 업무의 흐름과 활용 및 기능에 따라 분석하였다. 접수 및 신상등록에 있어서 기본적인 자료의 입력내용이 민간의료기관의 내용을 기준으로 보완됨이 바람직할 것으로 보여지는 데 특히 추후 검색과 리마인드(reminder) 및 리콜(Recall)기능의 이용을 대비하여 E-mail주소 등 개인신원의 내용을 충분히 파악할 필요가 있다고 판단된다. 예방접종 예진부분은 모든 프로그램에서 누락되어 있는데 필수적인 예진표의 내용을 반드시 포함시킬 필요가 있다. 개인의 접종기록 및 검색은 개인별 접종표 화면이 출력과 필수적인 접종내역란이 구성으로 접종표 형식이 단순화되어 사용하기에 편리하게 구성되어야 할 것이다. 접종대상 및 실적보고 서식 출력은 법령에 따라 Non-chart system을 이용한 자동화된 전산처리가 가능하여야 하며 자동화된 출력서식의 모듈이 제공되어야한다. 예방접종 증명서 발급기능은 2005년 이후부터 초등학교 입학시 예방접종증명서 제출 의무화가 예정되어 있으므로 예방접종 증명서의 발급기능이 추가되어야 한다. 접종자료의 전송기능으로는 의료보험의 EDI 청구를 위한 전송기능을 이용한 기능이 추가되어야하며 추후 예방접종 자료의 DB변환과 더불어 전송될 수 있는 기능이 추가되어야 한다. 리마인드(Reminder) 및 리콜(Recall)기능은 예방접종 등록사업의 필수적인 부분이며, E-mail을 통한 방법, 전화 또는 편지를 발송하는 방법 등이 추가되어야한다. 백신의 등록 및 재고관리 기능은 다양한 제약회사의 백신생산 및 백신의 효율적인 공금과 유효기간내 접종 등 관리와 견제되므로 백신등록 추가기능이 필요하며 아울러 연령별, 용량별, 백신종류별 등으로 구분되어 기록될 필요가 없었다.

  • PDF

종합 평점과 다기준 평점을 선택적으로 활용하는 협업필터링 기반 하이브리드 추천 시스템 (A Hybrid Recommender System based on Collaborative Filtering with Selective Use of Overall and Multicriteria Ratings)

  • 구민정;안현철
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.85-109
    • /
    • 2018
  • 추천시스템은 사용자의 과거 구매행동을 통해 향후 구매할 것이라고 예상되는 제품을 자동으로 검색하여 추천해준다. 특히 전자상거래 기업의 상품추천시스템은 일대일 마케팅의 대표적 실현수단으로 가치가 있다. 하지만, 전통적인 추천시스템, 특히 학계 및 산업계에서 가장 널리 사용되고 있는 전통적인 협업필터링 기법은 단일차원의 '종합 평점'만을 고려하여 추천결과를 생성하도록 설계되어 있어, 사용자들의 정확한 니즈를 이해하고 대응하는데 근본적인 한계가 있다. 최근에는 전자 상거래 기업들도 고객들로부터 보다 다각화된, 다기준 방식으로 피드백을 받고 있다. 특히 다기준 평점은 정량적으로 입력되는 정보이므로 상대적으로 분석 및 처리가 용이하다는 장점이 있다. 그러나 다기준 평점 역시 사전에 정해진 기준에 대해서만 사용자의 피드백이 이루어지기 때문에, 보다 상세하게 사용자의 의견을 이해하여 추천에 반영하는 데에는 한계가 있다. 이에 본 연구는 다기준 평점 정보와 선택적 협업필터링의 서로 다른 접근방법을 통해 도출된 추천결과를 종합하여, 최종적으로 추천 대상리스트를 산출할 수 있는 하이브리드 기술을 제안한다. 본 연구에서 제안한 연구모형의 유용성을 검증하기 위해, 식음료점(식당, 카페 등)에 대한 실제 이용자를 대상으로 온라인 설문을 통해 종합 평점과 다기준 평점을 수집하였으며, 데이터를 학습용과 검증용으로 구분하여 학습시키고 성과를 평가하였다. 이 기법은 결합 함수 기반 접근법과 사용자마다 구매의사결정의 체계가 다르다는 전제하에, 사용자들을 유형화하고, 유형에 따라 정보원을 선택적으로 활용하는 협업필터링 알고리즘을 활용했다. 실험결과, 제안 알고리즘을 통한 추천 방법이 단일 차원을 고려하는 전통적인 협업필터링과 비교해 더 우수한 예측정확도를 나타냄을 확인했다. 아울러, 본 연구가 제안하는 다기준 평점과 선택적 협업필터링 알고리즘을 종합하여 추천하는 방법이, 단순히 다기준 평점을 고려했을 때 보다 통계적으로 유의한 수준의 정확도의 개선이 이루어짐을 확인할 수 있었다.

토픽모델링을 활용한 COVID-19 학술 연구 기반 연구 주제 분류에 관한 연구 (A study on the classification of research topics based on COVID-19 academic research using Topic modeling)

  • 유소연;임규건
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.155-174
    • /
    • 2022
  • 2020년 1월부터 2021년 10월 현재까지 COVID-19(치명적인 호흡기 증후군인 코로나바이러스-2)와 관련된 학술 연구가 500,000편 이상 발표되었다. COVID-19와 관련된 논문의 수가 급격하게 증가함에 따라 의료 전문가와 정책 담당자들이 중요한 연구를 신속하게 찾는 것에 시간적·기술적 제약이 따르고 있다. 따라서 본 연구에서는 LDA와 Word2vec 알고리즘을 사용하여 방대한 문헌의 텍스트 자료로부터 유용한 정보를 추출하는 방안을 제시한다. COVID-19와 관련된 논문에서 검색하고자 하는 키워드와 관련된 논문을 추출하고, 이를 대상으로 세부 주제를 파악하였다. 자료는 Kaggle에 있는 CORD-19 데이터 세트를 활용하였는데, COVID-19 전염병에 대응하기 위해 주요 연구 그룹과 백악관이 준비한 무료 학술 자료로서 매주 자료가 업데이트되고 있다. 연구 방법은 크게 두 가지로 나뉜다. 먼저, 47,110편의 학술 논문의 초록을 대상으로 LDA 토픽 모델링과 Word2vec 연관어 분석을 수행한 후, 도출된 토픽 중 'vaccine'과 관련된 논문 4,555편, 'treatment'와 관련된 논문 5,791편을 추출한다. 두 번째로 추출된 논문을 대상으로 LDA, PCA 차원 축소 후 t-SNE 기법을 사용하여 비슷한 주제를 가진 논문을 군집화하고 산점도로 시각화하였다. 전체 논문을 대상으로 찾을 수 없었던 숨겨진 주제를 키워드에 따라 문헌을 분류하여 토픽 모델링을 수행한 결과 세부 주제를 찾을 수 있었다. 본 연구의 목표는 대량의 문헌에서 키워드를 입력하여 특정 정보에 대한 문헌을 분류할 수 있는 방안을 제시하는 것이다. 본 연구의 목표는 의료 전문가와 정책 담당자들의 소중한 시간과 노력을 줄이고, 신속하게 정보를 얻을 수 있는 방법을 제안하는 것이다. 학술 논문의 초록에서 COVID-19와 관련된 토픽을 발견하고, COVID-19에 대한 새로운 연구 방향을 탐구하도록 도움을 주는 기초자료로 활용될 것으로 기대한다.