• 제목/요약/키워드: Accuracy analysis

검색결과 11,863건 처리시간 0.041초

지상 라이다를 활용한 트렌치 단층 단면 3차원 영상 생성과 웹 기반 대용량 점군 자료 가시화 플랫폼 활용 사례 (Application of Terrestrial LiDAR for Reconstructing 3D Images of Fault Trench Sites and Web-based Visualization Platform for Large Point Clouds)

  • 이병우;김승섭
    • 자원환경지질
    • /
    • 제54권2호
    • /
    • pp.177-186
    • /
    • 2021
  • 한반도 지진 재해 대비를 위해 지난 5년간 활성 단층 조사가 수행되어 왔다. 특히 피복 활성단층 조사는 항공 LiDAR 기반 지형 분석, 지표 지질 조사, 지구 물리 탐사 결과를 종합하여 피복된 단층면에 대한 트렌치 조사를 수반한다. 하지만 이러한 트렌치 조사에 의해 발견된 단층면은 한시적으로 연구된 후 복구되기 때문에 트렌치 단층면 현장에 대한 정보는 논문 및 보고서 등과 같은 정성 자료로 남게 된다. 이와 같은 한시적 지질 연구의 한계를 보완하기 위하여 이 연구에서는 지상 LiDAR를 활용하여 트렌치 단층면에 대한 3차원 점군 자료를 생성하고 디지털 공간상에서 트렌치 현장을 복원하였다. 지상 LiDAR 탐사는 양산 단층 지역에서 수행된 두 곳의 트렌치 조사 지점에서 수행되었으며, LiDAR 점군의 기본 속성값인 진폭과 반사도 이외에도 디지털 카메라를 활용하여 트렌치 단층면의 색상 정보도 측정하였다. 측정된 자료는 평균 0.003 m의 정합 오차를 가지는 3차원 점군 자료로 변환되어 트렌치 형상을 정교하게 복원하였다. 하지만 LiDAR 스캔 위치에 따라 점군의 진폭과 반사도 값이 변화되었으며, 햇빛 노출 정도에 따라서 트렌치 단면의 색상 정보가 다르게 형상화 되어 후처리 과정의 고도화가 필요함을 시사하였다. 이러한 점군 자료는 대용량 파일로 존재하고 점군 자료 가시화 방법 또한 제한적이기 때문에 3차원 점군 자료에 대한 연구자 간 공유가 어렵다. 이에 대한 대안으로 오픈소스 플랫폼인 Potree를 활용하여 트렌치 점군 자료를 웹 상에서 가시화하는 방법을 제안하였다. 이와 같이 우리는 시간적 그리고 공간적 제약 조건이 따르는 지질 현장 조사에서 지상 LiDAR 자료가 주요 지질 대상에 대한 재현성을 높일 수 있는 동시에 연구자 및 미래 후속 세대에 의해 손쉽게 활용될 수 있음을 보여주고자 한다.

한국인 상용 수산물 식단의 비타민 B9과 B12 함량 (Contents of vitamin B9 (folate) and B12 (cobalamins) in commonly consumed seafood menus in Korea)

  • 박은영;정보미;천지연
    • Journal of Nutrition and Health
    • /
    • 제54권2호
    • /
    • pp.211-223
    • /
    • 2021
  • 본 연구는 한국인이 주로 상용하는 수산물을 이용한 다소비 메뉴 39종을 선정하고, 이를 기준 레시피로 조리한 후 이들에 대한 비타민 B9 (엽산)과 B12 (코발라민류) 함량을 분석하였다. 국가식품영양성분 데이터베이스 자료로 활용하기 위한 데이터의 신뢰도 확보를 위해 비타민 B9(trienzyme-L. casei법)과 B12 (immunoaffinity-HPLC/PDA) 분석법의 유효성을 검증하였으며 분석품질관리를 수행하였다. 각 성분 분석법의 정확성, 정밀성, 특이성, 상관성, 검출한계 및 정량 한계를 분석한결과 모두 AOAC 가이드라인 수용 기준에 충족되는 결과를 얻었으며, 분석품질관리도표를 전 분석 기간 동안 작성하여 확보된 분석 데이터의 신뢰도를 확보하였다. 상용 수산물 메뉴의 비타민 B9과 B12 함량을 분석한 결과 각각 1.83-523.08 ㎍/100 g과 0.11-38.30 ㎍/100 g의 범위로 사용된 재료와 조리법의 특성에 따라 다양하게 나타났다. 비타민 B9 함량은 구이류의 김구이 (523.08 ㎍/100 g)가 가장 높은 함량을 보였으며, 볶음류에서 건새우볶음 (128.34 ㎍/100 g)과 잔멸치볶음 (121.53 ㎍/100 g)이 높은 함량을 나타내었다. 비타민 B12함량은 찜·조림류의 꼬막찜 (38.30 ㎍/100 g)이 가장 높은 함량을 보였으며, 구이류의 김구이 (29.79 ㎍/100 g)와 볶음류의 멸치마늘종볶음 (18.99 ㎍/100 g)으로 높은 함량을 나타내었다. 유사 재료의 조리법에 따른 비타민 B9과 B12 함량을 비교하면 비타민 B9의 경우 물 사용량이 많은 국·탕·찌개류는 다른 시료군 (볶음, 찜, 조림, 구이, 튀김 및 무침)에 비하여 비교적 낮은 함량을 나타내어 수산물과 다양한 채소류를 함께 볶는 볶음 메뉴가 비타민 B9 섭취에 도움을 줄 것으로 보인다. 비타민 B12의 경우 식물성 식품에는 발견되지 않고 주로 동물성 식품에만 존재하는데 본 연구 결과 김 및 미역과 같은 해조류 메뉴는 채식주의자들에게 비타민 B12의 좋은 급원메뉴가 될 수 있을 것으로 보여진다. 본 연구는 분석법 검증 및 품질관리를 통하여 분석 신뢰도를 확보하였으며 이와 함께 제공된 한국 상용수산물 메뉴의 비타민 B9과 B12 함량데이터는 한국인의 보건영양 정책 수립을 위한 국가식품영양성분 데이터베이스 자료로 활용될 수 있을 것으로 사료된다.

목적함수에 따른 매개변수 추정 및 수문모형 정확도 비교·분석 (Analysis of the Effect of Objective Functions on Hydrologic Model Calibration and Simulation)

  • 이기하;연민호;김영훈;정성호
    • 한국방재안전학회논문집
    • /
    • 제15권1호
    • /
    • pp.1-12
    • /
    • 2022
  • 수문모형의 최적 매개변수를 추정하기 위해서 자동최적화기법이 자주 이용되며, 이러한 최적화기법은 관측값과 모의값의 오차를 최소로 하기 위해 목적함수를 필요로 한다. 다만, 다양한 목적함수 선택에 따라 각기 다른 수문응답 결과를 제공할 수 있다. 본 연구에서는 국내·외에서 사용되는 다양한 목적함수를 활용하여 단기 강우-유출 수문모형의 매개변수를 추정하고, 목적함수에 따른 수문곡선의 재현성을 평가하고, 적정 목적함수를 제시하고자 하였다. 강우-유출 모형으로는 현행 홍수예보에서 유역 유출모의에 활용되고 있는 집중형 수문모형인 저류함수모형을 선택하였으며, 모형의 5개 매개변수에 대해서 전역최적화기법인 SCE-UA를 적용하여 모형의 최적매개변수를 추정하였다. 목적함수별 수문곡선의 재현성 평가를 위해 용담댐 상류유역인 천천유역을 대상으로 9개의 강우사상을 추출하였으며, 7개의 목적함수를 선택하여 개별 강우사상별로 저류함수모형의 매개변수를 추정하고, 이를 활용한 모의 수문곡선의 재현성을 비교·분석하였다. 분석결과, 목적함수에 오차제곱을 포함하고 있는 RMSE, NSE, RSR이 Event 7을 제외한 모든 강우사상에 대해 가장 높은 정확도를 나타냈으며, 관측유량과 모의유량의 오차만을 반영한 ABIAS의 경우, 정확도가 가장 낮은 것으로 분석되었다. 또한, 관측유량 대비 오차 항을 포함하고 있는 PBIAS 및 VE의 경우 역시, 상기 3개(RMSE, NSE, RSR)의 결과와 유사하게 비교적 안정적인 수문곡선 재현성을 보여주었다. 다만, 고유량과 저유량을 동시에 고려하여 이에 민감한 매개변수를 조정하도록 개발된 MIA의 경우, 수문곡선 재현성 성능이 매우 낮은 것으로 나타났다.

초소형 SAR 위성을 활용한 수체면적 추출: 대청댐 유역 대상 (Extraction of Water Body Area using Micro Satellite SAR: A Case Study of the Daecheng Dam of South korea)

  • 박종수;강기묵;황의호
    • 한국지리정보학회지
    • /
    • 제24권4호
    • /
    • pp.41-54
    • /
    • 2021
  • 수자원 관리와 수재해 피해 분석 및 예측 등을 위해 원격탐사를 활용한 수체면적을 추정하는 것은 매우 필수적이다. 위성을 활용한 수체탐지는 주로 광학 및 영상레이더(Synthetic Aperture Radar, SAR) 센서를 탑재한 대형(무게 1,000kg 이상) 위성을 중심으로 수행되어왔다. 그러나 긴 재방문주기(repeat cycle)로 인해 재난/재해 시 적시 활용이 불가능한 한계가 존재한다. 최근 초소형위성(무게 100kg 미만) 개발이 활발히 이루어짐에 따라 기존 대형위성 중심의 시간해상도 한계를 극복할 수 있는 계기가 되었다. 현재 활발히 운용중인 초소형 SAR 위성은 핀란드의 ICEYE와 미국의 Capella 위성으로, 지구관측을 목적으로 군집(constellation) 형태로 운용되고 있다. 군집화 운용으로 인해 짧은 재방문주기(현재 0.8회/1일) 및 고해상도(Spot(0.5m))를 가지며, SAR센서 탑재로 기상 및 주야 무관하게 관측이 가능한 장점이 있다. 본 연구에서는 초소형위성의 운영 현황 및 특징에 대해서 기술하였으며, 초소형 SAR 위성 영상에 최적화된 수체면적 추정기술을 한반도 대청댐 유역에 적용해 보았다. 또한 광학 위성인 Sentinel-2 위성으로부터 생성된 수체를 참조값(reference)으로 하여 초소형위성 2기와 대형위성인 Sentinel-1위성과의 면적, 상관성 분석을 수행하였다. Capella 위성의 경우 가장 적은 면적의 차를 보였으며, 세 영상 모두 높은 상관관계를 나타냄을 확인하였다. 본 연구의 결과를 통해 초소형 SAR 위성의 낮은 NESZ(Noise Equivalent Sigma Zero)에도 불구하고 수체면적 추정이 가능함을 확인하였으며, 기존 대형 SAR 위성을 활용한 수자원/수재해 감시 활용의 한계를 극복할 수 있을 것으로 사료된다.

표면유도환자셋업(Surface-Guided Patient Setup, SGPS)을 활용한 Markerless환자의 영상유도방사선치료(Image Guided Radiation Therapy, IGRT)시 유용성 평가 (Evaluation of the usefulness of IGRT(Image Guided Radiation Therapy) for markerless patients using SGPS(Surface-Guided Patient Setup))

  • 이경재;이응만;이정수;김다연;고현준;최신철
    • 대한방사선치료학회지
    • /
    • 제33권
    • /
    • pp.109-116
    • /
    • 2021
  • 목 적: 본 연구는 표면유도환자셋업(Surface-Guided Patient Setup, SGPS)을 활용한 Markerless환자(피부에 표시를 시행하지 않은 환자)와 레이저기반환자셋업(Laser-Based Patient Setup, LBPS)을 활용한 Marker환자(피부에 표시를 시행한 환자)를 영상유도방사선치료(Image Guided Radiotherapy, IGRT)로 시행했을 때 환자 위치 정확도를 비교하여 SGPS의 유용성을 평가하는데 목적이 있다. 대상 및 방법: 3개의 카메라를 이용한 광학 표면 스캐닝시스템을 사용하여 SGPS로 초기 셋업한 Markerless 환자와 환자 피부에 그려진 Marker와 레이저를 정렬하는 LBPS로 초기 셋업한 Marker환자의 IGRT시 위치 오차를 비교하였다. SGPS,LBPS 모두 각각 전립선암 환자 20명, 뇌정위적방사선수술(Stereotactic Radiation Surgery, SRS) 환자 10명을 대상으로 시행하였고 SGPS의 경우는 추가로 유방암 환자 60명을 대상으로 시행하였다. 모두 CBCT 또는 OBI를 사용하여 IGRT를 시행하였다. 자동위치교정시스템(Auto-Matching System)을 이용하여 6방향(6 Degree Of Freedom, 6 DoF)의 위치 오차를 획득하였고 치료계획시스템에서 Offline-Review를 이용하여 비교, 분석하였다. 결 과 : 전립선암환자의 SGPS와 LBPS의 RMS(Root Mean Square) 차이는 Vrt -0.02cm, Log -0.02cm, Lat -0.01cm, Pit -0.01°, Rol -0.01°, Rtn -0.01°이였고 SRS 환자는 Vrt 0.02cm, Log -0.05cm, Lat 0.00cm, Pit -0.30°, Rol -0.15°, Rtn -0.33°으로 두 부위 모두 큰 차이가 없었다. 유방암환자의 IGRT기준 RMS는 Vrt 0.26, Log 0.21, Lat 0.15, Pit 0.81, Rol 0.49, Rtn 0.59으로 나타났다. 결 론 : 본 연구의 결과 LBPS 대비 SGPS의 위치 오차 값은 전립선암 환자와 SRS 환자의 경우 큰 차이를 보이지 않았다. 추가로 실시한 SGPS의 유방암 환자의 경우에도 IGRT기준으로 위치 오차 값이 크지 않았다. 따라서 환자 피부 표시를 필요로 하지 않는 큰 장점을 가진 SGPS로 LBPS를 대체하기에 유용할 것으로 사료된다.

인공지능 기반 금융서비스의 공정성 확보를 위한 체크리스트 제안: 인공지능 기반 개인신용평가를 중심으로 (A Checklist to Improve the Fairness in AI Financial Service: Focused on the AI-based Credit Scoring Service)

  • 김하영;허정윤;권호창
    • 지능정보연구
    • /
    • 제28권3호
    • /
    • pp.259-278
    • /
    • 2022
  • 인공지능(AI)의 확산과 함께 금융 분야에서도 상품추천, 고객 응대 자동화, 이상거래탐지, 신용 심사 등 다양한 인공지능 기반 서비스가 확대되고 있다. 하지만 데이터에 기반한 기계학습의 특성상 신뢰성과 관련된 문제 발생과 예상하지 못한 사회적 논란도 함께 발생하고 있다. 인공지능의 효용은 극대화하고 위험과 부작용은 최소화할 수 있는 신뢰할 수 있는 인공지능에 대한 필요성은 점점 더 커지고 있다. 이러한 배경에서 본 연구는 소비자의 금융 생활에 직접 영향을 끼치는 인공지능 기반 개인신용평가의 공정성 확보를 위한 체크리스트 제안을 통해 인공지능 기반 금융서비스에 대한 신뢰 향상에 기여하고자 하였다. 인공지능 신뢰성의 주요 핵심 요소인 투명성, 안전성, 책무성, 공정성 중 포용 금융의 관점에서 자동화된 알고리즘의 혜택을 사회적 차별 없이 모두가 누릴 수 있도록 공정성을 연구 대상으로 선정하였다. 문헌 연구를 통해 공정성이 영향을 끼치는 서비스 운용의 전 과정을 데이터, 알고리즘, 사용자의 세 개의 영역으로 구분하고, 12가지 하위 점검 항목과 항목별 세부 권고안으로 체크리스트를 구성하였다. 구성한 체크리스트는 이해관계자(금융 분야 종사자, 인공지능 분야 종사자, 일반 사용자)별 계층적 분석과정(AHP)을 통해 점검 항목에 대한 상대적 중요도 및 우선순위를 도출하였다. 이해관계자별 중요도에 따라 세 개의 그룹으로 분류하여 분석한 결과 학습데이터와 비금융정보 활용에 대한 타당성 검증 및 신규 유입 데이터 모니터링의 필요성 등 실용적 측면에서 구체적인 점검 사항을 파악하였고, 금융 소비자인 일반 사용자의 경우 결과에 대한 해석 오류 및 편향성 확인에 대한 중요도를 높게 평가한다는 것을 확인할 수 있었다. 본 연구의 결과가 더 공정한 인공지능 기반 금융서비스의 구축과 운영에 기여할 수 있기를 기대한다.

Sentinel-1 SAR 위성영상의 위상차분간섭기법(DInSAR)을 이용한 적설심의 공간분포 추정 (Estimation of spatial distribution of snow depth using DInSAR of Sentinel-1 SAR satellite images)

  • 박희성;정건희
    • 한국수자원학회논문집
    • /
    • 제55권12호
    • /
    • pp.1125-1135
    • /
    • 2022
  • 적설에 의한 피해는 자주 발생하지 않지만 발생하면 광범위한 지역에 피해를 준다. 적설에 의한 피해를 예방하기 위해서는 지역별로 피해를 유발하는 적설심을 미리 파악해 둘 필요가 있다. 하지만 관측하고 있는 적설심은 특정 관측지점으로 한정되어 피해를 유발하는 지역별 피해유발적설심을 파악하는데 어려움이 있다. 이를 극복하기 위한 일반적인 방법은 관측지점의 적설을 보간하여 공간적으로 확대하는 것이다. 하지만 이것은 매우 적은 자료를 가지고 고도 등 지형적인 특성이 다른 넓은 영역을 통계적으로 추론해야 하는 한계로 인해 지역에 대한 피해유발 피해유발적설심의 구명에 더 혼란을 주기도 한다. 이를 보완하기 위해서는 넓은 영역을 관측하는 위성영상을 활용할 수 있으며, 그 중에서도 합성개구레이더(Synthetic Aperture Radar; SAR)를 이용한 위상차분 간섭기법(DInSAR)을 활용할 수 있다. 위상간섭영상은 두 개의 다른 시기에 측정된 합성개구레이더 영상의 위상간섭을 이용한 것으로 일반적으로 미세한 지형의 변화를 추적할 때 사용되기도 한다. 본 연구에서는 유럽우주국(ESA)에서 운영하는 Sentinel-1B 위성의 dual polarimetric IW 모드 C-band SAR 데이터를 사용하여 DInSAR 분석을 수행하여 적설심의 공간분포를 추정하였다. 또한 정지궤도복합위성 천리안 2호(GK-2A)의 L2 적설심 추정 자료를 이용하여 비교하였다. 적용 결과, 적설예측의 정확도는 격자별로 계산할 경우, DInSAR 는 약 0.92%, GK-2A 는 약 0.71% 를 나타내 DInSAR의 적용성이 높게 나타났다. 즉, DInSAR 방법을 이용하여 계산된 적설심과 기상관측소에서 관측된 적설심을 공간보간하여 비교한 결과, 적설의 분석 결과 적설심을 과대추정하는 경우가 발생하기는 했으나, 적설심의 공간분포를 추정하는데 충분한 정보를 제공했으며, 이러한 방법으로 파악된 적설심의 공간분포는 실제 피해발생지역의 적설심을 보다 정확하게 추정하는데 기여할 수 있으며, 이것은 지역별 피해유발적설심을 파악하는데 도움이 될 것이다.

도메인 특수성이 도메인 특화 사전학습 언어모델의 성능에 미치는 영향 (The Effect of Domain Specificity on the Performance of Domain-Specific Pre-Trained Language Models)

  • 한민아;김윤하;김남규
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.251-273
    • /
    • 2022
  • 최근 텍스트 분석을 딥러닝에 적용한 연구가 꾸준히 이어지고 있으며, 특히 대용량의 데이터 셋을 학습한 사전학습 언어모델을 통해 단어의 의미를 파악하여 요약, 감정 분류 등의 태스크를 수행하려는 연구가 활발히 이루어지고 있다. 하지만 기존 사전학습 언어모델이 특정 도메인을 잘 이해하지 못한다는 한계를 나타냄에 따라, 최근 특정 도메인에 특화된 언어모델을 만들고자 하는 방향으로 연구의 흐름이 옮겨가고 있는 추세이다. 도메인 특화 추가 사전학습 언어모델은 특정 도메인의 지식을 모델이 더 잘 이해할 수 있게 하여, 해당 분야의 다양한 태스크에서 성능 향상을 가져왔다. 하지만 도메인 특화 추가 사전학습은 해당 도메인의 말뭉치 데이터를 확보하기 위해 많은 비용이 소요될 뿐 아니라, 고성능 컴퓨팅 자원과 개발 인력 등의 측면에서도 많은 비용과 시간이 투입되어야 한다는 부담이 있다. 아울러 일부 도메인에서 추가 사전학습 후의 성능 개선이 미미하다는 사례가 보고됨에 따라, 성능 개선 여부가 확실하지 않은 상태에서 도메인 특화 추가 사전학습 모델의 개발에 막대한 비용을 투입해야 하는지 여부에 대해 판단이 어려운 상황이다. 이러한 상황에도 불구하고 최근 각 도메인의 성능 개선 자체에 초점을 둔 추가 사전학습 연구는 다양한 분야에서 수행되고 있지만, 추가 사전학습을 통한 성능 개선에 영향을 미치는 도메인의 특성을 규명하기 위한 연구는 거의 이루어지지 않고 있다. 본 논문에서는 이러한 한계를 극복하기 위해, 실제로 추가 사전학습을 수행하기 전에 추가 사전학습을 통한 해당 도메인의 성능 개선 정도를 선제적으로 확인할 수 있는 방안을 제시한다. 구체적으로 3개의 도메인을 분석 대상 도메인으로 선정한 후, 각 도메인에서의 추가 사전학습을 통한 분류 정확도 상승 폭을 측정한다. 또한 각 도메인에서 사용된 주요 단어들의 정규화된 빈도를 기반으로 해당 도메인의 특수성을 측정하는 지표를 새롭게 개발하여 제시한다. 사전학습 언어모델과 3개 도메인의 도메인 특화 사전학습 언어모델을 사용한 분류 태스크 실험을 통해, 도메인 특수성 지표가 높을수록 추가 사전학습을 통한 성능 개선 폭이 높음을 확인하였다.

UAS 영상 및 지상 LiDAR 조합한 3D 수치모형 기반 비탈면 앵커의 손상인자 분석에 관한 연구 (A Study on Damage factor Analysis of Slope Anchor based on 3D Numerical Model Combining UAS Image and Terrestrial LiDAR)

  • 이철희;이종현;김달주;강준오;권영훈
    • 한국지반공학회논문집
    • /
    • 제38권7호
    • /
    • pp.5-24
    • /
    • 2022
  • 현행 비탈면 앵커공법의 보강성능평가는 앵커 두부와 지반밀착도, 앵커 두부의 균열 및 파손에 대해서 정성적으로 성능을 평가하고 있다. 이로 인해 성능저하 상태 점검을 위한 정량적 데이터베이스화와 이를 이용한 시간이력 관리는 어려운 실정이다. 이에 본 연구에서는 비탈면에 설치된 앵커공법의 정량적 유지관리에 활용하기 위하여 UAS 영상과 지상 LiDAR의 사각지대를 보완하기 위한 SfM기반의 조합 3차원 수치모형을 구현하여 손상인자의 수치데이터를 검출하였다. 비탈면과 같은 수직구조물에서 상대적으로 높은 z 좌표 오차를 갖는 UAS 3차원 수치모형에서 사각지대 데이터 공백을 상호 보완하기 위하여 지상 LiDAR 스캔 데이터를 조합하였고 z 좌표 정확도의 향상을 확인하였다. 비탈면에 설치된 10공의 앵커에 임의로 손상을 발생시킨 후에 3차원 수치모형을 구축하였고 정사투영을 통해 균열, 파손, 회전변위와 지반 밀착도에 대한 수치 값을 검출하였다. 8K 해상도로 균열 실측값과 비교시 ±0.05mm의 오차범위에서 0.3mm 미만의 균열 검출이 가능하였다. 앵커 두부의 최대 파손 면적은 설계대비 3% 이내로 발생된 것을 확인하였고, 파손부의 체적 또한 검출하였다. 특히 z 좌표 데이터가 중요한 지반밀착도의 경우 UAS 3차원 수치모형에서는 사각지대로 인한 데이터 공백으로 측정이 불가능하였지만 지상 LiDAR를 조합할 경우 앵커 저면과 지반의 불규칙한 표면에서 표고차 확인이 가능하여 임의의 20개 지점의 평균 표고차를 지반밀착도로 도출하였다. 또한, 앵커 두부의 1° 미만의 회전각과 이동 변위 값도 검출하였다. 이에 본 연구에서 구축한 3차원 수치모형에서 앵커 손상인자의 정량적 데이터 추출이 가능하였고, 이를 데이터베이스화 한다면 정량적 평가지표의 기초자료로써 활용이 가능할 것으로 판단된다.

머신러닝을 활용한 수도권 약수터 수질 예측 모델 개발 (Development of a water quality prediction model for mineral springs in the metropolitan area using machine learning)

  • 임영우;엄지연;곽기영
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.307-325
    • /
    • 2023
  • 코로나19 팬데믹의 장기화로 인해 실내 생활에 지쳐가는 사람들이 우울감, 무기력증 등을 해소하기 위해 근거리의 산과 국립공원을 찾는 빈도가 폭발적으로 증가하였다. 자연으로 나온 수많은 사람들이 오가는 걸음을 멈추고 숨을 돌리며 쉬어가는 장소가 있는데 바로 약수터이다. 산이나 국립공원이 아니더라도 근린공원 또는 산책로에서도 간간이 찾아볼 수 있는 약수터는 수도권에만 약 6백여개가 위치해 있다. 하지만 불규칙적이고 수작업으로 수행되는 수질검사로 인해 사람들은 실시간으로 검사 결과를 알 수 없는 상태에서 약수를 음용하게 된다. 따라서 본 연구에서는 약수터 수질에 영향을 미치는 요인을 탐색하고 다양한 곳에 흩어져 있는 데이터를 수집하여 실시간으로 약수터 수질을 예측할 수 있는 모델을 개발하고자 한다. 데이터 수집의 한계로 인해 서울과 경기로 지역을 한정한 후 데이터 관리가 잘 이루어지고 있는 18개 시의 약 300여개 약수터를 대상으로 2015~2020년의 수질 검사 데이터를 확보하였다. 약수터 수질 적합 여부에 영향을 미칠 것으로 여겨지는 다양한 요인들 중 두 차례의 검토를 거쳐 총 10개의 요인을 최종 선별하였다. 최근 주목받고 있는 자동화 머신러닝 기술인 AutoML 기법을 활용하여 20여가지의 머신러닝 기법들 중 예측 성능 기준 상위 5개의 모델을 도출하였으며 그 중 catboost 모델이 75.26%의 예측 분류 정확도로 가장 높은 성능을 가지고 있음을 확인하였다. 추가로 SHAP 기법을 통해 분석에 사용한 변인들이 예측에 미치는 절대적인 영향력을 살펴본 결과 직전 수질 검사에서 부적합 판정을 받았는지 여부가 가장 중요한 요인이었으며 그 외 평균 기온, 과거 연속 2번 수질 부적합 판정 기록 유무, 수질 검사 당일 기온, 약수터 고도 등이 수질 부적합 여부에 영향을 미치고 있음을 확인하였다.