• 제목/요약/키워드: 빈도분석

검색결과 9,556건 처리시간 0.038초

머신러닝을 활용한 수도권 약수터 수질 예측 모델 개발 (Development of a water quality prediction model for mineral springs in the metropolitan area using machine learning)

  • 임영우;엄지연;곽기영
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.307-325
    • /
    • 2023
  • 코로나19 팬데믹의 장기화로 인해 실내 생활에 지쳐가는 사람들이 우울감, 무기력증 등을 해소하기 위해 근거리의 산과 국립공원을 찾는 빈도가 폭발적으로 증가하였다. 자연으로 나온 수많은 사람들이 오가는 걸음을 멈추고 숨을 돌리며 쉬어가는 장소가 있는데 바로 약수터이다. 산이나 국립공원이 아니더라도 근린공원 또는 산책로에서도 간간이 찾아볼 수 있는 약수터는 수도권에만 약 6백여개가 위치해 있다. 하지만 불규칙적이고 수작업으로 수행되는 수질검사로 인해 사람들은 실시간으로 검사 결과를 알 수 없는 상태에서 약수를 음용하게 된다. 따라서 본 연구에서는 약수터 수질에 영향을 미치는 요인을 탐색하고 다양한 곳에 흩어져 있는 데이터를 수집하여 실시간으로 약수터 수질을 예측할 수 있는 모델을 개발하고자 한다. 데이터 수집의 한계로 인해 서울과 경기로 지역을 한정한 후 데이터 관리가 잘 이루어지고 있는 18개 시의 약 300여개 약수터를 대상으로 2015~2020년의 수질 검사 데이터를 확보하였다. 약수터 수질 적합 여부에 영향을 미칠 것으로 여겨지는 다양한 요인들 중 두 차례의 검토를 거쳐 총 10개의 요인을 최종 선별하였다. 최근 주목받고 있는 자동화 머신러닝 기술인 AutoML 기법을 활용하여 20여가지의 머신러닝 기법들 중 예측 성능 기준 상위 5개의 모델을 도출하였으며 그 중 catboost 모델이 75.26%의 예측 분류 정확도로 가장 높은 성능을 가지고 있음을 확인하였다. 추가로 SHAP 기법을 통해 분석에 사용한 변인들이 예측에 미치는 절대적인 영향력을 살펴본 결과 직전 수질 검사에서 부적합 판정을 받았는지 여부가 가장 중요한 요인이었으며 그 외 평균 기온, 과거 연속 2번 수질 부적합 판정 기록 유무, 수질 검사 당일 기온, 약수터 고도 등이 수질 부적합 여부에 영향을 미치고 있음을 확인하였다.

개인별 목표 설정과 스마트폰 기반 영양상담을 통한 20-30대 성인의 영양지수 및 식이 자아효능감 향상 (Improving the nutrition quotient and dietary self-efficacy through personalized goal setting and smartphone-based nutrition counseling among adults in their 20s and 30s)

  • 김다현;박다원;한영희;현태선
    • Journal of Nutrition and Health
    • /
    • 제56권4호
    • /
    • pp.419-438
    • /
    • 2023
  • 본 연구에서는 20-30대 성인을 대상으로 개인별 식습관 목표를 설정하고 인스턴트 메신저를 활용한 스마트폰 기반의 영양상담이 대상자의 영양지수, 식이 자아효능감, 영양소 섭취상태를 향상시킬 수 있는지를 평가하고자 하였다. 총 30명을 대상으로 모바일 메신저의 1:1 채팅방을 통해 주 1회 1시간 내외로 8주간 비대면 영양상담을 진행하였다. 상담 첫째 주에는 사전 온라인 설문조사와 식사섭취조사를 실시하였고, 두 번째 주에는 사전 조사 결과를 바탕으로 2가지의 식습관 목표를 설정하였고, 목표 달성 여부를 매일 기록할 수 있는 체크리스트를 제공하였다. 3주차부터는 상담영양사가 체크리스트를 바탕으로 피드백 메시지와 식생활 지침에 대한 정보를 카드뉴스 형식으로 제공하였다. 7주차 상담 후에는 사후 온라인 설문조사와 식사섭취조사를 실시하였고, 8주차에는 그 동안의 변화된 식습관을 살펴보고 상담 과정 평가에 대한 온라인 설문조사를 실시하였다. 영양상담 전후의 결과를 분석한 결과, 영양상담 후 대상자의 영양지수와 주위 환경 자극 조절 효능감 점수가 영양상담 전보다 유의하게 높았다. 영양지수 문항별로는 과일, 우유 및 유제품, 견과류, 채소류, 패스트푸드, 라면, 달고 기름진 빵류, 가당음료류의 섭취 빈도 점수가 영양상담 후 유의하게 높았다. 단백질, 비타민 A, 티아민, 리보플라빈, 엽산, 칼슘, 철의 섭취량과 비타민 A, 리보플라빈, 엽산, 칼슘, 철의 INQ도 영양상담 전보다 후에 높았다. 또한 참가자들은 영양상담 프로그램과 제공되는 영양정보에 대해 높은 만족도를 보였다. 이와 같이 개인별 목표 설정과 스마트폰 기반 영양상담은 20-30대 성인의 영양지수, 주위 환경 자극 조절 효능감, 그리고 영양소의 양적, 질적 향상에 효과적인 것으로 나타났으며, BMI에 따라 분류한 저체중·정상체중군과 과체중·비만군 모두 유사한 결과를 얻었다. 본 연구 결과 개인별 목표 설정, 자기 모니터링, 목표 달성에 대한 피드백과 격려가 행동 변화에 긍정적인 효과를 주는 것으로 보이며, 스마트폰을 편하게 사용하는 젊은 성인에게는 대면 상담이 아닌 스마트폰 채팅 기반 영양상담도 효과적인 방법이라고 사료된다.

드론기반 시공간 초분광영상을 활용한 식생유무에 따른 하천 수심산정 기법 적용성 검토 (Evaluation for applicability of river depth measurement method depending on vegetation effect using drone-based spatial-temporal hyperspectral image)

  • 권영화;김동수;유호준
    • 한국수자원학회논문집
    • /
    • 제56권4호
    • /
    • pp.235-243
    • /
    • 2023
  • 하천법 개정 및 수자원의 조사·계획 및 관리에 관한 법률 제정으로 하상변동조사를 정기적으로 실시하는 것이 의무화되었고, 지자체가 계획적으로 수자원을 관리할 수 있도록 제도가 마련되고 있다. 하상 지형은 직접 측량할 수 없기 때문에 수심 측량을 통해 간접적으로 이루어지고 있으며, 레벨측량이나 음향측심기를 활용한 접촉식 방법으로 이루어지고 있다. 접촉식 수심측량법은 자료수집이 제한적이기 때문에 공간해상도가 낮고 연속적인 측량이 불가능하다는 한계가 있어 최근에는 LiDAR나 초분광영상을 이용한 원격탐사를 이용한 수심측정 기술이 개발되고 있다. 개발된 초분광영상을 이용한 수심측정 기술은 접촉식 조사보다 넓은 지역을 조사할 수 있고, 잦은 빈도로 자료취득이 용이한 드론에 경량 초분광센서를 탑재하여 초분광영상을 취득하고, 최적 밴드비 탐색 알고리즘을 적용해 수심분포 산정이 가능하다. 기존의 초분광 원격탐사 기법은 드론의 경로비행으로 획득한 초분광영상을 면단위의 영상으로 정합한 후 특정 물리량에 대한 분석이 수행되었으며, 수심측정의 경우 모래하천을 대상으로 한 연구가 주를 이루었으며, 하상재료에 대한 평가는 이루어지지 않았었다. 본 연구에서는 기존의 초분광영상을 활용한 수심산정 기법을 식생이 있는 하천에 적용하고, 동일지역에서 식생을 제거한 후의 2가지 케이스에 대해서 시공간 초분광영상과 단면초분광영상에 모두 적용하였다. 연구결과, 식생이 없는 경우의 수심산정이 더 높은 정확도를 보였으며, 식생이 있는 경우에는 식생의 높이를 바닥으로 인식한 수심이 산정되었다. 또한, 기존의 단면초분광영상을 이용한 수심산정뿐만 아니라 시공간 초분광영상에서도 수심산정의 높은 정확도를 보여 시공간 초분광영상을 활용한 하상변동(수심변동) 추적의 가능성을 확인하였다.

다문화사회의 문화적 특성을 반영한 텍스타일디자인 콘텐츠 개발 연구 - 중국, 베트남, 일본의 민화를 중심으로 - (A Study on the Development of Textile Design Contents Reflecting The Cultural Characteristics of Multi-cultural Society - Focused on Folk Paintings in China, Vietnam and Japan -)

  • 박상오
    • 한국과학예술포럼
    • /
    • 제30권
    • /
    • pp.119-127
    • /
    • 2017
  • 세계화시대에 따른 다민족, 다문화사회는 이제 전세계가 공통적으로 겪고 있는 현상이다. 우리나라도 이미 다문화사회로 진입하였기에 더 이상은 단일민족이라는 이데올로기에 머무를 수만은 없는 실정이다. 그러나 현재 국내 다문화사회관련 국가정책과 연구들은 제도적 측면과 한국문화의 일방적 교육에 국한되어 있기에 본 연구는 이러한 실질적 한계점을 극복하고자 하는데서 시작되었다. 본 연구의 목적은 각국의 문화가 함축적으로 반영된 민화에서 디자인 리소스를 확보하고 생활 속 의식주에 가장 밀접한 섬유제품에 접목시킬 수 있는 텍스타일디자인 콘텐츠를 개발함으로서, 문화적 교류에 의한 소통방안을 제시하고자하는 것이다. 따라서 본 논문은 국내의 결혼 이민자 현황을 기반으로 빈도수 상위 3개국인 중국·베트남·일본의 민화의 특성 분석결과를 통하여 배색 및 텍스타일패턴디자인콘텐츠로 개발함으로써 다양한 섬유상품들에 즉각적으로 적용이 가능하도록 시도하였다. 연구 결과 및 내용은 다음과 같다. 첫째, 국내 다문화사회는 국제결혼을 통해 형성된 것으로 나타났으며 가장 많은 결혼이민자 국가는 중국, 베트남, 일본, 필리핀, 캄보디아, 타이, 몽골, 기타 순으로 나타났다. 둘째, 민화는 각국의 차별화된 문화가 함축적으로 내제되어 있는 중요한 요소로서 텍스타일디자인 콘텐츠를 개발하는데 적합하였다. 셋째, 중국, 베트남, 일본의 민화를 활용하여 문양 및 배색 DB구축 및 텍스타일 패턴디자인콘텐츠를 개발한 결과 각국의 문화적 특성이 반영된 콘텐츠의 활용도와 상품화의 가능성을 검증할 수 있었다. 이러한 연구결과를 바탕으로 다문화사회 구성원 간의 문화를 자연스럽게 공유하고 접하는 정서적·예술적 측면의 화합과 차별화된 관련 상품개발에 기여하기를 기대한다.

조식동물 탐지 및 모니터링을 위한 딥러닝 기반 객체 탐지 모델의 강인성 평가 (Evaluation of Robustness of Deep Learning-Based Object Detection Models for Invertebrate Grazers Detection and Monitoring)

  • 박수호;김흥민;김탁영;임재영;장선웅
    • 대한원격탐사학회지
    • /
    • 제39권3호
    • /
    • pp.297-309
    • /
    • 2023
  • 최근 조식동물로 인한 갯녹음 현상으로 인해 연안 생태계 및 어장환경의 황폐화가 가속화되고 있다. 이러한 갯녹음 현상을 모니터링하고 방지대책을 세우기 위해서는 광범위한 해역에 대한 원격탐사 기반의 모니터링 기술 도입이 필요하다. 본 연구에서는 수중에서 촬영된 동영상으로부터 조식동물을 탐지하고 모니터링하기 위한 딥러닝 기반 객체 탐지 모델의 강인성(robustness)을 비교 분석하였다. 우리나라 연안의 대표적인 조식동물 7종을 대상으로 이미지 데이터셋을 구축하였으며, 이를 활용하여 딥러닝 기반 객체 탐지 모델인 You Only Look Once (YOLO)v7과 YOLOv8을 훈련시켰다. 총 6개의 YOLO 모델(YOLOv7, YOLOv7x, YOLOv8s, YOLOv8m, YOLOv8l, YOLOv8x)에 대해 탐지 성능과 탐지 속도를 평가하였으며, 수중환경에서 촬영 시 발생할 수 있는 다양한 이미지 왜곡에 대해서 강인성 평가를 실시하였다. 평가결과 YOLOv8 계열 모델이 파라미터(parameter) 수 대비 더 높은 탐지 속도(약 71-141 FPS [frame per second])를 보였다. 탐지 성능에 있어서도 YOLOv8 계열 모델(mean average precision [mAP] 0.848-0.882)이 YOLOv7 계열 모델(mAP 0.847-0.850)에 비해 더 높은 성능을 보이는 것을 확인하였다. 모델의 강인함에 있어서 형태 왜곡에 대해서는 YOLOv7 계열 모델이 YOLOv8 계열 모델에 비해 강인한 것을 확인하였으며, 색상 왜곡에 대해서는 YOLOv8 계열 모델이 상대적으로 강인한 것을 확인 하였다. 따라서 실해역에서 수중 영상 촬영 시, 형태 왜곡은 발생 빈도가 낮으며 색상 왜곡은 연안에서 빈번하게 발생한다는 점을 고려했을 때, 연안해역에서 조식동물 탐지와 모니터링을 위해서는 YOLOv8 계열 모델을 활용하는 것이 타당한 것으로 판단된다.

국립중앙박물관 소장 《회혼례도첩》 속 등장인물의 복식 고찰 (Analysis of Clothing in a Painting Album of a 60th Wedding Anniversary Feast in the Collection of the National Museum of Korea)

  • 이은주
    • 헤리티지:역사와 과학
    • /
    • 제56권3호
    • /
    • pp.76-98
    • /
    • 2023
  • 국립중앙박물관 소장 《회혼례도첩》(덕수6375)에 묘사된 남녀 등장인물의 복식을 분석하고 《회혼례도첩》의 제작 시기를 추정한 결과는 다음과 같다. 첫째, 주인공 노신랑은 <전안례도>와 <교배례도>에서는 평소 관원으로 착용하던 흑단령을 착용하였다. 그 외 <헌수례도>와 <접빈도>, <중뢰연도>에서는 패영 없는 자립에 옥색 포, 홍색 세조대를 둘렀다. 기럭아범은 자립에 귀 옆에 묶은 패영을 달고 흉배를 부착한 무문 흑단령을 착용하였다. 성인 남자 자손과 하객들은 도포 등 당시의 대표적인 포 종류를 착용하였는데 특히 무관으로 추정되는 인물들은 철릭, 직령을 착용하고 붉은 색 띠와 청색 계통의 띠를 신분에 맞추어 착용하였다. 징씨(徵氏) 등 안내자는 중치막과 홍단령을 착용하였으며 어린 동자들과 시동(侍童)은 중치막을 착용하였다. 술을 따르고 음식을 나르는 총각들은 땋은 머리에 소창의(小氅衣)를 입고 성인들은 전립(氈笠)에 소창의를 착용하였다. 군영 소속의 세악수들은 소색 소창의에 흑색 전복, 그리고 허리에 남색 포대 등 군복을 착용하였다. 둘째, 노신부는 <교배례도>에서는 거두미와 초록원삼 차림을 하였고 <헌수연도>에서는 남치마·옥색저고리 차림이 확인되었다. 여자 자손들은 어여머리에 비녀와 반자, 진주댕기 등의 칠보장식을 하였고 다양한 색상의 저고리에 남색과 홍색, 옥색 등의 치마를 입었다. 남치마에 초록 장옷을 입은 부인도 확인되었다. 홍치마에 초록색 회장저고리를 입은 <교배례도>의 동녀(童女) 4명은 낭자머리에 비녀 꽂고 도다익 댕기를 길게 드리웠으며 칠보족두리를 썼다. 비자(婢子)들은 어여머리에 가리마를 썼으며 양반 부인들과 유사한 치마·저고리를 착용하였으나 색상이 연했고 치마의 길이가 짧았으며 치마의 부풀림 정도가 약하였다. 기녀는 양반 부인과 비슷한 모습이었으나 색상이 덜 화려하였으며 어여머리에는 칠보장식이 없었다. 셋째, 주인공의 자립 착용, 철릭과 직령을 입은 하객들, 군영 소속 세악수 참여 등에 근거하여 회혼례의 주인공이 병조나 군영과 관련된 인물이었을 가능성을 제시하였으며 군영 악대의 전복의 소매 길이와 잠화 사용, 어여머리의 형태와 댕기, 저고리의 길이와 치마의 부풀린 형태 등에 근거하여 《회혼례도첩》의 제작 시기를 1760년대~1780년대로 추정하였다.

BMI와 체지방률을 고려한 비만위험도 판정에 따른 대학생의 식생활 및 섭취 양상 연구 (Dietary habits and nutrient intake status of university students according to obesity risk based on body mass index and percent body fat)

  • 이채홍;이경아
    • Journal of Nutrition and Health
    • /
    • 제56권6호
    • /
    • pp.714-729
    • /
    • 2023
  • 최근 코로나 팬데믹 이후 비만인구가 증가하고 있으며, 특히 가공식품, 당분 및 동물성지방 섭취 증가와 신체활동 감소 등으로 젊은 층의 가속노화현상이 보고되고 있다. 이에 대학생들을 대상으로 비만 위험도에 따른 식생활 및 영양소 섭취상태를 분석하여 올바른 식습관 개선을 위한 기초자료를 제공하고자 하였다. 본 연구는 대학생 90명을 대상으로 식습관 조사와 사진활용 식사섭취 조사를 실시하였다. 비만위험도 판정은 생체 전기 저항 측정법을 통해 신장, 체중, 체질량지수와 체지방률을 측정하고, BMI와 체지방률이 둘 다 정상이면 정상군, 둘 다 과체중 이상이면 위험군, BMI만 비만인 대상자 BMI군, 체지방률만 비만인 대상자 PBF군으로 판정하였다비만위험도에 따른 식습관 조사 결과, 위험군이 정상군보다 수면시간이 적고, 채소류의 섭취빈도는 낮은 반면 패스트푸드 섭취는 높은 것으로 나타나 유의한 차이를 보였다. 식사섭취조사에서 한국인식사섭취기준의 식사구성안에 따른 권장섭취횟수와 비교한 결과, BMI군이 PBF군에 비해 고기·생선·고기·콩류의 섭취가 높았으며, 정상군이 위험군에 비해 채소류의 섭취가 유의적으로 높았다. 1일 평균 영양소 섭취량을 비교한 결과, 에너지섭취량에서는 비만 위험도 판정에 따른 차이를 보이지 않은 반면, 식이섬유, 비타민 A의 섭취에서는 정상군이 위험군에 비해 섭취량이 많았으며, 칼슘은 BMI군이 위험군에 비해 섭취량이 유의하게 많았다. 단백질과 리보플라빈은 BMI군이 PBF군과 위험군에 비해 섭취량이 높아 유의한 차이를 보였고, 비타민 C는 PBF군이 위험군에 비해 높은 섭취를 나타냈다. 이상의 결과를 통해 대학생을 대상으로 정확한 비만진단을 위해 체지방률을 측정하여 BMI와 함께 활용하여 일반 비만뿐 아니라 마른 비만과 근육발달형을 구분하고, 각 유형별 식행동 특성에 맞는영양교육 및 상담을 제공하는 것이 필요하다.

소형 초고속해상무선통신망 송수신기 성능 검증 방안에 관한 연구 (A Study on the Performance Verification Method of Small-Sized LTE-Maritime Transceiver)

  • 우석;김부영;심우성
    • 해양환경안전학회지
    • /
    • 제29권7호
    • /
    • pp.902-909
    • /
    • 2023
  • 해양사고 예방 지원을 목표로 해양수산부 주도의 지능형 해상교통정보서비스가 지난 21년 1월부터 시작되었고 그동안 이용이 제한되었던 3톤 미만 선박까지 확대하기 위해 개발·추진되는 소형 초고속해상무선통신망(이하 LTE-M) 송수신기의 성능 검증 방안에 대해 연구하였다. 국내 해양 사고의 약 30%가 3톤 미만의 선박에서 발생되고 있기 때문에 소형 선박 전용의 송수신기 개발을 통한 해양안전 사각지대 보완이 필요하다. 소형 LTE-M 송수신기는 연안에서 조업 활동이 활발한 어선과 육지 인근의 수상레저기구 등을 대상으로 적용될 수 있다. 따라서 실제 송수신기가 설치·이용되는 환경을 고려하여 충분한 성능 및 안정적인 통신 품질 제공 여부를 검증하는 방안이 필요하다. 본 연구에서는 LTE-M 망의 통신품질 요구 기준과 해양수산부의 소형 송수신기 성능 요구 기준을 검토해보고, 소형 송수신기의 성능을 적합하게 평가할 수 있는 시험 방안을 제안하였다. 제안한 시험 방안은 해양 사고 빈도가 높은 6개 실해역 노선을 대상으로 타당성을 검증하였으며, 소형 송수신기 다운링크 및 업링크 전송속도가 각각 9Mbps 이상 및 3Mbps 이상의 성능을 보임을 확인할 수 있었다. 또한 커버리지 분석시스템을 활용하여 집중관리구역(0~30km) 및 관심구역(30~50km)에서 각 95% 이상 및 100%의 커버리지를 확인하였다. 본 논문에서 제안한 성능 평가 방안 및 시험 결과는 송수신기의 성능 검증을 위한 참고 자료로 활용되어 정부가 추진하는 바다 내비게이션 서비스 및 소형 송수신기의 보급 및 확산에 기여할 것으로 기대된다.

딥러닝과 Landsat 8 영상을 이용한 캘리포니아 산불 피해지 탐지 (Detection of Wildfire Burned Areas in California Using Deep Learning and Landsat 8 Images)

  • 서영민;윤유정;김서연;강종구;정예민;최소연;임윤교;이양원
    • 대한원격탐사학회지
    • /
    • 제39권6_1호
    • /
    • pp.1413-1425
    • /
    • 2023
  • 기후변화로 인한 대형 산불의 빈도가 증가함에 따라 극심한 인명 및 재산상의 피해를 초래하고 있다. 이로 인해 많은 식생이 소실되며, 그 강도와 발생 형태에 따라 생태계 변화에 영향을 끼친다. 생태계 변화는 다시 산불 발생을 유발하여 2차 피해를 야기한다. 따라서 산불 피해지에 대한 정확한 탐지 및 면적 산정의 중요성이 지속적으로 제기되고 있다. 효율적인 산불 피해지 모니터링을 위해 산불 발생 후 실시간 지형 및 기상정보는 물론 피해지역의 영상을 대규모로 취득할 수 있는 위성영상이 주로 활용되고 있다. 최근, 합성곱 신경망(convolution neural network, CNN) 기반 모델부터 고성능 트랜스포머(Transformer) 기반 모델에 이르기까지 딥러닝 알고리즘이 빠르게 발전하면서 산림원격탐사에서 이를 적용한 연구가 활발히 이루어지고 있다. 하지만 현재까지 적용된 딥러닝 모델은 제한적이며 현업에서의 합리적인 활용을 위한 정량적 성능평가에 대한 보고가 부족한 상황이다. 따라서 본 연구에서는 모델에 따른 성능향상과 데이터 설계에 따른 성능향상을 중점적으로 비교 분석하였다. 미국 캘리포니아 지역을 대상으로 CNN 기반 모델의 U-Net, High Resolution Network-Object Contextual Representation (HRNet-OCR)을 활용하여 산불 피해지 모델을 구축하였다. 또한, 기본 파장대역과 함께 식생활력도 및 지표의 수분함량 정도를 고려하고자 normalized difference vegetation index (NDVI), normalized burn ratio (NBR)와 같은 산불 관련 분광지수를 산출하여 입력 이미지로 사용하였다. U-Net의 mean intersection over union (mIoU)이 0.831, HRNet-OCR이 0.848을 기록하여 두 모델 모두 우수한 영상분할 성능을 보였다. 또한, 밴드 반사도뿐 아니라 분광지수를 추가한 결과 모든 조합에서 평가지표 값이 상승하여 분광지수를 활용한 입력 데이터 확장이 픽셀 세분화에 기여함을 확인하였다. 이와 같은 딥러닝 방법론을 발전시킨다면 우리나라의 산불 피해지에 대한 신속한 파악 및 복구 계획 수립의 기초자료로 활용될 수 있을 것으로 기대된다.

3D 프린팅 소재 화학물질의 독성 예측을 위한 Data-centric XAI 기반 분자 구조 Data Imputation과 QSAR 모델 개발 (Data-centric XAI-driven Data Imputation of Molecular Structure and QSAR Model for Toxicity Prediction of 3D Printing Chemicals)

  • 정찬혁;김상윤;허성구;;신민혁;유창규
    • Korean Chemical Engineering Research
    • /
    • 제61권4호
    • /
    • pp.523-541
    • /
    • 2023
  • 3D 프린터의 활용이 높아짐에 따라 발생하는 화학물질에 대한 노출 빈도가 증가하고 있다. 그러나 3D 프린팅 발생 화학물질의 독성 및 유해성에 대한 연구는 미비하며, 분자 구조 데이터의 결측치로 인해 in silico 기법을 사용한 독성예측 연구는 저조한 실정이다. 본 연구에서는 화학물질의 분자구조 정보를 나타내는 주요 분자표현자의 결측치를 보간하여 3D 프린팅의 독성 및 유해성을 예측한 Data-centric QSAR 모델을 개발하였다. 먼저 MissForest 알고리즘을 사용해 3D 프린팅으로 발생되는 유해물질의 분자표현자 결측치를 보완하였으며, 서로 다른 4가지 기계학습 모델(결정트리, 랜덤포레스트, XGBoost, SVM)을 기반으로 Data-centric QSAR 모델을 개발하여 생물 농축 계수(Log BCF)와 옥탄올-공기분배계수(Log Koa), 분배계수(Log P)를 예측하였다. 또한, 설명 가능한 인공지능(XAI) 방법론 중 TreeSHAP (SHapley Additive exPlanations) 기법을 활용하여 Data-centric QSAR 모델의 신뢰성을 입증하였다. MissForest 알고리즘 기반 결측지 보간 기법은, 기존 분자구조 데이터에 비하여 약 2.5배 많은 분자구조 데이터를 확보할 수 있었다. 이를 바탕으로 개발된 Data-centric QSAR 모델의 성능은 Log BCF, Log Koa와 Log P를 각각 73%, 76%, 92% 의 예측 성능으로 예측할 수 있었다. 마지막으로 Tree-SHAP 분석결과 개발된 Data-centric QSAR 모델은 각 독성치와 물리적으로 상관성이 높은 분자표현자를 통하여 선택함을 설명할 수 있었고 독성 정보에 대한 높은 예측 성능을 확보할 수 있었다. 본 연구에서 개발한 방법론은 다른 프린팅 소재나 화학공정, 그리고 반도체/디스플레이 공정에서 발생 가능한 오염물질의 독성 및 인체 위해성 평가에 활용될 수 있을 것으로 사료된다.