• 제목/요약/키워드: ACCURACY

검색결과 33,961건 처리시간 0.067초

인공지능 기반 금융서비스의 공정성 확보를 위한 체크리스트 제안: 인공지능 기반 개인신용평가를 중심으로 (A Checklist to Improve the Fairness in AI Financial Service: Focused on the AI-based Credit Scoring Service)

  • 김하영;허정윤;권호창
    • 지능정보연구
    • /
    • 제28권3호
    • /
    • pp.259-278
    • /
    • 2022
  • 인공지능(AI)의 확산과 함께 금융 분야에서도 상품추천, 고객 응대 자동화, 이상거래탐지, 신용 심사 등 다양한 인공지능 기반 서비스가 확대되고 있다. 하지만 데이터에 기반한 기계학습의 특성상 신뢰성과 관련된 문제 발생과 예상하지 못한 사회적 논란도 함께 발생하고 있다. 인공지능의 효용은 극대화하고 위험과 부작용은 최소화할 수 있는 신뢰할 수 있는 인공지능에 대한 필요성은 점점 더 커지고 있다. 이러한 배경에서 본 연구는 소비자의 금융 생활에 직접 영향을 끼치는 인공지능 기반 개인신용평가의 공정성 확보를 위한 체크리스트 제안을 통해 인공지능 기반 금융서비스에 대한 신뢰 향상에 기여하고자 하였다. 인공지능 신뢰성의 주요 핵심 요소인 투명성, 안전성, 책무성, 공정성 중 포용 금융의 관점에서 자동화된 알고리즘의 혜택을 사회적 차별 없이 모두가 누릴 수 있도록 공정성을 연구 대상으로 선정하였다. 문헌 연구를 통해 공정성이 영향을 끼치는 서비스 운용의 전 과정을 데이터, 알고리즘, 사용자의 세 개의 영역으로 구분하고, 12가지 하위 점검 항목과 항목별 세부 권고안으로 체크리스트를 구성하였다. 구성한 체크리스트는 이해관계자(금융 분야 종사자, 인공지능 분야 종사자, 일반 사용자)별 계층적 분석과정(AHP)을 통해 점검 항목에 대한 상대적 중요도 및 우선순위를 도출하였다. 이해관계자별 중요도에 따라 세 개의 그룹으로 분류하여 분석한 결과 학습데이터와 비금융정보 활용에 대한 타당성 검증 및 신규 유입 데이터 모니터링의 필요성 등 실용적 측면에서 구체적인 점검 사항을 파악하였고, 금융 소비자인 일반 사용자의 경우 결과에 대한 해석 오류 및 편향성 확인에 대한 중요도를 높게 평가한다는 것을 확인할 수 있었다. 본 연구의 결과가 더 공정한 인공지능 기반 금융서비스의 구축과 운영에 기여할 수 있기를 기대한다.

수종에 따른 스트로크 하베스터의 벌도⋅조재작업 생산성 및 비용 (Productivity and Cost of Mechanized Felling and Processing Operations Performed with an Excavator-based Stroke Harvester by Tree Species)

  • 최윤성;조민재;문호성;오재헌
    • 한국산림과학회지
    • /
    • 제111권4호
    • /
    • pp.567-582
    • /
    • 2022
  • 체인톱에 의한 인력위주의 임목수확작업은 안전사고 문제에 직면하고 있으나, 기계화작업을 통해 작업자의 위험성을 줄이고 생산성을 높일 수 있다. 본 연구는 국내 수종에 적합한 굴삭기 기반의 스트로크 하베스터을 이용하여 리기다소나무(Pinus rigida)와 신갈나무(Quercus mongolica)를 대상으로 벌도+조재작업, 벌도작업과 조재작업으로 구분하여 생산성과 비용을 분석하였다. 스트로크 하베스터의 효율적인 운영을 위한 작업생산성 예측모델 개발과 직경 및 기계이용률에 따른 작업비용 변화를 분석하였다. 벌도+조재작업에서 리기다소나무와 신갈나무의 생산성은 각각 6.53 m3/SMH와 4.02 m3/SMH이고, 비용은 각각 17,983 won/m3과 29,210 won/m3으로 나타났다. 벌도작업에서 리기다소나무와 신갈나무의 생산성은 각각 40.9 m3/SMH와 23.0 m3/SMH이고 비용은 각각 2,667 won/m3와 4,743 won/m3으로 나타났다. 조재작업에서 리기다소나무와 신갈나무의 생산성은 각각 8.25 m3/SMH와 7.75 m3/SMH이고, 비용은 각각 15,296 won/m3와 16,283 m3/SMH으로 나타났다. 스트로크 하베스터를 이용한 벌도+조재작업, 벌도작업과 조재작업의 생산성에 대한 중요인자는 흉고직경, 이동거리와 절단횟수가 선정되었으며(p<0.05), 이를 이용하여 작업생산성 예측모델을 개발하였다. 따라서 스트로크 하베스터를 이용한 벌도 및 조재작업에서 다양한 조건과 수종을 고려한 DB 구축으로 생산성과 비용 예측의 정확성을 높이기 위한 연구가 필요할 것으로 판단된다.

Sentinel-1 SAR 위성영상의 위상차분간섭기법(DInSAR)을 이용한 적설심의 공간분포 추정 (Estimation of spatial distribution of snow depth using DInSAR of Sentinel-1 SAR satellite images)

  • 박희성;정건희
    • 한국수자원학회논문집
    • /
    • 제55권12호
    • /
    • pp.1125-1135
    • /
    • 2022
  • 적설에 의한 피해는 자주 발생하지 않지만 발생하면 광범위한 지역에 피해를 준다. 적설에 의한 피해를 예방하기 위해서는 지역별로 피해를 유발하는 적설심을 미리 파악해 둘 필요가 있다. 하지만 관측하고 있는 적설심은 특정 관측지점으로 한정되어 피해를 유발하는 지역별 피해유발적설심을 파악하는데 어려움이 있다. 이를 극복하기 위한 일반적인 방법은 관측지점의 적설을 보간하여 공간적으로 확대하는 것이다. 하지만 이것은 매우 적은 자료를 가지고 고도 등 지형적인 특성이 다른 넓은 영역을 통계적으로 추론해야 하는 한계로 인해 지역에 대한 피해유발 피해유발적설심의 구명에 더 혼란을 주기도 한다. 이를 보완하기 위해서는 넓은 영역을 관측하는 위성영상을 활용할 수 있으며, 그 중에서도 합성개구레이더(Synthetic Aperture Radar; SAR)를 이용한 위상차분 간섭기법(DInSAR)을 활용할 수 있다. 위상간섭영상은 두 개의 다른 시기에 측정된 합성개구레이더 영상의 위상간섭을 이용한 것으로 일반적으로 미세한 지형의 변화를 추적할 때 사용되기도 한다. 본 연구에서는 유럽우주국(ESA)에서 운영하는 Sentinel-1B 위성의 dual polarimetric IW 모드 C-band SAR 데이터를 사용하여 DInSAR 분석을 수행하여 적설심의 공간분포를 추정하였다. 또한 정지궤도복합위성 천리안 2호(GK-2A)의 L2 적설심 추정 자료를 이용하여 비교하였다. 적용 결과, 적설예측의 정확도는 격자별로 계산할 경우, DInSAR 는 약 0.92%, GK-2A 는 약 0.71% 를 나타내 DInSAR의 적용성이 높게 나타났다. 즉, DInSAR 방법을 이용하여 계산된 적설심과 기상관측소에서 관측된 적설심을 공간보간하여 비교한 결과, 적설의 분석 결과 적설심을 과대추정하는 경우가 발생하기는 했으나, 적설심의 공간분포를 추정하는데 충분한 정보를 제공했으며, 이러한 방법으로 파악된 적설심의 공간분포는 실제 피해발생지역의 적설심을 보다 정확하게 추정하는데 기여할 수 있으며, 이것은 지역별 피해유발적설심을 파악하는데 도움이 될 것이다.

도메인 특수성이 도메인 특화 사전학습 언어모델의 성능에 미치는 영향 (The Effect of Domain Specificity on the Performance of Domain-Specific Pre-Trained Language Models)

  • 한민아;김윤하;김남규
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.251-273
    • /
    • 2022
  • 최근 텍스트 분석을 딥러닝에 적용한 연구가 꾸준히 이어지고 있으며, 특히 대용량의 데이터 셋을 학습한 사전학습 언어모델을 통해 단어의 의미를 파악하여 요약, 감정 분류 등의 태스크를 수행하려는 연구가 활발히 이루어지고 있다. 하지만 기존 사전학습 언어모델이 특정 도메인을 잘 이해하지 못한다는 한계를 나타냄에 따라, 최근 특정 도메인에 특화된 언어모델을 만들고자 하는 방향으로 연구의 흐름이 옮겨가고 있는 추세이다. 도메인 특화 추가 사전학습 언어모델은 특정 도메인의 지식을 모델이 더 잘 이해할 수 있게 하여, 해당 분야의 다양한 태스크에서 성능 향상을 가져왔다. 하지만 도메인 특화 추가 사전학습은 해당 도메인의 말뭉치 데이터를 확보하기 위해 많은 비용이 소요될 뿐 아니라, 고성능 컴퓨팅 자원과 개발 인력 등의 측면에서도 많은 비용과 시간이 투입되어야 한다는 부담이 있다. 아울러 일부 도메인에서 추가 사전학습 후의 성능 개선이 미미하다는 사례가 보고됨에 따라, 성능 개선 여부가 확실하지 않은 상태에서 도메인 특화 추가 사전학습 모델의 개발에 막대한 비용을 투입해야 하는지 여부에 대해 판단이 어려운 상황이다. 이러한 상황에도 불구하고 최근 각 도메인의 성능 개선 자체에 초점을 둔 추가 사전학습 연구는 다양한 분야에서 수행되고 있지만, 추가 사전학습을 통한 성능 개선에 영향을 미치는 도메인의 특성을 규명하기 위한 연구는 거의 이루어지지 않고 있다. 본 논문에서는 이러한 한계를 극복하기 위해, 실제로 추가 사전학습을 수행하기 전에 추가 사전학습을 통한 해당 도메인의 성능 개선 정도를 선제적으로 확인할 수 있는 방안을 제시한다. 구체적으로 3개의 도메인을 분석 대상 도메인으로 선정한 후, 각 도메인에서의 추가 사전학습을 통한 분류 정확도 상승 폭을 측정한다. 또한 각 도메인에서 사용된 주요 단어들의 정규화된 빈도를 기반으로 해당 도메인의 특수성을 측정하는 지표를 새롭게 개발하여 제시한다. 사전학습 언어모델과 3개 도메인의 도메인 특화 사전학습 언어모델을 사용한 분류 태스크 실험을 통해, 도메인 특수성 지표가 높을수록 추가 사전학습을 통한 성능 개선 폭이 높음을 확인하였다.

UAS 영상 및 지상 LiDAR 조합한 3D 수치모형 기반 비탈면 앵커의 손상인자 분석에 관한 연구 (A Study on Damage factor Analysis of Slope Anchor based on 3D Numerical Model Combining UAS Image and Terrestrial LiDAR)

  • 이철희;이종현;김달주;강준오;권영훈
    • 한국지반공학회논문집
    • /
    • 제38권7호
    • /
    • pp.5-24
    • /
    • 2022
  • 현행 비탈면 앵커공법의 보강성능평가는 앵커 두부와 지반밀착도, 앵커 두부의 균열 및 파손에 대해서 정성적으로 성능을 평가하고 있다. 이로 인해 성능저하 상태 점검을 위한 정량적 데이터베이스화와 이를 이용한 시간이력 관리는 어려운 실정이다. 이에 본 연구에서는 비탈면에 설치된 앵커공법의 정량적 유지관리에 활용하기 위하여 UAS 영상과 지상 LiDAR의 사각지대를 보완하기 위한 SfM기반의 조합 3차원 수치모형을 구현하여 손상인자의 수치데이터를 검출하였다. 비탈면과 같은 수직구조물에서 상대적으로 높은 z 좌표 오차를 갖는 UAS 3차원 수치모형에서 사각지대 데이터 공백을 상호 보완하기 위하여 지상 LiDAR 스캔 데이터를 조합하였고 z 좌표 정확도의 향상을 확인하였다. 비탈면에 설치된 10공의 앵커에 임의로 손상을 발생시킨 후에 3차원 수치모형을 구축하였고 정사투영을 통해 균열, 파손, 회전변위와 지반 밀착도에 대한 수치 값을 검출하였다. 8K 해상도로 균열 실측값과 비교시 ±0.05mm의 오차범위에서 0.3mm 미만의 균열 검출이 가능하였다. 앵커 두부의 최대 파손 면적은 설계대비 3% 이내로 발생된 것을 확인하였고, 파손부의 체적 또한 검출하였다. 특히 z 좌표 데이터가 중요한 지반밀착도의 경우 UAS 3차원 수치모형에서는 사각지대로 인한 데이터 공백으로 측정이 불가능하였지만 지상 LiDAR를 조합할 경우 앵커 저면과 지반의 불규칙한 표면에서 표고차 확인이 가능하여 임의의 20개 지점의 평균 표고차를 지반밀착도로 도출하였다. 또한, 앵커 두부의 1° 미만의 회전각과 이동 변위 값도 검출하였다. 이에 본 연구에서 구축한 3차원 수치모형에서 앵커 손상인자의 정량적 데이터 추출이 가능하였고, 이를 데이터베이스화 한다면 정량적 평가지표의 기초자료로써 활용이 가능할 것으로 판단된다.

곰피추출물의 지표성분 Dieckol의 분석법 개선 및 검증 (Modification and Validation of an Analytical Method for Dieckol in Ecklonia Stolonifera Extract)

  • 한웅호;최선일;문효;이세정;오건;진희구;오현지;김은진;김종욱;이부용;이옥환
    • 한국식품위생안전성학회지
    • /
    • 제37권3호
    • /
    • pp.143-148
    • /
    • 2022
  • 본 연구에서는 곰피추출물을 이용하여 건강기능식품 개발 시 원료의 표준화를 위하여 HPLC-PDA를 이용하여 지표성분 dieckol의 분석법 개선 및 검증을 실시하였다. 분석법의 유효성 검증은 ICH가이드라인에 근거하여 특이성, 직선성, 정확성, 정밀성, 검출한계 및 정량한계를 통해 신뢰성 및 타당성을 검증하였다. 지표성분 dieckol 분석을 위하여 0.1% formic acid가 첨가된 water와 acetonitrile을 이동상으로 사용하였고 컬럼은 Capcell pak C18을 사용하여 HPLC를 이용한 분석방법에서 표준용액과 곰피추출물의 지표성분 dieckol 피크 머무름 시간 일치하고 다른 물질의 간섭을 받지 않는 것을 확인하였으며, PDA spectrum이 일치하므로 특이성을 확인하였다. Dieckol의 검량선의 상관계수(R2)은 1에 가까운 높은 상관계수 값 0.9997로 높은 직선성을 확인할 수 있었으며 분석에 적합함을 알 수 있었다. 농도를 알고 있는 곰피추출물에 dieckol 표준용액을 최종 농도가 각각 저농도(2.5 ㎍/mL), 중간농도(5 ㎍/mL), 고농도(10 ㎍/mL)가 되도록 첨가하여 정밀성 및 정확성을 계산하였다. 정밀성은 일간, 일내 정밀성으로 확인하였으며, intra-day 및 inter-day 분석에서 RSD는 각각 1.58-4.39%, 1.37-4.64% 수준으로 5% 이하의 우수한 정밀성을 보였다. 정확성 측정결과 intra-day 및 inter-day 분석에서 회수율은 각각 96.91-102.33% 및 98.41-105.71%로 우수한 정확성을 나타내었다. 검출한계(LOD)와 정량한계(LOQ)는 0.18 ㎍/mL, 0.56 ㎍/mL로 각각 확인되였으며 낮은 농도에서도 검출이 가능함을 보였다. 확립된 분석법은 특이성, 직선성, 정밀성, 정확성, 검출한계 및 정량한계에 대한 분석법 검증결과가 모두 우수한 분석방법임을 증명하였다. 또한 검증된 분석법을 이용하여 곰피추출물 중 함유한 dieckol 함량을 분석한 결과 27.39±0.50 mg/dry weight g로 분석되었다. 본 연구는 HPLC-PDA를 이용한 곰피추출물의 지표성분인 dieckol의 분석방법을 개선 및 유효성 검증을 진행하여 과학적으로 신뢰성이 있는 적합한 분석방법임이 검증되었다.

격국과 상신에 대한 소고 (The Study on Gyeokguk and Sangshin)

  • 황보관
    • 산업진흥연구
    • /
    • 제7권3호
    • /
    • pp.115-124
    • /
    • 2022
  • 인간의 미래를 예측하는 운명학을 공부하면서 가장 당혹스러운 일은 사람의 타고난 운명 즉 사주팔자가 좋지 않을 때 어떻게 해야 하나? 그냥 운명에 순응하며 살아가는가? 아니면 좋은 운명으로 바뀌도록 도전적인 노력을 하며 개운하는가? 라는 물음에 대한 답을 찾기가 쉽지 않다는 점이다. 운명을 뛰어넘는 길을 제시한 명대의 학자 원료범이 자식을 훈계하기 위하여 남긴 『요범사훈』은 팔자를 고치는 안내 책이며 그 핵심은 공덕(적선)을 쌓는 일이라 하며 운명은 얼마든지 바뀔 수 있다고 했다. 또 혹자는 "미래는 예측하는 것이 아니라 창조하는 것이다." 라고 하기도 하고 동기부여 전문가로 베스트셀러 저자인 스티븐 코비 박사는 "미래를 예측하는 가장 확실한 방법은 미래를 창조하는 것이다."라고 했다. 하여간 인간의 미래를 알고 싶어 하는 욕구와 궁금증은 창세 이래로 오늘날까지도 지속되어 오고 있다. 아마도 이는 우리 인간의 본능적 욕구가 아닐까 생각된다. 그렇다면 인간의 운명이 정명론(定命論)이든 변명론(變命論)이든, 운명학의 기능과 역할은 미래 예측의 정확도를 높이는 것일 것이다. 따라서 본 연구는 미래 예측 술수학의 하나로 가장 대중화되어 있고 예측의 적중률이 높은 것으로 인지되고 있는 명리학에 있어서 그 핵심과 요체가 되는 격국과 이에 수반되는 상신에 대하여 자평명리학을 중심으로 살펴보며 혼란스러운 용어에 대하여 정리해 보았다. 격은 주로 내격을 위주로 살펴보았고 여러 외격이나 별격은 본 논문에서는 다루지 않았다. 구체적으로는 명리 고전과 현대의 여러 학자들의 격국과 용신에 대한 견해를 정리하였고, 특히 격국의 여러 개념과 각각의 내격 특성의 장·단점의 비교, 내격의 취격 순서 및 취격된 격에 대한 성격·패격의 경우를 구분하여 살펴보았다. 아울러, 『자평진전』에서 얘기하는 상신에 대한 개념을 정리하고 보다 폭넓은 개념인 희신에 대하여도 간단히 정리하였고, 일간간명법과 월지간명법에서의 상신의 쓰임의 차이점을 검토·분석하였다. 마지막으로, 격신과 격국의 혼용 및 동일한 용어에 대한 학자들의 포괄적인 다양성의 수용에서 오는 혼란을 후일의 연구 과제로 남겨둔 채 마무리하였다.

기후변화에 따른 동해 심층 해수의 물리적 특성 및 순환 변화 연구 : 현황과 전망 (Studies on Changes in the Hydrography and Circulation of the Deep East Sea (Japan Sea) in a Changing Climate: Status and Prospectus)

  • 이호준;남성현
    • 한국해양학회지:바다
    • /
    • 제28권1호
    • /
    • pp.1-18
    • /
    • 2023
  • 동해는 전 세계적으로 가장 빠른 수준의 온난화를 경험하는 해역 중 하나로서, 기후변화에 민감하게 반응할 뿐 아니라 대양에 비해 월등히 짧은 순환 주기를 가지고 있기 때문에 미래의 대양 환경 변화에도 중요한 시사점을 주는 것으로 알려져 있다. 그러나 동해 심층 해수의 특성과 순환의 변화 과정에 대한 연구는 동해 전역의 심층을 정밀하게 조사하기 위한 국제협력 프로그램이 자리잡고, 측정 장비의 분해능을 포함하는 관측기술과 수치모델 모의 능력이 크게 향상된 최근(1990년대 이후)에서야 본격화되고 있다. 여기서는 동해 심층 해수의 물리적 특성과 순환의 변화 과정에 대한 그간의 연구 결과를 요약하고, 향후 남은 과제를 제시하고자 한다. 동해는 내부에서 자체적으로 심층 해수가 생성되며 대양과 분리된 독특한 심층 순환 구조를 가진다. 동해의 수백 m 수심 아래에는 수온이 낮고(<1℃) 염분이 거의 일정(34.0-34.1)한 해수가 분포하기 때문에 오랜 기간 이 해수를 일본해고유수(동해고유수)로 명명된 단일 해수로 여겨 왔다. 그러나 1990년대 이후 정밀한 관측이 이루어지며, 동해 심층을 채우고 있는 해수가 적어도 3개의 서로 다른 물리적 특성을 가진 해수(중앙수, 심층수, 저층수)로 구성됨이 밝혀졌다. 이들 3개 해수의 물리적 특성과 해수 사이의 경계 수심은 항상 일정한 것이 아니라, 지난 수십 년 동안 유의한 수준의 변화를 겪어왔다. 동해 북부 해역의 대마난류 재순환, 해양-대기 열과 담수의 교환량, 해빙 형성에 영향을 받는 대류(심층사면대류 및 심층외양대류) 과정에 따라 심층 해수 생성에 뚜렷한 차이가 발생했기 때문이다. 생성된 심층 해수는 수심이 얕은 곳을 오른쪽에 두고 일본 분지에서부터 반시계 방향으로 울릉 분지, 야마토 분지를 차례로 거쳐 다시 일본 분지로 수송되며, 이 수평적인 심층 순환도 변화를 겪어 왔다. 수평적인 심층 순환은 동시에 남북 및 연직 방향의 순환(자오면 순환) 경로와 강도의 변화를 동반한다. 동해는 수천 년 규모의 순환 주기를 가지는 대양에 비해 훨씬 짧은 수백 년 혹은 그 이내의 순환 시간 규모를 가지기 때문에 동해 심층 해수의 물리적 특성과 자오면 순환의 급격한 변화를 더 뚜렷하게 볼 수 있을 것으로 기대 가능하다. 심층 및 자오면 순환 사이의 연계성, 대양과 동해의 유출입 해수 수송을 포함하는 동해 상층 순환과 심층 순환 사이의 연계성은 아직까지 잘 밝혀지지 않았다. 동해 심층 해수 수송의 경로와 강도를 지배하는 다양한 과정들에 대한 후속 연구들이 요구된다.

일반화 적응 심층 잠재요인 추천모형 (A Generalized Adaptive Deep Latent Factor Recommendation Model)

  • 김정하;이지평;장성현;조윤호
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.249-263
    • /
    • 2023
  • 대표적인 추천 시스템 방법론인 협업 필터링(Collaborative Filtering)에는 이웃기반 방법(Neighbor Methods)과 잠재 요인 모델(Latent Factor model)이라는 두 가지 접근법이 있다. 이중 행렬 분해(Matrix Factorization)를 이용하는 잠재 요인 모델은 사용자-아이템 상호작용 행렬을 두 개의 보다 낮은 차원의 직사각형 행렬로 분해하고 이들의 행렬 곱으로 아이템의 평점(Rating)을 예측한다. 평점 패턴으로부터 추출된 요인 벡터들을 통해 사용자와 아이템 속성을 포착할 수 있기 때문에 확장성, 정확도, 유연성 측면에서 이웃기반 방법보다 우수하다고 알려져 있다. 하지만 평점이 지정되지 않은 아이템에 대해서는 선호도가 다른 개개인의 다양성을 반영하지 못하는 근본적인 한계가 있고 이는 반복적이고 부정확한 추천을 초래하게 된다. 이러한 잠재요인 모델의 한계를 개선하고자 각각의 아이템 별로 사용자의 선호도를 적응적으로 학습하는 적응 심층 잠재요인 모형(Adaptive Deep Latent Factor Model; ADLFM)이 등장하였다. ADLFM은 아이템의 특징을 설명하는 텍스트인 아이템 설명(Item Description)을 입력으로 받아 사용자와 아이템의 잠재 벡터를 구하고 어텐션 스코어(Attention Score)를 활용하여 개인의 다양성을 반영할 수 있는 방법을 제시한다. 하지만 아이템 설명을 포함하는 데이터 셋을 요구하기 때문에 이 방법을 적용할 수 있는 대상이 많지 않은 즉 일반화에 있어 한계가 있다. 본 연구에서는 아이템 설명 대신 추천시스템에서 보편적으로 사용하는 아이템 ID를 입력으로 하고 Self-Attention, Multi-head attention, Multi-Conv1d 등 보다 개선된 딥러닝 모델 구조를 적용함으로써 ADLFM의 한계를 개선할 수 있는 일반화된 적응 심층 잠재요인 추천모형 G-ADLFRM을 제안한다. 다양한 도메인의 데이터셋을 가지고 입력과 모델 구조 변경에 대한 실험을 진행한 결과, 입력만 변경했을 경우 동반되는 정보손실로 인해 ADLFM 대비 MAE(Mean Absolute Error)가 소폭 높아지며 추천성능이 하락했지만, 처리할 정보량이 적어지면서 epoch 당 평균 학습속도는 대폭 향상되었다. 입력 뿐만 아니라 모델 구조까지 바꿨을 경우에는 가장 성능이 우수한 Multi-Conv1d 구조가 ADLFM과 유사한 성능을 나타내며 입력변경으로 인한 정보손실을 충분히 상쇄시킬 수 있음을 보여주었다. 결론적으로 본 논문에서 제시한 모형은 기존 ADLFM의 성능은 최대한 유지하면서 빠른 학습과 추론이 가능하고(경량화) 다양한 도메인에 적용할 수 있는(일반화) 새로운 모형임을 알 수 있다.

머신러닝을 활용한 수도권 약수터 수질 예측 모델 개발 (Development of a water quality prediction model for mineral springs in the metropolitan area using machine learning)

  • 임영우;엄지연;곽기영
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.307-325
    • /
    • 2023
  • 코로나19 팬데믹의 장기화로 인해 실내 생활에 지쳐가는 사람들이 우울감, 무기력증 등을 해소하기 위해 근거리의 산과 국립공원을 찾는 빈도가 폭발적으로 증가하였다. 자연으로 나온 수많은 사람들이 오가는 걸음을 멈추고 숨을 돌리며 쉬어가는 장소가 있는데 바로 약수터이다. 산이나 국립공원이 아니더라도 근린공원 또는 산책로에서도 간간이 찾아볼 수 있는 약수터는 수도권에만 약 6백여개가 위치해 있다. 하지만 불규칙적이고 수작업으로 수행되는 수질검사로 인해 사람들은 실시간으로 검사 결과를 알 수 없는 상태에서 약수를 음용하게 된다. 따라서 본 연구에서는 약수터 수질에 영향을 미치는 요인을 탐색하고 다양한 곳에 흩어져 있는 데이터를 수집하여 실시간으로 약수터 수질을 예측할 수 있는 모델을 개발하고자 한다. 데이터 수집의 한계로 인해 서울과 경기로 지역을 한정한 후 데이터 관리가 잘 이루어지고 있는 18개 시의 약 300여개 약수터를 대상으로 2015~2020년의 수질 검사 데이터를 확보하였다. 약수터 수질 적합 여부에 영향을 미칠 것으로 여겨지는 다양한 요인들 중 두 차례의 검토를 거쳐 총 10개의 요인을 최종 선별하였다. 최근 주목받고 있는 자동화 머신러닝 기술인 AutoML 기법을 활용하여 20여가지의 머신러닝 기법들 중 예측 성능 기준 상위 5개의 모델을 도출하였으며 그 중 catboost 모델이 75.26%의 예측 분류 정확도로 가장 높은 성능을 가지고 있음을 확인하였다. 추가로 SHAP 기법을 통해 분석에 사용한 변인들이 예측에 미치는 절대적인 영향력을 살펴본 결과 직전 수질 검사에서 부적합 판정을 받았는지 여부가 가장 중요한 요인이었으며 그 외 평균 기온, 과거 연속 2번 수질 부적합 판정 기록 유무, 수질 검사 당일 기온, 약수터 고도 등이 수질 부적합 여부에 영향을 미치고 있음을 확인하였다.