• Title/Summary/Keyword: tree based learning

검색결과 418건 처리시간 0.03초

AutoML을 이용한 산사태 예측 및 변수 중요도 산정 (Prediction of Landslides and Determination of Its Variable Importance Using AutoML)

  • 남경훈;김만일;권오일;왕파우;정교철
    • 지질공학
    • /
    • 제30권3호
    • /
    • pp.315-325
    • /
    • 2020
  • 이 연구는 도로 비탈면에서 발생하는 산사태의 확률론적 예측에 기반된 산사태 발생에 영향을 미치는 인자의 중요도 산정 및 예측 모델을 개발하는 것이다. 산사태 예측 모델을 개발하기 위해 한반도 전 지역을 대상으로 2007년부터 2020년까지 조사된 30,615사면의 현장조사 자료를 활용하였다. 전체 131개의 변수 인자 중 지형인자 17개, 지질인자 114개(기반암 89개를 포함), 도로와의 이격거리를 사용하였다. 산사태 발생에 영향을 미치는 인자를 자동화된 머신러닝인 AutoML을 실시하여 예측 성능이 뛰어난 XRT(extremely randomized trees)를 선정하였다. 변수 중요도 분석결과 지형적 요인 10개, 지질인자 9개, 사회적 영향성인 도로와의 이격 거리와 관련된 항목순으로 급경사지 불안정에 가장 많은 영향을 주는 것으로 분석되었다. 개발된 모델의 신뢰성 검증을 수행한 결과 AUC 83.977%의 예측율을 확보한 것으로 나타났다. 이 모델은 산사태 이력을 기반으로 한 현장조사 자료만을 이용하여 변수 중요도의 순위를 도출함으로써 그에 따른 산사태 발생 가능성을 확률적 및 정량적으로 평가하였다. 향후 의사 결정자들에게 현장조사를 통한 사면진단 안전평가 시 신뢰성 있는 근거를 제공하리라 판단된다.

장기요양 필요 발생의 고위험 대상자 발굴을 위한 예측모형 개발 (Development of prediction model identifying high-risk older persons in need of long-term care)

  • 송미경;박영우;한은정
    • 응용통계연구
    • /
    • 제35권4호
    • /
    • pp.457-468
    • /
    • 2022
  • 고령인구가 증가함에 따라 국가차원에서 노인의 건강노화 실현을 위한 장기요양 필요 발생의 예방 방안을 마련하는 것은 매우 중요하며, 정책적 효과를 극대화하기 위해서는 적절한 대상자의 선정이 선행되어야 한다. 이에 본 연구는 국민건강보험공단의 국민건강정보를 활용하여, 장기요양 필요를 야기하는 기능장애 발생 가능성이 높은 대상자를 발굴하기 위한 예측모형을 개발하고자 한다. 본 연구는 연구대상자의 과거 수집된 자료를 활용하는 후향적 연구로, 본 연구의 연구대상자는 만 65세 이상 의료보장등록인구이다(총 7,724,101명). 예측모형 개발을 위해 고유 방법인 로지스틱 회귀모형, 머신러닝 방법인 의사결정나무와 랜덤포레스트, 딥러닝 방법인 다층퍼셉트론 신경망을 분석하였다. 체계적 분석절차를 통해 각 분석방법별 모형을 적합하였고, 내적 타당성 및 외적 타당성 평가 결과를 기반으로 최종 예측모형을 랜덤포레스트로 선정하였다. 랜덤포레스트는 모집단에서의 4.50%밖에 되지 않는 장기요양 필요 대상자의 약 90%를 장기요양 필요 발생 고위험 대상자로 예측할 수 있다. 본 연구의 예측모형 및 고위험군 기준은 노인의 욕구 중심에서 예방 서비스가 필요한 대상자를 선제적으로 발굴하는데 기여할 것으로 기대된다.

선비화가 윤덕희(尹德熙)·윤용(尹愹) 부자(父子)의 변유적(變維的) 회화심미(繪畵審美) 고찰 (The Newly changed Painting's Aesthetic of Seonbi painter Yoon DeokHee and Yun Yong Father and Son)

  • 김도영
    • 문화기술의 융합
    • /
    • 제7권2호
    • /
    • pp.199-206
    • /
    • 2021
  • 공재(恭齋) 윤두서(尹斗緖)(1668~1715)와 낙서(駱西) 윤덕희(尹德熙)(1685~1776), 그리고 청고(靑皐) 윤용(尹愹)(1708~1740)으로 전해져 온 해남윤씨 3대의 화맥과 학문사상은 해남에 본거지를 두었지만, 주로 한양을 무대로 예술혼을 펼쳤고 가법을 계승하여 조선 후기를 대표하는 선비출신 서화 가문으로 명망을 쌓았다. 공재(恭齋)의 장남으로 태어나 82세를 살았던 낙서(駱西)는 친부 및 남인(南人)계열 이서(李漵)에게서 다양한 학문과 서화를 익혔다. 조선 초·중기 화풍을 섭렵하고 남종화법을 수용하면서 서양식 음영법을 가미하여 대상의 사실성과 입체감을 추구했는데 미법산수(米法山水), 원말(元末) 사대가(四大家), 명대(明代) 오파(吳派), 동기창(董其昌), 청대(淸代) 안휘파(安徽派) 등 다양한 화법을 융복합하여 변유적 회화심미를 이루었다. 그는 특히 말 그림과 도석인물화에서 탁월한 재능을 드러냈는데, 박학(博學) 실득적(實得的) 가풍에 비덕적(比德的)으로 구현한 독창적 진경미(眞景美)를 발현하였다. 낙서(駱西)의 둘째아들로 태어나 32세로 요절한 청고(靑皐)는 다양한 수지법(樹枝法)을 구사한 남종산수화에 능했는데, 물상의 정확한 사실묘사를 위해 세밀한 관찰과 깊은 탐구심, 그리고 화보 화제시의 새로운 시정(詩情)을 펼치면서 독창적 구성의 시의도(詩意圖)를 그렸다. 또한, 가전된 화풍을 변유적으로 재해석하여 진경(眞景)을 넘어 이형사신(以形寫神)의 진정미(眞情美)를 발현하였다. 공재(恭齋)를 계승한 낙서(駱西)와 청고(靑皐) 부자의 서민풍속화는 조선 후기 새로운 장로로 자리잡게 되는 등 이들 부자의 변유적 회화심미와 화법은 녹우당 화풍을 이루어 조선 회화풍을 획기적으로 변화시켜 한국회화사에 지대한 영향을 끼쳤다.

1시간 호우피해 규모 예측을 위한 AI 기반의 1ST-모형 개발 (Development of 1ST-Model for 1 hour-heavy rain damage scale prediction based on AI models)

  • 이준학;이하늘;강나래;황석환;김형수;김수전
    • 한국수자원학회논문집
    • /
    • 제56권5호
    • /
    • pp.311-323
    • /
    • 2023
  • 집중호우, 홍수 및 도시침수와 같은 재해를 저감시키기 위하여 자연 재난으로 인한 재해의 발생 여부를 사전에 파악하는 것은 중요하다. 현재 국내는 기상청에서 운영하고 있는 호우주의보 및 호우경보를 발령하고 있지만, 이는 전국에 일괄적인 기준으로 적용하고 있어 사전에 호우로 인한 피해를 명확하게 인지하지 못하고 있는 실정이다. 따라서, 일괄된 기준을 지역적 특성을 반영한 호우특보 기준으로 재설정하고 1시간 후에 강우로 발생할 수 있는 피해의 규모를 예측하고자 하였다. 연구 대상 지역으로는 호우피해가 가장 빈번하게 발생하였던 경기도 지역으로 선정하였고, 강우량 및 호우 피해액 자료를 활용하여 지역적 특성을 고려한 시간단위 재해 유발 강우를 설정하였다. 강우에 의한 호우피해 발생 여부를 예측하는 모형을 개발하기 위해 재해 유발 강우 및 강우 자료를 활용하였으며, 머신러닝 기법인 의사 결정 나무 모형과 랜덤 포레스트 모형을 활용하여 분석 및 비교하였다. 또한 1시간 후의 강우를 예측하기 위한 모형으로는 장단기 메모리, 심층 신경망 모형을 활용하여 분석 및 비교하였다. 최종적으로 예측 모형을 통해 예측된 강우를 훈련된 분류 모형에 적용하여 1시간 후 호우에 의한 규모별 피해 발생 여부를 예측하였고, 이를 1ST-모형이라고 정의하였다. 본 연구를 통해 개발된 1ST-모형을 활용하여 예방 및 대비 차원의 재난관리를 실시한다면 호우로 인한 피해를 저감하는데 기여 할 수 있을 것으로 판단된다.

산림지역에서의 2023년 봄철 꽃나무 개화시기 예측 (Prediction of Spring Flowering Timing in Forested Area in 2023)

  • 서지희;김수경;김현석;천정화;원명수;장근창
    • 한국농림기상학회지
    • /
    • 제25권4호
    • /
    • pp.427-435
    • /
    • 2023
  • 이상기상으로 인한 봄꽃 개화 시기의 변화는 식물의 생장기간 뿐 아니라 생물계절을 포함한 생태계의 모든 측면에 영향을 미친다. 따라서 봄꽃 개화 시기를 예측하는 것은 산림 생태계의 효과적인 관리에 필수적이다. 본 연구에서는 464곳의 산림에서 수집된 날씨정보를 기반으로 대한민국 산림의 대표적인 5가지 수종(미선나무, 아까시나무, 철쭉, 산철쭉, 마가목)의 2023년 개화 시기를 예측하기 위해 과정 기반 모형을 사용하였다. 이를 위해 28개 지역의 9년간(2009-2017) 개화 시기 자료를 활용하여 모형을 개발하였다. 개화 시기는 식물의 세 개 이상의 위치에서 처음으로 꽃이 피는 것을 기준으로 측정되었다. 본 연구에서는 STDD와 GDD 과정 기반 모형을 사용하여 개화 시기를 예측하였으며, 두 모형 모두 일반적으로 우수한 성능을 보였다. 과정 기반 모형의 주요 입력변수인 날씨 자료는 산악기상관측시스템과 기상청에서 제공하는 기온 정보를 융합하여 1km의 공간 해상도로 일 단위 기온 자료를 생성하였다. 지역별 보정 계수를 생산하고 적용하기 위해 랜덤포레스트 기계 학습을 활용하여 STDD와 GDD 모형을 기반으로 예측 정확도를 개선하였다. 결과적으로 보정 계수가 적용될 때 대부분의 수종에서 개화 시기의 예측 오차가 작았으며, 특히, 미선나무, 아까시나무, 철쭉에서 평균제곱근오차가 각각 1.2, 0.6, 1.2일로 매우 낮았다. 모형 성능을 평가하기 위해 10회의 무작위 샘플링 테스트를 실시하고, 최적의 결정계수 값을 가진 모형을 선택하여 모형의 성능을 평가하였다. 그 결과, 마가목을 제외한 모든 수종에서 보정 계수가 적용된 모형에서 결정계수가 최소 0.07에서 최대 0.7 증가하였으며 최종적으로 75%에서 90%의 설명력을 가졌다. 이를 기반으로 수종별 보정 계수를 산출하였으며, 1km 해상도의 전국 단위 개화시기예측 지도를 제작하였다. 본 연구는 식물의 계절 변화에 대한 자료로 활용될 것으로 예상되며, 수종 및 지역별로 개화 시기를 상세히 설명하여 기후 변화로 인한 계절 변화를 연구하는 데에 유용할 것으로 기대된다. 또한 우리나라 산림의 주요 수종에 대한 정확도 높은 개화 시기 예측 서비스는 산림 방문객들의 산림 경험 만족도를 크게 높일 수 있으며, 양봉업 등 임업 종사자들의 경제적 향상에 기여할 것으로 기대된다.

XGBoost를 활용한 리스크패리티 자산배분 모형에 관한 연구 (A Study on Risk Parity Asset Allocation Model with XGBoos)

  • 김영훈;최흥식;김선웅
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.135-149
    • /
    • 2020
  • 인공지능을 기반으로 한 다양한 연구들이 현대사회에 많은 변화를 불러일으키고 있다. 금융시장 역시 예외는 아니다. 로보어드바이저 개발이 활발하게 진행되고 있으며 전통적 방식의 단점을 보완하고 사람이 분석하기 어려운 부분을 대체하고 있다. 로보어드바이저는 인공지능 알고리즘으로 자동화된 투자 결정을 내려 다양한 자산배분 모형과 함께 활용되고 있다. 자산배분 모형 중 리스크패리티는 대표적인 위험 기반 자산배분 모형의 하나로 큰 자산을 운용하는 데 있어 안정성을 나타내고 현업에서 역시 널리 쓰이고 있다. 그리고 XGBoost 모형은 병렬화된 트리 부스팅 기법으로 제한된 메모리 환경에서도 수십억 가지의 예제로 확장이 가능할 뿐만 아니라 기존의 부스팅에 비해 학습속도가 매우 빨라 많은 분야에서 널리 활용되고 있다. 이에 본 연구에서 리스크패리티와 XGBoost를 장점을 결합한 모형을 제안하고자 한다. 기존에 널리 사용되는 최적화 자산배분 모형은 과거 데이터를 기반으로 투자 비중을 추정하기 때문에 과거와 실투자 기간 사이의 추정 오차가 발생하게 된다. 최적화 자산배분 모형은 추정 오차로 인해 포트폴리오 성과에서 악영향을 받게 된다. 본 연구는 XGBoost를 통해 실투자 기간의 변동성을 예측하여 최적화 자산배분 모형의 추정 오차를 줄여 모형의 안정성과 포트폴리오 성과를 개선하고자 한다. 본 연구에서 제시한 모형의 실증 검증을 위해 한국 주식시장의 10개 업종 지수 데이터를 활용하여 2003년부터 2019년까지 총 17년간 주가 자료를 활용하였으며 in-sample 1,000개, out-of-sample 20개씩 Moving-window 방식으로 예측 결과값을 누적하여 총 154회의 리밸런싱이 이루어진 백테스팅 결과를 도출하였다. 본 연구에서 제안한 자산배분 모형은 기계학습을 사용하지 않은 기존의 리스크패리티와 비교하였을 때 누적수익률 및 추정 오차에서 모두 개선된 성과를 보여주었다. 총 누적수익률은 45.748%로 리스크패리티 대비 약 5% 높은 결과를 보였고 추정오차 역시 10개 업종 중 9개에서 감소한 결과를 보였다. 실험 결과를 통해 최적화 자산배분 모형의 추정 오차를 감소시킴으로써 포트폴리오 성과를 개선하였다. 포트폴리오의 추정 오차를 줄이기 위해 모수 추정 방법에 관한 다양한 연구 사례들이 존재한다. 본 연구는 추정 오차를 줄이기 위한 새로운 추정방법으로 기계학습을 제시하여 최근 빠른 속도로 발전하는 금융시장에 맞는 진보된 인공지능형 자산배분 모형을 제시한 점에서 의의가 있다.

칠곡 심원정원림의 공간구성과 경관특성 - '심원정 25영(心遠亭 二十五詠)'과 「심원정수석기(心遠亭水石記)」를 중심으로 - (Spatial Composition and Landscape Characteristics of Shimwon-Pavilion Garden in Chilgok - Focusing on 'Shimwon-pavilion Poem of 25 Sceneries' and 「Shimwon-pavilion Soosukgi(心遠亭水石記)」 -)

  • 김화옥;박율진;노재현;신상섭;조호현
    • 한국전통조경학회지
    • /
    • 제34권2호
    • /
    • pp.27-34
    • /
    • 2016
  • "기헌(寄軒)집"에 실린 "심원정수석기(心遠亭水石記)"의 '심원정 25영'을 바탕으로, 일제강점기인 1937년에 기헌 조병선에 의해 조성되고 향유된 칠곡 심원정원림의 공간구성과 경관특성을 고찰한 본 연구의 결과는 다음과 같다. 1. 심원정원림은 북쪽으로는 송림이 있는 '임수형(林藪型)'이자 원림 내부로 구야천이 흐르는 '계류형 별서원림'의 입지 특성을 공유하며 본제(本第)와는 직선거리로 약 400m 이격되어 있다. 2. 북쪽에는 가산(假山)인 학림산을, 동쪽과 서쪽에는 만경류를 올린 취병(翠屛)을, 남쪽으로는 구야천변의 석벽(隱屛)을 포치시키는 등 사방에 '가림'시설을 조성함으로써 위요공간 속에 은일을 추구한 기헌의 정신을 표출하고 있다. 3. 심성을 수양하는 선비의 소우주이자 거처로 조성되고 향유된 심원정원림은 송림사의 경역 내에 위치함으로써 불교사상을 수용하며, 도연명의 전원사상과 시선(詩仙)이라 불리는 이백의 낭만주적 감성을 통한 도가적 삶의 추구 그리고 주자의 성리학적 가치를 실현하는 통섭(統攝)의 장으로서의 면모를 엿볼 수 있다. 4. 심원정 25영 중 5영은 정운루 암수실 위류재 이열당 등의 용도가 다른 부속실과 이를 아우르는 정각인 '장수지소(藏修之所)' 심원정에 의탁되었으며 외원에 부여된 20영은 자연에 이름을 붙인 것 9개, 조성한 것 11개로 나뉘며, 자연에서 얻은 9영은 "석경기"에 기술된 바를 바위에 각인시켰다. 5. 현존하는 실내경물 4영은 편액으로, 원림내 경물 중 5개소는 바위글씨로 그리고 8개소는 표지석으로 각 경물이 인식되도록 의도했으나, 8개 영의 표식은 유실 및 훼철 등으로 확인되지 않는다. 6. 심원정 25영 중 '괴강(槐岡)'에는 학자수를 상징하는 회화나무, '유제(柳堤)'에는 도연명과 줄기찬 생명력을 상징하는 버드나무, '기천(杞泉)'에는 '가족의 단란함'을 상징하는 구기자나무 그리고 '동 서취병(東 西翠屛)'과 '방원(芳園)'에는 만경류와 초본류 등 다채로운 의미를 담는 식물경관이 등장한다. 또한 폭포(은폭(隱瀑)), 소(군자소(君子沼)), 못(양지(湯池)), 샘(기천(杞泉)), 바위를 가운데 두고 갈라 흐르는 물(반타석(盤陀石)) 그리고 바위 사이로 흐르는 물(수구암(水口巖)) 등 다채로운 수경관이 기도되었다. 7. 심원정원림은 수계 인접형 원림임에도 불구하고 11개 영을 직접 조성하는 등의 적극적인 개입이 두드러진다. 기존의 여타 정자원림이 가깝고 먼 곳에 자연 중심의 경(景)과 곡(曲)의 경물 설정에 충실한 곳이었다면, 심원정원림은 정자를 시점으로 의미 강화된 경물을 취경(聚景)하도록 유도된 적극적인 수경(修景)이 두드러진다.

RFM 기반 SOM을 이용한 매장관리 전략 도출 (Strategy for Store Management Using SOM Based on RFM)

  • 정윤정;최일영;김재경;최주철
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.93-112
    • /
    • 2015
  • 소비자의 소비성향이 필요 품목을 중심으로 근거리에서 구매하는 근린형으로 변화함에 기존의 소매점은 식료품, 생활용품을 위주로 제공하는 슈퍼마켓, 하이퍼마켓 또는 편의점으로 진화하고 있다. 따라서 소매점이 한정된 공간에서 효율적으로 공간을 활용하고 매출을 증대하기 위해서는 소비자의 구매욕을 충족시킬 수 있는 상품배치와 적정한 재고수준을 유지하는 것이 매우 중요하다. 본 연구에서는 소매점의 판매 상품에 대하여 RFM 기반 SOM 군집화를 하여 효율적으로 매장을 관리할 수 있는 상품 배치전략 및 재고전략을 제안하였다. 실제 M마트의 판매데이터를 이용하여 RFM모델을 상품에 적용한 후, 기존 문헌 연구뿐만 아니라 해석 가능성, 응용 가능성 등을 고려하여 3X3 총 9개의 군집으로 분류하여 분석한 결과, 주요 군집으로 R값, F값, M값이 모두 높은 군집, R값, F값, M값 모두 낮은 군집, R값만 높은 군집, F값만 높은 군집이 도출되었다. 본 논문에서는 다른 군집과 비교시 R값, F값, M값이 차이를 보이는 주요 4개의 군집의 상품 배치 및 재고 전략을 제시하였다. R값, F값, M값이 모두 높은 군집의 상품은 소비자 동선을 늘림으로써 상품 노출을 확대시킬 수 있는 장소에 배치하여야 할 뿐만 아니라 높은 수준의 재고를 보유할 필요가 있다. 반면에 R값, F값, M값이 모두 낮은 군집의 상품은 가시성이 낮은 곳에 배치하고 최소한의 안전재고만 보유할 필요가 있다. 또한 R값이 높은 군집은 신상품으로 매장 입구에 배치하여 상품의 판매를 유도할 필요가 있다. 그리고 F값만 높은 군집의 경우, R값과 M값이 평균 값 보다 작은 상품들의 군집이므로 최근에는 판매가 저조하며 빈도 수에 비해 총 판매액이 낮다는 것을 유추할 수 있다. 따라서 현재보다 과거에 많이 판매된 저가의 상품군집으로 재고 수준을 점차 감소시킬 필요가 있다. 본 연구에서 제시한 방법은 POS 시스템의 보유한 소매점에서 상품배치 및 재고관리 방법으로 활용되어 매장의 수익성 증대에 기여할 수 있을 것으로 기대된다.