• 제목/요약/키워드: 분류나무

검색결과 985건 처리시간 0.027초

시정계 자료와 기계학습 기법을 이용한 지역 안개예측 모형 개발 (Developing a regional fog prediction model using tree-based machine-learning techniques and automated visibility observations)

  • 김대하
    • 한국수자원학회논문집
    • /
    • 제54권12호
    • /
    • pp.1255-1263
    • /
    • 2021
  • 안개는 대체수자원이 될 수 있으나 교통사고 위험을 높이고 공항 운영에 제약을 가하는 사회적 영향이 큰 기상현상이다. 본 연구에서는 1 km 미만 가시거리(시정)로 정의되는 안개 발생을 기상자료로 예측하는 지역 기계학습모형을 개발하고 그 예측력을 평가하였다. 전라북도 지역의 10개 기상청 지상관측소의 2017-2019년 시정 및 기상관측자료로 앙상블 분류기법인 Extreme Gradient Boosting (XGB), Light Gradient Boosting(LGB), Random Forests (RF)를 학습시켜 지역 안개 모형을 개발하였고 독립적인 2020년 자료로 모형의 사용성을 평가하였다. 그 결과, 학습·검증기간(2017-2019)에는 True Skill Score를 기준으로 가장 높은 예측력을 보인 방법은 LGB 기법이었지만 다른 두 모형에 비해 False Alarm Ratio가 컸다. RF 모형과 XGB 방법 역시 기존 연구에 상응하는 예측성능을 보이는 것으로 확인되었다. 2020년 자료를 입력해 안개 발생을 모의했을 때 세 모형의 예측성능은 2017-2019년 기간보다 떨어졌지만 모두 관측 안개일수의 공간분포와 일관되는 안개 위험을 예측했다. 세 기계학습모형은 안개위험이 상대적으로 높은 지역을 추출하는 기법으로 사용이 가능할 것으로 보인다.

인공지능기법을 이용한 온라인 P2P 대출거래의 채무불이행 예측에 관한 실증연구 (Artificial Intelligence Techniques for Predicting Online Peer-to-Peer(P2P) Loan Default)

  • 배재권;이승연;서희진
    • 한국전자거래학회지
    • /
    • 제23권3호
    • /
    • pp.207-224
    • /
    • 2018
  • 온라인 P2P 대출(Online Peer-to-Peer Lending)이란 대출자(차입자)들이 인터넷 및 모바일 P2P 플랫폼을 통해 대출을 신청하면 P2P 플랫폼 기업이 이를 심사하고, 공개하여 불특정 다수가 자금을 빌려주고 이자를 받는 대출중개 서비스를 말한다. 국내외적으로 P2P 대출시장의 성장과 수익률에 대한 관심이 커진 상황에서 현재는 P2P 대출에 대한 안정성 측면에서 문제가 제기되고 있다. P2P 대출시장은 높은 수익률을 제공하지만 P2P 업체의 연체율과 부실률(채무불이행률)도 함께 높아지고 있는 실정이다. P2P 금융시장의 신뢰도를 높이기 위해서는 P2P 대출의 연체율과 채무불이행률을 줄이는 것이 무엇보다 중요하다. 본 연구는 세계적인 P2P 기업인 렌딩클럽(Lending Club)의 P2P 대출거래데이터베이스를 이용하여 인공지능기반의 P2P 채무불이행 예측모형을 구축하고자 한다. 구체적으로 벤치마크(benchmark) 모형으로 통계기법인 판별분석과 로지스틱 회귀분석을 이용하고, 인공지능기법으로는 신경망, CART, 그리고 C5.0을 이용하여 P2P 대출거래의 채무불이행 예측모형을 구축하고자 한다. 연구결과, P2P 대출거래의 채무불이행 예측을 위해 우선 고려해야 할 변수는 대출이자율이며, 중요도 3순위에 가장 많이 언급된 대출금액과 총부채상환비율도 고려해야 할 요인으로 추출되었다. 전통적인 통계기법보다는 인공지능기법의 예측성과가 더 좋은 것으로 나타났으며, 신경망의 경우 모든 데이터 셋에서 오분류율이 가장 낮은 예측모형으로 나타났다.

머신러닝을 이용한 급성심근경색증 환자의 퇴원 시 사망 중증도 보정 방법 개발에 대한 융복합 연구 (Convergence Study in Development of Severity Adjustment Method for Death with Acute Myocardial Infarction Patients using Machine Learning)

  • 백설경;박혜진;강성홍;최준영;박종호
    • 디지털융복합연구
    • /
    • 제17권2호
    • /
    • pp.217-230
    • /
    • 2019
  • 본 연구는 기존 동반질환을 이용한 중증도 보정 방법의 제한점을 보완하기 위해 급성심근경색증 환자의 맞춤형 중증도 보정방법을 개발하고, 이의 타당성을 평가하기 위해 수행되었다. 이를 위하여 질병관리본부에서 2006년부터 2015년까지 10년간 수집한 퇴원손상심층조사 자료 중 주진단이 급성심근경색증인 한국표준질병사인분류(KCD-7) 코드 I20.0~I20.9의 대상자를 추출하였고, 동반질환 중증도 보정 도구로는 기존 활용되고 있는 CCI(Charlson comorbidity index), ECI(Elixhauser comorbidity index)와 새로이 제안하는 CCS(Clinical Classification Software)를 사용하였다. 이에 대한 중증도 보정 사망예측모형 개발을 위하여 머신러닝 기법인 로지스틱 회귀분석, 의사결정나무, 신경망, 서포트 벡터 머신기법을 활용하여 비교하였고 각각의 AUC(Area Under Curve)를 이용하여 개발된 모형을 평가하였다. 이를 평가한 결과 중증도 보정도구로는 CCS 가 가장 우수한 것으로 나타났으며, 머신러닝 기법 중에서는 서포트 벡터 머신을 이용한 모형의 예측력이 가장 우수한 것으로 확인되었다. 이에 향후 의료서비스 결과평가 등 중증도 보정을 위한 연구에서는 본 연구에서 제시한 맞춤형 중증도 보정방법과 머신러닝 기법을 활용하도록 하는 것을 제안한다.

조선거수노수명목지에 왜곡되어 있는 조선의 신목에 관한 고찰 (A Study on a God tree of Chosun Distorted in Chosun-Gersu-Nosu-Myungmok-Ji)

  • 박찬우;안창호;김세창
    • 한국산림과학회지
    • /
    • 제108권3호
    • /
    • pp.372-381
    • /
    • 2019
  • 조선거수노수명목지는 조선총독부가 조선의 신목을 왜곡하기 위해 만든 자료라는 가설을 세우고 이를 증명하기 위해 연구하였다. 다음과 같은 결론을 얻었다. 첫째 조선거수노수명목지에는 64개 수종 3,170본의 목록이 기록되어 있다. 노거수에 신적 요소 고사 전설이 있으면 신목, 고사적 요소 고사 전설이 있으면 명목으로 분류되어 있다. 본수가 가장 많은 느티나무로부터 8번째로 많은 전나무까지 8수종 2,632본을 분석대상으로 하였다. 8개 수종별 신목과 명목의 평균 직경, 평균 수고, 평균 수령을 산출하였다. 8개 수종 중 7개 수종에서 명목의 직경과 수령이 신목보다 크고, 6개 수종에서 명목의 수고가 신목보다 컸다. 신목이 명목보다 왜소하고 볼품없는 크기의 나무라는 이 상식에 반하는 사실이 조선거수노수명목지에 기록되어 있음이 확인되었다. 본 고의 가설은 위의 사실 확인으로 증명되었다. 둘째 조선총독부는 신목을 중심으로 행해지는 동제를 미신으로 타파하는 시책을 추진하였다. 신목이 작고 볼품없어야 미신이라고 주장하기 좋았을 것이다. 조선 신목의 신성성을 폄하하기 위한 설명자료 또는 증거자료로 조선거수노수명목지를 작성한 것이다. 셋째 조선의 신목이 명목보다 작고 왜소하다는 날조된 내용을 사실인양 쉽게 설명할 수 있도록 조선거수노수명목지를 흉고직경순으로 편찬한 것이다.

낙동강 하구 인근 해양 퇴적토 중의 PAHs 농도 및 발생원 산정 연구 (Distribution and Source Apportionment of Polycyclic Aromatic Hydrocarbons in Surface Sediments Near Nakdong Estuary)

  • 이준호;양찬근;한경수;이태윤
    • 한국지반환경공학회 논문집
    • /
    • 제20권1호
    • /
    • pp.5-11
    • /
    • 2019
  • 본 연구는 낙동강 하구 인근의 해양퇴적토에 포함된 PAHs의 농도를 분석하여 퇴적토의 생태학적 위해성을 평가하고자 하였다. 퇴적토의 주성분은 $SiO_2$, $Al_2O_3$, CaO, $Fe_2O_3$였으며, 강열감량은 2.97%에서 8.39%의 분포를 보였다. 총 PAHs의 농도는 $128.4ng\;g^{-1}$에서 $507.4ng\;g^{-1}$의 범위를 가졌으며 2고리와 4고리 형태의 PAHs로 주로 구성이 되어있었다. 8개 지역의 각각의 PAHs의 농도는 모두 ERL 이하로 생태학적 위해성은 낮은 것으로 판단되었다. 지역별 PAHs의 생태학적 위해성 평가는 M-ERM-Q를 사용하여 이루어졌고, 계산 값 모두 0.1 이하로 생태학적 위해성은 낮음으로 분류되었다. 발생원 분석을 통해 각 지역의 PAHs의 발생원은 N-1과 N-7은 풀, 나무, 석탄 등의 연소이며, N-5와 N-6는 석유연소, N-2, N-3, N-4, N-8은 석유오염인 것으로 판단되었다.

동국대박물관 소장 보타전명 목조감실 과학적 분석 및 보존처리 (Scientific Analysis and Conservation Treatment of the Wooden Gamsil with Inscription of "Botajeon" in the Collection of the Dongguk University Museum)

  • 이의천;강민지;박정혜;김수철
    • 박물관보존과학
    • /
    • 제27권
    • /
    • pp.125-146
    • /
    • 2022
  • 동국대학교 박물관 소장 보타전명 목조감실은 조선후기 목조 건축 양식으로 제작한 목조감실이다. 목조감실 안료의 박락, 부재의 탈락 등 손상이 확인되어 보존처리를 진행하였다. 보존처리 전 손상형태와 유형을 분류하고, 과학적 분석(수종 분석, 섬유 동정, 안료의 성분분석(P-XRF))를 실시하였다. 분석 결과, 제작에 사용된 목재는 주로 잣나무류, 현판은 가래나무속, 섬유는 벼섬유로 식별되었다. P-XRF 결과, 백색 안료는 연백과 아연화, 적색안료는 장단, 청색안료는 울트라 마린 블루, 녹색 안료는 에메랄드 그린으로 확인하였다. 목조감실의 보존처리는 건식·습식세척으로 고착된 오염물을 제거한 후 탈락한 부재들을 위치에 맞게 접합하고, 일부 결손부를 복원하였다.

의사결정나무 분석을 통한 세계핸드볼 승패결정요인 분석 (A Study of Influencing Factors on World Handball Win-Loss using the Decision Tree Analysis)

  • 김현철
    • 디지털융복합연구
    • /
    • 제19권5호
    • /
    • pp.461-468
    • /
    • 2021
  • 이 연구는 2019년 남녀 핸드볼 세계선수권대회에 참가하는 모든 국가를 대상으로 국제핸드볼연맹이 제공한 공식 기록을 수집해 팀 경기 기록의 승패를 가리는 중요한 슈팅 변수를 규명하는 데 목적이 있다. 이 연구의 목적을 달성하기 위해 2019 핸드볼 세계선수권대회에 참가한 24개국 남녀대표팀의 총 192경기를 수집해 승패 그룹에 따른 대회 기록의 차이를 검증한 이후 8가지 슈팅 변수에 따라 승패요인을 분류하기 위해 데이터마이닝 기법의 하나인 의사결정 트리 방식(CART 알고리즘)을 적용해 분석했다. 분석 결과 9m 슈팅성공률과 Near 슈팅성공률이 남녀 모두에게 가장 중요한 요인으로 평가됐다. 남자는 9m 슈팅성공률이 32.5% 이상, Near 슈팅성공률이 67.5% 이상이면 83.3% 승리하며, 여자는 9m 슈팅성공률이 75%이상, Near 슈팅성공률이 51% 이상이면 75%를 승리한다. 또한, 여자팀은 페널티 요인 중 옐로카드는 승패를 결정짓는 중요 변수로 판단된다. 결론적으로 본 연구를 통하여 국제핸드볼 경기에서 승리와 패배 팀의 기록 특성 차이와 승패를 구분하는 중요 슈팅 변수를 남녀 모두에서 확인 할 수 있었다.

연안건축물의 자외선 노출에 따른 안전성 연구 (A Study on the Effect on UV Exposure in Coastal Buildings)

  • 김태환;어재선
    • 한국재난정보학회 논문집
    • /
    • 제17권2호
    • /
    • pp.195-205
    • /
    • 2021
  • 연구목적: 연안건축 재료의 자외선 반사율과 투과율은 건물의 자외선 방출 및 방출의 주요 요인 중 하나이다. 이 연구에서는 건축 자재의 여러 종류의 자외선 스펙트럼 반사율이 측정되었으며 또한 표면 특성 중에 하나인 명도, 거칠기 및 색도와의 관계에 대해서도 검토 및 제안했다. 연구방법: 본 연구에서는 CIE 분류에 의거하여 자외선영역은 단파장 UV-C (10nm~280nm), 중파장 영역 UV-B (280-315 nm), 장파장 영역 UV-A (315-400nm), 가시광선 영역 (400nm~780nm)으로 정했으며, 연속적으로 측정하기 위하여 분광 광도계를 사용했다. 연구결과: 나무의 경우 반사율은 가시광선역 55-68 %, UV-A * 7-12 %, UV-B* 4-5 %로 나타났다. 벽타일은 가시광선역 18-40 %, UV-A* 8-20 %, UV-B* 7-8 % 로 나타났으며, 콘크리트는 가사광선역 37 %, UV-A* 28 %, UV-B* 19 %로 나타났다. 결론: 가시광선 반사율에 의해 자외선 반사율을 추정 할 수 있으며, 또한 자외선 차단을 할 때에는 용도에 따라 다양한 재료를 선택하는 것이 중요하다.

기계학습과 GPT3를 시용한 조작된 리뷰의 탐지 (The Detection of Online Manipulated Reviews Using Machine Learning and GPT-3)

  • 체르냐예바 올가;홍태호
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.347-364
    • /
    • 2022
  • 고객의 구매 의사결정에 영향을 주는 온라인 리뷰의 부적절한 조작을 통해 이익을 얻고자 하는 기업 또는 온라인 판매자들 때문에, 리뷰의 신뢰성은 온라인 거래에서 매우 중요한 이슈가 되었다. 온라인 쇼핑몰 등에서 온라인 리뷰에 대한 소비자들의 의존도가 높아짐에 따라 많은 연구들이 조작된 리뷰를 탐지하는 방법에 개발하고자 하였다. 기존의 연구들은 온라인 리뷰를 기반으로 정상 리뷰와 조작된 리뷰를 대상으로 기계학습으로 이용함으로써 조작된 리뷰를 탐지하는 모형을 제시하였다. 기계학습은 데이터를 이용하여 이진분류 문제에서 탁월한 성능을 보여왔으나, 학습에 충분한 데이터를 확보할 수 있는 환경에서만 이러한 성능을 기대할 수 있었다. 조작된 리뷰는 학습용으로 사용할 수 있는 데이터가 충분하지 못하며, 이는 기계학습이 충분한 학습을 할 수 없다는 치명적 약점으로 내포하게 된다. 본 연구에서는 기계학습이 불균형 데이터 셋으로 인한 학습의 저하를 방지할 수 있는 방안으로 부족한 조작된 리뷰를 인공지능을 이용하여 생성하고 이를 기반으로 균형된 데이터 셋에서 기계학습을 학습하여 조작된 리뷰를 탐지하는 방안을 제시하였다. 파인 튜닝된 GPT-3는 초거대 인공지능으로 온라인 플랫폼의 리뷰를 생성하여 데이터 불균형 문제를 해결하는 오버샘플링 접근방법으로 사용되었다. GPT-3로 생성한 온라인 리뷰는 기존 리뷰를 기반으로 인공지능이 작성한 리뷰로써, 본 연구에서 사용된 로짓, 의사결정나무, 인공신경망의 성능을 개선시키는 것을 SMOTE와 단순 오버샘플링과 비교하여 실증분석을 통해서 확인하였다.

도시교통 체증완화를 위한 효율적인 수송체계에 관한 연구 - 컨테이너 수송시간을 중심으로 - (A Study on the Effective Container Transport System for the Relief of Urban Traffic Congestion -A Container Transport Time-Oriented-)

  • 김태곤
    • 한국항만학회지
    • /
    • 제4권1호
    • /
    • pp.33-43
    • /
    • 1990
  • 우리나라에서는 70년대 이후 컨테이너 수송체계가 도입되어 운영되어 왔으나 차량의 급격한 증가와 더불어 컨테이너 수송체계는 도시교통에 있어서 많은 문제를 야기시키는 것으로 논란이 되고 있다. 특히, 부산항은 우리나라 최대의 국제 무역항으로써 전 컨테이너 수송화물의 90%이상을 처리하고 있고, 또한 수출입항으로서 제 역할을 다하고 있으나 낮은 도로율(12.45%)과 산재해 있는 30여개의 Off-Dock CY로 인해서 도심을 통과하는 컨테이너 수송차량은 많은 교통문제를 유발시키고 있다. 본 연구는 1) 부산시에 산재해 있는 30여개의 Off-Dock CY에 이르는 주요 도로상에서 컨테이너 수송량의 신간별 분포에 따라 컨테이너의 운행시간대를 첨두 시간대, 비첨두 시간대 및 심야 시간대로 분류하여 각 시간대별 평균 수송 시간 및 교통 체증으로 인한 수송 지체수준을 확인하였고, 2) 컨테이너 전용부두로 부터 Off-Dock CY에 이르는 도시 고속도로 및 주요간선도로상에서의 수송시간 및 수송 지체수준을 비교 분석하였으며, 3) 마지막으로, 효율적인 컨테이너 수송체계를 위한 최적 수송시간대 및 도로체계를 제시할 수 있었다. 특히, 컨테이너 수송시간 및 지체수준은 각 운행 시간대에 따라 현저한 차이를 보이고 있었는데, 심야 시간대를 이용하여 컨테이너 수송을 할 경우에는 다른 시간대에 비하여 50%정도의 수송시간 절감효과를 기대할 수 있었으며, 도시 고속도로를 이용할 경우에는 도시 간선도로에 비하여 30%정도의 수송시간을 절약할 수 있었다. 따라서 도시지역의 교통체중을 완화시키기 위해서 심야 시간대에 보다 많은 컨테이너 수송차량이 이용할 수 있는 컨테이너 수송체계가 확립되어야 하고, 산재해 있는 Off-Dock CY를 몇개의 ODCY그룹이나 단지까지 컨테이너 전용 고속도로의 건설이 바람직하고 생각된다.리구에서 조사한 결과 $10^{-3}$ M MGBG 단독 처리구에서 에틸렌 생성량이 가장 높았으며, spermidine과 spermine의 함량은 가장 낮았다. 부정근 형성능이 다소 회복된 $10^{-3}$ M MGBG+ $10^{-5}$M spermine 혼합처리구에서의 에틸렌 생성량은 대조구보다는 다소 높게 나타났다. 부정근 회복능이 가장 높았던 $10^{-3}$ M MGBG+ $10^{-5}$ M spermine + $10^{-4}$ M Cocl$_2$ 혼합처리구에서 에틸렌 생성량은 가장 낮게 나타났으며, polyamine 함량은 가장 높게 나타났다.(Cyperaceae), 명아주과(Chenopodiaceae) 같은 풀들이 하구언(estuary)의 해안가에 주로 서식하였던 것으로 나타났다. 이 시기동안에 해양성조류인 와편모류와 담수성 조류가 동시에 다양하게 산출되는 것은 하구언 퇴적환경이었음을 잘 지시해 준다. 제II화분대(고도, 43.72{\sim}3.36\;m$)가 시작되면서 혼합림은 침엽수림으로 바뀌었으며, 낙엽활엽수들의 서식지가 2엽소나무로 대치되면서 침엽수가 주요 수종을 이루었던 것으로 나타났다. 아마도 이런 산림형태는 자연 기후환경변화 뿐만 아니라 인간간섭에 의해 나타난 결과로 생각된다. 이 시기에 경작식물인 벼과(Gramineae), 옥수수(Zea), 메밀(Fagopyrum)과 논밭의 뚝 등지 에서 서식하는 돼지풀(Ambrosia) 등이 처음으로 산출되는 것으로 보아 인간간섭이 행해졌음을 잘 뒷 받침해준다. 또한 담수성 조류는 변함없이 산출되는 반면, 해양성조류인 와편모류가 산출되지 않는 것으로 보아 해안환경에서 다소 멀 어진

  • PDF