• 제목/요약/키워드: BIG TREE

검색결과 223건 처리시간 0.026초

Heart Disease Prediction Using Decision Tree With Kaggle Dataset

  • Noh, Young-Dan;Cho, Kyu-Cheol
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권5호
    • /
    • pp.21-28
    • /
    • 2022
  • 심혈관질환은 심장질환과 혈관질환 등 순환기계통에 생기는 모든 질병을 통칭한다. 심혈관질환은 2019년 사망의 1/3을 차지하는 전 세계 사망의 주요 원인이며, 사망자는 계속 증가하고 있다. 이와 같은 질병을 인공지능을 활용해 환자의 데이터로 미리 예측이 가능하다면 질병을 조기에 발견해 치료할 수 있을 것이다. 본 연구에서는 심혈관질환 중 하나인 심장질환을 예측하는 모델들을 생성하였으며 Accuracy, Precision, Recall의 측정값을 지표로 하여 모델들의 성능을 비교한다. 또한 Decision Tree의 성능을 향상시키는 방법에 대해 기술한다. 본 연구에서는 macOS Big Sur환경에서 Jupyter Notebook으로 Python을 사용해 scikit-learn, Keras, TensorFlow 라이브러리를 이용하여 실험을 진행하였다. 연구에 사용된 모델은 Decision Tree, KNN(K-Nearest Neighbor), SVM(Support Vector Machine), DNN(Deep Neural Network)으로 총 4가지 모델을 생성하였다. 모델들의 성능 비교 결과 Decision Tree 성능이 가장 높은 것으로 나타났다. 본 연구에서는 노드의 특성배치를 변경하고 트리의 최대 깊이를 3으로 지정한 Decision Tree를 사용하였을 때 가장 성능이 높은 것으로 나타났으므로 노드의 특성 배치 변경과 트리의 최대 깊이를 설정한 Decision Tree를 사용하는 것을 권장한다.

중국 한단시 자연성지 내 노거수의 특성과 관리방안 (A Study on the Characteristics and Management Plan of Old Big Trees in the Sacred Natural Sites of Handan City, China)

  • 석소정;신현실
    • 한국전통조경학회지
    • /
    • 제41권2호
    • /
    • pp.35-45
    • /
    • 2023
  • 첫째, 본 연구는 지역 원림국이 집계한 한단시 노거수의 수종과 수령 등 기본 정보를 결합해 노거수의 공간적 분포 특징을 ArcGIS 그림으로 분석하였다. 수종의 유형, 수령분포, 소유권 현황, 성장세 및 다양성 현황을 종합적으로 분석하였다. 통계적으로 콩나무과의 회화나무속, 아카시아속, 쥐엄나무속, 자귀나무속이 다수의 비중을 차지하였고, 이중 회화나무은 가장 높은 비중을 차지하였다. 회화나무는 한단시 각 현 및 구에 이르기까지 널리 또한 집중적으로 군락을 이루어 분포되어 있었다. 수령 및 분포를 보면 1000년 이상의 노거수는 회화나무, 느티나무, 향나무, 산뽕나무, 황단나무, 쥐엄나무, 황련목, 측백나무가 주를 이루었다. 둘째, 각 유형의 노거수 현황에서 발견한 바와 같이 다양한 유형의 노거수의 현황을 조사한 결과, 한단시 노거수보호 관리 체계, 보호 관리 과정 및 보호 관리 이점을 연구하여 자연성지 보호 관리에서 한단시 노거수의 역할을 분석하여, 노거수의 보호는 주로 지역사회를 주체로 하는 문화, 신앙적 보호형태를 보이며 보호상태는 성장환경과 밀접한 관련이 있다. 현재 노거수 보호의 핵심 동력은 주로 노거수에 대한 숭배이다. 그 신성함을 노거수에 기탁하여 자연이 노거수에 부여한 자연적 성품을 사회 활동의 지도의식으로 승화시켜 자연의 '미(美)'와 인격의 '선(善)'이 잘 결합되어 있다. 노거수의 보호 상태는 주변 환경과의 상호 작용 정도 및 여러 문화 및 주체의 참여와 밀접한 관련이 있다. 장기간의 노거수 성장 과정에서 점차 주변 환경과 지속적으로 상호 작용하여 상향식 및 하향식의 교차 지역, 다문화 및 다중 주체가 참여하는 '자연-문화-경관' 시스템이 자발적으로 구축되는 과정에서 노거수를 중심으로 자연성지가 형성된 것으로 보인다. 셋째, 중국은 노거수보호와 회복 조치를 중점으로 하였지만, 노거수 자원의 관리 과정에서 노거수에 대한 역사, 문화적 가치, 식물 다양성 의의 및 사회적 가치에 대한 종합적인 고려가 부족하여 보호 관리시스템이 허술하다. 공간의 지역적 특징, 재산권 및 보호 상 특징, 가치상 특징의 세 가지 지표는 한단시 노거수의 자연성지 평가에 있어서 노거수를 중심으로 하여 자발적으로 형성 중인 자연성지를 발견할 수 있으며, 이는 전통 의식 관리, 자원 보호 실천, 신앙 체계 구축, 생명공동체 가치 실현 면에서 높은 가치가 있다. 이들을 장기간 보호하고 발전시킬 수 있는지에 대해서는 체계적인 관리 체계가 뒷받침되어야 한다. 넷째, 현재 중국에서는 보호 구역에 대한 인식이 아직 성숙하지 않아 '자연성지'는 자연보호구역 체계가 구축되는 과정에서 중요한 연구 내용으로 다루어야 한다. 상향식 지역사회 참여를 주체로 하는 자연성지 관리 형태는 현재 중국의 하향식 자연보호구역 관리 유형에 대한 강력한 보완이다. 이를 기초로 하여 노거수 보호를 자연보호구역 체계에서 천연기념물이라는 자연보호구역 형태에 포함해야 한다. 또한 자연보호구역 주변 지역 주민도 생물 다양성 보전의 주체 중 하나가 되어야 한다.

노거수 수령 추정을 위한 지역별 연륜연대기 구축 및 활용 (Establishing Local Master Ring-Width Chronologies and Their Utilization for Estimating The Age of Big Old Trees)

  • 오정애;서정욱;김병로
    • Journal of the Korean Wood Science and Technology
    • /
    • 제45권1호
    • /
    • pp.85-95
    • /
    • 2017
  • 본 연구는 연륜연대학적 방법을 이용하여 노거수 수령의 정확한 추정을 위해 수행되었다. 연구지역은 충청북도 괴산군(CBGS), 전라남도 구례군(JNGR), 경상북도 울진군(GBUJ)이며, 수종은 각 지역의 보호수로 지정된 느티나무와 소나무로 하였다. CBGS, JNGR, GBUJ에서 채취한 느티나무는 각각 12, 8, 6본이며, 소나무는 각각 10, 3, 9본이다. 시료(생장편)는 생장추(직경 5.2 mm)를 이용하여 채취하였다. 정확한 연륜측정을 위해 느티나무는 활주식 마이크로톰으로 횡단면을 절삭하였으며, 소나무는 사포를 이용하여 횡단면을 연마하였다. 연륜폭은 이용하여 0.01 mm 정확도로 측정하였다. 느티나무의 경우 CBGS와 GBUJ에서 203 (1813~2015)년의 연륜연대기가 작성되었으며, JNGR에서는 175 (1841~2015)년의 연륜연대기가 성공적으로 작성되었다. 소나무의 경우 CBGS, JNGR, GBUJ에서 각각 154(1862~2015)년, 175 (1841~2015)년, 250 (1776~2015)년의 연륜연대기가 성공적으로 작성되었다. 느티나무와 소나무의 지역별 대표연륜연대기를 상호 비교한 결과 대부분 낮은 t 값과 Glk 값을 보여 대표연륜연대기 상호간 일치도가 낮은 것으로 확인되었다. 최근 50년 평균 기온과 강수량 분포도를 지역별 대표연륜연대기와 비교한 결과, 지역별 대표 연륜연대기 패턴은 온도보다 강수량에 의해 결정되는 것이 확인되었다. 따라서 향후 연륜연대학적 방법을 이용한 정확한 수령추정을 위해선 강수량이 고려된 지역별 대표연륜연대기가 준비되어야 할 것이다.

PPFP(Push and Pop Frequent Pattern Mining): 빅데이터 패턴 분석을 위한 새로운 빈발 패턴 마이닝 방법 (PPFP(Push and Pop Frequent Pattern Mining): A Novel Frequent Pattern Mining Method for Bigdata Frequent Pattern Mining)

  • 이정훈;민연아
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권12호
    • /
    • pp.623-634
    • /
    • 2016
  • 현존하는 빈발 패턴 마이닝 방법은 대부분 시간 효율성을 목표로 하고, 물리적 메모리 사용에 매우 의존적이다. 하지만 빅데이터 시대가 도래함에 따라 실제 세상의 데이터베이스는 급속도로 증가하고 있으며, 그에 따라 기존의 방법으로 현실적인 거대한 양의 데이터를 마이닝하기에 물리적 메모리 공간이 부족한 실정이다. 이러한 문제를 해결하기 위해, 빈발 패턴 마이닝의 메모리 의존성을 줄이기 위한 보조저장장치 기반의 연구들이 진행되었으나, 메모리 기반의 방법들에 비해 처리 시간이 너무 많이 소비된다는 한계가 있었다. 따라서 확장성을 가지며, 기존의 디스크 기반의 방법들에 비해 시간효율성을 높인 새로운 빈발 패턴 마이닝이 필요하게 되었다. 본 논문에서는 빅데이터로부터 빈도 아이템 집합들을 마이닝하기 위해 메모리와 디스크를 함께 사용하는 스택 기반의 새로운 접근법인 PPFP 알고리즘을 제안하였다. PPFP는 빈발 패턴 마이닝 접근법 중 가장 인기 있고 효율적인 접근법 중 하나인 FP-growth를 기반으로 하고 있다. PPFP 마이닝 방법은 다음과 같이 두 단계로 진행된다. (1) IFP-tree 구축: FP-tree를 생성한 후, 새로운 인덱스 번호 부여 방법으로 FP-tree의 각 노드에 인덱스 번호를 부여하고, 이 인덱스 번호가 부여된 FP-tree(IFP-tree)를 테이블로 변환하여(IFP-table) 디스크에 저장한다. (2) PPFP 알고리즘을 이용한 빈발 패턴 마이닝: 스택 기반의 PUSH-POP 방식으로 패턴을 확장시켜 나가며 빈발 패턴을 마이닝한다. 이러한 방식을 통해 메모리 기반의 방법에 비해 반복적으로 많은 시간이 소모되는 연산에 매우 적은 양의 메모리를 활용하여 확장성과 함께 시간효율성 또한 향상시킬 수 있었다. 그리고 기존의 연구 방법들과 비교 실험을 통해 새로운 알고리즘의 성능을 증명하였다.

Knowledge Extractions, Visualizations, and Inference from the big Data in Healthcare and Medical

  • Kim, Jin Sung
    • 한국지능시스템학회논문지
    • /
    • 제23권5호
    • /
    • pp.400-405
    • /
    • 2013
  • The purpose of this study is to develop a composite platform for knowledge extractions, visualizations, and inference. Generally, the big data sets were frequently used in the healthcare and medical area. To help the knowledge managers/users working in the field, this study is focused on knowledge management (KM) based on Data Mining (DM), Knowledge Distribution Map (KDM), Decision Tree (DT), RDBMS, and SQL-inference. The proposed mechanism is composed of five key processes. Firstly, in Knowledge Parsing, it extracts logical rules from a big data set by using DM technology. Then it transforms the rules into RDB tables. Secondly, through Knowledge Maintenance, it refines and manages the knowledge to be ready for the computing of knowledge distributions. Thirdly, in Knowledge Distribution process, we can see the knowledge distributions by using the DT mechanism.Fourthly, in Knowledge Hierarchy, the platform shows the hierarchy of the knowledge. Finally, in Inference, it deduce the conclusions by using the given facts and data.This approach presents the advantages of diversity in knowledge representations and inference to improve the quality of computer-based medical diagnosis.

Dynamic Caching Routing Strategy for LEO Satellite Nodes Based on Gradient Boosting Regression Tree

  • Yang Yang;Shengbo Hu;Guiju Lu
    • Journal of Information Processing Systems
    • /
    • 제20권1호
    • /
    • pp.131-147
    • /
    • 2024
  • A routing strategy based on traffic prediction and dynamic cache allocation for satellite nodes is proposed to address the issues of high propagation delay and overall delay of inter-satellite and satellite-to-ground links in low Earth orbit (LEO) satellite systems. The spatial and temporal correlations of satellite network traffic were analyzed, and the relevant traffic through the target satellite was extracted as raw input for traffic prediction. An improved gradient boosting regression tree algorithm was used for traffic prediction. Based on the traffic prediction results, a dynamic cache allocation routing strategy is proposed. The satellite nodes periodically monitor the traffic load on inter-satellite links (ISLs) and dynamically allocate cache resources for each ISL with neighboring nodes. Simulation results demonstrate that the proposed routing strategy effectively reduces packet loss rate and average end-to-end delay and improves the distribution of services across the entire network.

Data Mining을 이용한 전략시뮬레이션 게임 데이터 분석 (A Study of Analyzing Realtime Strategy Game Data using Data Mining)

  • 용혜련;김도진;황현석
    • 한국게임학회 논문지
    • /
    • 제15권4호
    • /
    • pp.59-68
    • /
    • 2015
  • 정보통신기술의 발달로 빅데이터 분석을 통해 사람들 일상의 기록과 잠재적 요구까지 통찰할 수 있게 되었으며, 우리의 일상 속에서 방대한 정보를 실시간으로 도출하고 있다. 여러 산업이나 기업에서 이미 빅데이터와 결합시켜 비즈니스 등 다양한 분야에 활용하고 있지만 게임 산업에서의 빅데이터 활용은 아직까지 미흡한 실정이다. 이에 본 연구에서는 데이터 마이닝을 기법을 적용하여 전략시뮬레이션 게임 데이터를 분석하였다. 전략시뮬레이션 게임 데이터를 Decision Tree, Random Forest, Multi-class SVM, Linear Regression 분석 기법을 적용하여 게임 유저의 게임수준에 영향을 미치는 요인을 분석하였다. 게임수준을 예측하는데 있어 가장 우수한 성능을 보인 기법과 변수들을 도출하여 게임 디자인과 사용성을 증대시키기 위한 제안을 하고자 한다.

빅데이터 분류 기법에 따른 벤처 기업의 성장 단계별 차이 분석 (The Difference Analysis between Maturity Stages of Venture Firms by Classification Techniques of Big Data)

  • 정병호
    • 디지털산업정보학회논문지
    • /
    • 제15권4호
    • /
    • pp.197-212
    • /
    • 2019
  • The purpose of this study is to identify the maturity stages of venture firms through classification analysis, which is widely used as a big data technique. Venture companies should develop a competitive advantage in the market. And the maturity stage of a company can be classified into five stages. I will analyze a difference in the growth stage of venture firms between the survey response and the statistical classification methods. The firm growth level distinguished five stages and was divided into the period of start-up and declines. A classification method of big data uses popularly k-mean cluster analysis, hierarchical cluster analysis, artificial neural network, and decision tree analysis. I used variables that asset increase, capital increase, sales increase, operating profit increase, R&D investment increase, operation period and retirement number. The research results, each big data analysis technique showed a large difference of samples sized in the group. In particular, the decision tree and neural networks' methods were classified as three groups rather than five groups. The groups size of all classification analysis was all different by the big data analysis methods. Furthermore, according to the variables' selection and the sample size may be dissimilar results. Also, each classed group showed a number of competitive differences. The research implication is that an analysts need to interpret statistics through management theory in order to interpret classification of big data results correctly. In addition, the choice of classification analysis should be determined by considering not only management theory but also practical experience. Finally, the growth of venture firms needs to be examined by time-series analysis and closely monitored by individual firms. And, future research will need to include significant variables of the company's maturity stages.

이동체의 색인을 위한 시간 기반 R-트리의 설계 및 구현 (Design and implementation of a time-based R-tree for indexing moving objects)

  • 전봉기;홍봉희
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권3호
    • /
    • pp.320-335
    • /
    • 2003
  • 위치 기반 서비스는 이동체의 위치에 따라 종속적인 결과를 얻는 위치 기반 질의를 필요로 하게 하였다. 연속적으로 이동하는 이동체의 위치를 추적하는 것은 위치 기반 서비스에서는 중요한 응용 중의 하나이다. 효과적인 질의 처리를 위해 이동체 데이터베이스는 연속적으로 위치를 변경하는 이동체의 이동을 관리하는 3차원 색인을 필요로 한다. 2차원 R-tree의 확장으로 시간 도메인을 포함하는 3DR-tree와 같은 이동체 색인은 노드 간의 높은 중복과 사장 공간으로 인하여 낮은 공간 활용도와 검색 성능이 저하되는 문제점이 있다. 이 논문에서 제시하는 TR-tree는 R-tree 기반의 색인으로서, 시간 도메인의 성장을 고려하여 시간 축 분할 시 비균등 분할 정책을 사용하여 공간 활용도를 높였다. 노드간의 중복과 사장 공간을 최소화 하기 위하여 강제 합병 정책을 사용하여 중복이 심한 노드를 강제 합병 시킨다. 또한 오버플로우 노드의 분할 시에 노드간의 중복을 심하게 하는 원인이 되는 긴 선분을 절단 정책을 사용하여 2개의 선분으로 절단하여 분할 노드 간의 중복을 제거한다. 실험 평가 결과에서 TR-tree는 3DR-tree와 TB-tree 보다 성능이 우수하였으며, 특히 R-tree와 R*-tree보다 색인의 크기가 작다.

천연기념물 노거수 외과수술 문제점 및 보존 관리방안에 관한 연구 (A Study on the Tree Surgery Problem and Protection Measures in Monumental Old Trees)

  • 정종수
    • 헤리티지:역사와 과학
    • /
    • 제42권1호
    • /
    • pp.122-142
    • /
    • 2009
  • 본 연구는 노거수 관리개선을 위하여 국내외의 외과수술 제반 이론을 살펴보고 국내 외과수술의 현 실태를 대상 수목의 수술부위 해체 조사와 전문가 집단의 인식조사를 실시하여 그 개선 방안을 제안하는 과정을 통해, 다음과 같은 결론을 도출할 수 있었다. 첫째, 조사 대상 수목 67주를 수령, 생육 상태, 주변 환경 등과 상관관계 분석 결과, 이들은 위치별 특성과 상처크기별 특성은 상호 상관관계가 밀접한 것으로 분석되었으나, 충전물별 재료 등에는 상관관계가 적은 것으로 나타났다. 둘째, 환부의 크기는 $0.09m^2$ 이하의 가지 절단부위에서 빈도가 가장 높았고, 위치별(부위별) 공동의 크기는 근주부후로 출발되는 "뿌리+줄기"에서 가장 크게 나타났다. 상관관계 분석 결과에서도, 건전도가 낮은 상위 그룹에서도 동일한 결과가 도출되었다. 셋째, 근주(根株)부후에서 발생된 큰 공동이나 노출뿌리에 충전물(특히 우레탄)을 채우거나 표면처리를 하는 경우 문제가 심각하였다. 공동부 충전으로 인한 잇점은 크지 않은 것으로 분석되었다. 넷째, 현재 주로 사용하고 있는 충전물의 표면처리(인공수피)는 주로"에폭시+부직포+코르크"를 이용하고 있으나, 유연성이 없어 목질부와의 접합부에서 틈이 자주 발생하고 표면이 갈라지는 등 문제가 발생하고 있었다. 다섯째, 수술부위 외부 상태와의 상관관계 평가에서 목질부와의 밀착, 표면상태, 유합조직 형성 등과 내부 조사 결과와 매우 높은 상관관계를 가지고 있었다. 여섯째, 노거수의 관리 잘못으로 수세에 가장 큰 영향을 미치는 것은 복토였으며, 잘못된 가지치기는 지상부 상처의 근원이 되고 있음을 파악할 수 있었다. 가지치기에서 작은 가지는 표준방법으로 잘랐을 경우 유합조직의 형성이 활발하여 상처가 쉽게 회복되지만 심재가 있는 큰 가지는 방어능력이 없어 부후균의 침입을 받게 되는 경우가 많다. 일곱째, 노거수 관련업무 처리횟수에 영향을 미치는 변수들을'노거수 관리자 및 관련업체의 의식개혁이 필요', '노거수에 가장 많은 피해가 발생되는 부위는 특정부위와 상관없다.', '노거수의 가장 중요한 가치는 생물학적 가치', '노거수 외과수술 결과, 문제점 발생원인은 약제 사용 부적절이다.', '새로운 기법의 개발 및 시도로 인한 수술기법의 다양', '노거수에 가장 많은 피해가 발생되는 부위는 가지이다.', '노거수 관리자 및 관련업체의 의식개혁이 필요', '노거수 관련업무 처리시 문제가 되는 것은 업무분장 모호성 및 중복성이다.'등 8개의 변수들이 나타났다. 설문 조사결과, 수술 및 제도 개선 부분에서 가장 높은 빈도수를 보인 항목은 노거수 관리 현황 등의 파악을 통한 관리 정보체계의 확립, 수목외과수술의 처치법 표준화, 업체와 기관사이의 정보의 공유 활성화, 전문인력에 의한 모니터링, 정기적 교육프로그램의 개발이 중요하게 나타났으며, 행정조직의 개선, 산학협력, 수술시기의 부적절성, 외과수술 건의 안정적 수요에 대한 불안감, 전문인력의 부족 등이 문제점으로 분석되었다. 여덟째, 개선 방안으로는 제도적인 측면에 있어서 노거수 관리 및 보존에 관한 법과 조직의 정비를 들 수 있다. 특히. 노거수 관리에 있어서 외부 용역 등을 통하여 적시에 행함으로써 노거수 생육 상태의 건전도를 유지할 수 있다. 또한 보존 관련법의 연계성을 확보할 수 있도록 다른 법의 개정이나 제정 시 문화재 보호를 위한 조항의 삽입을 적극 추진해야 한다. 본 연구는 지정 노거수의 실태 조사를 통해 개선 방안을 마련하는 연구로, 보다 많은 개체조사를 통한 실태 조사 결과를 토대로 개선 방안을 도출하는 것에 대한 한계점과 제도적 개선 방안 도출을 위한 통계적 자료에 의한 근거 제시가 미약했다는 미진함을 남기고 있다. 이는 연구자의 후속연구를 통해 보완될 수 있을 것이다.