• 제목/요약/키워드: canonical forest

불균형 데이터의 분류 성능 향상을 위한 일반화된 불균형 비율(GIR) 기반의 과소 표집 canonical forest (GC-Forest) (GIR-based canonical forest: An ensemble method for imbalanced big data)

  • 한솔지;명재성;김현중
    • 응용통계연구
    • 제37권5호
    • pp.615-629
    • 2024
  • 빅데이터 마이닝 분야에서 불균형 분류 문제의 도전 과제는 수십 년 동안 활발히 연구되어 왔다. 불균형 데이터 문제는 그 양상과 형태가 매우 다양한데, 과거 연구는 주로 클래스 간 데이터 크기 불균형 해결에 초점을 두었다. 그러나 최근 연구에 따르면 데이터 수의 불균형만이 아니라, 클래스 간 중첩이 결합된 경우에 분류 성능의 저하가 더 심각해진다는 것이 밝혀졌다. 이에 따라 본 연구에서는 클래스 간 중첩 정도를 고려한 가중치 재샘플링 기법을 활용하는 효율적인 앙상블 분류 방법인 GC-Forest (GIR-based canonical forest)를 제안한다. 이 방법은 앙상블의 각 단계에서 데이터 개수의 불균형이 아닌 클래스 중첩 면에서 불균형 비율을 측정하고 소수 클래스의 대표성을 증가시킴으로써 클래스를 균형있게 맞춘다. 또한, 전체 분류 성능을 향상시키기 위해 GC-Forest 방법은 개별 분류기의 성능과 다양성을 모두 향상시키는 것으로 설계된 canonical forest 방법을 앙상블 분류기로 채택한다. 제안된 방법의 성능은 14개의 다양한 실제 불균형 데이터를 사용한 실험을 통해 비교 및 검증되었다. GC-Forest는 AUC, PR-AUC, G-mean, F1-score 측면에서 7개의 다른 앙상블 방법과 비교하여 매우 경쟁력 있는 분류 성능을 보여주었다.

토양(土壤)의 이화학적(理化學的) 특성(特性)과 대나무 생장(生長)과의 관계(關係) (Relationships between Soil-Site Properties and Bamboo (Phyllostachys bambusoides) Growth)

  • 정영관
    • 한국산림과학회지
    • 제79권1호
    • pp.16-20
    • 1990
  • 17개(個)의 토양인자(土壤因子)와 대나무의 직경(直徑), 간고(稈高) 그리고 절간(節間) 생장량(生長量)과의 관계(關係)를 구명(究明)하기 위하여 정준상관분석(正準相關分析)을 실시(實施)하였다. 첫번째 정준상관(正準相關)은 매우 유의적(有意的) 이었고, 변수(變數)의 2조합(組合)에서 분산(分散)은 크고, 그리고 정준변량(正準變量)은 생물학적(生物學的)으로 의의(意義)가 있었다. 따라서 표층토심(表層土深), 전질소(全窒素) 그리고 유기물함량(有機物含量)등은 첫번째 토양성질(土壤性質)의 정준변량(正準變量)과 매우높은 정(正)의 상관(相關)을 나타내었다. 그리고 점토함량(粘土含量)과 치환성용량(置煥性容量)은 부(負)의 상관(相關)으로 나타났다. 17개(個) 변수(變數) 가운데 8개(個) 변수(變數)만이 대나무의 생장(生長)을 예측(豫測)하는데 관계(關係)되는 것으로 사료(思料)된다.

Canonical Correspondence Analysis(CCA)에 의한 덕유산 국립공원의 삼림식생분석 (Canonical Correspondence Analysis(CCA) on the Forest Vegetation of Mt. Togyu National Park, Korea)

  • 김창환;길봉섭
    • The Korean Journal of Ecology
    • 제20권2호
    • pp.125-132
    • 1997
  • A study of forest vegetation in Mt. $T\v{o}kyu$ National Park was investigated by ordination technique. By TWINSPAN(Two-Way Indicator Species Analysis) method, 10 groups were recognized as follows: pinus densiflora, Quercus variabilis, Quercus serrata, Quercus mongolica-Rhododendron schlippenbachii, Quercus mongolica-Abies koreana, Quercus mongolica-Acer pseudo-sieboldi-amum, Quercus mongolica-Symplocos chinensis for. pilosa, Carpinus laxiflora, Fraxinus mandshurica and Taxus cuspidata groups. The floristic composition of these groups showed high correlation to soil moisture(r=0.831), altitude(r=0.784), topography(r=-0.722), organic matter(r=0.642), and pH(r=-0.509) among various environmental factors. According to the results of CCA(Canonical Correspondence Analysis) Pinus densiflora group and Quercus variabilis group were situated in a xeric area at a lower altitude where soil nutrients were poor compared with the other groups. Fraxinus mandshurica group was distributed throughout the valley with high soil moisture and good nutrients, Quercus serrata group and Carpinus laxiflora group were found in the low altitude region with good nutrients, Quercus mongolica group, at the high altitude region with good nutrients, and Quercus mongolica-Acer koreana and Taxus cuspidata at higher altitudes(1, 400-1600 m).

한국의 생태지역별 산불특성과 임상분포패턴과의 관계 (The Relationship between Characteristics of Forest Fires and Spatial Patterns of Forest Types by the Ecoregions of South Korea)

  • 이병두;송정은;이명보;정주상
    • 한국산림과학회지
    • 제97권1호
    • pp.1-9
    • 2008
  • 산불을 고려하여 효율적으로 산림을 관리하기 위해서는 임상분포패턴과 산불특성과의 관계 규명이 요구된다. 본 연구에서는 기후형과 산불 빈도 및 규모를 표현하는데 유용한 생태지역을 단위로, 임상분포패턴 및 산불특성을 분석하고, 두 인자 간의 관계를 살펴 보았다. 이를 위해 수치임상도의 경관분석을 통해 생태지역별 전체 임상과 산불에 취약한 소나무 임분의 분포패턴을 분석하고, 산림청의 산불통계자료를 이용하여 생태지역별 산불특성을 추출한 다음 정준상관분석을 수행하였다. 임상패치는 산림면적비율이 높은 생태지역일수록 크고 복잡하였으며, 소나무 임분은 해안지역을 중심으로 형태가 복잡하고 패치 간의 근접성이 높았다. 1,000ha 당 산불발생건수는 도시화된 생태지역에서 많았으나, 건당 피해면적과 확산속도는 낮았다. 이와 반대로 "강원해안" 등 산림비율이 높은 생태지역에서는 적은 발생건수와 넓은 피해면적, 빠른 확산속도를 보였다. 정준상관분석 결과 산불특성은 소나무 임분의 경관지수와 유의한 상관관계가 있었는데, 소나무 임분 면적이 크면서 응집된 구조를 갖는 해안 생태지역일수록 장시간 연소되어 피해면적이 큰 특성을 보였다.

Environmental Factors Affecting the Abundance and Presence of Tree Species in a Tropical Lowland Limestone and Non-limestone Forest in Ben En National Park, Vietnam

  • Nguyen, Thinh Van;Mitlohner, Ralph;Bich, Nguyen Van;Do, Tran Van
    • Journal of Forest and Environmental Science
    • 제31권3호
    • pp.177-191
    • 2015
  • The effect of environmental variables on the presence and abundance of tree species in a tropical lowland undisturbed limestone and non-limestone forest in Ben En National Park, Vietnam was investigated. The relationships between 13 environmental variables and 29 tree species with a DBH ${\geq}10cm$, as well as between six 6 physical variables with 26 species of seedling and sapling communities were assessed by canonical correspondence analysis (CCA). Data concerning all tree species ${\geq}10cm$ DBH were collected from eighteen $400m^2$ sample plots, while the abundance of regeneration (all individuals ${\leq}5cm$ DBH) was counted in fifty $2{\times}20m$ strip-plots. The significance of species-environments correlations were tested by distribution-free Monte Carlo tests. The CCA of the 29 examined tree species and 13 environmental variables indicated that the presence and abundance of the tree species were closely related to topographic factors. We may confirm that soil properties including pH, soil moisture content, and soil textures, were the most crucial factor in tree species composition and their distribution. Several species including Pometia pinnata, Amesiodendron chinense, Gironniera cuspidate, Cinnamomum mairei, and Caryodaphnopsis tonkinensis were not controlled by soil properties and topographic variables. The CCA also indicated that the abundance of regeneration tree species at all sites had positive and significant correlations with soil depth, while the occurrence of several other tree species (such as Koilodepas longifolium and Aglaia dasyclada) was positively correlated with a higher slope and rocky outcrop.

Disturbance, Diversity, Regeneration and Composition in Temperate Forests of Western Himalaya, India

  • Tiwari, Om Prakash;Sharma, Chandra Mohan;Rana, Yashwant Singh;Krishan, Ram
    • Journal of Forest and Environmental Science
    • 제35권1호
    • pp.6-24
    • 2019
  • We have investigated the impact of anthropogenic and natural disturbances on regeneration, composition and diversity in some temperate forests of Bhagirathi Catchment Area of Garhwal Himalaya. The forests were categorized on the basis of canopy cover and magnitude of disturbance into highly, moderately and least disturbed classes. The dominant tree species at lower elevation were Pinus roxburghii and Quercus leucotrichophora, while Abies pindrow, Q. semecarpifolia and Rhododenron arboreum were the dominant species at the upper elevational forests. Cythula tomentosa and Indegophera heterentha were the dominant shrub species present in all the forests. Similarly, Circium wallichii and Oxalis corniculata were the dominant herb species found in all forests (except Q. leucotrichophora forest), whereas Thalictrum foliolosum and Viola pilosa were noticed in each forest (except P. roxburghii forest). The tree density values oscillated between $400{\pm}10\;trees\;ha^{-1}$ to $750{\pm}89.1\;trees\;ha^{-1}$ which generally decreased from lower to higher disturbance regimes however, the total basal cover value was highest ($88.1{\pm}23.6m^2\;ha^{-1}$) in highly disturbed forest and lowest ($25.8{\pm}2.2m^2\;ha^{-1}$) in moderately disturbed forest. The shrub and herb densities were maximum in least disturbed forest, while the young regenerating individuals i.e., sapling and seedling were observed increasing from high to low disturbed forests which reflected that the forest fragmentation adversely affected the regeneration. However, A. pindrow and P. roxburghii were found invariably encroaching the habitats of R. arboreum and Q. leucotrichophora at various altitudes, respectively. The Canonical Correspondence Analysis clearly indicated that the elevation and lopping intensity have more impact on trees, while shrub and herbs were more influenced by elevation, canopy cover, light attenuation and soil erosion. Pinus roxburghii was the only species which was affected by heavy litter removal and forest fire.

DCCA 와 Polar Ordination 에 依한 無等山의 森林 群落 分析 (Detrended canonical correspondence analysis and polar ordination analysis on the forest communities of mudungsan.)

  • Kim, Chang-Hwan;Kil, Bong-Seop
    • The Korean Journal of Ecology
    • 제15권2호
    • pp.117-125
    • 1992
  • TWINSPAN(two-way indicator species analysis), DCCA(detrended canonical correspondence analysis) and polar ordination method wee used so as to analyze the the relation between forest vegetation and hibitat of mudungsan(1, 187m) located in kwangju area. Vegetationsurvey consulted 1:25, 000 topographical map, set up 41 quadrats and analyzed from April, 1990 to August, 1991. Forest vegetation of mudungsan was classifild to quercus acutissima community, fraxinus mandshurica community, quercus mongolica community, quercus serrata community, quercus dentata community, quercus variabilis community, and pinus densiflora community by TWINSPANmethod, and this almost coincide with the result of plar ordination. according to DCCA analysis, P. densiflora community was formed in xeric and low altitude region which soil nutrient was poor, compared with other communities. q. variabilis and q. acutissima community wee distributed in the region that low altitude and organic matter content was comparatively low, but q. acutissima community was formed in a damp region while q. variabilis community in a xeric region. q. mongolica and f. mandshurica formed the communities in a high altitude region, especially f. mandshurica cmmunity was distributed in a high humidity region. According to polar ordination analysis, the forest vegetation was classified to 7 communities by means of environmental gradient such as humidity, organic matter, ph, temperature, c.e.c and P2O5.

DCCA에 의(依)한 계룡산(鷄龍山)과 덕유산(德裕山)의 삼림군집(森林群集)과 환경(環境)의 상관관계(相關關係) 분석(分析) (An Analysis of Vegetation-Environment Relationships of Mt. Gyeryong and Mt. Deokyu by Detrended Canonical Correspondence Analysis)

  • 송호경
    • 한국산림과학회지
    • /
    • /
    • /
  • 계룡산(鷄龍山)과 덕유산(德裕山) 삼림군집(森林群集)의 종(種) 조성(組成)과 입지(立地)와의 관계(關係)를 구명(究明)하기 위하여 TWINSPAN(two-way indicator species analysis)과 DCCA(detrended canonical correspondence analysis)를 시행하였다. 식생(植生) 및 환경자료(環境資料)로 계룡산(鷄龍山) 128개소(個所), 덕유산(德裕山) 57개소(個所)의 data를 사용(使用)하여 분석(分析)한 결과(結果)는 다음과 같다. 계룡산(鷄龍山)과 덕유산(德裕山)의 삼림군집(森林群集)과 토양환경(土壤環境)과의 관계(關係)를 살펴보면 Quercus mongolica군집(群集)은 해발고(海拔高)가 높고, 토양(土壤) 양료(養料)가 많은 곳에 주(主)로 분포(分布)하고 있으며, Carpinus laxiflora군집(群集)과 Fraxinus rhynchophylla군집(群集)은 해발고(海拔高)는 중간(中間)이고 양료(養料)가 많은 곳에 주(主)로 분포(分布)하고 있으며, Pinus densiflora-Quercus mongolica 군집(群集)과 Quercus variabilis 군집(群集)은 해발고(海拔高), 양료(養料) 모두 중간(中間) 부분(部分)인 곳에 주(主)로 분포(分布)하고 있으며, Styrax japonica 군집(群集)은 해발고(海拔高)는 낮고 양료(養料)가 중간부분(中間部分)인 곳에 주(主)로 분포(分布)하고 있으며, Pinus densiflora 군집(群集)은 해발고(海拔高)는 낮고 양료(養料)가 적은 부분(部分)에 주(主)로 분포(分布)하고 있다. 군집(群集) 분포(分布)에 영향을 미치는 제일(第一)의 환경(環境) 요인(要因)은 해발고(海拔高)(온도(溫度))이다.

투영 조합을 통한 빅데이터 앙상블 모형 (Ensemble model through mixed projections useful for big data analytics)

  • 박혜준;김현중;이영섭
    • 응용통계연구
    • 제37권5호
    • pp.691-702
    • 2024
  • 이 논문에서는 빅데이터 분석 분야에서 유용하게 사용할 수 있는 새로운 분류 앙상블 방법인 mixed projection forest (MPF)를 제안하였다. 앙상블 내 개별 분류기를 학습할 때, MPF는 주성분 분석(PCA)과 정준 선형 판별 분석(CDA) 등의 데이터 투영 기법의 조합에 의한 회전 행렬을 활용한다. 이를 통해 경사 초평면을 사용함으로써 각 분류기의 정확성을 향상시킨다. 또한 변수 집합의 랜덤 분할을 이용해 다양한 회전 행렬을 도출하여 개별 분류기들의 다양성을 증대시킨다. 이러한 접근 방식은 궁극적으로 분류 성능을 향상시켜 정밀도가 필요한 빅데이터 분석에 매우 효과적이다. 이 논문에서는 실제 및 가상의 30개 데이터셋을 사용하여 MPF와 전통적인 분류 앙상블 모형의 성능을 비교하였다. 결과적으로, MPF는 분류 성능 및 분류기의 다양성 측면에서 우수한 경쟁력을 가진다는 것을 확인할 수 있었다.

화악산의 산림군락과 환경요인의 상관관계 분석 (Correlation Analysis between Forest Vegetation Type and Environment Factor in Mt. Hwaak)

  • 윤충원;김혜진;양희문;임종환;김영걸;신준환;이병천
    • 한국환경과학회지
    • 제18권5호
    • pp.579-588
    • 2009
  • The purpose of this study was to explain relationship between community structure and their environment variables in Mt. Hwaak. Samples were collected by 101 plots using ZM phytosociological method and followed by cluster, importance value and canonical correspondence analysis. The forest vegetation classified into 8 community types such as Pinus densiflora community, Berberis amurensis community, Betula ermani community, Betula schmidtii community, Larix leptolepis community, Pinus koraiensis community, Cornus controversa community and Salix koreensis community. Altitude was considered as the highest factor correlated to the community types. Berberis amurensis community and Betula ermani community were located in upper slope area of high elevation, Comus controversa community and Salix koreensis community in valley area, and Pinus densiflora community in ridge area, respectively.