• 제목/요약/키워드: Classification trees

검색결과 316건 처리시간 0.027초

베이지안 망에 기초한 불임환자 임상데이터의 분석 (Bayesian Network-Based Analysis on Clinical Data of Infertility Patients)

  • 정용규;김인철
    • 정보처리학회논문지B
    • /
    • 제9B권5호
    • /
    • pp.625-634
    • /
    • 2002
  • 본 논문에서는 베이지안 망을 기초로 불임환자의 임상 데이터에 대한 다양한 분석 실험을 전개하였다. 이 실험을 통해 임신여부에 영향을 주는 요인들간의 상호의존성을 분석해보고, 또 NBN, BAN, GBN 등 제약조건이 다른 다양한 유형의 베이지안 망 분류기들의 분류성능을 서로 비교해보았다. 그리고 우리는 이와 같은 실험을 통해 임신가능여부(Clin)에 직접적인 영향을 미치는 중요한 요인들로 증상(IND), 약물치료법(stimulation), 여성의 나이(FA), 미세조작 난자의 수(ICT), Wallace 사용여부(ETM) 등 5개의 특성들을 가려낼 수 있었고, 이 요인들간의 상호 의존성도 찾아낼 수 있었다. 또 서로 다른 유형의 베이지안 망 분류기들 중에서 요인들간의 상호의존관계를 허용하는 좀 더 일반적인 BAN과 GBN 등이 그렇지 못한 NBN에 비해 상대적으로 더 높은 분류 성능을 보여준다는 것을 확인하였다. 또 결정트리와 k-최근접 이웃과 같은 다른 분류기들과의 성능 비교를 통해, 임상 데이터의 특성상 확률적 표현과 추론에 기초한 베이지안 망 분류기들이 보다 높은 성능을 보여준다는 사실도 확인할 수 있었다. 또 본 논문에서는 클래스 노드의 Markov blanket에 속한 특성들로 특성집합을 축소하는 것을 제안하고, 실험을 통해 이 특성 축소방법이 베이지안 망 분류기들의 성능을 높여 줄 수 있는지 알아보았다.

한반도 도서지역 춘란집단의 종조성과 군락구조 (Community Structure and Floristic Composition of Cymbidium goeringii Group in Korean Islets)

  • 송홍선;박용진
    • 화훼연구
    • /
    • 제18권2호
    • /
    • pp.110-116
    • /
    • 2010
  • 본 연구는 상관에 의한 종조성표의 불연속성인 분류법과 연속성인 배열법을 적용하여 한반도 도서지역 춘란 집단의 식물종조성 및 식생을 식물사회학적으로 분석하였다. 자생지 33개소는 평균 해발고도 65.9m이었고, 방향은 동남 사면이었으며, 경사는 평균 7.9%이었다. 조사구 $4m^2$ 면적의 춘란 피도는 4.5%이었다. 춘란과 동반 출현하는 식물은 총 102분류군이었다. 그 중 목본은 68분류군(66.7%)이었고, 초본은 34분류군(33.3%)이었으며, 상록식물은 36분류군(35.3%), 낙엽식물은 66분류군(64.7%)이었다. 춘란과 동반 출현하는 빈도가 가장 높은 식물은 사스레피나무(48.5%)이었으며, 다음으로 곰솔(45.5%), 청미래덩굴(36.4%), 그늘사초(33.3%), 송악(33.3%), 후박나무(30.0%), 때죽나무(30.3%), 소나무(27.3%) 순이었다. 춘란집단의 식물군락은 곰솔군락, 소나무군락, 구실잣밤나무군락, 굴참나무군락으로 구분되었으며, 춘란과 결합력이 강한 식물군락은 곰솔군락이었다. 춘란집단 식물군락의 유사성과 결합양상은 곰솔군락과 구실잣밤나무 군락이 가까웠고, 소나무군락은 굴참나무군락과 가까웠다.

의사결정나무분석을 이용한 심혈관질환자의 재입원 위험 요인에 대한 융합적 분석 (Convergence Analysis of Risk factors for Readmission in Cardiovascular Disease: A Machine Learning Approach)

  • 김현수
    • 융합정보논문지
    • /
    • 제9권12호
    • /
    • pp.115-123
    • /
    • 2019
  • 본 연구는 의사결정나무 통계분석법을 톨해 국민건강영양조사 자료를 2차 분석하여 심혈관질환자의 재입원 위험 요인을 확인하는 기초자료를 마련하고자 하였다. 연구대상자는 국민건강영양조사 4-6기 자료대상자 총 65,973명 중 협심증이나 심근경색 진단 병력이 있는 총 1,037명의 성인이며, SPSS window 21 Program을 이용하여 분류 분석 중 CHAID 의사결정나무 방법으로 분석하였다. 뿌리 마디(Root node)는 경제활동상태((χ2=12.063, p=.001), 자식 마디(Child node)는 개인 소득수준(χ2=6.575, p=.031), 최근 1년간 체중 변화(χ2=12.758, p=.001), 거주지역(χ2=4.025, p=.045), 직접흡연(χ2=3.884, p=.049), 교육수준(χ2=9.630, p=.024)으로 확인되었다. 끝마디(Terminal node)는 고혈압(χ2=3.854, p=.050), 당뇨(χ2=6.056, p=.014), 직업형태(χ2=7.799, p=.037)로 분석되었다. 이를 통해 심혈관질환자의 재입원 관리를 위해 다양한 요인의 통합적 접근을 고려한 프로그램의 개발 및 운영이 필요함을 제언한다.

국내자생 팥배나무 11개 천연집단의 잎 형태적 특성과 변이 (Leaf Morphological Characteristics and Variation of Sorbus alnifolia (Sieb. et Zucc.) K. Koch in 11 Natural Habitats)

  • 김영기;김세현;김문섭;윤아영;박인협;고영석
    • 한국자원식물학회지
    • /
    • 제32권1호
    • /
    • pp.29-37
    • /
    • 2019
  • 본 연구는 우리나라에 자생하고 있는 팥배나무 11개 집단으로부터 잎의 형태적 특성과 변이를 조사하여 조경수로서의 팥배나무 선발 및 육종에 대한 기초자료를 제공하고자 수행하였다. 잎의 형태적 특성 12개를 조사하고 집단 간 차이를 비교한 결과 11개 특성에서 유의적인 차이가 인정되었다. 특히 잎의 길이와 너비, 엽면적 등 잎 크기와 관련된 인자들은 마니산 집단이 모두 상위그룹에 속하여 비교적 큰 경향을 나타냈으나, 백운산과 두륜산은 하위 그룹으로 분류되어 비교적 작은 경향을 나타냈다. 주성분 분석을 실시한 결과 제1 주성분은 29.9%의 설명력이 있으며 엽면적, 잎의 너비, 잎의 길이 순으로 높은 상관을 나타내어 잎의 형태적 차이를 설명하는 주요 요인으로 나타났고, 제5 주성분까지 72.9%의 누적 설명력을 나타냈다. 제5 주성분까지의 득점치를 새로운 변량으로 하여 유집분석을 실시한 결과 I그룹인 광교산과 안면도 집단, II그룹인 덕유산 등 3집단, III그룹인 발왕산 등 3집단, IV그룹인 가지산과 축령산 집단, V그룹인 마니산 집단 등 5개 그룹으로 분류되었고, 지리적으로 인접 집단 간의 구분은 명확하게 이루어지지 않았다.

천연기념물 지정 당산숲·비보숲의 명칭 부여 및 지정 물량 실태 고찰 (Naming and Object Specifying of Dangsan Forests and Bibo Forests Designated as Natural Monument)

  • 최재웅;김동엽
    • 헤리티지:역사와 과학
    • /
    • 제43권1호
    • /
    • pp.28-55
    • /
    • 2010
  • 천연기념물의 명칭 부여 및 지정 물량을 포함한 현재의 천연기념물 관련 체계는 일제강점기에 도입된 '조선보물고적명승천연기념물보존령' (1934)을 기반으로 하고 있으며, 이에 따른 골격이 지금까지 그대로 통용되고 있다는 문제점이 지적되고 있다. 당산숲 비보숲은 우리나라 농어촌의 숲문화를 대표하는 전통문화자원이며 국가적 문화자산이다. 천연기념물을 포함한 당산숲 비보숲을 논할 때 천연기념물 등에서 사용하는 "명칭", "분류 체계" 등에 대해서 문화재청에서조차, '조선의임수(朝鮮の林藪)' (1938)라는 일제의 조사보고서에 실린 내용에 전적으로 의존하고 있다는 것이 근본적인 문제점이라고 할 수 있다. 즉, 일제가 1938년에 '완도 예송리 당산숲'을 '례송리상녹수림(禮松里常綠樹林)'이라고 이름을 붙인 후, 현재까지도 우리 농어촌의 당산숲 비보숲을 천연기념물 등으로 지정할 때, 해안가의 경우 대부분 일제가 한 방식대로 '~상록수림'이라는 명칭을 그대로 따르고 있다는 것이 대표적인 예이다. 본 논문의 목적은 천연기념물 제도의 출발점인 일제강점기의 '조선의임수(朝鮮の林藪)' 등 일본 자료에 대한 문제점을 고찰하고, '조선의임수(朝鮮の林藪)' 등의 논리를 우리의 당산숲 비보숲 등에 여과 없이 적용시키고 있는 현 상황을 개선하는 방안을 찾고자 하는 것이다. 이를 위해 천연기념물로 지정된 수림지, 노거수 중에서 당산제를 지내는 당산숲이 있는 18개소를 선정하여 조사, 분석하였다. 결과로서, 천연기념물로 지정된 많은 수림지, 노거수 중에서 그것이 당산숲, 당산나무라면 "~당산숲", "~당산숲과 비보숲", "~당산나무"라는 명칭을 일관성 있게 부여해야 할 필요가 있다는 것을 제안하고자 한다. 이러한 조치가 이루어지면 일제강점기에 도입된 천연기념물 제도의 한계를 극복하는 출발점이 시작될 수 있으며, 우리나라 전통조경 양식 및 문화경관으로서의 당산숲에 대한 위상이 제고될 수 있을 것이다.

Vegetation structure and distribution characteristics of Symplocos prunifolia, a rare evergreen broad-leaved tree in Korea

  • Kim, Yangji;Song, Kukman;Yim, Eunyoung;Seo, Yeonok;Choi, Hyungsoon;Choi, Byoungki
    • Journal of Ecology and Environment
    • /
    • 제44권4호
    • /
    • pp.275-285
    • /
    • 2020
  • Background: In Korea, Symplocos prunifolia Siebold. & Zucc. is only found on Jeju Island. Conservation of the species is difficult because little is known about its distribution and natural habitat. The lack of research and survey data on the characteristics of native vegetation and distribution of this species means that there is insufficient information to guide the management and conservation of this species and related vegetation. Therefore, this study aims to identify the distribution and vegetation associated with S. prunifolia. Results: As a result of field investigations, it was confirmed that the native S. prunifolia communities were distributed in 4 areas located on the southern side of Mt. Halla and within the evergreen broad-leaved forest zones. Furthermore, these evergreen broad-leaved forest zones are themselves located in the warm temperate zone which are distributed along the valley sides at elevations between 318 and 461 m. S. prunifolia was only found on the south side of Mt. Halla, and mainly on south-facing slopes; however, small communities were found to be growing on northwest-facing slopes. It has been confirmed that S. prunifolia trees are rare but an important constituent species in the evergreen broad-leaved forest of Jeju. The mean importance percentage of S. prunifolia community was 48.84 for Castanopsis sieboldii, 17.79 for Quercus acuta, and 12.12 for Pinus thunbergii; S. prunifolia was the ninth most important species (2.6). Conclusions: S. prunifolia can be found growing along the natural streams of Jeju, where there is little anthropogenic influence and where the streams have caused soil disturbance through natural processes of erosion and deposition of sediments. Currently, the native area of S. prunifolia is about 3300 ㎡, which contains a confirmed population of 180 individual plants. As a result of these low population sizes, it places it in the category of an extremely endangered plant in Korea. In some native sites, the canopy of evergreen broad-leaved forest formed, but the frequency and coverage of species were not high. Negative factors that contributed to the low distribution of this species were factors such as lacking in shade tolerance, low fruiting rates, small native areas, and special habitats as well as requiring adequate stream disturbance. Presently, due to changes in climate, it is unclear whether this species will see an increase in its population and habitat area or whether it will remain as an endangered species within Korea. What is clear, however, is that the preservation of the present native habitats and population is extremely important if the population is to be maintained and expanded. It is also meaningful in terms of the stable conservation of biodiversity in Korea. Therefore, based on the results of this study, it is judged that a systematic evaluation for the preservation and conservation of the habitat and vegetation management method of S. prunifolia should be conducted.

일 도시 노인의 성공적인 노화 관련 요인 (Factors Associated with Successful Aging of Korean Older People Living in a City)

  • 신영희;이혜정
    • 한국노년학
    • /
    • 제29권4호
    • /
    • pp.1327-1340
    • /
    • 2009
  • 본 연구의 목적은 일 도시 노인의 성공적인 노화의 수준을 알아보고, 성공적인 노화와 관련된 요인을 규명하는 것이며, 또한 의사결정나무분석 방법을 이용하여 성공적인 노화의 점수에 따른 취약 그룹의 특성을 알아보고 우리나라 노인의 성공적인 노화 증진 프로그램을 개발하는데 기초자료로 활용하기 위함이다. 대구의 일 동사무소에 등록된 노인 중에서 연구 참여에 동의하고 설문지 면접을 마친 총 187명을 대상으로 하였다. 연구 참여에 동의한 노인은 면담자가 직접 노인 가구를 방문하여 구조화된 설문지를 이용하여 성공적인 노화, 우울, 신체적 기능상태, 만성 질환 수, 그리고 친구와의 접촉 빈도수에 대한 정보를 수집하였다. 일 도시의 노인에서 남성, 고학력, 배우자와 사별하지 않은, 그리고 가족과 동거하는 노인이 그렇지 않은 노인에 비해 상대적으로 성공적인 노화의 점수가 높았다. 반면에 우울정도가 심하거나 만성질환이 많을수록 성공적인 노화의 점수가 낮았다. 또한 신체기능과 자가 건강 평가수준이 높거나, 규칙적인 운동을 하거나 친구와의 교제가 많을수록 성공적인 노화의 점수가 높았다. 우울은 노인의 성공적인 노화의 점수에 따른 취약그룹을 분류하는데 일차적으로 중요한 결정 요인이었으며, 성공적인 노화의 점수가 가장 낮은 노인 그룹은 우울정도가 심하고 신체적 기능 상태가 좋지 않았으며, 반대로 성공적인 노화의 점수가 가장 높은 그룹은 우울정도가 약하고 신체적 기능상태가 좋은 노인이었다. 우울과 만성질환은 노인이 성공적인 노화를 경험하는데 부정적인 영향을 미칠 뿐 아니라 성공적인 노화의 점수가 낮은 그룹의 공통적인 특성이었으므로 노인의 우울과 만성질환을 위한 중재 프로그램의 제공이 중요하다는 것을 본 연구는 재확인하였다.

MRI Predictors of Malignant Transformation in Patients with Inverted Papilloma: A Decision Tree Analysis Using Conventional Imaging Features and Histogram Analysis of Apparent Diffusion Coefficients

  • Chong Hyun Suh;Jeong Hyun Lee;Mi Sun Chung;Xiao Quan Xu;Yu Sub Sung;Sae Rom Chung;Young Jun Choi;Jung Hwan Baek
    • Korean Journal of Radiology
    • /
    • 제22권5호
    • /
    • pp.751-758
    • /
    • 2021
  • Objective: Preoperative differentiation between inverted papilloma (IP) and its malignant transformation to squamous cell carcinoma (IP-SCC) is critical for patient management. We aimed to determine the diagnostic accuracy of conventional imaging features and histogram parameters obtained from whole tumor apparent diffusion coefficient (ADC) values to predict IP-SCC in patients with IP, using decision tree analysis. Materials and Methods: In this retrospective study, we analyzed data generated from the records of 180 consecutive patients with histopathologically diagnosed IP or IP-SCC who underwent head and neck magnetic resonance imaging, including diffusion-weighted imaging and 62 patients were included in the study. To obtain whole tumor ADC values, the region of interest was placed to cover the entire volume of the tumor. Classification and regression tree analyses were performed to determine the most significant predictors of IP-SCC among multiple covariates. The final tree was selected by cross-validation pruning based on minimal error. Results: Of 62 patients with IP, 21 (34%) had IP-SCC. The decision tree analysis revealed that the loss of convoluted cerebriform pattern and the 20th percentile cutoff of ADC were the most significant predictors of IP-SCC. With these decision trees, the sensitivity, specificity, accuracy, and C-statistics were 86% (18 out of 21; 95% confidence interval [CI], 65-95%), 100% (41 out of 41; 95% CI, 91-100%), 95% (59 out of 61; 95% CI, 87-98%), and 0.966 (95% CI, 0.912-1.000), respectively. Conclusion: Decision tree analysis using conventional imaging features and histogram analysis of whole volume ADC could predict IP-SCC in patients with IP with high diagnostic accuracy.

KOSDAQ 시장의 관리종목 지정 탐지 모형 개발 (Development of a Detection Model for the Companies Designated as Administrative Issue in KOSDAQ Market)

  • 신동인;곽기영
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.157-176
    • /
    • 2018
  • 관리종목은 상장폐지 가능성이 높은 기업들을 즉시 퇴출하기 보다는 시장 안에서 일정한 제약을 부여하고, 그러한 기업들에게 상장폐지 사유를 극복할 수 있는 시간적 기회를 주는 제도이다. 뿐만 아니라 이를 투자자 및 시장참여자들에게 공시하여 투자의사결정에 주의를 환기시키는 역할을 한다. 기업의 부실화로 인한 부도 예측에 관한 연구는 많이 있으나, 부실화 가능성이 높은 기업에 대한 사회, 경제적 경보체계라 할 수 있는 관리종목에 관한 연구는 상대적으로 매우 부족하다. 이에 본 연구는 코스닥 기업들 가운데 관리종목 지정 기업과 비관리종목 기업을 표본으로 삼아 로지스틱 회귀분석과 의사결정나무 분석을 이용하여 관리종목 지정 예측 모형을 개발하고 검증하였다. 분석결과에 따르면 로지스틱 회귀분석 모형은 ROE(세전계속사업이익), 자기자본현금흐름률, 총자산회전율을 사용하여 관리종목 지정을 예측하였으며, 전체 평균 예측 정확도는 검증용 데이터셋에 대해 86%의 높은 성능을 보여주었다. 의사결정나무 모형은 현금흐름/총자산과 ROA(당기순이익)를 통한 분류규칙을 적용하여 약 87%의 예측 정확도를 보여주었다. 로지스틱 회귀분석 기반의 관리종목 탐지 모형의 경우 ROE(세전계속사업이익)와 같은 구체적인 관리종목 지정 사유를 반영하면서 기업의 활동성에 초점을 맞추어 관리종목 지정 경향성을 설명하는 반면, 의사결정 관리종목 탐지 모형은 기업의 현금흐름을 중심으로 하여 관리종목 지정을 예측하는 것으로 나타났다.

하이브리드 인공신경망 모형을 이용한 부도 유형 예측 (Bankruptcy Type Prediction Using A Hybrid Artificial Neural Networks Model)

  • 조남옥;김현정;신경식
    • 지능정보연구
    • /
    • 제21권3호
    • /
    • pp.79-99
    • /
    • 2015
  • 부도 예측은 회계와 재무 분야에서 꾸준히 연구되고 있는 분야이다. 초기에는 주로 다중판별분석(multiple discriminant analysis)와 로짓 분석(logit analysis)과 같은 통계적 방법을 이용하였으나, 1990년대 이후에는 경영 분야의 분류 문제를 위해 많은 연구자들이 인공신경망(back-propagation neural network), 사계기반추론(case-based reasoning), 서포트 벡터 머신(support vector machine) 등과 같은 인공지능을 통한 접근법을 이용하여 통계적 방법보다 분류 성과 측면에서 우수함을 입증해왔다. 기존의 기업의 부도에 관한 연구에서 많은 연구자들이 재무비율을 이용하여 부도 예측 모형을 구축하는 것에 초점을 맞추어왔다. 부도예측에 관한 연구가 꾸준히 진행되고 있는 반면, 부도의 세부적인 유형을 예측하여 제시하는 것에 대한 연구는 미흡한 실정이었다. 따라서 본 연구에서는 수익성, 안정성, 활동성 지표를 중심으로 국내 비외감 건설업 기업들의 부도 여부뿐만 아니라 부도의 세부적인 유형까지 예측 가능한 모형을 개발하고자 한다. 본 연구에서는 부도 유형을 예측하기 위해 두 개의 인공신경망 모형을 결합한 하이브리드 접근법을 제안하였다. 첫 번째 인공신경망 모형은 부도예측을 위한 역전파 인공신경망을 이용한 모형이며, 두 번째 인공신경망 모형은 부도 데이터를 몇 개의 유형으로 분류하는 자기조직화지도(self-organizing map)을 이용한 모형이다. 실험 결과를 통해 정의된 5개의 부도 유형인 심각한 부도(severe bankruptcy), 안정성 부족(lack of stability), 활동성 부족(lack of activity), 수익성 부족(lack of profitability), 회생 가능한 부도(recoverable bankruptcy)는 재무 비율에 따라 유형별로 상이한 특성을 갖는 것을 확인할 수 있었다. 본 연구 결과를 통해 신용 평가 분야의 연구자와 실무자들이 기업의 부도의 유형에 대한 유용한 정보를 얻을 것으로 기대한다.