• 제목/요약/키워드: Decision trees

검색결과 303건 처리시간 0.034초

지식 기반 시스템에서 GIS 자료를 활용하기 위한 기계 학습 기법에 관한 연구 - Landsat ETM+ 영상의 토지 피복 분류를 사례로 (A Machine learning Approach for Knowledge Base Construction Incorporating GIS Data for land Cover Classification of Landsat ETM+ Image)

  • 김화환;구자용
    • 대한지리학회지
    • /
    • 제43권5호
    • /
    • pp.761-774
    • /
    • 2008
  • 원격탐사에서 위성 영상의 디지털 처리 기술이 발달하면서 GIS 자료와 지식 기반 전문가 시스템과의 통합에 대한 관심이 증가하고 있다. 본 연구에서는 위성영상을 토지피복 분류하는 과정에서 GIS 자료를 통합하기 위하여 기계 학습 기법과 규칙 기반 분류 기법을 적용하였다. 사례 지역을 대상으로 Landsat ETM+ 영상과 고도, 경사, 향, 수역과의 거리, 도로와의 거리, 인구밀도 등의 GIS 자료를 함께 활용하였다. C5.0 추론 기계 학습 알고리듬을 이용하여 350개의 표본점으로부터 결정 트리와 분류 규칙을 생성하였다. 본 연구에서 도출된 규칙을 이용하여 분류한 결과, 고독 수역과의 거리, 인구밀도 등의 GIS 자료가 규칙 기반 분류에 효과적인 것으로 나타났다. 본 연구에서 제안한 기계 학습과 지식 기반 분류 기법을 이용하면 다양한 GIS 자료들을 통합하여 위성영상을 보다 효과적으로 분류할 수 있다.

선별 시스템 기반 표지 유전자를 포함한 난소암 마이크로어레이 데이터 분류 (Classification of Ovarian Cancer Microarray Data based on Intelligent Systems with Marker gene)

  • 박수영;정채영
    • 한국정보통신학회논문지
    • /
    • 제15권3호
    • /
    • pp.747-752
    • /
    • 2011
  • 마이크로어레이 분류는 전형적으로 분류기 디자인과 에러 추정이 현저하게 작은 샘플에 기반한다는 것과 교차 검증 에러 추정이 대다수의 논문에 사용된다는 주목할 만한 두 가지 특징을 소유한다. 마이크로어레이 난소 암 데이터는 수 만개의 유전자 발현으로 구성되어 있고, 이러한 정보를 동시에 분석하기 위한 어떤 체계적인 절차도 없다. 본 논문에서는, 통계에 따라 유전자의 우선순위를 정함으로써 표지유전자를 선택하였고, 널리 보급되어 있는 분류 규칙인 선형 분류 분석, 3-nearest-neighbor와 결정 트리 알고리즘은 표지 유전자를 선택한 데이터와 선택하지 않는 데이터의 분류 정확도 비교를 위해 사용되어졌다. ANOVA를 이용하여 선택된 표지 유전자를 포함하는 마이크로어레이 데이터 셋에 선영 분류분석 규칙을 적용한 결과 97.78%의 가장 높은 분류 정확도와 가장 낮은 예측 에러 추정치를 나타내었다.

랜덤 포레스트를 이용한 심전도 기반 생체 인증 (ECG-based Biometric Authentication Using Random Forest)

  • 김정균;이강복;홍상기
    • 전자공학회논문지
    • /
    • 제54권6호
    • /
    • pp.100-105
    • /
    • 2017
  • 본 논문은 개인 인증 알고리즘에 관한 것으로 심전도를 이용한 생체 인증 방식은 특정 보정기준점을 추출하는 방법과 그렇지 않은 방법으로 분류할 수 있으며 본 논문에서 제안하는 방법은 특정 보정기준점을 추출하지 않는 방법으로 이산 코사인 변환과 랜덤 포레스트 분류기를 사용하였다. 심전도 신호는 R-Peak 점을 기준으로 단일 심박으로 나누었으며 각 심박의 특징 추출을 위해 이산 코사인 변환을 적용하였다. 이산 코사인 변환 계수는 정보가 저주파에 집중되는 특성이 있으므로 초기 저주파에 해당하는 40까지 값을 특징으로 랜덤 포레스트 분류기를 구성하였다. 랜덤 포레스트는 의사결정 트리의 앙상블 분류기로 결정 트리를 기본으로 하고 있으므로 빠른 학습 속도와 많은 양의 데이터 처리 능력, 다양한 클래스를 분류할 수 있어 실생활에 적용 가능하며 무엇보다 ID의 승인과 거절을 위한 임계값을 분류기 내부에서 조절할 수 있어 오 분류에 강건한 알고리즘을 구성할 수 있다. 18개의 심전도 파일로 구성된 MIT-BIT Normal Sinus Rhythm 데이터베이스를 선정하여 성능을 평가하였으며 99.99%의 심전도 인식률을 보였다.

삼척 대이리 통방앗간 복원에 관한 건축적 특성 연구 (An Architectural Feature Study on the Restoration of Tongbanga-House at Samcheok)

  • 최장순;김진원
    • 한국농촌건축학회논문집
    • /
    • 제10권1호
    • /
    • pp.101-109
    • /
    • 2008
  • It is very hard to find out Tongbanga-millhouse installed nearby a streamlet to use water with Tongbanga(a kind of water-mill) to polish cereals by pounding like a visage of its old days. It plays an important part in folkloric, architectural and educational aspects. The purpose of this study is to analyse the architectural features of Tongbanga and millhouse itself so that to find the way how to build and fabricate the materials and frame members. Therefore this study has been focused on the composition principle and fabrication method of Tongbanga-millhouse on the side of architecture. The fabrication methods of its house in accordance with regular sequences are as follows. ${\cdot}$ Firstly the decision of location of Tongbanga-millhouse and Hwak(a big mortar made of stone). ${\cdot}$ Slantly three rafter installation at an angle of $50^{\circ}$ to err on the safe side and then slantly fifteen rafter installation making a circular cone shape. ${\cdot}$ Installation of twigs to be circles from bottom to top. ${\cdot}$ Manifoldly covering of trunks peeling the barks from flax plants. ${\cdot}$ Threefoldly thatching with upside barks of oak trees. ${\cdot}$ Placing woods alike rafter on the bark thatches as a weight not to fly away by wind. ${\cdot}$ Binding woods alike rafter with vines of arrowroots to maintain the proper place. The decayed Tongbanga-millhouse by means of upper ways was restored out of all recognition.

  • PDF

러프집합과 계층적 분류구조를 이용한 데이터마이닝에서 분류지식발견

  • 이철희;서선화
    • 한국지능시스템학회논문지
    • /
    • 제12권3호
    • /
    • pp.202-209
    • /
    • 2002
  • 본 논문은 제어 시스템에서 규칙기반과 데이터 마이닝에서의 분류규칙의 명료함에 대해 다룬다. 대용량의 데이터로부터 유용한 정보를 얻어내는 데이터 마이닝은 중요한 이슈가 되고 있다. 인공지능에 기반을 둔 데이터 마이닝 분류기법에는 신경망, 의사결정나무 등 여러가지가 있지만 그 결과는 명확하고 이해하기 쉽고 분류규칙이 간단명료해야 한다. 러프집합이론은 불충분하고 비일관적인 데이터로부터 의미있는 지식을 추출하는데 효과적인 기법이고, 다양한 속성들을 효과적으로 사용함으로써 분류와 근사화에 대한 좋은 해법을 제시한다. 본 논문에서는 러프집합이론의 근사화를 이용하여 알갱이 속에 숨겨져 있는 지식들을 찾아내는데 있어 효과적인 접근을 하였으며, 최상위 레벨에 코어를 적용하여 계층적 분류를 함으로써 대량의 데이터를 효율적으로 처리할 수 있도록 하였다. 제안된 분류방법은 정보시스템의 해석을 용이하게 하고 최소의 분류규칙을 만든다.

아파트 단지 인공지반의 계획적 평가에 관한 연구 (A Study on the Landscape Planning Evaluation on Apartment Artificial Ground)

  • 김유일;오정학;김인혜;윤홍범
    • 한국조경학회지
    • /
    • 제26권3호
    • /
    • pp.297-311
    • /
    • 1998
  • Landscaping on artificial ground is currently served as a means to imposing a greenery benefit on high-density and high-rise apartment sites. It functions as a sub-hierarchy in apartment planning such as ornamental element from the past. Major parking space tends to be allocated on the basement area in response to the required parking regulation. Therefore, competitive relatioinship between the parking and greenery space I limited outdoor of apartments leads to the development planning strategy and technology of artificial ground. This study aims at evaluating landscape planning on artificial ground of apartment complex through several approaches such as site survey, plan drawing analysis, and interview with related field experts. 15 survey apartment sites including Bundang Model, Shindaebang-dong, Pyoungchon Hyundai Apartments have been selected for conducting the research. Main results of this study are summarized below : First, scattering allocation of artificial ground between apartment building units is a dominant plan layout type among the survey sites. Even though unifying allocation type has an advantage to maximize underground parking space, it has a difficulty in maintaining proper soil ground base for nurturing plants. Therefore, underground parking space should be planned by unifying allocation type placed separately from apartment units. This plan type can provide a balanced planting between soil and artificial ground on surface level. Second, It is strongly recommended to integrate the whole planting base which involves architectural structure, drainage, and water proofing above the planting design. When considering that process as a professional subject dealing with natural material such as trees and shrubs, those tasks should be directed by landscape architectural divison and landscape architect. And planting area for artificial ground has to be specified in initial phase of architectural design. This step provides an opportunity to make a proper decision on structural load, drainage, and water proof design as an integrated part of the management.

  • PDF

신용카드 대손회원 예측을 위한 SVM 모형 (Credit Card Bad Debt Prediction Model based on Support Vector Machine)

  • 김진우;지원철
    • 한국IT서비스학회지
    • /
    • 제11권4호
    • /
    • pp.233-250
    • /
    • 2012
  • In this paper, credit card delinquency means the possibility of occurring bad debt within the certain near future from the normal accounts that have no debt and the problem is to predict, on the monthly basis, the occurrence of delinquency 3 months in advance. This prediction is typical binary classification problem but suffers from the issue of data imbalance that means the instances of target class is very few. For the effective prediction of bad debt occurrence, Support Vector Machine (SVM) with kernel trick is adopted using credit card usage and payment patterns as its inputs. SVM is widely accepted in the data mining society because of its prediction accuracy and no fear of overfitting. However, it is known that SVM has the limitation in its ability to processing the large-scale data. To resolve the difficulties in applying SVM to bad debt occurrence prediction, two stage clustering is suggested as an effective data reduction method and ensembles of SVM models are also adopted to mitigate the difficulty due to data imbalance intrinsic to the target problem of this paper. In the experiments with the real world data from one of the major domestic credit card companies, the suggested approach reveals the superior prediction accuracy to the traditional data mining approaches that use neural networks, decision trees or logistics regressions. SVM ensemble model learned from T2 training set shows the best prediction results among the alternatives considered and it is noteworthy that the performance of neural networks with T2 is better than that of SVM with T1. These results prove that the suggested approach is very effective for both SVM training and the classification problem of data imbalance.

Random Forest 분류기와 Bag-of-Feature 특징 히스토그램을 이용한 의료영상 자동 분류 및 검색 (Medical Image Classification and Retrieval Using BoF Feature Histogram with Random Forest Classifier)

  • 손정은;고병철;남재열
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권4호
    • /
    • pp.273-280
    • /
    • 2013
  • 본 논문에서는 의료영상의 특성을 반영하여 픽셀 그래디언트의 방향 값을 특징으로 하는 OCS-LBP (Oriented Center Symmetric Local Binary Patterns) 특징을 개발하고 BoF(Bag-of-Feature)와 Random Forest 분류기를 이용한 영상 검색 방법을 제안한다. 학습영상에서 추출된 특징 값은 code book 으로 군집화 되고, 각 영상들은 code book을 통해 의미 있는 새로운 차원인 BoF특징으로 변환된다. 이렇게 추출된 BoF특징은 Random Forest 분류기에 적용되고 학습된 분류기에 의해 유사한 특성을 갖는 N개의 클래스별로 분류되게 된다. 질의 영상이 입력되면 동일한 OCS-LBP특징이 추출되고 code book을 통해 BoF특징이 추출된다. 전통적인 내용기반 영상검색과는 다르게, 본 논문에서는 질의 영상에서 추출된 BoF특징이 학습된 Random Forest에 적용되어 가장 유사한 K-근접 이웃 (K-nearest neighbor) 클래스들을 선택하고 선택된 클래스들에 포함된 영상들에 대해서만 질의 영상과의 BoF 유사도 측정을 통해 최종 유사한 영상을 검색하게 된다. 실험결과에서 본 논문에서 제안하는 방법은 빠르고 우수한 검색 성능을 보여 주었다.

병원급식의 미생물적 품질보증을 위한 HACCP 전산프로그램의 개발 (The Development of a Computer-Assisted HACCP Program for the Microbiological Quality Assurance in Hospital Foodservice Operations)

  • 곽동경;류경;최성경
    • 한국식생활문화학회지
    • /
    • 제11권1호
    • /
    • pp.107-121
    • /
    • 1996
  • This study was carried out to develop the computer-assisted Hazard Analysis and Critical Control Point (HACCP) program for a systematic approach to the identification, assessment and control of hazards for foodservice manager to assure the microbiological quality of food in hospital foodservice operations. Sanitation practices were surveyed and analyzed in the dietetic department of 4 hospitals. Among them, one 762-bed general hospital was selected as standard model to develop computer-assisted HACCP program. All data base files and processing programs were created by using Foxpro package for easy access of HACCP concept. HACCP program was developed based on the methods suggested by NACMCF, IAMFES and Bryan. This program consisted of two parts: the pre-stage for HACCP study and the implementation stage of the HACCP system. 1. Pre-stage for HACCP study includes the selection of menu item, the development of the HACCP recipe, the construction of a product flow diagram, and printing the HACCP recipe and a product flow diagram. A menu item for HACCP study can be selected from the menu item lists classified by cooking methods. HACCP recipe includes ingredients, their amount and cooking procedure. A flow diagram is constructed based on the HACCP recipe. The HACCP recipe and a product flow diagram are printed out. 2. Implementation of HACCP study includes the identification of microbiological hazards, the determination of critical control points, the establishment of control methods of each hazard, and the complementation of data base file. Potentially hazardous ingredients are determined and microbiological hazards are identified in each phase of the product flow. Critical control points (CCPs) are identified by applying CCP decision trees for ingredients and each process stage. After hazards and CCPs are identified, criteria, monitoring system, corrective action plan, record-keeping system and verification methods are established. When the HACCP study is complemented, HACCP study result forms are printed out. HACCP data base file can be either added, corrected or deleted.

  • PDF

드론을 이용한 산림자원 정보관리를 위한 DB 설계 (Database Design for Management of Forest Resources using a Drone)

  • 오선진
    • 문화기술의 융합
    • /
    • 제5권3호
    • /
    • pp.251-256
    • /
    • 2019
  • 현대사회가 급속히 발전하면서 자연과 환경의 중요성에 대한 관심이 주요 이슈로 대두되고 있다. 특별히 최근 빠른 산업화로 극심한 환경오염과 미세먼지로 인한 사람들의 건강이 크게 위협을 받으면서 자연보호와 산림자원 관리에 대한 관심이 집중되고 있다. 하지만 잦은 화재나 풍수해 및 난개발 등으로 인해 소중한 산림자원이 제대로 관리 되지 못하고 헛되이 소실되어 지고 있는 실정이다. 이러한 문제를 효율적으로 해결하기 위해서는 산림자원의 체계적이고 과학적인 조성과 관리가 필요하며, 이를 위해 산림을 구성하는 나무 정보와 산의 지형 정보 및 생태계 정보를 아우르는 정확하고 구체적인 산림자원 정보 데이터베이스 구축이 절실히 요구된다. 본 연구는 드론 기술을 이용하여 촬영된 산림자원 이미지를 기반으로 특정 지역 위치기반 산림 자원의 생태에 대한 정보와 그 위치 지역의 지형 정보를 기반으로 효율적인 산림자원 관리와 벌목 대상이 되는 수목 의사결정 그리고 향후 조성할 산림 조림사업에 도움을 줄 수 있는 산림자원 정보 데이터베이스를 설계하고 구축하고자 한다.