• 제목/요약/키워드: classification model

검색결과 4,101건 처리시간 0.028초

기계학습 기반 철근콘크리트 기둥에 대한 신속 파괴유형 예측 모델 개발 연구 (Machine Learning-Based Rapid Prediction Method of Failure Mode for Reinforced Concrete Column)

  • 김수빈;오근영;신지욱
    • 한국지진공학회논문집
    • /
    • 제28권2호
    • /
    • pp.113-119
    • /
    • 2024
  • Existing reinforced concrete buildings with seismically deficient column details affect the overall behavior depending on the failure type of column. This study aims to develop and validate a machine learning-based prediction model for the column failure modes (shear, flexure-shear, and flexure failure modes). For this purpose, artificial neural network (ANN), K-nearest neighbor (KNN), decision tree (DT), and random forest (RF) models were used, considering previously collected experimental data. Using four machine learning methodologies, we developed a classification learning model that can predict the column failure modes in terms of the input variables using concrete compressive strength, steel yield strength, axial load ratio, height-to-dept aspect ratio, longitudinal reinforcement ratio, and transverse reinforcement ratio. The performance of each machine learning model was compared and verified by calculating accuracy, precision, recall, F1-Score, and ROC. Based on the performance measurements of the classification model, the RF model represents the highest average value of the classification model performance measurements among the considered learning methods, and it can conservatively predict the shear failure mode. Thus, the RF model can rapidly predict the column failure modes with simple column details.

앙상블 딥러닝을 이용한 초음파 영상의 간병변증 분류 알고리즘 (Classification Algorithm for Liver Lesions of Ultrasound Images using Ensemble Deep Learning)

  • 조영복
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권4호
    • /
    • pp.101-106
    • /
    • 2020
  • 현재 의료 현장에서 초음파 진단은 과거 청진기와 같다고 할 수 있다. 그러나 초음파의 특성상 검사자의 숙련도에 따라 결과 예측이 불확실하다는 단점을 가진다. 따라서 본 논문에서는 이런 문제를 해결하기 위해 딥러닝 기술을 기반으로 초음파 검사 중 간병변 탐지의 정확도를 높이고자 한다. 제안 논문에서는 CNN 모델과 앙상블 모델을 이용해 병변 분류의 정확도 비교 실험하였다. 실험결과 CNN 모델에서 분류 정확도는 평균 82.33%에서 앙상블모델의 경우 평균 89.9%로 약 7% 높은 것을 확인하였다. 또한 앙상블 모델이 평균 ROC커브에서도 0.97로 CNN모델보다 약 0.4정도 높은 것을 확인하였다.

Classification models for chemotherapy recommendation using LGBM for the patients with colorectal cancer

  • Oh, Seo-Hyun;Baek, Jeong-Heum;Kang, Un-Gu
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권7호
    • /
    • pp.9-17
    • /
    • 2021
  • 본 연구는 대장암 환자의 치료방법 중 하나인 항암화학요법을 분류할 수 있는 시스템인 CDSS연구의 일환으로 시행되었다. 대장암 치료에서 환자의 상태에 맞는 항암화학요법의 선택은 환자의 생존 기간과 직결되기 때문에 매우 중요하다. 따라서 본 연구에서는 대장암 환자의 개인적, 병리학적 특성을 사용해 기저 모델, 병리학적 모델, 그리고 환자의 두 가지 특성을 모두 사용한 결합 모델을 만들어 머신러닝 알고리즘으로 항암화학요법을 분류하였다. Top-n Accuracy와 ROC 곡선, AUC로 모델의 예측 정확도를 비교한 결과, 결합 모델에서 가장 우수한 예측 정확도를 보였으며, LGBM 알고리즘의 성능이 가장 우수한 것을 알 수 있었다. 본 연구에서는 머신러닝 알고리즘을 이용해 환자 특성별 모델을 분류함으로써 환자의 상태에 맞는 항암화학요법 분류 모델을 구축하였다. 향후 연구에서 본 연구 결과를 기초한다면 더 좋은 성능의 항암화학요법 분류 모델을 만들어 CDSS 연구에 도움이 될 것이다.

Robust Face Recognition under Limited Training Sample Scenario using Linear Representation

  • Iqbal, Omer;Jadoon, Waqas;ur Rehman, Zia;Khan, Fiaz Gul;Nazir, Babar;Khan, Iftikhar Ahmed
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권7호
    • /
    • pp.3172-3193
    • /
    • 2018
  • Recently, several studies have shown that linear representation based approaches are very effective and efficient for image classification. One of these linear-representation-based approaches is the Collaborative representation (CR) method. The existing algorithms based on CR have two major problems that degrade their classification performance. First problem arises due to the limited number of available training samples. The large variations, caused by illumintion and expression changes, among query and training samples leads to poor classification performance. Second problem occurs when an image is partially noised (contiguous occlusion), as some part of the given image become corrupt the classification performance also degrades. We aim to extend the collaborative representation framework under limited training samples face recognition problem. Our proposed solution will generate virtual samples and intra-class variations from training data to model the variations effectively between query and training samples. For robust classification, the image patches have been utilized to compute representation to address partial occlusion as it leads to more accurate classification results. The proposed method computes representation based on local regions in the images as opposed to CR, which computes representation based on global solution involving entire images. Furthermore, the proposed solution also integrates the locality structure into CR, using Euclidian distance between the query and training samples. Intuitively, if the query sample can be represented by selecting its nearest neighbours, lie on a same linear subspace then the resulting representation will be more discriminate and accurately classify the query sample. Hence our proposed framework model the limited sample face recognition problem into sufficient training samples problem using virtual samples and intra-class variations, generated from training samples that will result in improved classification accuracy as evident from experimental results. Moreover, it compute representation based on local image patches for robust classification and is expected to greatly increase the classification performance for face recognition task.

건설기록물 분류체계 모형에 관한 연구 (A Study on the Model for Construction Records Classification System)

  • 박용부;김태수
    • 정보관리학회지
    • /
    • 제28권3호
    • /
    • pp.83-101
    • /
    • 2011
  • 국제 표준인 ISO 15489와 관련코드에 따르면 공공조직이든 민간조직이든지를 막론하고 안정적인 기록물 분류체계를 구현하게 하는 기능 분류 사용을 권고하고 있다. 기업에서도 이를 따라 업무 수행 기록물을 분류 축적하여 검색 활용할 수 있는 체계를 구축하는 것은 기업 성장을 위해서 중요하다. 따라서 기업의 기록물 분류체계 개발에 적용할 수 있는 분류기준이나 개발 방법론 연구 및 모형의 연구가 반드시 필요하다. 본 연구에서는 우리나라 대기업 3개 회사와 중소기업 4개 회사 등 총 7개의 종합건설기업의 기록물 분류체계 사례연구를 통하여 분류체계의 내용을 비교 분석하였다. 사례연구를 통하여 도출한 분류원칙을 정리 종합하여 핵심적인 건설기록물 분류기준을 제시하고, 건설기록물 분류체계 모형을 도출하기 위하여 대기업 사례기업의 본사조직 및 프로젝트조직의 대분류 및 중분류 항목 구성을 상호 비교하면서 표준적인 본사조직 및 프로젝트조직 기록물 분류 항목을 도출하는 과정을 기술하고 그 결과로 개발된 건설기록물 분류체계 모형을 제시하였다.

A Computational Approach for the Classification of Protein Tyrosine Kinases

  • Park, Hyun-Chul;Eo, Hae-Seok;Kim, Won
    • Molecules and Cells
    • /
    • 제28권3호
    • /
    • pp.195-200
    • /
    • 2009
  • Protein tyrosine kinases (PTKs) play a central role in the modulation of a wide variety of cellular events such as differentiation, proliferation and metabolism, and their unregulated activation can lead to various diseases including cancer and diabetes. PTKs represent a diverse family of proteins including both receptor tyrosine kinases (RTKs) and non-receptor tyrosine kinases (NRTKs). Due to the diversity and important cellular roles of PTKs, accurate classification methods are required to better understand and differentiate different PTKs. In addition, PTKs have become important targets for drugs, providing a further need to develop novel methods to accurately classify this set of important biological molecules. Here, we introduce a novel statistical model for the classification of PTKs that is based on their structural features. The approach allows for both the recognition of PTKs and the classification of RTKs into their subfamilies. This novel approach had an overall accuracy of 98.5% for the identification of PTKs, and 99.3% for the classification of RTKs.

용어관계의 분류 모형 개발에 관한 연구 (A Study on the Development of a Classification Model for Terminological Relationships)

  • 백지원;정연경
    • 정보관리학회지
    • /
    • 제23권1호
    • /
    • pp.63-81
    • /
    • 2006
  • 본 연구는 모든 지식조직체계의 근간인 용어관계가 동일성, 계층성, 연관성이라는 세 가지 포괄적인 기준에 의해 정의되어 사용됨으로써 정보의 정확성이 중시되는 오늘날의 정보 환경에서 제 기능을 다하지 못하고 있으므로, 그 해결 방안의 하나로 용어관계의 분류 모형을 제시하고자 하는데 목적이 있다. 이를 위해 기존의 여러 지식조직체계에 나타나는 각종 용어관계의 사례와 용어관계에 대한 이론적 연구들을 광범위하게 수집하여 다양한 용어관계의 유형을 파악하였다. 그리고 이를 바탕으로 용어관계를 명확하게 정의하고 범주화할 수 있는 용어관계 분류의 근거를 세우고 용어관계의 분류 모형을 개발하였다. 더 나아가 이 분류 모형을 정보검색을 비롯한 다양한 방면에 활용할 수 있는 방안을 모색하고 향후 용어관계 분류 연구에 대한 제언을 했다.

은닉 마코프 모델을 이용한 정신질환자의 뇌파 판별 (The Classification of the Schizophrenia EEG Signal using Hidden Markov Model)

  • 이경일;김필운;조진호;김명남
    • 대한의용생체공학회:의공학회지
    • /
    • 제25권3호
    • /
    • pp.217-225
    • /
    • 2004
  • 본 논문에서는 은닉 마코프 모델을 이용하여 정상인과 정신분열증 환자의 뇌파에 대한 새로운 자동 판별 방법을 제안하였다. 특징 파라미터로는 통계적 정상구간에 대한 분산과 알파파, 베타파, 세타파의 전력비를 이용하였다. 실험 결과, 정상인의 경우에는 90.9%, 정신분열증 환자의 경우에는 90.5%의 높은 판별 정확성을 보였으며 이는 제안한 시스템이 복잡한 신호처리과정을 이용하는 시스템보다 효과적임을 알 수 있다. 따라서, 은닉 마코프 모델이 뇌파와 같은 복잡한 생체신호의 분석과 판별에 사용될 수 있으며 제안한 방법이 임상적인 전단에 상당한 도움이 될 것으로 기대된다.

그래프 구조를 이용한 악성 댓글 분류 시스템 설계 및 구현 (Design and implementation of malicious comment classification system using graph structure)

  • 성지석;임희석
    • 한국융합학회논문지
    • /
    • 제11권6호
    • /
    • pp.23-28
    • /
    • 2020
  • 인터넷상의 소통을 위해 댓글 시스템은 필수적이다. 하지만 온라인상의 익명성을 악용하여 타인에 대한 부적절한 표현 등의 악성 댓글 또한 존재한다. 악성 댓글로부터 사용자를 보호하기 위해 악성/정상 댓글의 분류가 필요하고 이는 텍스트 분류로 구현할 수 있다. 자연어 처리에서 텍스트 분류는 중요한 주제 중 하나이고 최근 BERT 등 pretrained model을 활용한 연구와 GCN, GAT 등의 그래프 구조를 활용한 연구가 활발히 진행되고 있다. 본 연구에서는 실제 공개된 댓글에 대해 BERT, GCN, GAT 을 활용하여 댓글 분류 시스템을 구현하고 성능을 비교하였다. 본 연구에서는 그래프 기반 모델을 사용한 시스템이 BERT 대비 높은 성능을 보여주었다.

벌점 부분최소자승법을 이용한 분류방법 (A new classification method using penalized partial least squares)

  • 김윤대;전치혁;이혜선
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권5호
    • /
    • pp.931-940
    • /
    • 2011
  • 분류분석은 학습표본으로부터 분류규칙을 도출한 후 새로운 표본에 적용하여 특정 범주로 분류하는 방법이다. 데이터의 복잡성에 따라 다양한 분류분석 방법이 개발되어 왔지만, 데이터 차원이 높고 변수간 상관성이 높은 경우 정확하게 분류하는 것은 쉽지 않다. 본 연구에서는 데이터차원이 상대적으로 높고 변수간 상관성이 높을 때 강건한 분류방법을 제안하고자 한다. 부분최소자승법은 연속형데이터에 사용되는 기법으로서 고차원이면서 독립변수간 상관성이 높을 때 예측력이 높은 통계기법으로 알려져 있는 다변량 분석기법이다. 벌점 부분최소자승법을 이용한 분류방법을 실제데이터와 시뮬레이션을 적용하여 성능을 비교하고자 한다.