• 제목/요약/키워드: one class classification

검색결과 348건 처리시간 0.038초

다중 레이블 분류의 정확도 향상을 위한 스킵 연결 오토인코더 기반 레이블 임베딩 방법론 (Label Embedding for Improving Classification Accuracy UsingAutoEncoderwithSkip-Connections)

  • 김무성;김남규
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.175-197
    • /
    • 2021
  • 최근 딥 러닝 기술의 발전으로 뉴스, 블로그 등 다양한 문서에 포함된 텍스트 분석에 딥 러닝 기술을 활용하는 연구가 활발하게 수행되고 있다. 다양한 텍스트 분석 응용 가운데, 텍스트 분류는 학계와 업계에서 가장 많이 활용되는 대표적인 기술이다. 텍스트 분류의 활용 예로는 정답 레이블이 하나만 존재하는 이진 클래스 분류와 다중 클래스 분류, 그리고 정답 레이블이 여러 개 존재하는 다중 레이블 분류 등이 있다. 특히, 다중 레이블 분류는 여러 개의 정답 레이블이 존재한다는 특성 때문에 일반적인 분류와는 상이한 학습 방법이 요구된다. 또한, 다중 레이블 분류 문제는 레이블과 클래스의 개수가 증가할수록 예측의 난이도가 상승한다는 측면에서 데이터 과학 분야의 난제로 여겨지고 있다. 따라서 이를 해결하기 위해 다수의 레이블을 압축한 후 압축된 레이블을 예측하고, 예측된 압축 레이블을 원래 레이블로 복원하는 레이블 임베딩이 많이 활용되고 있다. 대표적으로 딥 러닝 모델인 오토인코더 기반 레이블 임베딩이 이러한 목적으로 사용되고 있지만, 이러한 기법은 클래스의 수가 무수히 많은 고차원 레이블 공간을 저차원 잠재 레이블 공간으로 압축할 때 많은 정보 손실을 야기한다는 한계가 있다. 이에 본 연구에서는 오토인코더의 인코더와 디코더 각각에 스킵 연결을 추가하여, 고차원 레이블 공간의 압축 과정에서 정보 손실을 최소화할 수 있는 레이블 임베딩 방법을 제안한다. 또한 학술연구정보서비스인 'RISS'에서 수집한 학술논문 4,675건에 대해 각 논문의 초록으로부터 해당 논문의 다중 키워드를 예측하는 실험을 수행한 결과, 제안 방법론이 기존의 일반 오토인코더 기반 레이블 임베딩 기법에 비해 정확도, 정밀도, 재현율, 그리고 F1 점수 등 모든 측면에서 우수한 성능을 나타냄을 확인하였다.

스탠포드 감성 트리 말뭉치를 이용한 감성 분류 시스템 (Sentiment Analysis System Using Stanford Sentiment Treebank)

  • 이성욱
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제39권3호
    • /
    • pp.274-279
    • /
    • 2015
  • 본 연구는 스탠포드 감성 트리 말뭉치를 이용하여 감성 분류 시스템을 구현하였으며, 분류기로는 지지벡터기계(Support Vector Machines)를 이용하여 긍정, 중립, 부정 등의 3가지 감성으로 분류하였다. 먼저 감성 문장의 품사를 부착한 후 의존구조를 부착하였다. 트리 말뭉치의 모든 노드와 감성 태그를 자동으로 추출하여 문장 레벨의 지지벡터 분류 시스템과 노드 레벨의 지지벡터 분류 시스템을 각각 구현하였다. 자질로는 어휘, 품사, 감성어휘, 의존관계, 형제관계 등 다양한 자질의 조합을 이용하였다. 평가 말뭉치를 이용하여 3클래스로 분류한 결과, 노드 단위에서는 74.2%, 문장 단위에서는 67.0%의 정확도를 얻었으나 2클래스 분류에서는 현재 알려진 최고의 시스템에 어느 정도 필적하는 성능을 거두었다.

중복판막이식: 23 치험예 (Double Valve Replacement: A Report of 23 Cases)

  • 김용진
    • Journal of Chest Surgery
    • /
    • 제11권4호
    • /
    • pp.535-540
    • /
    • 1978
  • Between January 1974 and November 1978, 23 cases of double valve replacement were done in the Department of Thoracic Surgery, Seoul National university Hospital. All had symptoms of rheumatic valvular heart disease and belonged to functional class III or IV according to NYHA classification. Among 23 cases, mitral and aortic valves were replaced in 14, and mitral and tricuspid valves in 9 cases. Six operative deaths [26%] and 4 late deaths [23%] were found. In the former group 5 and in latter one operative death were noted. Main cause of operative death was low cardiac output syndrome due to myocardial failure. Among 4 late deaths, 2 were caused by thromboembolism, one by bacterial endocarditis, and one by arrhythmia.

  • PDF

현대 산업 사회에 있어서 40대 중산층 주부가 지각한 가정 생활의 제 문제 (A Study on the Family Life Issues Percieved by the Middle-Class Housewives in Modern Industrial Society)

  • 옥선화
    • 대한가정학회지
    • /
    • 제29권2호
    • /
    • pp.135-154
    • /
    • 1991
  • The purposes of this study are: 1) To find out overall family life issues percieved by the middle-classhousewives in their forties. 2) To examine detailed aspects related to middle years crises, leisure activities, children issues, family economy issues, and housing issues. 3) To clarify solutions to, and provide basic data on family issues raised by the middle-class families. The middle-class housewives in their forties living in the Seoul area were the subject of the survey. The sample size analysed in this study was 422. Data were analysed by the frequency, mean, percentile, standard deviation, X2-test, analysis of variance, multiple classification analysis, analysis of multiple regression, and Scheffe-test as a post-hoc analysis. The conclusions are as follows: First, the middle-class housewives tend to give more importance on children issues, especially on academic achievement and career development. Second, family cohesion of middle-class families is comparatively high and intra-familial conflict is low, and middle years crisis of housewives is comparatively low, too. Third, the stability of middle-class families can be found in household economic management patterns. one fourth of the families own stocks and two fifths of the families own real estate except their own dwelling house. Be based on their property income add to their labor income, middle-class families are showed their economic stability, however, intra-class inequality is found, too. Fourth, the great part of middle-class families that possess their own house, tend to be unsatisfied with their housig scale, and a half of the families expect to enlarge their housing scale for more comfortable and convient living.

  • PDF

Application of Deep Learning to the Forecast of Flare Classification and Occurrence using SOHO MDI data

  • Park, Eunsu;Moon, Yong-Jae;Kim, Taeyoung
    • 천문학회보
    • /
    • 제42권2호
    • /
    • pp.60.2-61
    • /
    • 2017
  • A Convolutional Neural Network(CNN) is one of the well-known deep-learning methods in image processing and computer vision area. In this study, we apply CNN to two kinds of flare forecasting models: flare classification and occurrence. For this, we consider several pre-trained models (e.g., AlexNet, GoogLeNet, and ResNet) and customize them by changing several options such as the number of layers, activation function, and optimizer. Our inputs are the same number of SOHO)/MDI images for each flare class (None, C, M and X) at 00:00 UT from Jan 1996 to Dec 2010 (total 1600 images). Outputs are the results of daily flare forecasting for flare class and occurrence. We build, train, and test the models on TensorFlow, which is well-known machine learning software library developed by Google. Our major results from this study are as follows. First, most of the models have accuracies more than 0.7. Second, ResNet developed by Microsoft has the best accuracies : 0.77 for flare classification and 0.83 for flare occurrence. Third, the accuracies of these models vary greatly with changing parameters. We discuss several possibilities to improve the models.

  • PDF

레이블 멱집합 분류와 다중클래스 확률추정을 사용한 단백질 세포내 위치 예측 (Prediction of Protein Subcellular Localization using Label Power-set Classification and Multi-class Probability Estimates)

  • 지상문
    • 한국정보통신학회논문지
    • /
    • 제18권10호
    • /
    • pp.2562-2570
    • /
    • 2014
  • 단백질의 기능을 유추할 수 있는 중요한 정보중의 하나는 단백질이 존재하는 세포내 위치이다. 최근에는 하나의 단백질이 동시에 존재하는 여러 세포내 위치를 예측하는 연구가 활발하다. 본 논문에서는 단백질이 존재하는 세포내의 다중위치를 예측하기 위해서 레이블 멱집합 방법을 개선한다. 레이블 멱집합 방법으로 분류한 다중위치들을 예측 확률에 따라 결합하여 최종적인 다중레이블로 분류한다. 각 다중위치에 대한 정확한 확률적 기여를 구하기 위하여 쌍별 비교와 오류정정 출력코드를 사용한 다중클래스 확률추정 방법을 적용하였다. 단백질 세포내 위치 예측 실험에 제안한 방법을 적용하여 성능이 향상됨을 보였다.

지지벡터기계를 이용한 단어 의미 분류 (Word Sense Classification Using Support Vector Machines)

  • 박준혁;이성욱
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권11호
    • /
    • pp.563-568
    • /
    • 2016
  • 단어 의미 분별 문제는 문장에서 어떤 단어가 사전에 가지고 있는 여러 가지 의미 중 정확한 의미를 파악하는 문제이다. 우리는 이 문제를 다중 클래스 분류 문제로 간주하고 지지벡터기계를 이용하여 분류한다. 세종 의미 부착 말뭉치에서 추출한 의미 중의성 단어의 문맥 단어를 두 가지 벡터 공간에 표현한다. 첫 번째는 문맥 단어들로 이뤄진 벡터 공간이고 이진 가중치를 사용한다. 두 번째는 문맥 단어의 윈도우 크기에 따라 문맥 단어를 단어 임베딩 모델로 사상한 벡터 공간이다. 실험결과, 문맥 단어 벡터를 사용하였을 때 약 87.0%, 단어 임베딩을 사용하였을 때 약 86.0%의 정확도를 얻었다.

머신러닝을 활용한 냉간압조용 선재의 다중 분류 및 지능형 매칭 시스템 개발 (Developing a Multiclass Classification and Intelligent Matching System for Cold Rolled Steel Wire using Machine Learning)

  • 이근원;이동건;권영준;조기훈;박성수;조기섭
    • 열처리공학회지
    • /
    • 제36권2호
    • /
    • pp.69-76
    • /
    • 2023
  • In this study, we present a system for identifying equivalent grades of standardized wire rod steel based on alloy composition using machine learning techniques. The system comprises two models, one based on a supervised multi-class classification algorithm and the other based on unsupervised autoencoder algorithm. Our evaluation showed that the supervised model exhibited superior performance in terms of prediction stability and reliability of prediction results. This system provides a useful tool for non-experts seeking similar grades of steel based on alloy composition.

Half-Against-Half Multi-class SVM Classify Physiological Response-based Emotion Recognition

  • ;고광은;박승민;심귀보
    • 한국지능시스템학회논문지
    • /
    • 제23권3호
    • /
    • pp.262-267
    • /
    • 2013
  • The recognition of human emotional state is one of the most important components for efficient human-human and human- computer interaction. In this paper, four emotions such as fear, disgust, joy, and neutral was a main problem of classifying emotion recognition and an approach of visual-stimuli for eliciting emotion based on physiological signals of skin conductance (SC), skin temperature (SKT), and blood volume pulse (BVP) was used to design the experiment. In order to reach the goal of solving this problem, half-against-half (HAH) multi-class support vector machine (SVM) with Gaussian radial basis function (RBF) kernel was proposed showing the effective techniques to improve the accuracy rate of emotion classification. The experimental results proved that the proposed was an efficient method for solving the emotion recognition problems with the accuracy rate of 90% of neutral, 86.67% of joy, 85% of disgust, and 80% of fear.

Performance of Random Forest Classifier for Flood Mapping Using Sentinel-1 SAR Images

  • Chu, Yongjae;Lee, Hoonyol
    • 대한원격탐사학회지
    • /
    • 제38권4호
    • /
    • pp.375-386
    • /
    • 2022
  • The city of Khartoum, the capital of Sudan, was heavily damaged by the flood of the Nile in 2020. Classification using satellite images can define the damaged area and help emergency response. As Synthetic Aperture Radar (SAR) uses microwave that can penetrate cloud, it is suitable to use in the flood study. In this study, Random Forest classifier, one of the supervised classification algorithms, was applied to the flood event in Khartoum with various sizes of the training dataset and number of images using Sentinel-1 SAR. To create a training dataset, we used unsupervised classification and visual inspection. Firstly, Random Forest was performed by reducing the size of each class of the training dataset, but no notable difference was found. Next, we performed Random Forest with various number of images. Accuracy became better as the number of images in creased, but converged to a maximum value when the dataset covers the duration from flood to the completion of drainage.