• 제목/요약/키워드: Meta-Classification

검색결과 120건 처리시간 0.025초

다중 클래스 데이터셋의 메타특징이 판별 알고리즘의 성능에 미치는 영향 연구 (The Effect of Meta-Features of Multiclass Datasets on the Performance of Classification Algorithms)

  • 김정훈;김민용;권오병
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.23-45
    • /
    • 2020
  • 기업의 경쟁력 확보를 위해 판별 알고리즘을 활용한 의사결정 역량제고가 필요하다. 하지만 대부분 특정 문제영역에는 적합한 판별 알고리즘이 어떤 것인지에 대한 지식은 많지 않아 대부분 시행착오 형식으로 최적 알고리즘을 탐색한다. 즉, 데이터셋의 특성에 따라 어떠한 분류알고리즘을 채택하는 것이 적합한지를 판단하는 것은 전문성과 노력이 소요되는 과업이었다. 이는 메타특징(Meta-Feature)으로 불리는 데이터셋의 특성과 판별 알고리즘 성능과의 연관성에 대한 연구가 아직 충분히 이루어지지 않았기 때문이며, 더구나 다중 클래스(Multi-Class)의 특성을 반영하는 메타특징에 대한 연구 또한 거의 이루어진 바 없다. 이에 본 연구의 목적은 다중 클래스 데이터셋의 메타특징이 판별 알고리즘의 성능에 유의한 영향을 미치는지에 대한 실증 분석을 하는 것이다. 이를 위해 본 연구에서는 다중 클래스 데이터셋의 메타특징을 데이터셋의 구조와 데이터셋의 복잡도라는 두 요인으로 분류하고, 그 안에서 총 7가지 대표 메타특징을 선택하였다. 또한, 본 연구에서는 기존 연구에서 사용하던 IR(Imbalanced Ratio) 대신 시장집중도 측정 지표인 허핀달-허쉬만 지수(Herfindahl-Hirschman Index, HHI)를 메타특징에 포함하였으며, 역ReLU 실루엣 점수(Reverse ReLU Silhouette Score)도 새롭게 제안하였다. UCI Machine Learning Repository에서 제공하는 복수의 벤치마크 데이터셋으로 다양한 변환 데이터셋을 생성한 후에 대표적인 여러 판별 알고리즘에 적용하여 성능 비교 및 가설 검증을 수행하였다. 그 결과 대부분의 메타특징과 판별 성능 사이의 유의한 관련성이 확인되었으며, 일부 예외적인 부분에 대한 고찰을 하였다. 본 연구의 실험 결과는 향후 메타특징에 따른 분류알고리즘 추천 시스템에 활용할 것이다.

유전 알고리즘 기반 귀납적 학습 환경에서 다중 분류기 시스템의 구축을 위한 메타 학습법 (A Meta-learning Approach for Building Multi-classifier Systems in a GA-based Inductive Learning Environment)

  • 김영준;홍철의
    • 한국정보통신학회논문지
    • /
    • 제19권1호
    • /
    • pp.35-40
    • /
    • 2015
  • 본 논문은 유전 알고리즘 기반 귀납적 학습 환경 하에서 메타 학습법을 이용한 다중 분류기 시스템의 구축에 관한 것이다. 메타 학습법을 이용한 다중 분류기 시스템의 구축에서 분류기는 일반 분류기와 메타 분류기로 구성된다. 메타 분류기는 사례에 대한 일반 분류기의 분류 결과에 학습 알고리즘을 적용하여 얻어진다. 분류시스템의 의사 결정과정에서 메타 분류기의 역할은 일반 분류기의 분류 결과를 평가하여 최종 의사 결정 과정에의 참여 여부를 결정하는 것이다. 분류 시스템은 분류기의 분류 결과가 옳은 것으로 평가된 결과들만 취합하여 이를 바탕으로 최종 분류 결과를 도출해 낸다. 메타 학습법이 다중 분류기 시스템의 성능에 미치는 영향을 다수의 사례 집합을 이용하여 평가하였다.

골 성숙도 판별을 위한 심층 메타 학습 기반의 분류 문제 학습 방법 (Deep Meta Learning Based Classification Problem Learning Method for Skeletal Maturity Indication)

  • 민정원;강동중
    • 한국멀티미디어학회논문지
    • /
    • 제21권2호
    • /
    • pp.98-107
    • /
    • 2018
  • In this paper, we propose a method to classify the skeletal maturity with a small amount of hand wrist X-ray image using deep learning-based meta-learning. General deep-learning techniques require large amounts of data, but in many cases, these data sets are not available for practical application. Lack of learning data is usually solved through transfer learning using pre-trained models with large data sets. However, transfer learning performance may be degraded due to over fitting for unknown new task with small data, which results in poor generalization capability. In addition, medical images require high cost resources such as a professional manpower and mcuh time to obtain labeled data. Therefore, in this paper, we use meta-learning that can classify using only a small amount of new data by pre-trained models trained with various learning tasks. First, we train the meta-model by using a separate data set composed of various learning tasks. The network learns to classify the bone maturity using the bone maturity data composed of the radiographs of the wrist. Then, we compare the results of the classification using the conventional learning algorithm with the results of the meta learning by the same number of learning data sets.

A Meta-learning Approach that Learns the Bias of a Classifier

  • 김영준;홍철의;김윤호
    • 지능정보연구
    • /
    • 제3권2호
    • /
    • pp.83-91
    • /
    • 1997
  • DELVAUX is an inductive learning environment that learns Bayesian classification rules from a set o examples. In DELVAUX, a genetic a, pp.oach is employed to learn the best rule-set, in which a population consists of rule-sets and rule-sets generate offspring by exchanging some of their rules. We have explored a meta-learning a, pp.oach in the DELVAUX learning environment to improve the classification performance of the DELVAUX system. The meta-learning a, pp.oach learns the bias of a classifier so that it can evaluate the prediction made by the classifier for a given example and thereby improve the overall performance of a classifier system. The paper discusses the meta-learning a, pp.oach in details and presents some empirical results that show the improvement we can achieve with the meta-learning a, pp.oach.

  • PDF

A Comparison of Meta-learning and Transfer-learning for Few-shot Jamming Signal Classification

  • Jin, Mi-Hyun;Koo, Ddeo-Ol-Ra;Kim, Kang-Suk
    • Journal of Positioning, Navigation, and Timing
    • /
    • 제11권3호
    • /
    • pp.163-172
    • /
    • 2022
  • Typical anti-jamming technologies based on array antennas, Space Time Adaptive Process (STAP) & Space Frequency Adaptive Process (SFAP), are very effective algorithms to perform nulling and beamforming. However, it does not perform equally well for all types of jamming signals. If the anti-jamming algorithm is not optimized for each signal type, anti-jamming performance deteriorates and the operation stability of the system become worse by unnecessary computation. Therefore, jamming classification technique is required to obtain optimal anti-jamming performance. Machine learning, which has recently been in the spotlight, can be considered to classify jamming signal. In general, performing supervised learning for classification requires a huge amount of data and new learning for unfamiliar signal. In the case of jamming signal classification, it is difficult to obtain large amount of data because outdoor jamming signal reception environment is difficult to configure and the signal type of attacker is unknown. Therefore, this paper proposes few-shot jamming signal classification technique using meta-learning and transfer-learning to train the model using a small amount of data. A training dataset is constructed by anti-jamming algorithm input data within the GNSS receiver when jamming signals are applied. For meta-learning, Model-Agnostic Meta-Learning (MAML) algorithm with a general Convolution Neural Networks (CNN) model is used, and the same CNN model is used for transfer-learning. They are trained through episodic training using training datasets on developed our Python-based simulator. The results show both algorithms can be trained with less data and immediately respond to new signal types. Also, the performances of two algorithms are compared to determine which algorithm is more suitable for classifying jamming signals.

메타 태그를 이용한 자동 웹페이지 분류 시스템 (An Automatic Web Page Classification System Using Meta-Tag)

  • 김상일;김화성
    • 한국통신학회논문지
    • /
    • 제38B권4호
    • /
    • pp.291-297
    • /
    • 2013
  • 최근 월드 와이드 웹(World Wide Web)의 사용이 폭발적으로 증가함에 따라 다양한 정보를 포함하고 있는 웹 페이지들의 양도 엄청나게 증가 하였다. 따라서 웹상에 존재 하고 있는 웹페이지들에 대한 접근을 용이하게 하고, 그룹화를 통한 검색을 가능하게 하기 위해 웹 페이지 분류의 필요성이 대두 되고 있다. 웹 페이지 분류는 기존의 웹 상에 산재 되어 있는 웹페이지들을 비슷한 문서 유형 또는 같은 키워드를 사용하는 문서들의 묶음으로 구분하는 작업을 의미하며, 웹 페이지 분류 기술은 웹페이지 검색, 그룹 검색, 메일 필터링 등의 분야에 응용될 수 있는 기술이다. 하지만 웹상에 존재하는 웹페이지들을 사람이 수동적으로 분류하는 방법으로는 현재 월드 와이드 웹에 존재하는 엄청난 양의 웹페이지들을 처리할 수 없으며, 자동적인 분류 방법 역시 서로 다른 형태로 작성된 웹페이지들을 정확하게 분류할 수 없다는 문제로 인해 한계를 보이고 있다. 본 논문에서는 서로 다른 형태로 작성된 웹 문서들에 대한 부정확한 분류 문제를 해결하기위해 웹페이지에 존재하는 메타 정보를 획득하여 자동적으로 분류하는 메타 태그기반의 자동화된 웹페이지 분류 시스템을 제안하였다.

SVM과 meta-learning algorithm을 이용한 고지혈증 유병 예측모형 개발과 활용 (Development and application of prediction model of hyperlipidemia using SVM and meta-learning algorithm)

  • 이슬기;신택수
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.111-124
    • /
    • 2018
  • 본 연구는 만성질환 중의 하나인 고지혈증 유병을 예측하는 분류모형을 개발하고자 한다. 이를 위해 SVM과 meta-learning 알고리즘을 이용하여 성과를 비교하였다. 또한 각 알고리즘에서 성과를 향상시키기 위해 변수선정 방법을 통해 유의한 변수만을 선정하여 투입하여 분석하였고 이 결과 역시 각각 성과를 비교하였다. 본 연구목적을 달성하기 위해 한국의료패널 2012년 자료를 이용하였고, 변수 선정을 위해 세 가지 방법을 사용하였다. 먼저 단계적 회귀분석(stepwise regression)을 실시하였다. 둘째, 의사결정나무(decision tree) 알고리즘을 사용하였다. 마지막으로 유전자 알고리즘을 사용하여 변수를 선정하였다. 한편, 이렇게 선정된 변수를 기준으로 SVM, meta-learning 알고리즘 등을 이용하여 고지혈증 환자분류 예측모형을 비교하였고, TP rate, precision 등을 사용하여 분류 성과를 비교분석하였다. 이에 대한 분석결과는 다음과 같다. 첫째, 모든 변수를 투입하여 분류한 결과 SVM의 정확도는 88.4%, 인공신경망의 정확도는 86.7%로 SVM의 정확도가 좀 더 높았다. 둘째, stepwise를 통해 선정된 변수만을 투입하여 분류한 결과 전체 변수를 투입하였을 때보다 각각 정확도가 약간 높았다. 셋째, 의사결정나무에 의해 선정된 변수 3개만을 투입하였을 때 인공신경망의 정확도가 SVM보다 높았다. 유전자 알고리즘을 통해 선정된 변수를 투입하여 분류한 결과 SVM은 88.5%, 인공신경망은 87.9%의 분류 정확도를 보여 주었다. 마지막으로, 본 연구에서 제안하는 meta-learning 알고리즘인 스태킹(stacking)을 적용한 결과로서, SVM과 MLP의 예측결과를 메타 분류기인 SVM의 입력변수로 사용하여 예측한 결과, 고지혈증 분류 정확도가 meta-learning 알고리즘 중에서는 가장 높은 것으로 나타났다.

직업성 전자장 노출과 백혈병 발생에 관한 메타분석 (Relationship between Occupational Electromagnetic Field Exposure and Leukemia : A Meta-Analysis)

  • 김윤신;송혜향;홍승철;조용성
    • Journal of Preventive Medicine and Public Health
    • /
    • 제33권1호
    • /
    • pp.125-133
    • /
    • 2000
  • Objectives : This study uses meta-analysis methodology to examine the statistical consistency and importance of random variation among results of epidemiologic studies of occupational electromagnetic field exposure and leukemia. Methods : Studies for this meta-analysis were identified from previous reviews and by asking researcher active in this field for recommendations. Overall, 27 studies of occupational electromagnetic field exposures and leukemia were reviewed. A variety of meta-analysis statistical methods have been used to assess combined effects, to identify heterogeneity, and to provide a single summary risk estimate based on a set of simiar epidemiologic studies. In this study, classification of exposure metircs on occupational epidemiologic studies are reported for (1) job classification (20 individual studies); (2) leukemia subtypes (13 individual studies); and (3) country (27 individual studies). Results : Results of this study, an inverse-variance weighted pooling of all the data leads to a small but significant elevation in risk of f 1% (OR=1.11, 95% CI : $1.06\sim1.16$) among 27 occupational epidemiologic studies. Publication bias was assessed by the 'fail-safe n' that may be not influence for all combined results exception a few categories, ie, 'power station operators' and 'electric utility workers' by job classification on occupational study. And ail combined odds ratio results were similar for fixed-effects models and random-effects models, with slightly higher risk estimates for the random-effects model in situations where there was significant heterogeneity, ie, Q-statistic significant (p<.05). Conclusions : We found a small elevation in risk of leukemia, but the ubiquitous nature of exposure to electromagnetic fields from workplace makes even a weak association a public health issue of substantial power to influence the present overall conclusion about relationship between electromagnetic fields exposure and leukemia.

  • PDF

해양 전자정보자원 메타 데이터베이스 시스템 설계 및 구현방안에 관한 연구 (A Study on Planning & Implementation of the Meta Database System for Ocean Electronic Resources)

  • 한종엽
    • 한국도서관정보학회지
    • /
    • 제33권2호
    • /
    • pp.109-137
    • /
    • 2002
  • 해양 전자정보자원 메타 데이터베이스 시스템 설계 및 구현을 위해 국내외 관련 연구를 조사하고 분석하였다. 연구대상은 해양분야 웹 자원에서 해양조사자료가지를 범위로 하였다. 본 연구의 목적은 네트워크 자원의 기술에 적합한 더블린코어를 기반으로 효율적인 해양분야 전자정보자원 정보검색서비스를 제공하는데 있다. 본 논문에서는 해양분야 전자정보원 조사, 메타데이터 기술요소 분석, 베타데이터 분류체계, 시스템 구성 및 검색 구현방안의 연구를 수행하였다.

  • PDF

패턴 정보를 이용한 설계패턴 검색 시스템 구축 (Construction of Design Pattern Retrieval System using Pattern Information)

  • 김귀정;송영재
    • 정보처리학회논문지D
    • /
    • 제8D권1호
    • /
    • pp.88-98
    • /
    • 2001
  • 본 연구는 설계패턴의 효율적인 관리와 재사용을 위하여 패턴 정보를 이용한 설계패턴 검색 시스템을 구축하였다. 패턴 정보는 패턴 속성정보와 패턴 메타정보로 구성하였고, 패턴 속성정보는 패턴 패싯 분류와 패턴 검색을 위한 유사도 측정에 이용되며, 패턴 구조를 UML로 모델링하기 위하여 패턴 메타 정보를 이용하였다. Gamma 분류 방법을 확장하여 각 설계패턴이 사용될 수 있는 여러 경험적 상황을 패싯 항목으로 설정하고 패턴 정보로 관리하였다. 또한 E-SARM 검색 방법을 사용하여 검색된 패턴은 메타정보를 이용하여 UML 클래스 다이어그램으로 나타낼 수 있도록 하였고, E-SARM을 설계패턴의 검색에 적용하여 최적의 결과를 얻을 수 있는 환경을 시뮬레이션 하였다. 패턴 뷰어를 통한 신규 패턴 등록이 가능하며, 등록된 패턴은 패턴 속성정보와 메타정보로 관리된다. 따라서 본 시스템은 효율적인 패턴 관리가 가능하고, UML 모델링을 지원하며, 관련 패턴의 우선순위 검색이 가능하여 패턴 선택 비용이 적고, 재사용성이 높은 설계패턴 검색 시스템이다.

  • PDF