• 제목/요약/키워드: ensemble average

검색결과 140건 처리시간 0.021초

신용카드 불법현금융통 적발을 위한 축소된 앙상블 모형 (Illegal Cash Accommodation Detection Modeling Using Ensemble Size Reduction)

  • 이화경;한상범;지원철
    • 지능정보연구
    • /
    • 제16권1호
    • /
    • pp.93-116
    • /
    • 2010
  • 불법현금융통 적발모형 개발에 앙상블 접근방법을 사용하였다. 불법현금융통은 국내 신용카드사의 손익에 영향을 미치며 최근 국제화되고 있음에도 불구하고 학문적인 접근이 이루어지지 않았다. 부정행위 적발모형(Fraud Detection Model, FDM)은 데이터 불균형 문제로 인하여 좋은 성능을 얻기 어려운데, 다수의 모형을 결합하는 앙상블이 대안으로 제시되어 왔다. 앙상블에 포함된 모형들의 다양성이 보장된다면 단일모형에 비해 더 좋은 성능을 보인다는 점은 이미 인정되고 있으며, 최근 연구 결과는 학습된 모든 기본모형들을 사용하는 것보다 적절한 기본모형들만 선택하여 앙상블에 포함시키는 것이 바람직하다는 것이다. 본 논문에서는 효과적인 불법현금융통 적발을 위하여 축소된 앙상블 기법을 사용하는데, 정확성과 다양성 척도를 사용하여 앙상블에 참여할 기본모형을 선택하는 것이다. 다양성은 앙상블을 구성하는 기본모형들 사이의 불일치 (Disagreement or Ambiguity)를 의미하는데, FDM에 내재된 데이터 불균형문제를 고려하여 두 가지 측면에 중점을 두었다. 첫째, 학습 자료의 추출 과정에서 다양성을 확보하기 위한 소수 범주의 과잉추출 방법과 적절한 훈련 방법에 대해 설명하였다. 둘째, 소수범주에 초점을 맞추어 기존의 다양성 척도를 효과적인 척도로 변형시키고, 전진추가법과 후진소거법의 동적 다양성 계산법을 도입하여 앙상블에 참여할 기본모형을 평가하였다. 실험에 사용된 학습 알고리즘은 신경망, 의사결정수와 로짓 회귀분석이었으며, 동질적 앙상블과 이질적 앙상블을 구성하여 성능평가를 하였다. 실험결과 불법현금융통 적발모형에 있어 축소된 앙상블은 모든 기본모형이 포함된 앙상블과 성능 차이가 없었다. 축소된 앙상블은 앙상블 구성의 복잡성을 감소시키고 구현을 용이하게 한다는 점에서 FDM에서도 유력한 모형 수립 접근방법이 될 수 있음을 보였다.

Asymmetric Semi-Supervised Boosting Scheme for Interactive Image Retrieval

  • Wu, Jun;Lu, Ming-Yu
    • ETRI Journal
    • /
    • 제32권5호
    • /
    • pp.766-773
    • /
    • 2010
  • Support vector machine (SVM) active learning plays a key role in the interactive content-based image retrieval (CBIR) community. However, the regular SVM active learning is challenged by what we call "the small example problem" and "the asymmetric distribution problem." This paper attempts to integrate the merits of semi-supervised learning, ensemble learning, and active learning into the interactive CBIR. Concretely, unlabeled images are exploited to facilitate boosting by helping augment the diversity among base SVM classifiers, and then the learned ensemble model is used to identify the most informative images for active learning. In particular, a bias-weighting mechanism is developed to guide the ensemble model to pay more attention on positive images than negative images. Experiments on 5000 Corel images show that the proposed method yields better retrieval performance by an amount of 0.16 in mean average precision compared to regular SVM active learning, which is more effective than some existing improved variants of SVM active learning.

쇄파대의 저질부유에 관한 현지관측 (Field observation of sediment suspension in the surf zone)

  • 신승호;율산서소
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2003년도 춘계공동학술대회논문집
    • /
    • pp.141-146
    • /
    • 2003
  • 저질의 부유 현상이 일련의 쇄파라고 하는 파동 현상에 어떠한 형태로 연동하는가를 면밀히 조사하기 위하여 현지해안의 쇄파대내에 주 관측지점을 설치하고 부유사 농도와 유속, 수위변동 등의 관련 파랑 제원을 계측하였다. 분석을 위해 수위변동, 유속변동치의 부유사농도에 대한 상관관계를 조사하였으며, 상관이 탁월한 주기대에 대한 ensemble 평균 분석으로 유속 및 수위변동의 위상에 따른 부유사 농도의 변화와의 관계를 명백히 하여 다음의 결론을 얻었다. 1) 부유사의 농도 변동은 유속 및 수위변동의 에너지가 가장 큰 장주기 성분(100s)에 있서 상관이 높았으며, 2) 또한, 1차mode의 장주기중복파의 유속 성분이 해안으로 향하여 가속하는 위상 즉, 수면 경사가 상대적으로 해안선측보다 외해측이 높은 위상에서 부유사 농도가 가장 높아짐을 명백히 하였다.

  • PDF

내열기관에 있어서 열발생율(熱發生率)의 산출방법(算出方法)에 관한 연구 (A Study on the Computation Method of Simple Heat Release Rate in Internal Combustion Engine)

  • 탁영조;하종률
    • 한국자동차공학회논문집
    • /
    • 제3권1호
    • /
    • pp.129-135
    • /
    • 1995
  • This study aims to compare the heat release calculated using the ensemble average of pressure data with the heat release calculated using the least squares method for pressure data. This paper propose a heat release computation method that can analyze the most correct, straight and simple method to analyse combustion phenomenon. In conclusion, we found that the least squares method of third-order was the best computational method for heat release calculation.

  • PDF

Monte Carlo Simulation on the Adsorption Properties of Methane in Zeolite L

  • 문성두;Yoshimori Miyano
    • Bulletin of the Korean Chemical Society
    • /
    • 제18권3호
    • /
    • pp.291-295
    • /
    • 1997
  • The adsorption of methane in K+ ion exchanged zeolite L has been studied using grand canonical ensemble Monte Carlo simulation. Average number of molecules per unit cell, number density of molecules in zeolite, distribution of molecules per unit cell, average potential per sorbate molecule, and isosteric heats of adsorption were calculated, and these results were compared with experimental results. The simulation results agreed fairly well with experimental ones. All methane molecules were located in the main channel, and the average potential of sorbate molecule was almost constant regardless of average number of molecules per unit cell and the amounts sorbed in zeolite.

삼점 신호 평균기법에 의한 요속신호의 잡음 축소 기법 (Noise Reduction Technique by Three-Points Ensemble Averaging in Uroflowmetry)

  • 최성수;이인광;이상봉;박준오;이수옥;차은종;김경아
    • 전기학회논문지
    • /
    • 제58권8호
    • /
    • pp.1638-1643
    • /
    • 2009
  • Uroflowmetry is a convenient clinical test to screen the benign prostatic hyperplasia(BPH) common in the aged men. A load cell is located beneath the urine container to measure the weight of urine. However, it is sensitive to the impact applied on the bottom of the container by the urine stream, which could be a noise source lowering the reliability of the system. With this aim, our study proposed a noise reduction technique by computing ensemble average of the weighted signals that were acquired from three-load cells forming a regular triangle beneath the urine container. Simulated urination experiment was performed with three different collection methods, all of which demonstrated significant noise reduction by ensemble averaging. Furthermore, the best results can be obtained without any special urine collection devices. Thus, our novel method can be usefully applied to uroflowmetry for enhancing measurement in terms of accuracy and reliability.

부도예측을 위한 KNN 앙상블 모형의 동시 최적화 (Investigating Dynamic Mutation Process of Issues Using Unstructured Text Analysis)

  • 민성환
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.139-157
    • /
    • 2016
  • 앙상블 분류기란 개별 분류기보다 더 좋은 성과를 내기 위해 다수의 분류기를 결합하는 것을 의미한다. 이와 같은 앙상블 분류기는 단일 분류기의 일반화 성능을 향상시키는데 매우 유용한 것으로 알려져 있다. 랜덤 서브스페이스 앙상블 기법은 각각의 기저 분류기들을 위해 원 입력 변수 집합으로부터 랜덤하게 입력 변수 집합을 선택하며 이를 통해 기저 분류기들을 다양화 시키는 기법이다. k-최근접 이웃(KNN: k nearest neighbor)을 기저 분류기로 하는 랜덤 서브스페이스 앙상블 모형의 성과는 단일 모형의 성과를 개선시키는 데 효과적인 것으로 알려져 있으며, 이와 같은 랜덤 서브스페이스 앙상블의 성과는 각 기저 분류기를 위해 랜덤하게 선택된 입력 변수 집합과 KNN의 파라미터 k의 값이 중요한 영향을 미친다. 하지만, 단일 모형을 위한 k의 최적 선택이나 단일 모형을 위한 입력 변수 집합의 최적 선택에 관한 연구는 있었지만 KNN을 기저 분류기로 하는 앙상블 모형에서 이들의 최적화와 관련된 연구는 없는 것이 현실이다. 이에 본 연구에서는 KNN을 기저 분류기로 하는 앙상블 모형의 성과 개선을 위해 각 기저 분류기들의 k 파라미터 값과 입력 변수 집합을 동시에 최적화하는 새로운 형태의 앙상블 모형을 제안하였다. 본 논문에서 제안한 방법은 앙상블을 구성하게 될 각각의 KNN 기저 분류기들에 대해 최적의 앙상블 성과가 나올 수 있도록 각각의 기저 분류기가 사용할 파라미터 k의 값과 입력 변수를 유전자 알고리즘을 이용해 탐색하였다. 제안한 모형의 검증을 위해 국내 기업의 부도 예측 관련 데이터를 가지고 다양한 실험을 하였으며, 실험 결과 제안한 모형이 기존의 앙상블 모형보다 기저 분류기의 다양화와 예측 성과 개선에 효과적임을 알 수 있었다.

앙상블 딥러닝을 이용한 초음파 영상의 간병변증 분류 알고리즘 (Classification Algorithm for Liver Lesions of Ultrasound Images using Ensemble Deep Learning)

  • 조영복
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권4호
    • /
    • pp.101-106
    • /
    • 2020
  • 현재 의료 현장에서 초음파 진단은 과거 청진기와 같다고 할 수 있다. 그러나 초음파의 특성상 검사자의 숙련도에 따라 결과 예측이 불확실하다는 단점을 가진다. 따라서 본 논문에서는 이런 문제를 해결하기 위해 딥러닝 기술을 기반으로 초음파 검사 중 간병변 탐지의 정확도를 높이고자 한다. 제안 논문에서는 CNN 모델과 앙상블 모델을 이용해 병변 분류의 정확도 비교 실험하였다. 실험결과 CNN 모델에서 분류 정확도는 평균 82.33%에서 앙상블모델의 경우 평균 89.9%로 약 7% 높은 것을 확인하였다. 또한 앙상블 모델이 평균 ROC커브에서도 0.97로 CNN모델보다 약 0.4정도 높은 것을 확인하였다.

앙상블 학습의 부스팅 방법을 이용한 악의적인 내부자 탐지 기법 (Malicious Insider Detection Using Boosting Ensemble Methods)

  • 박수연
    • 정보보호학회논문지
    • /
    • 제32권2호
    • /
    • pp.267-277
    • /
    • 2022
  • 최근 클라우드 및 원격 근무 환경의 비중이 증가함에 따라 다양한 정보보안 사고들이 발생하고 있다. 조직의 내부자가 원격 접속으로 기밀 자료에 접근하여 유출을 시도하는 사례가 발생하는 등 내부자 위협이 주요 이슈로 떠오르게 되었다. 이에 따라 내부자 위협을 탐지하기 위해 기계학습 기반의 방법들이 제안되고 있다. 하지만, 기존의 내부자 위협을 탐지하는 기계학습 기반의 방법들은 편향 및 분산 문제와 같이 예측 정확도와 관련된 중요한 요소를 고려하지 않았으며 이에 따라 제한된 성능을 보인다는 한계가 있다. 본 논문에서는 편향 및 분산을 고려하는 부스팅 유형의 앙상블 학습 알고리즘들을 사용하여 악의적인 내부자 탐지 성능을 확인하고 이에 대한 면밀한 분석을 수행하며, 데이터셋의 불균형까지도 고려하여 최종 결과를 판단한다. 앙상블 학습을 이용한 실험을 통해 기존의 단일 학습 모델에 기반한 방법에서 나아가, 편향-분산 트레이드오프를 함께 고려하며 유사하거나 보다 높은 정확도를 달성함을 보인다. 실험 결과에 따르면 배깅과 부스팅 방법을 사용한 앙상블 학습은 98% 이상의 정확도를 보였고, 이는 사용된 단일 학습 모델의 평균 정확도와 비교하면 악의적인 내부자 탐지 성능을 5.62% 향상시킨다.

엔드밀 공정에서의 신호처리에 따른 제어모델에 관한 연구 (Study on Control Model Based on Signal Processing In End-Milling Process)

  • 양우석;이건복
    • 한국공작기계학회:학술대회논문집
    • /
    • 한국공작기계학회 2001년도 춘계학술대회 논문집(한국공작기계학회)
    • /
    • pp.192-196
    • /
    • 2001
  • This work describes the modeling of cutting process for feedback control based on signal processing in end-milling. Here, cutting force is used to design control model by a variety of schemes which are moving average, ensemble average, peak value, root mean square and analog low-pass filtering. It is expected that each model offers its own peculiar advantage in following cutting force control.

  • PDF