• 제목/요약/키워드: 비용민감학습

검색결과 12건 처리시간 0.033초

심혈관질환 위험 예측을 위한 비용민감 학습 모델 (Cost-Sensitive Learning for Cardio-Cerebrovascular Disease Risk Prediction)

  • 이유나;이경희;조완섭
    • 한국빅데이터학회지
    • /
    • 제6권2호
    • /
    • pp.161-168
    • /
    • 2021
  • 본 연구에서는 기계 학습을 사용하여 심혈관 질환 예측 모델을 제안한다. 먼저 두 집단간에 다양한 차이를 다차원분석하고 그 결과를 시각화한다. 특히, 질환과 같이 정상집단과 환자집단 간에 높은 클래스 불균형이 존재하는 경우에 대하여 민감도를 향상시킬 수 있는 비용 민감 학습을 사용하는 예측 모델을 제안한다. 본 연구에서는 대표적인 머신러닝 기술인 CART와 XGBoost를 사용하여 예측모델을 개발하고, 심혈관 질환 환자 데이터를 대상으로 예측하고 성능을 비교한다. 연구결과에 따르면 CART가 XGBoost 보다 더 높은 정확도와 특이도를 보였으며, 정확도는 약 70%~74%로 나타났다.

신용카드 사기 검출을 위한 비용 기반 학습에 관한 연구 (Cost-sensitive Learning for Credit Card Fraud Detection)

  • 박래정
    • 한국지능시스템학회논문지
    • /
    • 제15권5호
    • /
    • pp.545-551
    • /
    • 2005
  • 사기 검출의 주목적은 사기 거래로 인해 발생하는 손실을 최소화하는 것이다. 하지만, 사기 검출 문제의 특이한 속성, 즉 불균형하고 중첩이 심한 클래스 분포와 비균일한 오분류 비용으로 인해, 실제로 희망하는 거절율 동작 영역에서의 분류비용 측면의 최적 분류기를 생성하는 것이 용이하지 않다. 본 논문에서는, 특정 동작 영역에서의 분류기의 분류 비용을 정의하고, 진화 탐색을 이용하여 이를 직접적으로 최적화함으로써, 실제 신용카드 사기 검출에 적합한 분류기를 학습할 수 있는 비용 기반 학습 방법을 제시한다. 신용카드 거래 데이터를 사용한 실험을 통해, 제시한 방법이 타 학습 방법에 비해 비용에 민감한 분류기를 학습할 수 있는 효과적인 방법임을 보인다.

불균형데이터의 비용민감학습을 통한 국방분야 이미지 분류 성능 향상에 관한 연구 (A Study on the Improvement of Image Classification Performance in the Defense Field through Cost-Sensitive Learning of Imbalanced Data)

  • 정미애;마정목
    • 한국군사과학기술학회지
    • /
    • 제24권3호
    • /
    • pp.281-292
    • /
    • 2021
  • With the development of deep learning technology, researchers and technicians keep attempting to apply deep learning in various industrial and academic fields, including the defense. Most of these attempts assume that the data are balanced. In reality, since lots of the data are imbalanced, the classifier is not properly built and the model's performance can be low. Therefore, this study proposes cost-sensitive learning as a solution to the imbalance data problem of image classification in the defense field. In the proposed model, cost-sensitive learning is a method of giving a high weight on the cost function of a minority class. The results of cost-sensitive based model shows the test F1-score is higher when cost-sensitive learning is applied than general learning's through 160 experiments using submarine/non-submarine dataset and warship/non-warship dataset. Furthermore, statistical tests are conducted and the results are shown significantly.

기계학습을 이용한 수출 컨테이너의 무게그룹 분류

  • 강재호;강병호;류광렬;김갑환
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2005년도 춘계학술대회
    • /
    • pp.77-86
    • /
    • 2005
  • 컨테이너 터미널에서는 장치장으로 반입되는 수출 컨테이너의 무게를 몇 단계 그룹으로 나누고 각 무게그룹 별로 모아서 장치한다. 이는 수출 컨테이너를 선박에 싣는 적하 작업 시 선박의 안정성을 위하여 무거운 무게그룹의 컨테이너들을 장치장에서 먼저 반출하여 선박의 바닥 쪽에 놓기 위함이다. 하지만 반입되는 컨테이너의 무게그룹을 결정할 때 사용하는 운송사로부터 받은 무게정보는 부정확한 경우가 많아 하나의 스택(stack)에 서로 다른 무게그룹에 속하는 컨테이너들이 섞이게 된다. 이로 인하여 무거운 무게그룹의 컨테이너를 반출할 때 해당 컨테이너의 상단에 놓여진 보다 가벼운 무게그룹의 컨테이너들을 임시로 옮겨야 하는 재취급(rehandling, reshuffling)이 발생하게 된다. 적하작업 시 장치장에서 재취급이 빈번히 발생하면 작업이 지연되므로 터미널 생산성 향상을 위해서는 재취급 발생을 가급적 줄여야 한다. 본 논문에서는 기계학습 기법을 적용하여 반입 컨테이너의 무게그룹을 보다 정확히 추정하는 방안을 제안한다. 또한 탐색을 통하여 분류기 생성에 관여하는 비용행렬(cost matrix)을 조정함으로써 재취급 발생을 줄일 수 있는 분류기(classifier)를 생성하는 방안을 함께 소개한다. 실험 결과 본 논문에서 제안하는 방안 적용 시 재취급 발생을 $5{\sim}7%$ 정도 줄일 수 있음을 예상할 수 있었다.

  • PDF

심층 학습 기법을 이용한 탄성파 자료 잡음 제거 적용사례 분석 (Case Analysis of Applications of Seismic Data Denoising Methods using Deep-Learning Techniques)

  • 조준현;하완수
    • 지구물리와물리탐사
    • /
    • 제23권2호
    • /
    • pp.72-88
    • /
    • 2020
  • 최근 컴퓨터 하드웨어 성능의 급속한 발전으로 인해 계산 비용이 상대적으로 낮아지면서 기계 학습 기법을 지구물리학적 문제에 적용하는 사례가 점차 증가하고 있다. 특히 심층 학습 기법이 복잡하고 비선형적인 문제를 성공적으로 해결하는 사례가 많아지면서 큰 인기를 얻고 있다. 이 논문에서는 심층 학습 기법을 이용한 탄성파 자료 잡음 제거 적용사례를 조사하고 소개하였다. 감쇠하고자 하는 잡음 유형에 따라 일관성 잡음 적용사례, 무작위 잡음 적용사례, 일관성 잡음 및 무작위 잡음 적용사례로 분류하였고 해당 잡음 제거에 사용된 심층 학습 기법에 대해 조사하였다. 대표적인 심층 학습 기법인 심층 신경망은 탄성파 잡음 제거에 사용된 기존 기법과 달리 잡음의 특징을 스스로 학습하며 매개변수를 자동으로 최적화한다. 따라서 기존 기법에 비해 일반화 문제에 덜 민감하며 인적 비용을 절감할 수 있다. 또한 여러 연구 사례를 통해 계산 비용이나 잡음 제거 성능 측면에서도 심층 학습 기법이 뛰어난 성과를 달성하는 것을 보여주었다. 연구 결과들을 토대로 탄성파 잡음 제거에 사용된 심층 학습 기법의 장단점에 대해 분석하고 논의하였다.

교차 프로젝트 결함 예측 성능 향상을 위한 효과적인 하모니 검색 기반 비용 민감 부스팅 최적화 (Effective Harmony Search-Based Optimization of Cost-Sensitive Boosting for Improving the Performance of Cross-Project Defect Prediction)

  • 류덕산;백종문
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권3호
    • /
    • pp.77-90
    • /
    • 2018
  • 소프트웨어 결함 예측(SDP)은 결함이 있는 모듈을 식별하기 위한 연구 분야이다. 충분한 로컬 데이터가 없으면 다른 회사에서 수집한 데이터를 사용하여 분류기를 구축하는 교차 프로젝트 결함 예측(CPDP)을 활용할 수 있다. SDP에 대한 대부분의 기계 학습 알고리즘은 서로 다른 값에 따라 예측 성능에 큰 영향을 미치는 하나 이상의 매개 변수를 사용한다. 본 연구의 목적은 CPDP의 예측 성능 향상을 위해 매개 변수 선택 기법을 제안하는 것이다. Harmony Search 알고리즘을 사용하여, 예측 어려움을 야기하는 클래스 불균형을 해결하는 방법인 비용에 민감한 부스팅의 매개 변수를 조정한다. 분포 특성에 따라 매개 변수 범위와 매개 변수 간의 제한 조건 규칙이 정의되어 하모니 검색 알고리즘에 적용된다. 제안된 접근법은 15개의 대상 프로젝트를 대상으로 3개의 CPDP 모델과 내부프로젝트 결함 예측(WPDP) 모델을 비교한다. 실험 결과는 제안된 방법이 클래스 불균형의 맥락에서 다른 CPDP 방법보다 성능이 우수하다는 것을 보여준다. 이전의 연구에서는 탐지 확률이 낮거나 오보 가능성이 높았으나 우리의 기법은 높은 PD와 낮은 PF를 제공하면서 높은 전체 성능을 보였다. 또한 WPDP와 비슷한 성능을 제공하였다.

인간 miRNA 전구체 탐색을 위한 계산학적 방법 (Computational Method for Searching Human miRNA Precursors)

  • Nam, Jin-Wu;Joung, Je-Gun;Lee, Wha-Jin;Zhang, Byoung-Tak
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2003년도 제2차 연례학술대회 발표논문집
    • /
    • pp.288-297
    • /
    • 2003
  • 본 논문은 진화 알고리즘(Evolutionary algorithm)의 기법중의 하나인 유전자 프로그래밍(Genetic programming)을 이용하여 miRNA 유전자를 발굴하기 위한 알고리즘을 소개하고 있다 miRNA는 세포내에서 유전자의 전사를 중지시킴으로써 유전자의 발현을 직접적으로 조절하게 되는 작은 RNA 집단 중의 하나이다. 그러므로 miRNA를 유전체 데이터에서 동정해내는 작업은 생물학적으로 상당히 중요하다. 한편 유전체 데이터에서 miRNA를 동정해내는 알고리즘은 생물학적 실험에서의 시간과 비용을 상당히 절감할 수 있으며, 생물학적으로 miRNA를 동정하는 많은 어려움을 덜어주게 된다. 하지만 계산학적으로 miRNA의 동정은 1차 염기서열상의 통계적인 중요도가 부족하여 기존의 유전자 예측 알고리즘을 적용하기에는 어려움이 있다. 따라서 본 연구에서는 miRNA의 염기서열보다는 2차구조에서 더 많은 유사성을 갖는다는 점을 착안하여, 2차구조내에서 공통적인 구조를 찾아내고, 그 정보를 이용하여 miRNA를 동정해내는 방법으로 접근하였다. 이 알고리즘의 성능평가를 위해 우리는 test set을 이용하여 학습된 모델의 특이도(= 34/38)와 민감도(= 38/67)를 계산하였다. 평가결과 본 알고리즘이 기존의 miRNA 예측 프로그램보다 높은 특이도를 갖고 있으며, 유사한 수준의 민감도를 갖고 있음을 보여 주고 있다.

  • PDF

연합학습의 인센티브 플랫폼으로써 이더리움 스마트 컨트랙트를 시행하는 경우의 실무적 고려사항 (Practical Concerns in Enforcing Ethereum Smart Contracts as a Rewarding Platform in Decentralized Learning)

  • ;;장설아;이경현
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제9권12호
    • /
    • pp.321-332
    • /
    • 2020
  • 탈중앙화 접근법은 기존 시스템의 데이터 프라이버시 결함을 보완하기 위해 산·학계에서 폭넓게 연구되고 있다. 블록체인은 기록된 데이터는 위조할 수 없으며 합의를 기반으로 의사결정을 이루고 전반적인 거래의 비용은 저렴한 특징을 가지고 있다. 연합학습은 데이터 집합을 공개적으로 노출하지 않고 다수의 장치를 집합적으로 사용 함으로서 딥러닝 모델을 개선할 수 있게 한다. 모델 구축을 위해서는 자원을 사용하도록 참여자들의 동기 부여를 위한 적절하고 참여 비율에 합당한 인센티브 제도가 필수적이다. 그러나 중앙집중화된 인센티브 메커니즘은 중간 계층에 의존하고 여전히 병목현상을 유발하기 때문에 연합학습에 적용하기에는 어려움이 있다. 따라서, 우리는 이더리움 스마트컨트랙트를 활용하여 연합학습 어플리케이션을 위한 인센티브 모델을 제안한다. 구현 결과는 설계 목표를 충족하였고, 마지막 절에서 연합학습에서 프라이버시 및 데이터 유출과 관련된 민감 데이터에 대한 본 구현을 실행할 때 발생할 수 있는 사항들을 설명한다.

강화 학습 기반의 독립형 스마트 IoT 허브 연구 (A Study on the Self-Strengthening Smart IoT Hub Based on Strengthening Learning)

  • 이예린;김현;이인지;채지희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.288-290
    • /
    • 2019
  • 해가 갈수록 스마트홈을 구성하는 다양한 IoT 상품들이 출시되고 있고 이것들을 통합 관제하기 위한 IoT 허브(gateway) 등의 제어 장치들이 필요해 지고 있다. 구글의 'Google home', 아마존의 'Echo' 등이 대표적이다. 그러나 이러한 제어 장치들은 클라우드 기반으로 동작되기 때문에 비용이 발생하고 개인으로부터 생성되는 민감한 개인 데이터들의 보관방법에 대한 다양한 문제들을 내포하고 있다. 본 연구팀은 독립형 스마트 IoT 허브 개발을 통해 개인정보를 보호하고 다양한 IoT 단말기들을 손쉽고 간편하게 제어하고자 하였다. 그리고 IoT 단말기와 연결된 센서의 실시간 모니터링 및 분석을 인공지능 기술인 강화 학습 기술을 이용해 구현할 수 있었다. 네트워크 끊김, 고장 등 IoT 단말기 들의 다양한 통신값을 분석하고 이를 기반으로 안정적이고 효율적인 제어를 가능할 수 있게 되었다. IoT 단말기는 아두이노를 이용했으며 스마트 IoT 허브는 라즈베리 파이로 구현해 개인정보를 보다 안전하게 보호하고 다양한 IoT 단말기를 모니터링 하고 제어할 수 있는 독립형 IoT 허브를 설계하고 구현할 수 있었다.

수도 레이블을 활용한 준지도 학습 기반의 도로노면 파손 탐지 (Road Surface Damage Detection Based on Semi-supervised Learning Using Pseudo Labels)

  • 전찬준;류승기
    • 한국ITS학회 논문지
    • /
    • 제18권4호
    • /
    • pp.71-79
    • /
    • 2019
  • 의미론적 분할 형태로 합성곱 신경망을 구성하여 도로노면의 파손을 탐지하는 연구가 진행되고 있다. 이러한 합성곱 신경망 형태의 모델을 생성하기 위해서는 입력 이미지와 이에 상응한 레이블된 이미지 데이터셋으로 수집해야 하고, 이러한 과정에서는 굉장히 많은 시간과 비용이 발생하게 된다. 본 논문에서는 이러한 작업을 완화하기 위하여 수도 레이블링을 활용한 준지도 학습 기반의 도로노면 파손 탐지 기술을 제안하고자 한다. 레이블된 데이터셋과 레이블되지 않은 데이터셋을 적절하게 혼합하여 도로노면 파손을 탐지하는 모델을 업데이트하고, 이를 레이블된 데이터셋만을 활용한 기존 모델과 성능을 비교한다. 주관적인 성능결과, 민감도 부분에서는 조금 저하된 성능을 보였지만, 정밀도 부분에서는 대폭 성능 향상이 있었으며, 최종적으로 $F_1-score$ 또한 높은 수치로 평가되었다.