• 제목/요약/키워드: fraud detection

검색결과 128건 처리시간 0.027초

On the Performance of Cuckoo Search and Bat Algorithms Based Instance Selection Techniques for SVM Speed Optimization with Application to e-Fraud Detection

  • AKINYELU, Andronicus Ayobami;ADEWUMI, Aderemi Oluyinka
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권3호
    • /
    • pp.1348-1375
    • /
    • 2018
  • Support Vector Machine (SVM) is a well-known machine learning classification algorithm, which has been widely applied to many data mining problems, with good accuracy. However, SVM classification speed decreases with increase in dataset size. Some applications, like video surveillance and intrusion detection, requires a classifier to be trained very quickly, and on large datasets. Hence, this paper introduces two filter-based instance selection techniques for optimizing SVM training speed. Fast classification is often achieved at the expense of classification accuracy, and some applications, such as phishing and spam email classifiers, are very sensitive to slight drop in classification accuracy. Hence, this paper also introduces two wrapper-based instance selection techniques for improving SVM predictive accuracy and training speed. The wrapper and filter based techniques are inspired by Cuckoo Search Algorithm and Bat Algorithm. The proposed techniques are validated on three popular e-fraud types: credit card fraud, spam email and phishing email. In addition, the proposed techniques are validated on 20 other datasets provided by UCI data repository. Moreover, statistical analysis is performed and experimental results reveals that the filter-based and wrapper-based techniques significantly improved SVM classification speed. Also, results reveal that the wrapper-based techniques improved SVM predictive accuracy in most cases.

윈도우 시스템에서 사용되는 회계 프로그램의 특성을 이용한 포렌식 어카운팅 기법 개선 방안 (Improvement Method of Forensic Accounting Using Characteristics of Accounting Programs Used in Windows System)

  • 이승주;이국헌;이상진
    • 정보보호학회논문지
    • /
    • 제27권5호
    • /
    • pp.1099-1105
    • /
    • 2017
  • 기업에서는 대용량 회계 데이터를 처리하기 위해 각기 다른 회계 프로그램들을 사용한다. 회계 프로그램의 특성으로 인해 회계 프로그램이 사용하는 회계 데이터 이외에도 회계 부정을 탐지하는데 도움이 되는 다양한 정보들이 존재한다. 기존 포렌식 어카운팅 기법은 이러한 정보를 활용하지 않고 회계 원장과 같은 회계 데이터만을 분석했기 때문에 분석할 수 있는 범위에 제한이 있다. 회계 부정 탐지 시, 회계 프로그램의 특성으로 인해 얻을 수 있는 정보들을 활용한다면 회계 데이터 분석만으로는 얻을 수 없는 다양한 정보들을 얻을 수 있다. 본 논문에서는 윈도우 시스템에서 사용되는 회계 프로그램의 특성으로 인해 얻을 수 있는 기타 데이터를 활용하여 회계 부정을 효과적으로 탐지하는 기법을 제시함으로써 효과적인 회계 부정 수사에 기여하고자 한다.

축소된 앙상블에 의한 부정행위 적발 모형 (Ensemble Size Reduction in Fraud Detection System)

  • 송영미;지원철;한완규
    • 한국경영정보학회:학술대회논문집
    • /
    • 한국경영정보학회 2007년도 International Conference
    • /
    • pp.597-602
    • /
    • 2007
  • 데이터 마이닝 분야에서 앙상블 모형의 유용성은 널리 인정되고 있다. 앙상블을 구성하는 단위모형들 사이의 다양성이 보장되는 경우, 최종 모형의 정확성 및 안정성이 향상되기 때문이다. 하지만, 얼마나 많은 단위 모형들이 어떤 방식으로 결합되어야 하는가에 대해서는 아직도 더 많은 연구가 필요하다. 본 연구에서는 신용카드 부정사용 유형 중 하나인 현금불법융통 문제에 대해 앙상블 모형의 유용성을 검증하고자 한다. 부정행위 적발 모형은 전형적인 분류 문제의 한 유형이나, 클래스간 불균형이 매우 심하다는 특징이 있다. 따라서, 현금불법융통 문제에 적합한 다양성(Diversity) 척도를 개발하여 최소한의 단위모형들로 앙상블 모형을 구성하는 방안을 제시하였다. 축소된 앙상블 모형이 많은 수의 모형을 결합한 앙상블 모형과 거의 같은 정확성 및 안정성을 보임을 국내 신용카드사의 실제 자료를 사용하여 입증하였다.

  • PDF

데이터마이닝을 이용한 의료사기 탐지 시스템 (Medical Fraud Detection System Using Data Mining)

  • 이준우;지원철;박하영;신현정
    • 한국IT서비스학회:학술대회논문집
    • /
    • 한국IT서비스학회 2009년도 춘계학술대회
    • /
    • pp.357-360
    • /
    • 2009
  • 본 연구는 데이터마이닝 기법을 이용하여 건강보험청구료에 있어서 이상정도가 심한 요양기관을 탐지하고, 실제 의료영역에 적용하기 위한 시스템 개발을 목적으로 한다. 현재 건강보험 심사평가원의 이상탐지시스템은 평가대상이 되는 항목을 개별적으로 평가하고, 탐지된 기관의 선정 이유에 대한 근거제시가 부족한 단점을 가지고 있다. 따라서 본 연구에서는 항목을 종합적으로 평가할 수 있는 정량적 지표를 설계하고, 항목들의 상대적 중요도를 파악할 수 있도록 항목들에 대한 가중치 부여한다. 또한 지표에서 얻어진 값으로 등급을 구분하고, 의사결정나무기법(decision tree)를 이용하여 해석력을 높이는 방법을 제시한다.

  • PDF

가상통화거래소의 계정 및 자산 보호에 관한 사례연구: 유관기관의 프로세스를 중심으로 (A Case Study on the Protection of Accounts and Assets on Cryptocurrency Exchanges: Focusing on the Processes of Related Institutions)

  • 이윤주;이동원;한인구
    • 경영정보학연구
    • /
    • 제22권4호
    • /
    • pp.135-161
    • /
    • 2020
  • 블록체인과 가상통화 관련 시장의 성장과 함께 가상통화거래소는 하나의 신규 산업으로 성장하고 있다. 그러나, 가상통화에 대한 법·규제적 정의가 진행 중에 있어서 기존 산업과 다르게 규제기관의 관리감독을 받지 않고 있으며, 이에 따라 본 연구는 거래소 해킹 및 사고로 인한 사용자(가상통화 투자자)의 피해가 다수 보고되었다. 가상통화거래소에서 발생할 수 있는 피해를 개인정보 및 계정의 탈취로 인한 자산 피해와 사용자가 외부 사기사건 등에 연루되어 발생할 수 있는 피해로 구분하여 연관성이 높은 기능을 선행 사업자와 비교 분석하였다. 회원가입(KYC: Know Your Client), 로그인, 거래 추가인증은 선행 사업자와 유사한 수준이나, 이상거래탐지(FDS: Fraud Detection System), 법화 및 가상통화 자금세탁방지(AML: Anti-Money Laundering)는 미흡한 수준으로 조속한 개선이 필요할 것으로 파악되었다.

머신러닝을 이용한 선불전자지급수단의 이상금융거래 탐지 연구 (A Study on the Fraud Detection for Electronic Prepayment using Machine Learning)

  • 최병호;조남욱
    • 한국전자거래학회지
    • /
    • 제27권2호
    • /
    • pp.65-77
    • /
    • 2022
  • 전자금융서비스가 활성화됨에 따라 전자금융 거래 건수와 거래액은 매년 증가하고 있으며, 선불전자지급 과정에서의 사이버 금융범죄도 증가하고 있다. 본 논문에서는 머신러닝 알고리즘을 이용한 선불전자지급수단의 이상금융거래 탐지모델을 제시한다. 이를 위하여 실제 선불전자거래 데이터를 익명화하여 수집하였으며, 데이터의 효과적인 특성을 추출하기 위한 전처리 작업을 수행하였다. 제안된 모델은 거래내역 기반과 이용자 ID 기반 접근법을 이용하였다. 거래내역 기반 모델 분석에서는 원데이터 기반 거래내역 분석과 특성 항목을 추가한 2차 분석을 수행하였으며, 이용자 ID 기반 모델에서도 도메인 특성에 맞는 특성 항목을 추출하여 분석에 활용하였다. 이상치 탐지를 위해 의사결정나무, 인공신경망 및 서포트 벡터 머신 알고리즘을 활용하여 비교 분석하였다. 분석결과 거래내역 기반의 탐지모델보다 이용자 ID 기반의 탐지모델이 선불거래지급수단 이상탐지에 더 효과적임을 확인할 수 있었으며, 이용자 ID 기반 모델에서는 신경망 알고리즘이 가장 좋은 성능을 나타내었다. 제안된 방법론은 향후 이상금융거래 탐지시스템 분석에 활용함으로써 전자금융사고 피해를 줄이는데 기여할 수 있을 것으로 기대된다.

빅데이터와 FDS를 활용한 보이스피싱 피해 예측 방법 연구 (A Study on the Prediction Method of Voice Phishing Damage Using Big Data and FDS)

  • 이승용;이주락
    • 시큐리티연구
    • /
    • 제62호
    • /
    • pp.185-203
    • /
    • 2020
  • 2009년 이후 전체 범죄는 감소하고 있지만, 보이스피싱은 오히려 급증하고 있다. 정부와 학계에서는 이를 근절하기 위해 다양한 대책을 제시하고 연구를 진행해 왔으나 진화하는 보이스피싱을 따라잡기에는 역부족이다. 이 연구에서 연구자들은 범인 검거와 피해회복이 어려운 보이스피싱의 피해 예방에 초점을 두었다. 특히, 피해자가 금융거래행위(계좌이체 등)를 한다는 점이 금융사기(이상거래)와 유사하다는 점에 착안하여, 금융사기 탐지에 활용되고 있는 이상거래탐지시스템(FDS)을 활용한 보이스피싱 예측 방안을 연구하였다. 그 결과 머신러닝 기반의 이상거래탐지시스템(FDS)에 보이스피싱과 관련한 통화내역, 메신저내역, 대포통장, 보이스피싱 유형과 112신고 등 빅데이터를 결합한 방안을 개념적으로 도출하였다. 이 연구에서는 주로 정부 대책과 빅데이터 활용과 관련한 문헌연구를 중심으로 연구를 진행했다. 그러나 데이터 수집의 한계와 FDS의 보안 문제로 구체적인 모델까지를 제시하지는 못하였다. 다만, 관련된 선행연구가 없는 현실에서 머신러닝을 위해 필요한 데이터 종류와 FDS를 융합한 보이스피싱 대응방안의 개념을 최초로 제시했다는 점에 의미가 있다. 향후 이 연구를 바탕으로 '보이스피싱 피해 예측 시스템'이 개발되어 보이스피싱 피해가 근절되기를 기대한다.

Google Play Malware Detection based on Search Rank Fraud Approach

  • Fareena, N;Yogesh, C;Selvakumar, K;Sai Ramesh, L
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권11호
    • /
    • pp.3723-3737
    • /
    • 2022
  • Google Play is one of the largest Android phone app markets and it contains both free and paid apps. It provides a variety of categories for every target user who has different needs and purposes. The customer's rate every product based on their experience of apps and based on the average rating the position of an app in these arch varies. Fraudulent behaviors emerge in those apps which incorporate search rank maltreatment and malware proliferation. To distinguish the fraudulent behavior, a novel framework is structured that finds and uses follows left behind by fraudsters, to identify both malware and applications exposed to the search rank fraud method. This strategy correlates survey exercises and remarkably joins identified review relations with semantic and behavioral signals produced from Google Play application information, to distinguish dubious applications. The proposed model accomplishes 90% precision in grouping gathered informational indexes of malware, fakes, and authentic apps. It finds many fraudulent applications that right now avoid Google Bouncers recognition technology. It also helped the discovery of fake reviews using the reviewer relationship amount of reviews which are forced as positive reviews for each reviewed Google play the android app.

A Study on Fraud Detection in the C2C Used Trade Market Using Doc2vec

  • Lim, Do Hyun;Ahn, Hyunchul
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권3호
    • /
    • pp.173-182
    • /
    • 2022
  • 본 논문에서는 사기 거래를 사전에 예방하고 XAI 접근 방식을 사용하여 해석할 수 있는 기계학습 모델을 제안한다. 실험을 위해 국내 주요 온라인 C2C 재판매 거래 플랫폼인 중고나라에서 휴대폰 판매 게시물 1만2,258개에 대한 실제 데이터셋을 수집했다. 게시물 본문에 해당하는 텍스트를 Doc2vec을 이용해 특성을 추출했고 PCA를 통해 차원축소를 했으며, 이전 연구를 바탕으로 다양한 파생변수가 만들어졌다. 전처리 단계에서 데이터 불균형 문제를 해결하기 위해 오버샘플링과 언더샘플링을 결합한 복합샘플링 방법이 적용되었다. 이러한 특성을 기반으로 사기성 게시물을 탐지하는 기계학습 모델들이 학습되었다. 분석 결과 LightGBM이 다른 기계학습 모델에 비해 가장 우수한 성능을 보였다. 그리고, SHAP을 이용한 분석 결과, 시세에 비해 터무니없게 가격이 쌀수록, 거래지역 표기가 없을수록, 가격이 높을수록, 안전거래를 하지 않을수록, 택배거래를 할수록, 가격 중 0의 비율이 많을수록 사기 게시글일 확률이 높았다.

자동차 전방 감시를 위한 영상 구문 검출 평가 기술 (Visual Phrase Detection and Evaluation Technology for Car Front Monitoring)

  • 오원근;고종국
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 하계학술대회
    • /
    • pp.13-16
    • /
    • 2019
  • 영상이 포함하고 있는 풍부한 정보를 검출하고 이해하기 위해서는, 영상속의 일관된 상호관계를 갖는 영상 객체 그룹을 이해하고 표현하는 영상 구문 검출 기술(Visual Phrase Detecting Technology)이 필수적이다. 영상 구문 검출 기술은, 영상이 포함하고 있는 다양하고 풍부한 정보를 추출하고 활용하기 위한 핵심 기술로 이를 이용한 자동차 주행중 전방 감시, 영상의 자동 주석 달기, 동영상의 검색, 쇼핑 공간에서의 부정행위 검출(fraud detection) 등 다양한 분야에 적용할 수 있다.

  • PDF