• 제목/요약/키워드: BIG 6 모형

검색결과 80건 처리시간 0.03초

생성적 적대 신경망과 딥러닝을 활용한 이상거래탐지 시스템 모형 (Fraud Detection System Model Using Generative Adversarial Networks and Deep Learning)

  • 김예원;유예림;최홍용
    • 경영정보학연구
    • /
    • 제22권1호
    • /
    • pp.59-72
    • /
    • 2020
  • 인공지능이 다루기 어려운 개념에서 아주 익숙한 도구로 자리매김 하고 있다. 이와 더불어 금융권에서도 인공지능 기술을 도입하여 기존 시스템의 문제점을 개선하고자 하는 추세이며, 그 대표적인 예가 이상거래탐지 시스템(Fraud Detection System, FDS)이다. 결제 수단의 다양화 및 전자금융거래의 증가에 따라 치밀해져 가는 사이버 금융사기(Fraud)를 기존의 규칙기반 FDS로는 탐지하기 어려워지고 있다. 이를 극복하기 위해 딥러닝 기술을 적용하여 이상거래 탐지율을 향상시키고, 이상행위에 즉각 대응하며, 탐지 결과의 반영을 자동화하고자 하는 시도가 이루어지고 있다. 딥러닝 FDS 구축에서 핵심 문제는 데이터 불균형과 이상거래 패턴의 변동이다. 본 논문에서는 생성적 적대 신경망(Generative Adversarial Network, GAN)을 활용한 오버샘플링 기법을 통해 데이터 불균형 문제를 개선하고, 이상거래 분류기로써 심층 신경망(Deep Neural Network, DNN)과 합성곱 신경망(Convolutional Neural Network, CNN)을 적용하여 이러한 문제를 개선하고자 하였다. 실험 결과, GAN 오버샘플링이 이상거래 데이터의 불균형 문제를 개선하는데 효과를 보였으며, WGAN이 가장 높은 개선 효과가 있음을 확인하였다. 또한 제안 FDS 모형의 AUC가 0.9857로 랜덤포레스트 FDS 모형에 비해 약 6.5% 향상되어, 딥러닝이 이상거래 탐지에 뛰어난 성능을 가짐을 입증하였다. 더불어 딥러닝 모형 중 DNN은 CNN에 비해 오버샘플링의 효과를 더 잘 반영함을 확인하였다.

SWAT과 MODSIM-DSS 모형을 연계한 금강유역의 농업용수 공급능력 평가 (Assessment of Agricultural Water Supply Capacity Using MODSIM-DSS Coupled with SWAT)

  • 안소라;박근애;김성준
    • 대한토목학회논문집
    • /
    • 제33권2호
    • /
    • pp.507-519
    • /
    • 2013
  • 본 연구에서는 SWAT 모형과 MODSIM-DSS 모형을 이용하여 금강유역(9,865 $km^2$)의 농업용수 공급능력을 평가하고자 하였다. 하천유역 네트워크 물수지 모형인 MODSIM-DSS를 이용하여 금강유역을 14개의 소유역으로 구분하고 다목적댐과 농업용 수리시설을 고려한 물수지 네트워크를 소유역별로 구성하여 물수지 분석을 수행하였다. MODSIM-DSS의 유역별 유입량(공급량) 자료는 SWAT 모형의 소유역별 유출결과를 사용하였다. SWAT 모형의 신뢰성 있는 유출량 보정을 위해 금강유역 내 위치하는 2개의 다목적댐(용담, 대청)의 실측 방류량을 이용하여 댐 운영모의를 고려하여 모형의 보정(2005~2007)과 검증(2008~2010)을 실시하였다. 이후 MODSIM-DSS를 이용하여 8개년(2004~2011) 동안의 물수지 분석을 수행한 결과 과거 실제로 가뭄이 발생했던 기간인 2006년, 2008년, 2009년에 농업용수 부족량이 평년에 비해 많이 발생하는 것으로 나타났으며, 부족량은 각각 282 $10^6m^3$, 286 $10^6m^3$, 329 $10^6m^3$로 분석되었다. 유역평균 농업용수 공급능력이 86.4%인데 비해 2006년, 2008년, 2009년에 각각 81.6%, 81.5%, 78.5%로 농업용수 공급능력이 떨어지는 것을 알 수 있었다.

PISA 2018 독서 리터러시 평가틀 분석을 통한 디지털 정보 서비스 방안 탐색 (A Study on Exploring Digital Information Service Method through Analysis of PISA 2018 Reading Literacy Assessment Framework)

  • 박주현
    • 한국문헌정보학회지
    • /
    • 제55권1호
    • /
    • pp.135-159
    • /
    • 2021
  • 본 연구의 목적은 PISA 2018 독서 리터러시 개념의 변화를 살펴보고 독서 리터러시 평가틀의 구성요인을 분석하여 학생과 시민들의 독서와 정보 리터러시 향상 및 정보 서비스 제공에 필요한 시사점을 도출하는 데 있다. 연구결과는 다음과 같다. 첫째, PISA의 독서 리터러시의 개념은 사회적 기술적 환경에 따라 변화되어 왔다. 둘째, PISA 독서 리터러시 개념과 평가틀에는 독서 전중후의 전 과정이 포함되어 있었다. 셋째, 평가틀은 Big6 Skills와 같은 정보 리터러시 모형의 인지적 과정과 유사한 요인을 다수 포함하였으나 차이점도 있었다. 넷째, 평가틀에는 디지털 독서가 반영되었다. PISA 2018 독서 리터러시 평가틀은 사서가 시민들의 독서와 정보 리터러시 향상을 위하여 독서나 정보 리터러시 모형과 평가틀을 개발하고 시민들에게 정보 서비스를 제공하는 데 필요한 기준과 방법에 대한 시사점을 제공해주고 있다.

LightGBM 알고리즘을 활용한 고속도로 교통사고심각도 예측모델 구축 (Predicting of the Severity of Car Traffic Accidents on a Highway Using Light Gradient Boosting Model)

  • 이현미;전교석;장정아
    • 한국전자통신학회논문지
    • /
    • 제15권6호
    • /
    • pp.1123-1130
    • /
    • 2020
  • 본 연구는 고속도로 교통사고 심각도 예측모델을 구축하기 위해 다섯가지 머신러닝 기반의 분류모형 적용하였다. 2015년~2017년 동안 전국 고속도로에서 발생한 사고 데이터 21,013건을 5가지의 분류 모형을 적용한 결과 LightGBM(Light Gradient Boosting Model)이 가장 좋은 성능을 나타내는 것으로 나타났다. LightGBM에서는 교통사고심각도 추정에 있어 우선순위 요인으로 사고차량 수, 사고유형, 사고지점, 사고차로유형, 사고차량 유형 순으로 나타났다. 이러한 모형의 결과를 기반으로 일관적인 사고심각도 예측 과정을 통하여 교통사고대응관리 전략 수립에 활용할 수 있다. 본 연구는 국내 기계학습을 활용한 사례가 적은 여건에서 향후 빅데이터 기반의 다양한 기계학습 기법을 활용이 가능함을 제시하고 있다.

항공사진분석 자료를 이용한 2차원 하천흐름 해석모형의 검증 (Verification of Two Dimensional Hydrodynamic Model Using Velocity Data from Aerial Photo Analysis)

  • 서일원;김성은
    • 대한토목학회논문집
    • /
    • 제31권6B호
    • /
    • pp.515-522
    • /
    • 2011
  • 수리해석 모형들은 하천의 흐름에 대한 연구에 이용되거나, 수공구조물의 설계 및 하천의 설계 등 실무에 널리 사용되고 있다. 이들 수리해석 모형은 실측자료를 통한 보정이 필요하나, 홍수시 유속을 측정하는 것 자체가 위험한 작업이기 때문에 홍수시 하천의 2차원 유속분포에 대한 실측자료가 전무한 실정이다. 이러한 이유로 2차원 수치모형의 결과는 보통 몇 개 지점의 실측된 자료를 비교함으로써 보정 및 검증을 실시하고 있다. 더욱이 설계 홍수량에 대한 모형의 보정은 1차원 모형인 HEC-RAS의 모의결과를 이용하여 보정하고 있다. 본 연구에서는 일본의 토네강(Tone river)에서 홍수시 촬영한 항공사진을 분석하여 추출한 유속벡터 자료를 이용하여 하천설계 실무 및 연구 등에 널리 사용되어지고 있는 2차원 수치모형인 RAMS의 RAM2, SMS의 RMA2와 1차원 모형인 HEC-RAS 모형의 검증을 실시하였다. 또한, HEC-RAS결과를 이용한 2차원 모형의 보정에 대한 타당성을 검토하였다. 검토결과, HEC-RAS 및 RAM2, RMA2 모형의 수위모의 결과 모두 관측점의 수위와 비슷한 결과을 보이고 있었으나, 유속모의의 경우 고수부지에서의 2차원 모형에 의한 유속결과와 항공사진으로부터 추출된 유속결과가 차이를 보이고 있었다. 또한, 1차원 모형에 의한 결과와 항공사진으로부터 추출된 유속장을 단면평균한 유속과 비교한 결과 큰 오차가 발생하고 있는 것으로 나타났다.

소셜빅데이터 수집 및 분석을 위한 아동청소년 학교폭력 온톨로지 개발 (Ontology Development of School Bullying for Social Big Data Collection and Analysis)

  • 한윤선;김하영;송주영;송태민
    • 한국콘텐츠학회논문지
    • /
    • 제19권6호
    • /
    • pp.10-23
    • /
    • 2019
  • 소셜빅데이터는 아동청소년의 학교폭력 현상에 대한 풍부하고 다각적 시각을 제공할 수 있지만, 복잡하고 다양한 비정형 텍스트로 구성되어 있어 자료의 체계적인 수집과 활용이 어렵다. 소셜빅데이터의 수많은 정보 가운데 의미 있는 개념을 추출하고 자료를 효과적으로 수집하기 위해서는 연구주제에 상응하는 핵심용어를 명시하고, 해당 개념 간의 관계를 나타내주는 온톨로지의 역할이 중추적이다. 본 연구는 온톨로지의 개념을 정리하고, 7단계에 걸친 온톨로지 개발 과정을 구체적으로 설명한 후, 학교폭력 소셜빅데이터 수집 및 분석을 위한 온톨로지 구축에 적용하였다. 그 결과, 학교폭력의 대상, 원인, 유형, 장소, 지역, 대응방안 6가지 영역을 중심으로 최상위 계층인 대분류를 구성하고, 중분류 및 소분류 체계를 거쳐 총 2,400여 개의 핵심용어를 도출하였다. 본 연구의 의의는 온톨로지 수집 및 개발과정을 설명하고, 기존의 연구방법과는 다소 차별을 두는 소셜빅데이터를 활용한 연구모형을 학교폭력 연구에 제시하였다는 것이다. 소셜빅데이터 분석의 기초가 되는 온톨로지 개발 연구는 좁게는 학교폭력 대상자들에 대한 이해를 제고시킬 뿐 아니라, 거시적으로는 학교폭력이라는 사회현상을 바라보는 한국사회의 시각에 대한 정보를 제공하는 실천적 함의가 있다.

해양모니터링 자료의 장기결측 보충 기법 (Long-gap Filling Method for the Coastal Monitoring Data)

  • 조홍연;이기섭;이욱재
    • 한국해안·해양공학회논문집
    • /
    • 제33권6호
    • /
    • pp.333-344
    • /
    • 2021
  • 해양모니터링 자료에서 빈번하게 발생하는 장기결측구간의 자료 보충기법을 제안한다. 제안하는 방법은 결측구간의 장기변동 추세 성분과 단기변동 잔차성분을 추정하여 조합하는 방식으로 결측구간의 미지 정보를 추정한다. 이 방법을 이용하여 울릉도 해상부이 자료의 수온 항목, 약 1개월 정도의 장기결측 구간의 자료를 보충하였으며, 부이에서 관측하는 자료 항목에 대해서도 결측 보충을 수행하였다. 보충된 자료는 항목에 따라 차이를 보이지만 변동양상이 적절하게 재현되는 것으로 파악되었다. 이 방법은 추세추정과 잔차 반영에 따른 편향오차와 분산오차가 발생하지만, 장기결측으로 인한 통계적인 측도 추정의 편향오차는 크게 절감하는 것으로 파악되었다. 결측보충 모형의 추정 RMS 오차의 평균과 90% 신뢰구간은 각각 0.93, 0.35~1.95 범위이다.

돌발홍수 예보를 위한 빅데이터 분석방법 (The big data method for flash flood warning)

  • 박다인;윤상후
    • 디지털융복합연구
    • /
    • 제15권11호
    • /
    • pp.245-250
    • /
    • 2017
  • 돌발홍수는 강우유출수가 하천으로 모여드는 유역이 좁은 지역에 집중호우로 인해 유입되는 물의 양이 급증하여 나타난다. 돌발홍수는 유속이 빠르고 홍수를 대비할 수 있는 시간이 부족하므로 인명과 재산상의 피해를 발생시킨다. 본 연구에서는 돌발홍수를 예보를 위한 빅데이터 분석방법을 수행하였다. 연구 자료는 2009년에서 2012년까지 국민안전처 국가재난정보센터에 보고된 38건의 홍수 피해 자료와 지표수문모형(TOPLATS)에 의해 생성된 수문기상정보인 강우량, 토양수분 상태, 지표유출량이다. 돌발홍수 발생 선행 6시간의 강우량, 토양수분 상태, 지표유출량 데이터를 요인분석을 통해 토양수분 상태, 장기요인에 의한 강우량과 지표유출량, 단기요인에 의한 강우량과 지표유출량으로 축소하였다. 빅데이터 분석 방법으로는 유형분석인 의사결정나무, 랜덤포레스트, 나이브베이즈, 서포트벡터머신, 로지스틱 회귀모형을 사용하였다. 돌발홍수 사고발생 자료가 38건으로 한정되어 있기 때문에 예측성능 정확도 판단이 중요하다. 예측성능 정확도 평가방법으로 kappa계수, TP Rate, FP Rate, F-Measure를 이용하였다. 이 외에 돌발홍수 발생 선행 시점별 재현성 평가와 과거 4년간 돌발홍수 경보 횟수를 통해 최적 유형분석 방법을 제시하였다. 연구결과 로지스틱회귀모형과 랜덤포레스트가 돌발홍수 예보를 위한 예측 성능이 가장 좋았다. 사고발생 자료가 2009년부터 2012년까지 38건으로 한정되어 있어 분석을 위한 훈련자료와 검증자료 구축에 한계가 있었다. 장기간의 자료가 수집된다면 더욱 정확한 빅데이터 분석을 수행할 수 있다.

DSRC와 TCS 정보를 이용한 고속도로 경로통행시간 예측 (Forecasting of Motorway Path Travel Time by Using DSRC and TCS Information)

  • 장현호;윤병조
    • 대한토목학회논문집
    • /
    • 제37권6호
    • /
    • pp.1033-1041
    • /
    • 2017
  • 출발지 기준 고속도로 경로 통행시간(PTTDP)은 첨단여행자정보시스템(ATIS)의 핵심 정보이다. 이러한 필요성에도 불구하고, 지능형교통체계(ITS)의 예측분야에서 PTTDP에 대한 연구는 성공적으로 극복해야할 핵심 도전과제중 하나로 남아있는 상태이다. 이러한 문제점을 효과적으로 극복하기 위하여, 본 연구에서는 고속도로 IC간 경로통행시간을 동적으로 예측하는 방법론을 제시하고자 한다. 제안된 모형은 고속도로망에서 TG의 교통수요와 TG간 출발지기준 경로통행시간간의 관계를 기반으로 개발되었다. 모형의 입력 자료로(TCS로 수집되는) 통행수요와(DSRC로 수집되는) 경로통행시간 자료가 이용되었다. 개발 모형은 고속도로 정보시스템에 탑재/운영하기 위하여 Data Ming 기법중 연산속도가 빠른 k-최근린 이웃을 이용하였다. 실제 자료를 이용한 적용 실험에서, 제안된 모형은 예측의 신뢰성과 연산수행속도 측면에서 ATIS에 적용이 가능한 수준의 성능을 보였다.

SNS 기반 여론 감성 분석 (Sentiment Analysis for Public Opinion in the Social Network Service)

  • 하상현;노태협
    • 문화기술의 융합
    • /
    • 제6권1호
    • /
    • pp.111-120
    • /
    • 2020
  • 본 연구는 소셜네트워크서비스(SNS)상의 빅데이터를 이용한 텍스트 분석기법의 응용으로서 설문 조사 기반의 여론 조사 방법론과 달리 비정형적 언어 기반의 감성 여론 조사 방법론을 제안한다. 기존의 설문 기반 여론 분석모형에 대한 대안적 방법으로 주관성에 기초한 감성 분류 모형을 이용하였다. 이를 위하여, 제20대 국회의원 선거운동 기간 중 선거 관련 실시간 트위터 자료를 수집하여 속성 기반 감성 분석을 이용한 여론의 극성과 강도에 대한 실증 분석을 수행하였다. 개별 SNS에서 사용된 단어의 극성을 분류하기 위해 Lasso 및 Ridge 회귀 모형을 이용하여 극성에 영향력이 큰 변수를 추출하였다. 추출된 변수가 극성에 미치는 긍정 및 부정에 대한 영향을 구분하고, 영향력의 강도를 분석하였다. 대중들이 소셜네트워크상에서 표현한 내용을 바탕으로 한 여론에 대한 긍정 및 부정의 감성 분석을 통해 여론의 향방을 예측하고 극성분석 모형의 정확도를 측정하여, 여론 조사 분야에서 감성 분석 방법론의 적용가능성을 확인하였다.