금융 합성데이터 생성 및 후처리를 통한 품질 개선

Improving the Quality of Financial Synthetic Data through Generation and Post-processing

  • 이동현 (인천대학교 컴퓨터공학부) ;
  • 홍승혁 (인천대학교 컴퓨터공학부) ;
  • 김호정 (인천대학교 컴퓨터공학부) ;
  • 김세영 (인천대학교 컴퓨터공학부)
  • Dong-Hyeon Lee (Dept. of Computer Science Engineering, Incheon National University) ;
  • Seung-Hyuk Hong (Dept. of Computer Science Engineering, Incheon National University) ;
  • Ho-Jung Kim (Dept. of Computer Science Engineering, Incheon National University) ;
  • Se-Young Kim (Dept. of Computer Science Engineering, Incheon National University)
  • 발행 : 2024.10.31

초록

금융 데이터의 민감성으로 인해 합성 데이터가 주목받고 있으며, 본 연구는 유사성이 낮은 열에서0 근처 값을 0으로 치환하는 SVS(Single-Value Substitution) 후처리 기법을 제안한다. 기존 방식과 비교해 SVS와 DSF(Dynamic Sample Filtering)를 결합하여 합성 데이터의 품질을 크게 향상시켰다. 특히, DSF와 SVS를 함께 적용했을 때 Column Shapes와 Overall 성능에서 가장 높은 결과를 얻었다. 이 연구는 후처리 기법의 결합이 합성 데이터의 신뢰성과 성능을 극대화하는 데 효과적임을 보여준다.

키워드

과제정보

본 논문은 과학기술정보통신부 대학디지털교육역량강화 사업의 지원을 통해 수행한 ICT멘토링 프로젝트 결과물입니다.

참고문헌

  1. Andrea Lampis, Eugenio Lomurno, Matteo Matteucci, "Bridging the Gap: Enhancing the Utility of Synthetic Data via Post-Processing Techniques," arXiv preprint arXiv:2305.10118v2, 2023.
  2. 금융합성데이터,https://www.aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=data&dataSetSn=71792