• Title/Summary/Keyword: Data Mining Tool

검색결과 219건 처리시간 0.027초

Visualization Data Mining Tool을 활용한 보험사기 적발 (Dectection of Insurance Fraud using Visualization Data Mining Tool)

  • 성태경
    • 경영정보학연구
    • /
    • 제5권1호
    • /
    • pp.49-60
    • /
    • 2003
  • 본 연구의 목적은 현재 심각한 사회 및 경제 문제로 대두되고 있는 보험사기를 효과적으로 적발하기 위하여, visualization 데이터마이닝 tool을 실제 사례에 적용하여 그 타당성을 검증하는데 있다. 이를 위하여 최근 가장 효과적인 visualization 데이터마이닝 tool로 인정되고 있는 i2사의 Analyst's Notebook을 활용하여 대량의 보험금 청구 자료로부터 보험사기의 혐의가 가는 거래를 찾고, 이를 근거로 보첩사기의 혐의를 입증하는 일련의 과정을 검토하였다. 그 결과 visualization 데이터마이닝 tool이 대량의 보험금 청구 자료에서 혐의가 가는 거래를 찾는 단순한 예측의 수준을 넘어, 관련 범죄를 추적하여 체계적, 계획적으로 기획된 보험사기단을 추적해내는 성과를 올렸다. 따라서 보험사기 둥과 같은 부정거래나 범죄 행위를 적발하는 데는 visualization 데이터마이닝 tool이적합한 것으로 판명되었다.

대규모 궤적 데이타를 위한 데이타 마이닝 툴 (A Data Mining Tool for Massive Trajectory Data)

  • 이재길
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권3호
    • /
    • pp.145-153
    • /
    • 2009
  • 궤적(trajectory) 데이타는 실세계 어디에서든지 쉽게 찾아볼 수 있다. 최근 들어, 위성, 센서, RFID, 비디오 및 무선 통신 기술의 발전으로 말미암아 이동 객체를 체계적으로 추적하고, 많은 양의 궤적데이타를 수집할 수 있게 되었다. 이에 따라, 궤적 데이타의 분석에 대한 필요성이 점차 증대되고 있다. 본 논문에서는 대규모 궤적 데이타를 위한 마이닝 툴을 개발한다. 본 마이닝 툴에서는 가장 널리 사용되는 마이닝 연산인 집단화(clustering), 분류(classification), 이상치 발견(outlier detection)을 제공한다. 궤적 집단화는 공통적인 이동 패턴을 발견하며, 궤적 분류는 궤적에 기반하여 이동 객체의 범주를 예측하며, 궤적 이상치 발견은 나머지 궤적들과 크게 다르거나 일관적이지 않은 궤적을 발견한다. 본 마이닝 툴의 가장 큰 장점은 데이타 마이닝 도중에 부분 궤적 정보를 활용한다는 점이다. 본 마이닝 툴의 우수성은 다양한 실제 궤적 데이타 셋을 사용하여 입증되었다. 본 논문의 결과로 궤적 데이타 마이닝을 위한 실용적인 소프트웨어를 개발하였고 많은 실제 응용에 적용될 수 있을 것이라 사료된다.

효율적인 데이터베이스 마케팅을 위한 데이터마이닝 전처리도구에 관한 연구 (A Study on the Data Mining Preprocessing Tool For Efficient Database Marketing)

  • 이준석
    • 디지털융복합연구
    • /
    • 제12권11호
    • /
    • pp.257-264
    • /
    • 2014
  • 효율적인 데이터베이스 마케팅을 위하여 고객들을 세분화하고, 새로운 지식을 탐색할 수 있는 데이터마이닝의 필요성이 증대되고 있다. 데이터마이닝 도구를 구축하기 위해서는 단계별 구현이 요구되어 지는데, 본 연구에서는 데이터마이닝을 위한 분산 환경에 적응 가능한 데이터 전처리 도구를 구성하였다. 기존의 데이터마이닝 도구인 앤서 트리, 클레멘타인, 엔터프라이즈 마이너, 캔싱턴, 웨카의 전처리 부분을 고찰하고, 분산 환경에서 효율적으로 사용할 수 있는 데이터 마이닝 전처리 도구를 구성하였다. 새로이 제안된 시스템은 엔터프라이즈 자바 빈즈와 XML을 기반으로 하였다.

피에이치피와 웨카를 이용한 데이터마이닝 도구의 설계 및 구현 (Design and implementation of data mining tool using PHP and WEKA)

  • 유영재;박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권2호
    • /
    • pp.425-433
    • /
    • 2009
  • 데이터마이닝은 방대한 양의 데이터 속에서 유용한 정보를 찾아내는 과정이며, 이를 위해 데이터마이닝 도구가 필요하다. 데이터마이닝 도구 또는 솔루션은 E-Miner, Clementine, WEKA, R 등 상당히 많은 종류가 있으나 대부분의 데이터마이닝 도구는 다양성과 범용성에 초점을 맞추어 개발되어 사용 편의성과 분석 자동화에 대해서는 소홀한 실정이어서 비전문가가 사용하기 어려운 경우가 대부분이다. 본 논문에서는 피에이치피와 웨카를 이용하여 인터넷 환경에서 데이터마이닝 기법을 실행하고, 생성된 분석결과를 보다 쉽게 해석할 수 있도록 개선하여 일반 사용자도 쉽게 사용할 수 있는 시스템을 설계하고 구현하고자 한다. 본 논문에서 구현하는 데이터마이닝 기법은 가장 많이이용되고 있는 연관성 규칙의 Apriori 알고리즘, 군집분석의 K-평균 알고리즘, 의사결정나무의 J48 알고리즘 등이다.

  • PDF

시나리오 기반의 데이터 마이닝 도구 XM-TDDl/Miner 설계 및 구현 (A Design and Implementation of the Scenario-based Data Mining Tool named XM-T7D1/Miner)

  • 이창호;이남근;이승희;이병엽;김주용
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2000년도 추계정기학술대회:지능형기술과 CRM
    • /
    • pp.307-314
    • /
    • 2000
  • 정보기술이 발달하면서 자료의 흔적들이 체계화된 데이터베이스에 저장이 되고, 더불어 데이터베이스의 규모는 점점 커지고 있다. 데이터 마이닝은 이런 방대한 자료의 분석을 통해, 그 속에 숨어있는 의미를 찾는 과점이라고 될 수 있다. 본 논문에서는 대우정보시스템(주)서 개발된 사용자지향 데이터 마이닝 도구인 XM-Tool/Miner의 개발을 대상으로 하고 있다. 개발된 XM-Tool/Miner은 문제 중심적 마이닝 도구를 목표로 하였으며, 대표적인 마이닝 알고리즘을 적용하였고, 또한 사용의 편이성에 초점을 맞추었다. 더 나아가 데이터 마이닝 기법뿐만 아니라 데이터의 샘플링과 성능향상을 통하여 방대한 데이터로부터 다양한 지식탐사가 가능해지고, 발견된 규칙 또는 지식의 유용성 측정을 통하여 업무 분야의 특성에 따라 효과적으로 반영되며 의사 결정 및 CRM마케팅, 동향분석 및 예측 등에 유용한 정보를 추출하는 도구로 사용할 수 있을 것이다.

  • PDF

Developing a semi-automatic data conversion tool for Korean ecological data standardization

  • Lee, Hyeonjeong;Jung, Hoseok;Shin, Miyoung;Kwon, Ohseok
    • Journal of Ecology and Environment
    • /
    • 제41권3호
    • /
    • pp.78-84
    • /
    • 2017
  • Recently, great demands are rising around the globe for monitoring and studying of long-term ecological changes. To go with the stream, many researchers in South Korea have attempted to share and integrate ecological data for practical use. Although some achievements were made in the meantime, we still have to overcome a big obstacle that existing ecological data in South Korea are mostly spread all over the country in various formats of computer files. In this study, we aim to handle the situation by developing a semi-automatic data conversion tool for Korean ecological data standardization, based on some predefined protocols for ecological data collection and management. The current implementation of this tool works on only five species (libythea celtis, spittle bugs, mosquitoes, pinus, and quercus mongolica), helping data managers to quickly and efficiently obtain a standardized format of ecological data from raw collection data. With this tool, the procedure of data conversion is divided into four steps: data file and protocol selection step, species selection step, attribute mapping step, and data standardization step. To find the usability of this tool, we utilized it to conduct the standardization of raw five species data collected from six different observatory sites of Korean National Parks. As a result, we could obtain a common form of standardized data in a relatively short time. With the help of this tool, various ecological data could be easily integrated into the nationwide common platform, providing broad applicability towards solving many issues in ecological and environmental system.

데이터마이닝을 이용한 국민연금 부정수급 예측모형 개발 - 손해배상금 불성실 신고를 대상으로 - (An Application of Data-Mining Tool in Fraud Pension Payment Prediction)

  • 차경엽
    • Communications for Statistical Applications and Methods
    • /
    • 제17권1호
    • /
    • pp.1-8
    • /
    • 2010
  • 최근 사회복지분야에서 부정수급, 횡령 등이 빈번히 발생함에 따라 비리를 방지하기 위한 체계적인 관리 방안이 요구되고 있다. 데이터마이닝은 다수의 이해관계자와 많은 예산이 투입되는 사업을 관리하는데 효과적인 방법이다. 본 연구는 국민연금의 부정 수급자 관리방안으로 데이터마이닝을 이용한 예측모형을 개발하였다. 분석결과, 수급자의 급여, 연금 가입, 사고내역 정보가 부정수급의 특성 요인으로 나타났으며 이를 의사결정나무 모형, 로지스틱 회귀모형, 인공신경망 모형에 적용한 결과 의사결정나무 모형의 예측력이 가장 우수한 것으로 분석되었다.

S-PLUS와 StatServer를 이용한 Data Mining 도구 개발 (Development of Data Mining Tool Using S-PLUS and StatServer)

  • 정인석;이재준
    • 지능정보연구
    • /
    • 제4권2호
    • /
    • pp.129-139
    • /
    • 1998
  • 통계 software에는 data mining에 필요한 다양한 모형과 함수들이 제공되고 있어 이를 이용한 data mining 도구가 소개되고 있다. 본 논문에서는 data mining을 수행하는데 효과적인 환경을 제공하는 S-Plus로 data mining 기법들을 구현하거나 재구성하였으며, StatServer를 이용하여 대용량의 data base를 직접 관리할 수 있게 하고, S-PLUS의 분석기능을 Internet을 통하여 사용할 수 있게 하여 원거리에서 data mining작업을 수행될 수 있도록 구성하였다. 또한 분석자는 찾아낸 모형을 복잡한 프로그래밍 작업 없이 새로운 웹 페이지를 만들 수 있으며, 이를 통해 운영계의 사용자가 최적 모형이 제시하는 결과를 실제 업무에 즉시 이용할 수 있도록 하였다.

  • PDF

TFT-LCD 산업에서의 품질마이닝 시스템 (A Quality Data Mining System in TFT-LCD Industry)

  • 이현우;남호수
    • 품질경영학회지
    • /
    • 제34권1호
    • /
    • pp.13-19
    • /
    • 2006
  • Data mining is a useful tool for analyzing data from different perspectives and for summarizing them into useful information. Recently, the data mining methods are applied to solving quality problems of the manufacturing processes. This paper discusses the problems of construction of a quality mining system, which is based on the various data mining methods. The quality mining system includes recipe optimization, significant difference test, finding critical processes, forecasting the yield. The contents and system of this paper are focused on the TFT-LCD manufacturing process. We also provide some illustrative field examples of the quality mining system.

TFT-LCD 산업에서의 품질마이닝 시스템

  • 이현우;남호수;최경호
    • 한국품질경영학회:학술대회논문집
    • /
    • 한국품질경영학회 2006년도 춘계학술대회
    • /
    • pp.142-148
    • /
    • 2006
  • Data mining is a useful tool for analyzing data from different perspectives and for summarizing them into useful information. Recently, the data mining methods are applied to solving quality problems of the manufacturing processes. This paper discusses the problems of construction of a quality mining system, which is based on the various data mining methods. The quality mining system includes recipe optimization, significant difference test, finding critical processes, forecasting the yield. The contents and system of this paper are focused on the TFT-LCD manufacturing process. We also provide some illustrative field examples of the quality mining system.

  • PDF