• 제목/요약/키워드: Data Mining Process

검색결과 680건 처리시간 0.023초

Artificial Intelligence and Pattern Recognition Using Data Mining Algorithms

  • Al-Shamiri, Abdulkawi Yahya Radman
    • International Journal of Computer Science & Network Security
    • /
    • 제21권7호
    • /
    • pp.221-232
    • /
    • 2021
  • In recent years, with the existence of huge amounts of data stored in huge databases, the need for developing accurate tools for analyzing data and extracting information and knowledge from the huge and multi-source databases have been increased. Hence, new and modern techniques have emerged that will contribute to the development of all other sciences. Knowledge discovery techniques are among these technologies, one popular technique of knowledge discovery techniques is data mining which aims to knowledge discovery from huge amounts of data. Such modern technologies of knowledge discovery will contribute to the development of all other fields. Data mining is important, interesting technique, and has many different and varied algorithms; Therefore, this paper aims to present overview of data mining, and clarify the most important of those algorithms and their uses.

프로세스 마이닝을 이용한 웹 로그 분석 프레임워크 (A Framework for Web Log Analysis Using Process Mining Techniques)

  • 안윤하;오규협;김상국;정재윤
    • 정보화연구
    • /
    • 제11권1호
    • /
    • pp.25-32
    • /
    • 2014
  • 웹 마이닝은 사용자의 웹 이용 분석을 위해 웹에서 발생한 데이터를 대상으로 유용한 패턴을 찾아내는 기법이다. 하지만 기존의 웹 마이닝은 웹 로그의 연속적인 특성을 충분히 반영하여 분석하지 못하였다. 이를 보완하기 위하여 본 연구에서는 프로세스 마이닝을 활용하여 프로세스 모델에 의한 순차적인 관계에 따른 웹 접속 로그를 분석하는 프레임워크를 제시한다. 프로세스 모델에 기반한 웹 로그 분석은 웹 페이지들을 이동한 사용자들의 행위를 이해하고 문제점과 개선방안을 도출하는 데 유용하게 사용될 수 있다. 본 연구에서는 제안한 방법론을 이용하여 대학정보시스템의 웹 로그를 분석하여 적용 가능성과 그 분석 결과를 제시하였다.

RFID-based Supply Chain Process Mining for Imported Beef

  • Kang, Yong-Shin;Lee, Kyounghun;Lee, Yong-Han;Chung, Ku-Young
    • 한국축산식품학회지
    • /
    • 제33권4호
    • /
    • pp.463-473
    • /
    • 2013
  • Through the development of efficient data collecting technologies like RFID, and inter-enterprise collaboration platforms such as web services, companies which participate in supply chains can acquire visibility over the whole supply chain, and can make decisions to optimize the overall supply chain networks and processes, based on the extracted knowledge from historical data collected by the visibility system. Although not currently active, the MeatWatch system has been developed, and is used in part for this purpose, in the imported beef distribution network in Korea. However, the imported beef distribution network is too complicated to analyze its various aspects using ordinary process analysis approaches. In this paper, we suggest a novel approach, called RFID-based supply chain process mining, to automatically discover and analyze the overall supply chain processes from the distributed RFID event data, without any prior knowledge. The proposed approach was implemented and validated, by using a case study of the imported beef distribution network in Korea. Specifically we demonstrated that the proposed approach can be successfully applied to discover supply chain networks from the distributed event data, to simplify the supply chain networks, and to analyze anomaly of the distribution networks. Such novel process mining functionalities can reinforce the capability of traceability services like MeatWatch in the future.

워크플로우 마이닝 : 휴리스틱 접근 (Workflow Mining based on Heuristic Approach using Log data)

  • 이명희;유철중;장옥배
    • 한국전자거래학회:학술대회논문집
    • /
    • 한국전자거래학회 2005년도 e-Biz World Conference 2005
    • /
    • pp.195-200
    • /
    • 2005
  • As the workflow systems are becoming complex and obscure, there are discrepancies between actual workflow process and designed process. Therefore, we have developed techniques for discovering workflow models. The starting point for such techniques is a so-called 'workflow log' containing information about the workflow process as it is actually being executed. This paper presents an algorithm of workflow process mining based on heuristic approach from the workflow log, which can be happen to business process system.

  • PDF

의사결정나무를 활용한 비즈니스 프로세스 분석 (A Method for Business Process Analysis by using Decision Tree)

  • 허원창;배혜림;김승;정기성
    • 한국전자거래학회지
    • /
    • 제13권3호
    • /
    • pp.51-66
    • /
    • 2008
  • 기업이 비즈니스 프로세스의 중요성을 인식하게 되면서 비즈니스 프로세스 관리시스템에 대한 관심이 높아졌다. 그러나 전통적으로 BPMS는 업무프로세스의 모형화 및 실행에 그 초점이 맞추어져 있어, 상대적으로 프로세스 관리의 궁극적인 목적인 프로세스 효율성 제고나 더 나아가 프로세스를 혁신하는 데에는 큰 기여를 하지 못하였다. BPMS는 일반적으로 방대한 량의 이력 데이터를 남기게 되는데, 이에는 프로세스의 실행과 관련된 다양한 의미있는 정보나 규칙들이 숨어있다. 본 연구는 데이터마이닝 기법을 활용하여 프로세스 이력 데이터를 분석하는 체계적인 방법론을 제시한다. 제시된 방법론은 프로세스 분석을 위한 데이터 모형, 분석절차, 그리고 시스템 프레임워크를 포함한다. 또한 그 유용성을 검증하기 위하여, 시뮬레이션 데이터를 이용한 실험결과를 제시한다.

  • PDF

핵심 기술 파악을 위한 특허 분석 방법: 데이터 마이닝 및 다기준 의사결정 접근법 (A patent analysis method for identifying core technologies: Data mining and multi-criteria decision making approach)

  • 김철현
    • 대한안전경영과학회지
    • /
    • 제16권1호
    • /
    • pp.213-220
    • /
    • 2014
  • This study suggests new approach to identify core technologies through patent analysis. Specially, the approach applied data mining technique and multi-criteria decision making method to the co-classification information of registered patents. First, technological interrelationship matrices of intensity, relatedness, and cross-impact perspectives are constructed with support, lift and confidence values calculated by conducting an association rule mining on the co-classification information of patent data. Second, the analytic network process is applied to the constructed technological interrelationship matrices in order to produce the importance values of technologies from each perspective. Finally, data envelopment analysis is employed to the derived importance values in order to identify priorities of technologies, putting three perspectives together. It is expected that suggested approach could help technology planners to formulate strategy and policy for technological innovation.

데이터 바이닝을 이용한 로버스트 설계 모형의 최적화 (Optimization of Robust Design Model using Data Mining)

  • 정혜진;구본철
    • 산업경영시스템학회지
    • /
    • 제30권2호
    • /
    • pp.99-105
    • /
    • 2007
  • According to the automated manufacturing processes followed by the development of computer manufacturing technologies, products or quality characteristics produced on the processes have measured and recorded automatically. Much amount of data daily produced on the processes may not be efficiently analyzed by current statistical methodologies (i.e., statistical quality control and statistical process control methodologies) because of the dimensionality associated with many input and response variables. Although a number of statistical methods to handle this situation, there is room for improvement. In order to overcome this limitation, we integrated data mining and robust design approach in this research. We find efficiently the significant input variables that connected with the interesting response variables by using the data mining technique. And we find the optimum operating condition of process by using RSM and robust design approach.

데이터 스트림에서 개방 데이터 마이닝 기반의 빈발항목 탐색 (Finding Frequent Itemsets based on Open Data Mining in Data Streams)

  • 장중혁;이원석
    • 정보처리학회논문지D
    • /
    • 제10D권3호
    • /
    • pp.447-458
    • /
    • 2003
  • 기존의 데이터 마이닝 방법들은 기본적으로 지식 발견의 대상이 되는 데이터 집합이 마이닝 작업 시작 이전에 명확히 정의되는 것으로 가정하며 이러한 가정은 고정적으로 정의된 특정 데이터 집합에 내재된 정보 추출이 데이터 마이닝의 목적이 될 때 유효하다. 또한, 기존의 데이터 마이닝 방법들은 대용량의 데이터 집합에 대한 마이닝 결과를 얻는데 있어서 상당한 처리 시간을 요구한다. 따라서, 새로운 트랜잭션 데이터가 지속적으로 추가되는 데이터 스트림에서 추가된 트랜잭션의 정보들을 포함하는 최신의 마이닝 결과를 최대한 빠른 시간 안에 얻기를 기대하는 실시간 처리 환경에서는 기존의 데이터 마이닝 방법을 적용하는 것이 거의 불가능하다. 이러한 목적에 부합하기 위해서 본 논문에서는 새로운 데이터 마이닝 개념인 개방 데이터 마이닝을 제안한다. 개방 데이터 마이닝에서는 새로운 트랜잭션이 발생함에 따라 이전에 발생한 트랜잭션들에 대한 마이닝 결과가 새롭게 갱신되며 따라서 확장된 전체 트랜잭션 집합에 대한 마이닝 결과를 빠르게 얻을 수 있다. 이러한 방법을 효과적으로 구현하기 위해서는 새롭게 출현한 항목에 대한 지연추가와 이전 데이터 집합에 출현한 항목들 중에서 중요하지 않는 항목에 대한 전지작업이 병행되어야 한다. 논문에서 제안하는 알고리즘은 알고리즘의 특성을 파악하기 위한 일련의 다양한 실험을 통해서 검증된다.

A Study of Web Usage Mining for eCRM

  • Hyuncheol Kang;Jung, Byoung-Cheol
    • Communications for Statistical Applications and Methods
    • /
    • 제8권3호
    • /
    • pp.831-840
    • /
    • 2001
  • In this study, We introduce the process of web usage mining, which has lately attracted considerable attention with the fast diffusion of world wide web, and explain the web log data, which Is the main subject of web usage mining. Also, we illustrate some real examples of analysis for web log data and look into practical application of web usage mining for eCRM.

  • PDF

웹 데이터 마이닝과 지식경영 프레임웍을 통한 지식-기반 디자인 패러다임 구축 (The Knowledge-Based Design Paradigm through Web Data Mining and Knowledge Management Framework)

  • 양종열
    • 디자인학연구
    • /
    • 제15권4호
    • /
    • pp.159-168
    • /
    • 2002
  • 세계는 지식정보사회(knowledge information society)에 돌입하였다. 정보기술은 지식경영을 등장시킨 요인중의 하나이며 지식경영발전을 가속화시키는 원동력이라고 볼 수 있다. 그리고 최근 정보기술과 인터넷은 눈부신 발전을 해오고 있다. 따라서 본 연구는 급변하는 디지털 환경하의 방대한 인터넷 데이터에서 웹 데이터 마이닝을 통해 고객에 대한 숨겨진 지식을 창출하고, 그 지식을 지식경영프레임웍에 적용한 지식-기반디자인 패러다임을 구축하여 디지털 환경에서 실시간에 고객에 대한 유용한 지식을 창출하여 고객의 욕구를 충족시키는 디자인을 개발 할 수 있도록 하는데 목적이 있다. 연구의 목적을 달성하기 위해 먼저 이론적 고찰에서 지식경영프로세스와 웹 데이터 마이닝에 관련된 다양한 사전 연구들을 살펴보고 지식경영프로세스와 웹 데이터 마이닝을 결합하여 새로운 지식-기반 디자인 패러다임(본 연구에서는 웹 데이터 마이닝과 지식경영프로세스가 통합하여 구현된 진정한 의미의 eCRM을 지식-기반 디자인패러다임이라 칭한다)을 제안한다.

  • PDF