• 제목/요약/키워드: Mining tool

검색결과 287건 처리시간 0.024초

프로세스 마이닝 기법을 활용한 고장 수리 프로세스 분석 (Analysis of a Repair Processes Using a Process Mining Tool)

  • 최상현;한관희;임건훈
    • 한국콘텐츠학회논문지
    • /
    • 제13권4호
    • /
    • pp.399-406
    • /
    • 2013
  • 최근 기업의 비즈니스 프로세스를 혁신하고 효율화하기 위한 다양한 연구가 활발히 진행되고 있는 가운데, 의미 있는 비즈니스 프로세스 모델을 생성하고 분석하는 프로세스 마이닝 연구 분야가 주목받고 있다. ERP (Enterprise Resource Planning) 시스템이나 BPM (Business Process Management) 시스템에서 발생되는 업무 처리 내역이나 이벤트 로그를 분석하여 의미 있는 정보나 규칙을 발견해 낼 수 있는 프로세스 마이닝 기법은 다양한 분야에서 적용되고 있다. 본 연구에서는 프로세스 마이닝 도구인 ProM 시스템을 실제 고장 수리 사례에 적용하여 고장 수리 프로세스를 분석하고 제품의 주요 고장 패턴을 발견하는 방법을 제시한다. 고장 수리 프로세스 분석 결과 단순 통계 분석 결과에서 발견할 수 없었던 연결된 흐름의 빈도 분석이 가능하였으며, 연결된 흐름들 중에서 문제가 되는 프로세스에 대한 업무 향상 방안을 제시할 수 있었다.

Developing a semi-automatic data conversion tool for Korean ecological data standardization

  • Lee, Hyeonjeong;Jung, Hoseok;Shin, Miyoung;Kwon, Ohseok
    • Journal of Ecology and Environment
    • /
    • 제41권3호
    • /
    • pp.78-84
    • /
    • 2017
  • Recently, great demands are rising around the globe for monitoring and studying of long-term ecological changes. To go with the stream, many researchers in South Korea have attempted to share and integrate ecological data for practical use. Although some achievements were made in the meantime, we still have to overcome a big obstacle that existing ecological data in South Korea are mostly spread all over the country in various formats of computer files. In this study, we aim to handle the situation by developing a semi-automatic data conversion tool for Korean ecological data standardization, based on some predefined protocols for ecological data collection and management. The current implementation of this tool works on only five species (libythea celtis, spittle bugs, mosquitoes, pinus, and quercus mongolica), helping data managers to quickly and efficiently obtain a standardized format of ecological data from raw collection data. With this tool, the procedure of data conversion is divided into four steps: data file and protocol selection step, species selection step, attribute mapping step, and data standardization step. To find the usability of this tool, we utilized it to conduct the standardization of raw five species data collected from six different observatory sites of Korean National Parks. As a result, we could obtain a common form of standardized data in a relatively short time. With the help of this tool, various ecological data could be easily integrated into the nationwide common platform, providing broad applicability towards solving many issues in ecological and environmental system.

EDF: An Interactive Tool for Event Log Generation for Enabling Process Mining in Small and Medium-sized Enterprises

  • Frans Prathama;Seokrae Won;Iq Reviessay Pulshashi;Riska Asriana Sutrisnowati
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권6호
    • /
    • pp.101-112
    • /
    • 2024
  • 본 논문에서는 프로세스 마이닝을 위한 이벤트 로그 생성을 지원하도록 설계된 대화형 도구인 EDF(Event Data Factory)를 소개한다. EDF는 다양한 데이터 커넥터를 통합하여 사용자가 다양한 데이터 소스에 연결할 수 있도록 지원한다. 이 도구는 그래프 기반 시각화와 함께 로우 코드/노코드 기술을 사용하여 비전문가 사용자가 프로세스 흐름을 이해하도록 돕고, 사용자 경험을 향상시킨다. EDF는 메타데이터 정보를 활용하여 사용자가 case, activity 및 timestamp 속성을 포함하는 이벤트 로그를 효율적으로 생성할 수 있도록 한다. 로그 품질 메트릭을 통해 사용자는 생성된 이벤트 로그의 품질을 평가할 수 있다. 우리는 클라우드 기반 아키텍처에서 EDF를 구현하고 성능평가를 실행했으며, 본 연구와 결과는 EDF의 사용성과 적용 가능성을 보여주었다. 마지막으로 관찰 연구를 통해 EDF가 사용하기 쉽고 유용하여 프로세스 마이닝 애플리케이션에 대한 중소기업(SME)의 접근을 확장한다는 사실을 확인했다.

Biomedical Ontologies and Text Mining for Biomedicine and Healthcare: A Survey

  • Yoo, Ill-Hoi;Song, Min
    • Journal of Computing Science and Engineering
    • /
    • 제2권2호
    • /
    • pp.109-136
    • /
    • 2008
  • In this survey paper, we discuss biomedical ontologies and major text mining techniques applied to biomedicine and healthcare. Biomedical ontologies such as UMLS are currently being adopted in text mining approaches because they provide domain knowledge for text mining approaches. In addition, biomedical ontologies enable us to resolve many linguistic problems when text mining approaches handle biomedical literature. As the first example of text mining, document clustering is surveyed. Because a document set is normally multiple topic, text mining approaches use document clustering as a preprocessing step to group similar documents. Additionally, document clustering is able to inform the biomedical literature searches required for the practice of evidence-based medicine. We introduce Swanson's UnDiscovered Public Knowledge (UDPK) model to generate biomedical hypotheses from biomedical literature such as MEDLINE by discovering novel connections among logically-related biomedical concepts. Another important area of text mining is document classification. Document classification is a valuable tool for biomedical tasks that involve large amounts of text. We survey well-known classification techniques in biomedicine. As the last example of text mining in biomedicine and healthcare, we survey information extraction. Information extraction is the process of scanning text for information relevant to some interest, including extracting entities, relations, and events. We also address techniques and issues of evaluating text mining applications in biomedicine and healthcare.

데이터 마이닝을 이용한 농산물 전자상거래의 온 오프라인 통합시스템 (Integrated System of On-Off Line in Agricultural Products Electronic Commerce Based on Data Mining)

  • 주종문;황승국
    • 산업경영시스템학회지
    • /
    • 제25권3호
    • /
    • pp.58-63
    • /
    • 2002
  • The Internet, as a commercial tool, presented a new market that connects producers with consumers through the E-commerce. Now, E-commerce spreads over almost all industries through the Internet excluding some. This research indicates the reason why the E-commerce is not activated in agricultural Industry, which is less developed than other industries. And it suggests a good example of E-commerce on the agricultural products combining on and off line markets. In addition, data-mining technique is suggested to analyze whole information in system.

조선설계에서의 데이터 해석 및 활용을 위한 데이터 마이닝 도구 개발 (Development of Data Mining Tool for the Utilization of Shipbuilding Knowledge based on Genetic Programming)

  • 이경호;박종훈;최영복;장영훈;오준
    • 대한조선학회논문집
    • /
    • 제43권6호
    • /
    • pp.700-706
    • /
    • 2006
  • As development of information technology, companies stress the need of knowledge management. Companies construct ERP system including knowledge management. But, it is not easy to formalize knowledge in organization. They experience that constructing information system help knowledge management. Now, we focus on engineering knowledge. Because engineering data contains experts' experience and know-how in its own, engineering knowledge is a treasure house of knowledge. Korean shipyards are leader of world shipbuilding industry. They have accumulated a store of knowledge and data. But, they don't have data mining tool to utilize accumulated data. This paper treats development of data mining tools for the utilization of shipbuilding knowledge based on genetic programming(GP).

주식 투자자의 의사결정 지원을 위한 데이터마이닝 도구 (Data Mining Tool for Stock Investors' Decision Support)

  • 김성동
    • 한국콘텐츠학회논문지
    • /
    • 제12권2호
    • /
    • pp.472-482
    • /
    • 2012
  • 주식시장에는 많은 투자자들이 참여하고 있으며 점점 더 많은 사람이 주식투자에 관심을 가지고 있다. 주식시장에서 위험을 회피하고 수익을 얻기 위해서는 다양한 정보를 바탕으로 정확한 의사결정을 해야한다. 즉 수익을 얻을 수 있는 종목 선택, 적절한 매수-매도 가격의 결정, 그리고 적절한 보유기간 등을 결정해야 한다. 본 논문에서는 개인 주식 투자자의 의사결정 지원을 위한 데이터마이닝 도구를 제안한다. 즉, 개인 투자자가 직접 기계학습 방법을 적용하여 주가예측 모델을 생성할 수 있게 하고, 적절한 매수-매도 가격과 보유기간 등을 결정하는 것을 도와주는 도구를 제안한다. 제안하는 도구는 과거 데이터를 이용하여 투자자 자신의 성향에 맞는 투자에서의 의사결정을 할 수 있도록 지원하는 도구로서 주가데이터 관리, 기계학습 적용을 통한 주가예측 모델 생성, 투자 시뮬레이션 등의 기능을 제공한다. 사용자는 스스로 주가에 영향을 미칠 수 있다고 판단하는 기술적 지표를 선정하고 이를 이용하여 주가예측 모델을 만들고 테스트 할 수 있으며, 적절한 예측모델을 적용하여 시뮬레이션을 수행해 봄으로써 실제로 어느 정도 수익을 얻을 수 있는지 평가하고 적절한 매매 정책을 수립할 수 있다. 제안하는 도구를 이용하여 주식 투자자는 기존의 감정적 판단에 의한 투자가 아닌 객관적 데이터에 의해 검증을 거친 주가예측 모델과 매매정책에 따라 주식투자를 할 수 있어 이전 보다 나은 수익을 기대할 수 있다.

eCRM을 위한 데이터마이닝 에지전트의 개발 (The Development of the Data Mining Agent for eCRM)

  • 손달호;홍덕훈
    • 한국산업정보학회논문지
    • /
    • 제11권5호
    • /
    • pp.236-244
    • /
    • 2006
  • 전자상거래의 성장에 따라 고객의 특성을 파악하고 고객의 기호에 맞는 정보를 제공하여 구매력에 영향을 주고 동시에 웹사이트 운영자의 정보선별과 관련된 의사결정을 지원하는 시스템도구들이 개발되고 있다. 그러나 이런 시스템도구들은 웹운영기업에 경제적 부담을 주고 컴포넌트화 되어 있지 않아서 원하는 데이터를 수집하기보다는 수집된 데이터에 기업들의 요구정보를 맞춰야 하는 어려움이 있다. 이러한 점을 감안하여 본 연구는 기업의 필요정보에 대한 맞춤형 웹에이전트 시스템의 설계로 도구기반 로그분석을 대신할 수 있는 시스템개발을 연구목적으로 설정하였다. 본 연구에서 개발된 웹에이전트는 설계언어로 Java와 ASP를 이용하였으며 데이터 저장방식은 쿠키를 이용하는 방식으로 구현되었고 장기적 보존 데이터를 위해서 My-SQL의 데이터베이스와 연동될 수 있도록 개발되었다. 본 연구에서 개발된 시스템은 데이터마이닝개념을 이용하여 도구에 분석데이터를 전달시키기보다는 적극적으로 웹사이트의 컴포넌트형 에이전트로 데이터를 가공하도록 하였고 따라서 고객 개인화 인터페이스 설계 뿐 아니라 의사결정과 전문가 시스템의 성격을 지닌 정보제공방식을 마련할 수 있다는 점에서 기여도가 있다고 본다.

  • PDF

유전적 프로그래밍과 SOM을 결합한 개선된 선박 설계용 데이터 마이닝 시스템 개발 (Development of Data Mining System for Ship Design using Combined Genetic Programming with Self Organizing Map)

  • 이경호;박종훈;한영수;최시영
    • 한국CDE학회논문집
    • /
    • 제14권6호
    • /
    • pp.382-389
    • /
    • 2009
  • Recently, knowledge management has been required in companies as a tool of competitiveness. Companies have constructed Enterprise Resource Planning(ERP) system in order to manage huge knowledge. But, it is not easy to formalize knowledge in organization. We focused on data mining system by genetic programming(GP). Data mining system by genetic programming can be useful tools to derive and extract the necessary information and knowledge from the huge accumulated data. However when we don't have enough amounts of data to perform the learning process of genetic programming, we have to reduce input parameter(s) or increase number of learning or training data. In this study, an enhanced data mining method combining Genetic Programming with Self organizing map, that reduces the number of input parameters, is suggested. Experiment results through a prototype implementation are also discussed.

웹 컨텐츠의 분류를 위한 텍스트마이닝과 데이터마이닝의 통합 방법 연구 (Interplay of Text Mining and Data Mining for Classifying Web Contents)

  • 최윤정;박승수
    • 인지과학
    • /
    • 제13권3호
    • /
    • pp.33-46
    • /
    • 2002
  • 최근 인터넷에는 기존의 데이터베이스 형태가 아닌 일정한 구조를 가지지 않았지만 상당한 잠재적 가치를 지니고 있는 텍스트 데이터들이 많이 생성되고 있다. 고객창구로서 활용되는 게시판이나 이메일, 검색엔진이 초기 수집한 데이터 둥은 이러한 비구조적 데이터의 좋은 예이다. 이러한 텍스트 문서의 분류를 위하여 각종 텍스트마이닝 도구가 개발되고 있으나, 이들은 대개 단순한 통계적 방법에 기반하고 있기 때문에 정확성이 떨어지고 좀 더 다양한 데이터마이닝 기법을 활용할 수 있는 방법이 요구되고 있다. 그러나, 정형화된 입력 데이터를 요구하는 데이터마이닝 기법을 텍스트에 직접 적용하기에는 많은 어려움이 있다. 본 연구에서는 이러한 문제를 해결하기 위하여 전처리 과정에서 텍스트마이닝을 수행하고 정제된 중간결과를 데이터마이닝으로 처리하여 텍스트마이닝에 피드백 시켜 정확성을 높이는 방법을 제안하고 구현하여 보았다. 그리고, 그 타당성을 검증하기 위하여 유해사이트의 웹 컨텐츠를 분류해내는 작업에 적용하여 보고 그 결과를 분석하여 보았다. 분석 결과, 제안방법은 기존의 텍스트마이닝만을 적용할 때에 비하여 오류율을 현저하게 줄일 수 있었다.

  • PDF