• Title/Summary/Keyword: 데이터 처리 프로세스

Search Result 482, Processing Time 0.032 seconds

Recruitment collector using multiple processes based on Python (Python 언어 기반의 다중 프로세스를 이용한 채용공고 수집기)

  • Hur, Tai-Sung;Kim, Jun-Ho;Baek, Sang-Heong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2019.07a
    • /
    • pp.229-230
    • /
    • 2019
  • 평생직장이 사라지면서 중년층은 재취업을 희망하고, 매년 실업률이 높아지면서 취업 포털 사이트를 이용하는 이용자들이 증가하고 있다. 이러한 이용자들에게 채용공고 정보를 제공해 주기위해서 보편적으로 Python 언어를 이용하여 데이터를 처리하고 수집한다. 하지만, Python은 다중 프로세스 기반을 갖춘 PC가 보급됨에도 불구하고 단일 프로세스로 처리하는 한계를 보이며, 나머지 프로세스에서는 데이터 처리를 하지 못하는 한계가 있다. 이러한 문제를 해결하기 위해 개선된 Python에서는 다중 프로세스로 처리 가능함에 따라 이를 이용한 채용 공고 수집기를 개발을 제안한다. 제안한 다중 프로세스를 사용한 수집기는 단일 프로세스보다 처리성능이 최대 3.42배 향상되었음을 확인하였다. 따라서, 다중 프로세스를 이용하여 채용 공고를 수집한다면 기존보다 더 빠른 데이터 처리와 데이터 수집 능력을 갖췄음을 확인하였다.

  • PDF

Improvement of Datawarehouse Development Process by Applying the Configuration Management of CMMI (CMMI의 형상관리를 적용한 데이터웨어하우스 개발 프로세스의 개선)

  • Park Jong-Mo;Cho Kyung-San
    • The KIPS Transactions:PartD
    • /
    • v.13D no.4 s.107
    • /
    • pp.625-632
    • /
    • 2006
  • A Datawarehouse, which extracts and saves the massive analysis data from the operating servers, is a decision support tool in which data quality and processing time are very important. Thus, it is necessary to standardize and improve datawarehouse development process in order to stabilize data quality and improve the productivity. We propose a novel improved process for datawarehouse development by applying the configuration management of CMMI (Capability Maturity Model Integration) which has become a major force in software development process improvement. In addition, we specify some matrices for evaluating datawarehouse development process. Through the comparison analysis with other existing processes, we show that our proposal is more efficient in cost and productivity as well as improves data quality and reusability.

Enhanced Meta Process Implementation For Growing Data Warehouse (데이터웨어하우스 성장에 따른 개선된 메타프로세스 구현)

  • Lee, Dong-Won;Moon, Seung-Jin
    • Annual Conference of KIPS
    • /
    • 2000.04a
    • /
    • pp.7-9
    • /
    • 2000
  • 데이터 웨어하우스는 기업의 의사 결정 과정을 향상시킬 수 있게 하는 정보기술이다. 대표적인 정의로는 '기업의 의사결정 과정을 지원하기 위한 주제 중심적이고 통합적이며 시간성을 가지는 비휘발성 자료의 집합 '이다.[1] 즉, 기업들이 보유하고 있는 분산된 대량의 데이터를 추출, 변환, 통합하여 요약된 읽기 전용의 데이터베이스로 구축함으로써, 경영분석이나 기업내의 의사 결정 지원 자료로 주로 활용된다. 데이터 웨어하우스의 경우, 일반사용자는 웨어하우스내에 저장된 데이터를 직접 이용하는 경우가 대부분이다. 따라서, 데이터의 구조와 의미에 대한 일반 사용자의 이해가 필요하게 되었다. 즉, 데이터의 추출 및 정제규칙, 데이터의 통합규칙, 요약알고리즘, 데이터 처리스케쥴 등을 알아야만 한다. 메타데이터는 최소한의 데이터 구조, 데이터의 요약에 사용된 알고리즘, 운영 데이터베이스와 데이터 웨어하우스사이의 대응관계와 같은 정보를 포함하여야 한다.[3] 여기서 변환프로세스에 대한 정보를 데이터의 형식에 대한 정보와 일반적인 데이터들과 차별화하여 메타프로세스라 한다.[5] 메타프로세스는 데이터를 변환하여 데이터 웨어하우스에 적재하는 과정에서 생성되는 메타데이터의 일부로써 데이터 웨어하우스에 통합된 자료들이 어떤 변환과정을 거쳐 생성된 자료인지를 알려주는 변환프로세스에 관한 정보를 제공한다. 본 연구에서는 대부분의 데이터 웨어하우스에서 구현되고 있는 메타데이터들은 데이터 항목의 속성정보를 위주로 한 것이며, 변환 프로세스와 관련된 데이터 관리가 미약하다. 따라서, 데이터 웨어하우스의 메타데이터 중 메타프로세스 정보의 추출 및 관리 시스템을 제안하는 것이다.

  • PDF

인터넷 유통업의 대량 트랜잭션 처리를 위한 프로세스 에이전트 정의와 활동 프레임웍

  • 박광호
    • Proceedings of the Korea Database Society Conference
    • /
    • 1999.06a
    • /
    • pp.241-250
    • /
    • 1999
  • 인터넷 온라인 유통업은 기본적으로 다량의 트랜잭션 발생을 전제로 한다. 본 논문에서는 디지털 프로세스 처리를 목표로 한 프로세스 에이전트를 정의하고 이들의 활동 프레임웍을 제시하고 있다. 인터넷 온라인 유통업을 대상으로 내부 프로세스를 분석해 보았으며 이를 토대로 다양한 운영층 프로세스 에이전트 유형과 특성을 정의하였다 또한, 다수의 에이전트로 구성된 프로세스 에이전트팀 조직과 활동 원칙도 제시하였다. 에이전트의 구현을 위해 멀티쓰레딩 기법을 사용하였다. 단순한 데이터처리를 담당하는 운영층 프로세스 에이전트에 대한 연구는 향후 보다 복잡한 지능을 가진 전략층 프로세스 에이전트에 대한 연구로 발전할 것이다.

  • PDF

인터넷 유통업의 대량 트랜잭션 처리를 위한 프로세스 에이전트 정의와 활동 프레임웍

  • 박광호
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 1999.03a
    • /
    • pp.241-250
    • /
    • 1999
  • 인터넷 온라인 유통업은 기본적으로 다량의 트랜잭션 발생을 전제로 한다. 본 논문은 디지털 프로세스 처리를 목표로 한 프로세스 에이전트를 정의하고 이들의 활동 프레임웍을 제시하고 있다. 인터넷 온라인 유통업을 대상으로 내부 프로세스를 분석해 보았으며 이를 토대로 다양한 운영층 프로세스 에이전트 유형과 특성을 정의하였다. 또한, 다수의 에이전트로 구성된 프로세스 에이전트팀 조직과 활동 원칙도 제시하였다. 에이전트의 구현을 위해 컬티쓰데딩 기법을 사용하였다. 단순한 데이터 처리를 담당하는 운영층 프로세스 에이전트에 대한 연구는 향후 보다 복잡한 지능을 가진 전략층 프로세스 에이전트에 대한 연구로 발전할 것이다.

  • PDF

스마트 해상 물류 통합 프로세스 설계 기술을 위한 데이터 처리 연구

  • 최우근;박순호
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2022.06a
    • /
    • pp.435-437
    • /
    • 2022
  • 스마트 해상물류 통합 프로세스 설계 기술을 위한 데이터 처리 연구는 스마트 해상 물류 통합을 위한 메시지 관리 패턴 정의로 해운-항만-내륙물류의 다양한 서비스와의 연계 데이터 관리 패턴 설계, 디지털 문서의 수용 및 데이터 교환을 위한 상호운용성 보완 기술 설계 그리고 프로세스 기반 거래검증 알고리즘에 대한 연구 내용이다.

  • PDF

Petri net based ETL Process Modeling (페트리넷 기반의 ETL프로세스 모델링)

  • Jung, Sung-Jae;Choe, Yun-Ho;Hwang, Jongha;Kim, Dong-Hoon;Lee, Hwasik
    • Annual Conference of KIPS
    • /
    • 2015.10a
    • /
    • pp.1239-1241
    • /
    • 2015
  • ETL(Extraction, Transformation, Loading)작업은 데이터웨어하우스 시스템 구축 및 유지관리 뿐만 아니라 차세대 정보시스템 구축의 핵심 프로세스에 해당한다. 특히 차세대 정보시스템 구축에 있어서 ETL 작업의 성능은 시스템오픈의 성패를 좌우하는 중요한 요소이다. 일반적으로 차세대시스템 구축의 데이터 전환을 위해 수행되는 ETL작업은 대용량데이터에 대한 다양한 형태의 데이터변형 과정을 수반하며 반드시 정해진 시간안에 완료되어야 한다. 또한, 수 많은 원천 집합을 추출하여 타겟시스템의 형태에 맞게 변형 및 적재하는 작업은 한정된 컴퓨팅 자원내에서 수행되어야 한다. 따라서 자원성능을 고려한 ETL작업 스케줄 최적화는 데이터전환 작업에 있어 필수적인 고려사항이 된다. 이 연구에서는 가용한 물리자원을 최대한 활용하여 ETL 프로세스의 처리능(throughput)을 최대화 하는데 초점을 맞추어, ETL프로세스를 페트리넷을 이용해 모델링하는 기법을 제시한다. 이 모델에는 ETL 프로세스가 수행될 서버의 컴퓨팅자원이 토큰화(tokenize)되어 포함된다. 이 모델을 기반으로 가용자원을 최대한 활용하면서도 자원병목이 발생하지 않는 수준으로 ETL 작업이 수행될 수 있도록 프로세스를 제어할 수 있는 방안을 제시한다.

Design of a Run-time Process Monitor with a Function of Detecting Root Cause Process (원인 프로세스 추적 기능을 가진 실행시간 프로세스 모니터의 설계)

  • Jeong, Yoon-Seok;Kim, Tae-Wan;Chun-Hyon, Chang
    • Annual Conference of KIPS
    • /
    • 2003.11a
    • /
    • pp.405-408
    • /
    • 2003
  • 산업 전반에 보급된 실시간 시스템의 수행 상태를 파악하기 위해 실시간 감시 기능을 사용한다. 감시의 기본 목적은 감시 대상이 정상적으로 수행하는지를 파악하는 것이다. 특히 실시간 감시 기법으로는 실시간 시스템 상에서 동작하는 실시간 프로세스 상태를 감시하는 프로세스 감시 기법이 있다. 이러한 감시 기법을 지원하는 실행시간 프로세스 모니터의 구조 및 데이터 저장소의 구조에 대해서는 이미 설계 및 구현을 하였다. 하지만, 기존의 프로세스 모니터는 프로세스 상태 데이터를 수집하는 기본 기능만을 제공하였다. 개발자에게 있어서 의미 있는 정보는 프로세스 상태 데이터만이 아니라 프로세스의 동작상의 문제점을 발견하고 원인 규명을 할 수 있도록 하는 고급 정보이다. 이러한 정보를 도출하기 위해 본 논문에서는 기존의 실행시간 프로세스 모니터의 구조 기반 위에서 프로세스 동작 여부를 확인하는 기능과 흐름 추적 기능을 새롭게 설계 추가하였다. 이들 기능을 통해 개발자는 어떤 프로세스에서 동작상의 문제가 발생했는지, 또한 문제를 발생시킨 원인 프로세스가 무엇인지를 추적해 낼 수 있으며, 개발단계에서 문제 해결 능력을 높일 수 있다. 본 논문에서 설계한 원인 프로세스 추적 기능을 가진 실행시간 프로세스 모니터는 기본적으로 실시간 감시 및 제어를 필요로 하는 분야에서 이용될 수 있다.

  • PDF

Process-level integration method for performance improvement of large scaled batch data processing in EAI environment (EAI에서 대용량 배치 데이터의 통합 성능 향상을 위한 Process-level 방식)

  • Kim Yonghee;Kwon Juhum
    • Annual Conference of KIPS
    • /
    • 2004.11a
    • /
    • pp.19-22
    • /
    • 2004
  • 분산 시스템 환경에서 여러 시스템에 정보를 전송하기 위한 방법으로 최근 EAI 의 DB Trigger 및 Redo Log 등을 이용한 실시간 데이터 통합 방식을 적용해 왔다. 그러나 기업에서 순차적인 배치 프로세스들을 통해 처리하는 대량의 데이터에 대해 기존의 EAI 의 데이터 통합 방식을 사용할 경우 모든 변경 건수에 대해 이벤트가 발생하여 Source 시스템의 부하 및 통합 성능상의 문제점이 있다. 본 논문에서는 순차적인 배치 프로세스들을 EAI 의 프로세스 레벨 통합을 적용하여 최종 변경된 데이터에 대해서만 통합하도록 하여 통합 처리 시간을 단축할 수 있는 방법을 제시하고자 한다.

  • PDF

Design of Table Shape Comparison Algorithm for Improvement of Transformation Managing Process in Meta Data Management System (메타데이터 관리시스템의 이관 관리 프로세스 개선을 위한 테이블 형상 비교 알고리즘 설계)

  • Yang, Seungyeon;Park, Seok-Cheon;Moon, Seung-Sic;Lee, Jinhee;In, Teahwan
    • Annual Conference of KIPS
    • /
    • 2013.11a
    • /
    • pp.1222-1225
    • /
    • 2013
  • 오늘날 기업의 시스템은 훨씬 복잡해지고 다루는 데이터의 규모는 점점 대형화됨에 따라 환경 변화에 기업이 대응하기가 어려워지고 있다. IT 환경의 변화에 기업이 대응하기 위해서는 메타데이터 관리시스템의 기능을 개선할 필요가 있다. 본 논문에서는 데이터 모델링에 대한 새로운 요구사항을 신속히 반영하기 위해서 모델의 변경 이력을 참조하지 않고 이관해야 할 목표 데이터베이스의 테이블의 형상을 비교하여 이관 관리 프로세스를 향상시킨 알고리즘을 설계하였다. 본 논문서 설계한 알고리즘을 통해 모델의 변경 이력을 참조할 경우 발생하는 데이터베이스 변경의 처리 횟수를 줄임으로써 프로세스 개선의 효과를 기대할 수 있는 알고리즘을 제시하였다.