초록
현재 인터넷을 통해 수집되는 빅 데이터는 데이터의 종류와 크기에 따라 데이터가 수집되는 시간보다 데이터가 증가하는 속도가 높아 사용자가 원하는 데이터를 원활하게 수집하는 것이 어려운 상황이다. 특히, 데이터의 사용 목적 및 종류에 따라 다르게 처리되기 때문에 데이터의 정확성과 계산비용이 빅 데이터 관리에 중요한 항목 중 하나이다. 본 논문에서는 인터넷에 존재하는 수많은 서로 다른 종류의 데이터를 사용자가 원할 때, 데이터를 정확하게 추출하는 동시에 데이터의 계산비용을 최소화하기 위해서 이중 해쉬체인을 이용한 계층적 다중처리 기반의 데이터 처리기법을 제안한다. 제안 기법은 다양한 종류의 데이터를 추출하기 위해서 데이터를 사용 목적 및 방법에 따라 계층적으로 분류한다. 이때, 데이터의 정확도를 높이기 위해서 데이터를 이중 해쉬체인으로 묶어 다중 처리한다. 또한, 제안 기법은 계층적으로 분류된 데이터를 손쉽게 접근하기 위해서 해쉬체인으로 데이터를 구성하여 데이터의 처리 비용을 줄였다. 실험결과, 제안 기법은 기존 기법보다 데이터의 정확도는 평균 7.8% 높았고, 데이터의 처리 비용은 4.9% 단축시켰다.
Recently, bit data is difficult to easily collect the desired data because big data is collected via the Internet. Big data is higher than the rate at which the data type and the period of time for which data is collected depending on the size of data increases. In particular, since the data of all different by the intended use and the type of data processing accuracy and computational cost is one of the important items. In this paper, we propose data processing method using a dual-chain in a manner to minimize the computational cost of the data when data is correctly extracted at the same time a multi-layered process through the desired number of the user and different kinds of data on the Internet. The proposed scheme is classified into a hierarchical data in accordance with the intended use and method to extract various kinds of data. At this time, multi-processing and tie the data hash with the double chain to enhance the accuracy of the reading. In addition, the proposed method is to organize the data in the hash chain for easy access to the hierarchically classified data and reduced the cost of processing the data. Experimental results, the proposed method is the accuracy of the data on average 7.8% higher than conventional techniques, processing costs were reduced by 4.9% of the data.