• 제목/요약/키워드: Processing Map

검색결과 1,462건 처리시간 0.031초

Rhipe를 활용한 빅데이터 처리 및 분석 (Analysis of big data using Rhipe)

  • 고영준;김진석
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권5호
    • /
    • pp.975-987
    • /
    • 2013
  • 최근 Hadoop은 빅데이터의 저장, 처리 및 분석을 위한 표준시스템으로 인식되고 있으며, 많은 빅데이터 관련 시스템들이 Hadoop에 기반하여 구축되고 있다. 또한 R은 다른 소프트웨어와의 연동이 쉽고 다양한 분석 라이브러리들을 탑재하고 있어서 Hadoop 환경하에서 빅데이터의 분석을 위한 공통 분석 플렛폼으로 여겨지고 있다. 본 논문에서는 Hadoop 환경에서 분산 데이터 처리를 위한 R패키지인 Rhipe를 소개하고 빅데이터를 이용한 병렬 다중회귀분석을 위해 MapReduce 프로그램을 작성하는 방법을 예시하였다. 또한 시뮬레이션을 통해 기존의 대용량처리를 위한 R 분석패키지인 ff와 bigmemory와의 연산속도를 비교하였으며, 데이터의 크기가 커짐에 따라 Rhipe를 이용한 MapReduce 프로그램의 계산속도가 ff와 bigmemory에 비해 우수함을 확인하였다.

GIS를 이용한 하수도 시설물 관리 방법에 관한 연구 (A Study on the Sewerage Facility Management Technique based on GIS)

  • 최재화;박희주;이홍술
    • 한국측량학회지
    • /
    • 제11권2호
    • /
    • pp.43-51
    • /
    • 1993
  • 도시 시설물에 관한 도면들은 시민의 생활과 도시 발전에 있어 매우 중요한 기반시설자원이다. 현재 이들에 대한 관리에 있어 존재하는 비효율성 방지를 위해 전산화의 필요성이 대두되고 있다. 본 연구에서는 PC용 GIS 소프트웨어를 이용하여 도시시설물중 하수도 시설의 관리 방법에 관하여 연구하였다. 경기도 안산시 일부지역을 표본으로 하여 하수도관리를 전산화하는 시스템구축을 위하여 도형 자료의 입력에는 1:38,000 안산시 행 정구역도와 1:3,000 도시 계획 총괄도, 그리고 1:500 시설물 도면을 이용하였고, 속성자료로서는 토지의 지번, 하수도의 설치 년도, 관의 재질, 관경, 길이 등을 입력하였다. 데이타베이스의 구축은 관계형(Relational) 자료모형을 이용하였으며, 자료의 검색, 분석, 처리를 위하여 위상관계를 설정하였다. 또한 본 연구에서는 노후관의 교체, 보수를 위한 공사와 관련된 물량, 시간, 비용 등을 계산할 수 있는 프로그램을 작성하였다.

  • PDF

맵리듀스에서 빅데이터 분석을 위한 다중 Group-by 질의의 효율적인 처리 기법 (Efficient Processing of Multiple Group-by Queries in MapReduce for Big Data Analysis)

  • 박은주;박소정;오소현;최혜진;이기용;심준호
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권5호
    • /
    • pp.387-392
    • /
    • 2015
  • 맵리듀스(MapReduce)는 대용량의 데이터를 다수의 컴퓨터로 병렬 처리하기 위해 사용되는 프레임워크이다. Group-by 질의는 데이터를 지정된 애트리뷰트들의 값에 따라 그룹화하고, 각 그룹에 대해 지정된 집계 함수 값을 구하는 질의이다. 본 논문에서는 둘 이상의 group-by 질의가 동시에 요청되었을 때, 이들을 맵리듀스를 사용하여 효율적으로 처리하는 기법을 제안한다. 제안 기법은 각 group-by 질의를 독립적으로 계산하는 대신, 총 수행비용을 줄이기 위해 하나 이상의 맵리듀스 잡을 통해 단계적으로 계산한다. 성능 평가 실험을 통해, 제안 기법이 각 group-by 질의를 독립적으로 계산하는 단순 방법에 비해 좋은 성능을 가짐을 보인다.

건설 분야에 있어서 이미지 프로세싱 기술의 활용 (Application of Image Processing Techniques in Civil Engineering)

  • 손홍규;박정환;이철희
    • 한국전산구조공학회:학술대회논문집
    • /
    • 한국전산구조공학회 2006년도 정기 학술대회 논문집
    • /
    • pp.58-62
    • /
    • 2006
  • In construction fields. numerous studies have attempted to find the solution of various emerging problems by the introduction of the high technologies of other areas in recent years. In Korea, based on the best IT infrastructure, much experimental studies which are trying to utilizing Photogrammetry, GSISC(Geo-Spatial Information System, Remote Sensing in construction project has been done. The purpose of this study is to analyze the trend of the technologies in the related-fields and examine the detailed image processing techniques. Moreover this paper provides the preparation to create technology road map for systematic research.

  • PDF

Zr계 비정질 합금의 고온 변형거동과 성형성 예측 (High Temperature Deformation Behavior and Estimation for Formability of Zr55Cu30Al10Ni5 Bulk Metallic Glass)

  • 전현준;이광석;장영원
    • 소성∙가공
    • /
    • 제16권4호
    • /
    • pp.309-312
    • /
    • 2007
  • Deformation behavior of $Zr_{55}Cu_{30}Al_{10}Ni_5$(at. %) bulk metallic glass(BMG) fabricated by suction casting method has been investigated at elevated temperatures in this study. The BMG was first verified to have an amorphous structure with the analysis of X-ray diffraction(XRD) and differential scanning calorimetry(DSC) data. A series of compression tests has consequently been performed in the region of supercooled liquid temperature to investigate the behavior of high temperature deformation. A transition from Newtonian to non-Newtonian flow appeared to take place depending upon both the strain rate and test temperature. A processing map based on a dynamic materials model has been constructed to estimate a feasible forming condition for this BMG alloy.

Hadoop을 활용하여 3D 프린터용 대용량 데이터 처리 알고리즘 개발 (Development of high volumes of data processing algorithm for 3D printers in Hadoop systems)

  • 남기원;이규영;김건영;김주현;김성석;양순옥
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.691-693
    • /
    • 2017
  • 하둡 시스템은 대용량의 데이터를 처리할 수 있는 클러스터 기반 개방형 소프트웨어 프레임워크이다. 이는 하둡 분산 파일시스템(HDFS)과 MapReduce 모델을 활용하여 데이터의 병렬 처리를 지원한다. 본 연구에서는 3D 프린터를 위한 3D 모델 데이터를 G-code로 변환하는 알고리즘을 하둡을 활용하여 구현하였다. 4대의 컴퓨터에 하둡 시스템을 설치한 후 전처리-Map-Shuffling-Reduce의 과정을 거쳐 변환작업이 효율적으로 처리하였음을 보일 수 있었다.

맵리듀스를 이용한 다중 조인의 효율적인 처리 기법 (Efficient Processing of Multi-Way Joins using MapReduce)

  • 최연정;박진경;이기용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.779-782
    • /
    • 2014
  • 맵리듀스(MapReduce)는 대용량 데이터의 병렬 처리에 사용되는 프로그래밍 모델이다. 조인(join)은 둘 이상의 테이블에서 동일한 애트리뷰트 값을 가지는 레코드들을 결합하는 연산으로, 데이터베이스 분야에서 가장 중요한 연산 중 하나이다. 본 논문은 맵리듀스를 이용하여 다중 조인(multi-way)을 효율적으로 처리하는 방법을 제안한다. n개 테이블의 다중 조인을 처리하기 위해 기존 방법은 2-way 조인을 수행하는 맵리듀스 잡을 (n-1)번 수행하거나, 레코드들을 중복시켜 n개 테이블의 조인을 1 개의 맵리듀스 잡으로 한 번에 처리한다. 하지만 전자는 맵리듀스 잡을 (n-1)번 수행해야 하며, 후자는 레코드들을 상당히 많이 중복시켜야 한다는 단점이 있다. 본 논문은 레코드를 전혀 중복시키지 않고도 ${\lceil}{\log}_2n{\rceil}$개의 맵리듀스 잡만으로 다중 조인을 효율적으로 처리하는 방법을 제안한다. 실험을 통해 제안 방법은 기존 방법에 대해 다중 조인을 더 빠르게 처리함을 보인다.

Web-Enabler: Transformation of Conventional HIMS Data to Semantics Structure Using Hadoop MapReduce

  • Idris, Muhammad;Lee, Sungyoung
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.137-139
    • /
    • 2014
  • Objective: Data exchange, interoperability, and access as a service in healthcare information management systems (HIMS) is the basic need to provision health-services. Data existing in various HIMS not only differ in the basic underlying structure but also in data processing systems. Data interoperability can only be achieved when following a common structure or standard which is shareable such as semantics based structures. We propose web-enabler: A Hadoop MapReduce based distributed approach to transform the existing huge variety data in variety formats to a conformed and flexible ontological format that enables easy access to data, sharing, and providing various healthcare services. Results: For proof of concept, we present a case study of general patient record in conventional system to be enabled for analysis on the web by transforming to semantics based structure. Conclusion: This work achieves transformation of stale as well as future data to be web-enabled and easily available for analytics in healthcare systems.

클라우드 컴퓨팅에서의 대용량 데이터 처리 모델에 관한 조사 (A Survey on Massive Data Processing Model in Cloud Computing)

  • 진아연;박영호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.145-146
    • /
    • 2011
  • 클라우드 컴퓨팅은 세계적인 시장조사기관인 가트너사의 10대전략기술에서 2년 연속 1위를 할 정도로 많은 각광을 받고 있다. 클라우드 컴퓨팅이란 인터넷 기술을 활용하여 가상화된 컴퓨팅 자원을 서비스로 제공하는 것으로, 사용자는 IT자원을 필요한 만큼 빌려서 사용하고 사용한 만큼 비용을 지불하는 컴퓨팅을 지칭한다. 이러한 클라우드 컴퓨팅 상에서 폭발적으로 증가하고 있는 데이터를 효율적으로 병렬 처리할 수 있는 방법에 대하여 많은 연구가 활발히 이루어지고 있다. 이러한 대용량 데이터 처리를 위한 대표적인 모델에는 MapReduce와 Dryad가 있으며, 서로간에 많은 공통점이 있지만 MapReduce는 범용 프로그래밍 언어를 기반으로 쉬운 병렬 프로그래밍을 가능하게 했다는 점에서 많이 사용되고 있으며 Dryad는 재사용이 쉽고 데이터 처리 흐름을 유연하게 작성할 수 있다는 점에서 장점을 가지고 있다.

비트맵 근사 표현을 이용한 효율적인 공간 조인 (The Processing of Spatial Joins using a Bit-map Approximation)

  • 홍남희;김희수
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권2호
    • /
    • pp.157-164
    • /
    • 2001
  • 공간 질의 처리에서는 효율적인 처리를 위하여 대상 공간 객체들 중에서 후보객체를 찾아내는 여과단계와 후보객체들 중에서 최종 질의를 만족하는 객체들을 찾아내는 정제단계로 나누어 처리하는 방법이 연구되었다. 이때 정제단계의 비용이 여과단계에서의 비용보다 훨씬 크기 때문에 정제단계의 계산비용을 줄일 수 있는 방법을 찾아내는 것이 중요하다. 본 논문에서는 정제단계에서의 계산비용을 줄이기 위한 방법으로 비트맵 근사표현 기법을 제안한다. 비트맵 근사 표현은 conservative 표현과 progressive 표현을 모두 적용하여 정확한 공간객체 교차 알고리즘을 수행하기 전에 false hit과 true hit을 사전에 찾아냄으로써 정제 단계의 계산비용을 줄이는 방법이다. 또한 비트맵 근사 표현을 R-트리에 적용하여 정제단계에서 계산비용을 줄이는 다양한 방법들간의 비교를 통하여 성능을 평가하였다.

  • PDF