• 제목/요약/키워드: Large Scale Data

검색결과 2,796건 처리시간 0.036초

Removing Large-scale Variations in Regularly and Irregularly Spaced Data

  • 조정연
    • 천문학회보
    • /
    • 제44권1호
    • /
    • pp.43.2-43.2
    • /
    • 2019
  • In many astrophysical systems, smooth large-scale variations coexist with small-scale fluctuations. For example, a large-scale velocity or density gradient can exist in molecular clouds that have small-scale fluctuations by turbulence. In redshifted 21cm observations, we also have two types of signals - the Galactic foreground emissions that change smoothly and the redshifted 21cm signals that fluctuate fast in frequency space. In many cases, the large-scale variations make it difficult to extract information on small-scale fluctuations. We propose a simple technique to remove smooth large-scale variations. Our technique relies on multi-point structure functions and can obtain the magnitudes of small-scale fluctuations. It can also be used to design filters that can remove large-scale variations and retrieve small-scale data. We discuss how to apply our technique to irregularly spaced data, such as rotation measure observations toward extragalactic radio point sources.

  • PDF

과학 빅데이터를 위한 엔디엔 테스트베드 분석: 현황, 응용, 특징, 그리고 이슈 (Analysis on NDN Testbeds for Large-scale Scientific Data: Status, Applications, Features, and Issues)

  • 임헌국;신광천
    • 한국정보통신학회논문지
    • /
    • 제24권7호
    • /
    • pp.904-913
    • /
    • 2020
  • 데이터 볼륨과 복잡도가 빠르게 증가함에 따라 과학 빅데이터를 다루는 데이터 집적 과학은 네트워크를 통해 보다 효과적인 데이터 저장 및 분배를 위한 새로운 기술을 발견하는 것을 필요로 한다. 최근 네임드 데이터 네트워킹 커뮤니티와 데이터 집적 과학 커뮤니티는 함께 과학 실험 빅데이터의 분배 및 관리에 있어서 혁신적인 변화를 꾀하였다. 본 논문 에서는 기후과학 및 고에너지물리 데이터 등과 같은 과학 빅데이터를 위한 현존하는 엔디엔 테스트베드들에 대한 분석이 처음으로 이루어진다. 과학 빅데이터를 위한 엔디엔 테스트베드들을 현황, 엔디엔 기반 응용, 특징 측면에서 묘사하고 토의한다. 마지막으로 과학 빅데이터를 위한 엔디엔 테스트베드 네트워크를 확립함에 있어서, 함정에 빠질 수 있는 다양한 이슈들을 엔디엔 테스트베드들에 대한 묘사 그리고 특징들로 부터 도출하여, 분석 제시한다.

전진적 단계 알고리즘을 이용한 대용량 데이터와 순차적 배치 데이터의 분류 (Classification of large-scale data and data batch stream with forward stagewise algorithm)

  • 윤영주
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권6호
    • /
    • pp.1283-1291
    • /
    • 2014
  • 본 논문에서는 대용량이거나 시간에 따라 순차적으로 들어오는 데이터의 분류를 위한 전진적 단계 알고리즘을 제안한다. Adaboost 알고리즘은 노이즈가 있는 데이터에 대하여 성능이 떨어지는 것으로 알려져 있다. 이를 해결하기 위한 한 가지 방법으로 전진적 단계 선형 회귀 방법을 사용한다. 대용량 데이터나 순차적 배치 데이터의 경우에도 이러한 상황을 극복하기 위해 전진적 단계 알고리즘 방법을 적용한 방법을 제안한다. 모의실험과 실제 자료 분석을 통해 제안된 알고리즘이 좋은 성능을 보임을 알 수 있었다.

대용량 자료와 순차적 자료를 위한 부스팅 알고리즘 (Boosting Algorithms for Large-Scale Data and Data Batch Stream)

  • 윤영주
    • 응용통계연구
    • /
    • 제23권1호
    • /
    • pp.197-206
    • /
    • 2010
  • 본 논문에서는 대용량 자료 혹은 시간에 따라 순차적으로 들어오는 자료의 분류를 위한 부스팅(boosting) 알고리즘을 제안한다. 대용량 자료나 순차적 자료의 경우 분석시 모든 훈련 자료(training data)들을 한번에 이용하기 어려우므로 보통의 부스팅 알고리즘은 적절하지 못하다. 이러한 상황을 극복하기 위해 AdaBoost와 Arc-x4와 같은 부스팅 알고리즘을 수정하여 제안한다. 모의 실험과 실제 자료 분석을 통해 대용량 자료나 순차적 자료에 제안된 알고리즘이 잘 적용됨을 보였다.

대용량 자료 실시간 시각화를 위한 레벨 수준 표현 인터페이스 설계 (Level Scale Interface Design for Real-Time Visualizing Large-Scale Data)

  • 이도훈
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권2호
    • /
    • pp.105-111
    • /
    • 2008
  • 자료를 시각적으로 표현하는 방법은 입력자료나 출력자료의 형태에 따라 많은 방법들이 제시되었다. 복잡하거나 방대한 자료 또는 정보를 시각적으로 표현하기 위해서 LOD와 같은 방법을 사용하고 특정부분을 지정하여 확대하는 방법을 주로 사용하고 있다. 본 논문에서는 생물정보와 같은 대용량 자료의 동적이고 실시간으로 배율을 표현할 수 있는 레벨수준 표현을 위한 인터페이스 설계 방법을 제안한다. 이는 기존의 LOD나 특정지역의 단순한 확대만을 위한 것이 아니라 동적으로 특정 영역을 축소 또는 확대해야 할 경우 실시간으로 표현할 수 있는 방법이다. 축소 또는 확대영역의 폭을 크게 했다가 어느 시점에서 매우 정교하게 조절할 수 있다. 제안된 방법으로 방대한 유전체 자료를 표현하는데 접목하여 구현하였고 매우 편리함을 보여주었다.

  • PDF

GOMS: Large-scale ontology management system using graph databases

  • Lee, Chun-Hee;Kang, Dong-oh
    • ETRI Journal
    • /
    • 제44권5호
    • /
    • pp.780-793
    • /
    • 2022
  • Large-scale ontology management is one of the main issues when using ontology data practically. Although many approaches have been proposed in relational database management systems (RDBMSs) or object-oriented DBMSs (OODBMSs) to develop large-scale ontology management systems, they have several limitations because ontology data structures are intrinsically different from traditional data structures in RDBMSs or OODBMSs. In addition, users have difficulty using ontology data because many terminologies (ontology nodes) in large-scale ontology data match with a given string keyword. Therefore, in this study, we propose a (graph database-based ontology management system (GOMS) to efficiently manage large-scale ontology data. GOMS uses a graph DBMS and provides new query templates to help users find key concepts or instances. Furthermore, to run queries with multiple joins and path conditions efficiently, we propose GOMS encoding as a filtering tool and develop hash-based join processing algorithms in the graph DBMS. Finally, we experimentally show that GOMS can process various types of queries efficiently.

Robust Hierarchical Data Fusion Scheme for Large-Scale Sensor Network

  • Song, Il Young
    • 센서학회지
    • /
    • 제26권1호
    • /
    • pp.1-6
    • /
    • 2017
  • The advanced driver assistant system (ADAS) requires the collection of a large amount of information including road conditions, environment, vehicle status, condition of the driver, and other useful data. In this regard, large-scale sensor networks can be an appropriate solution since they have been designed for this purpose. Recent advances in sensor network technology have enabled the management and monitoring of large-scale tasks such as the monitoring of road surface temperature on a highway. In this paper, we consider the estimation and fusion problems of the large-scale sensor networks used in the ADAS. Hierarchical fusion architecture is proposed for an arbitrary topology of the large-scale sensor network. A robust cluster estimator is proposed to achieve robustness of the network against outliers or failure of sensors. Lastly, a robust hierarchical data fusion scheme is proposed for the communication channel between the clusters and fusion center, considering the non-Gaussian channel noise, which is typical in communication systems.

대규모 점군 및 폴리곤 모델의 GLSL 기반 실시간 렌더링 알고리즘 (A Real-Time Rendering Algorithm of Large-Scale Point Clouds or Polygon Meshes Using GLSL)

  • 박상근
    • 한국CDE학회논문집
    • /
    • 제19권3호
    • /
    • pp.294-304
    • /
    • 2014
  • This paper presents a real-time rendering algorithm of large-scale geometric data using GLSL (OpenGL shading language). It details the VAO (vertex array object) and VBO(vertex buffer object) to be used for up-loading the large-scale point clouds and polygon meshes to a graphic video memory, and describes the shader program composed by a vertex shader and a fragment shader, which manipulates those large-scale data to be rendered by GPU. In addition, we explain the global rendering procedure that creates and runs the shader program with the VAO and VBO. Finally, a rendering performance will be measured with application examples, from which it will be demonstrated that the proposed algorithm enables a real-time rendering of large amount of geometric data, almost impossible to carry out by previous techniques.

대형 이벤트 대응형 통합교통분석 시스템 개발 (Development of Integrated Transportation Analysis System for Large-scale event)

  • 임성한
    • 한국ITS학회 논문지
    • /
    • 제13권3호
    • /
    • pp.1-9
    • /
    • 2014
  • 본 연구는 대형 이벤트가 발생하였을 때 신속하고 정확한 교통정책을 수립할 수 있도록 대형 이벤트 대응형 통합교통분석 시스템을 개발하는 데 목적이 있다. 교통분석 시스템 사례조사를 기초로 통합교통분석 시스템의 요건을 정의하고 개발방향을 수립하였다. 데이터 웨어하우스 (data warehouse) 구축을 위해 신속하고 정확한 교통정책 수립이 요구되는 대형 이벤트를 선정하고 데이터를 수집하였다. 수집된 대형 이벤트 데이터와 교통 데이터를 통합하여 데이터 웨어하우스와 주제별 데이터 마트 (data mart)를 구축하였다. 이용자가 적시에 의사결정을 할 수 있도록 비즈니스 인텔리전스(business intelligence) 시스템 화면을 설계하고 개발하였다.

Privacy Enhanced Data Security Mechanism in a Large-Scale Distributed Computing System for HTC and MTC

  • Rho, Seungwoo;Park, Sangbae;Hwang, Soonwook
    • International Journal of Contents
    • /
    • 제12권2호
    • /
    • pp.6-11
    • /
    • 2016
  • We developed a pilot-job based large-scale distributed computing system to support HTC and MTC, called HTCaaS (High-Throughput Computing as a Service), which helps scientists solve large-scale scientific problems in areas such as pharmaceutical domains, high-energy physics, nuclear physics and bio science. Since most of these problems involve critical data that affect the national economy and activate basic industries, data privacy is a very important issue. In this paper, we implement a privacy enhanced data security mechanism to support HTC and MTC in a large-scale distributed computing system and show how this technique affects performance in our system. With this mechanism, users can securely store data in our system.