• 제목/요약/키워드: data repository

검색결과 436건 처리시간 0.024초

빅데이터 활용을 위한 클라우드 기반의 링크드 데이터 인덱싱 시스템 (Linked Data Indexing System for Big Data Processing on the Cloud System)

  • 이민아;정진욱;김응희;김홍기
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1596-1598
    • /
    • 2013
  • 2000년대 초반 등장한 시맨틱 웹 기술은 최근 재조명을 받고 있다. 이는 초기에 구축된 시맨틱 데이터와 최근에 구축하는 시맨틱 데이터의 양적 비교를 통해서도 알 수 있다. 그러나 기존의 시맨틱웹 기술은 대용량 데이터를 처리하는데 어려움이 많아, 이를 처리하기 위한 기술이 중요한 문제로 대두되고 있다. 본 논문에서는 앞에서 말한 바와 같이, 기존 RDF Repository의 대안으로, 다양한 데이터 베이스를 복합적으로 사용하였다. RDF 데이터를 효율적으로 처리하기 위해, NoSQL DB와 메모리 기반 관계형 DB를 활용하여 시스템을 구성하였다. 또한, 사용자가 이에 대한 별도의 지식 없이 기존의 SPARQL 질의를 그대로 사용하여, 원하는 결과를 얻을 수 있는 시스템을 제안한다.

Service Discovery Using Broadcasting Data Channel

  • Hasan, Md. Kamrul;Rubaiyeat, Husne Ara;Lee, Sungyoung;Lee, Young-Koo
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.312-313
    • /
    • 2010
  • Traditional service discovery mechanisms so far necessitate centralized registry containing all the service descriptions. Though centralized service registration is intuitive, it does not facilitate users in their usual ways of doing things. Moreover, centralized repository is not scalable for high query rate. We propose that service description be broadcast through the advertising data channels so that computers can parse and queue the service descriptions interesting to the users. The current technologies such as Digital Media Broadcast (DMB), Car Navigation Systems and Wireless Broadband can bring our idea to reality.

HUMAN ERRORS DURING THE SIMULATIONS OF AN SGTR SCENARIO: APPLICATION OF THE HERA SYSTEM

  • Jung, Won-Dea;Whaley, April M.;Hallbert, Bruce P.
    • Nuclear Engineering and Technology
    • /
    • 제41권10호
    • /
    • pp.1361-1374
    • /
    • 2009
  • Due to the need of data for a Human Reliability Analysis (HRA), a number of data collection efforts have been undertaken in several different organizations. As a part of this effort, a human error analysis that focused on a set of simulator records on a Steam Generator Tube Rupture (SGTR) scenario was performed by using the Human Event Repository and Analysis (HERA) system. This paper summarizes the process and results of the HERA analysis, including discussions about the usability of the HERA system for a human error analysis of simulator data. Five simulated records of an SGTR scenario were analyzed with the HERA analysis process in order to scrutinize the causes and mechanisms of the human related events. From this study, the authors confirmed that the HERA was a serviceable system that can analyze human performance qualitatively from simulator data. It was possible to identify the human related events in the simulator data that affected the system safety not only negatively but also positively. It was also possible to scrutinize the Performance Shaping Factors (PSFs) and the relevant contributory factors with regard to each identified human event.

빅데이터를 위한 H-RTGL 기반 단일 분류기 분산 처리 프레임워크 설계 (Design of Distributed Processing Framework Based on H-RTGL One-class Classifier for Big Data)

  • 김도균;최진영
    • 품질경영학회지
    • /
    • 제48권4호
    • /
    • pp.553-566
    • /
    • 2020
  • Purpose: The purpose of this study was to design a framework for generating one-class classification algorithm based on Hyper-Rectangle(H-RTGL) in a distributed environment connected by network. Methods: At first, we devised one-class classifier based on H-RTGL which can be performed by distributed computing nodes considering model and data parallelism. Then, we also designed facilitating components for execution of distributed processing. In the end, we validate both effectiveness and efficiency of the classifier obtained from the proposed framework by a numerical experiment using data set obtained from UCI machine learning repository. Results: We designed distributed processing framework capable of one-class classification based on H-RTGL in distributed environment consisting of physically separated computing nodes. It includes components for implementation of model and data parallelism, which enables distributed generation of classifier. From a numerical experiment, we could observe that there was no significant change of classification performance assessed by statistical test and elapsed time was reduced due to application of distributed processing in dataset with considerable size. Conclusion: Based on such result, we can conclude that application of distributed processing for generating classifier can preserve classification performance and it can improve the efficiency of classification algorithms. In addition, we suggested an idea for future research directions of this paper as well as limitation of our work.

메타데이터 교환표준(XMI)을 이용한 분산 이종 GIS 데이터베이스 검색 (Distributed and Heterogeneous GIS Database Search using Metadata Interchange Standard(XMI))

  • 박상우;유상봉
    • 한국공간정보시스템학회 논문지
    • /
    • 제2권1호
    • /
    • pp.29-41
    • /
    • 2000
  • 최근 네트웍의 보급과 지리정보의 활용이 증가하면서 효과적인 지리정보의 검색과 접근에 대한 중요성이 강조되고 있다. 하지만 기존의 GIS 데이터는 지리적으로 분리된 여러 부서나 조직에서 생성 및 관리되고 있으며, 공간 정보 유통을 위한 클리어링하우스 등이 서로 다른 DBMS 상에서 독자적인 스키마를 가지고 개발되어 있다. 이러한 이질적인 구조와 구현 환경으로 인해 일반 사용자들이 서로 다른 GIS 데이터베이스를 접근하여 검색하는데 많은 어려움이 따르고 있다. 본 연구에서는 OMG의 메타데이터 교환 표준인 XMI로 표현된 이질적인 GIS 데이터베이스의 메타데이터를 통하여 사용자에게 각 데이터베이스의 구현 환경과 스키마에 독립적인 공간 데이터를 검색 기능을 제공하는 검색 시스템을 구현하였다.

  • PDF

데이터베이스에서 빈발패턴의 추출을 위한 메모리 향상기법 (Memory Improvement Method for Extraction of Frequent Patterns in DataBase)

  • 박인규
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권2호
    • /
    • pp.127-133
    • /
    • 2019
  • 지금까지의 빈발 항목 추출에서는 FP-Tree에 대한 순회와 패턴의 탐색이 필수적인 과정이기 때문에 마이닝 데이터를 트리에 저장하는데 공간이 필요하고 탐색하는데 CPU시간이 필요하기 마련이다. 이러한 단점을 극복하기 위하여 본 논문에서는 조건부 FP-Tree의 의존하지 않고 트랜잭션 데이터의 각 항목들의 위치 정보를 부여하여 트랜잭션 데이터를 2차원의 위치정보 Look-Up테이블로 변환하여 시간과 공간적인 접근성을 용이하게 한다. 또한 항목과 항목의 위치에 대한 매핑배열을 병행하여 시간 복잡도를 줄이는 방법을 고려하는 알고리즘을 제안한다. 실험 결과를 통하여 제안된 방법은 FIMI 저장소 웹 사이트에서 얻은 데이터 세트를 기반으로 많은 실행 시간과 메모리 사용을 줄일 수 있음을 보였다.

ConvXGB: A new deep learning model for classification problems based on CNN and XGBoost

  • Thongsuwan, Setthanun;Jaiyen, Saichon;Padcharoen, Anantachai;Agarwal, Praveen
    • Nuclear Engineering and Technology
    • /
    • 제53권2호
    • /
    • pp.522-531
    • /
    • 2021
  • We describe a new deep learning model - Convolutional eXtreme Gradient Boosting (ConvXGB) for classification problems based on convolutional neural nets and Chen et al.'s XGBoost. As well as image data, ConvXGB also supports the general classification problems, with a data preprocessing module. ConvXGB consists of several stacked convolutional layers to learn the features of the input and is able to learn features automatically, followed by XGBoost in the last layer for predicting the class labels. The ConvXGB model is simplified by reducing the number of parameters under appropriate conditions, since it is not necessary re-adjust the weight values in a back propagation cycle. Experiments on several data sets from UCL Repository, including images and general data sets, showed that our model handled the classification problems, for all the tested data sets, slightly better than CNN and XGBoost alone and was sometimes significantly better.

지질학적 심지층 처분지 내 천연방벽의 고준위 방사성 폐기물 장기 처분 안전성 평가를 위한 지질학적 인자 분석 (Geological Factor Analysis for Evaluating the Long-term Safety Performance of Natural Barriers in Deep Geological Repository System of High-level Radioactive Waste)

  • 이형목;정지호;박재성;이수비 ;소수완 ;정진아
    • 자원환경지질
    • /
    • 제56권5호
    • /
    • pp.533-545
    • /
    • 2023
  • 본 연구에서는 고준위 방사성 폐기물 심지층 처분장을 구성하고 있는 천연방벽의 장기안전성에 영향을 줄 수 있는 요소(Feature), 사건(Event), 및 공정(Process)에 대한 조사를 수행하여 FEP 목록을 작성하였다. FEP 목록 작성을 위해 NEA (Nuclear Energy Agency)의 IFEP 목록 3.0이 기초 자료로 활용되었으며, 국외 선도국에서 수행된 지질 조사 및 연구 결과들이 추가적으로 참고되었다. 천연방벽의 성능과 관련하여 총 49개의 FEP 목록이 작성되었으며, 각 인자에 대한 정의, FEP 분류, 장기 안전성에 미치는 영향, 국내 여건에서의 중요도, 정량화 가능 여부 측면에서의 결과가 작성되었다. 또한, 작성된 FEP 목록을 기반으로 처분시설의 장기 안전성에 위협이 될 수 있는 총 3가지의 시나리오를 개발하고 각 시나리오에 있어 천연방벽의 처분 성능에 영향을 주는 지질학적 인자들을 선별 및 관계를 가시화하였다. 본 연구를 통해 구축된 FEP 목록과 시나리오별 인자간 상호관계 가시화 결과는 심지층 처분장의 장기 안전성을 정량 평가하기 위한 수학적 모델 개발에 있어 필수적으로 고려해야 할 인자를 선별 및 구성하는데 중요한 기초 정보를 제공할 수 있을 것으로 판단되며, 방폐물 처분장 부지확정을 위한 천연방벽의 주요 성능과 관련된 기준안을 마련하는 데 유용하게 활용될 수 있을 것으로 보인다.

아키텍처산출물 관리 시스템 개발 (Development of Architecture Products Management System)

  • 최남용;송영재
    • 정보처리학회논문지D
    • /
    • 제12D권6호
    • /
    • pp.857-862
    • /
    • 2005
  • 현재 국방부에서는 국방정보체계간 상호운용성을 보장하기 위해 아키텍처산출물을 쉽고 일관성이 있게 개발할 수 있는 국방아키텍처프레임워크와 개발된 아키텍처산출물을 저장하는 핵심아키텍처데이터모델을 개발하였다. 하지만 작성된 아키텍처산출물을 문서로 관리하기에는 많은 어려움이 존재함으로, 아키텍처를 모델링할 수 있고 모델링된 정보를 공통의 저장소에 관리할 수 있는 모델링 도구 및 리포지토리 시스템이 필요하다. 본 논문에서는 국방아키텍처프레임워크와 핵심아키텍처데이터모델의 메타모델과 아키텍처산출물 작성 및 관리를 지원하는 아키텍처산출물 관리 시스템을 개발하였고 기존 시스템과 비교 평가하였다. 이를 통해 각 기관의 아키텍처개발자가 아키텍처산출물을 모델링 방법으로 보다 쉽고 일관성 있게 작성하고 관리할 수 있으며, 다양한 질의를 통해 시스템에서 관리되는 아키텍처산출물 정보를 유용하게 검색 및 조회하여 의사결정에 참조할 수 있다. 또한 작성된 아키텍처산출물을 통합하고 분석 및 비교하여 정보체계간 상호운용성과 비용 절감을 지원한다.

방향성 스키마 그래프 매핑 규칙을 이용한 GML 문서의 공간 데이터베이스 변환 기법 (The Conversion Scheme of GML Document into Spatial Database using the Directed Schema Graph Mapping Rules)

  • 정원일;박순영;배해영
    • 한국공간정보시스템학회 논문지
    • /
    • 제7권1호
    • /
    • pp.39-52
    • /
    • 2005
  • XML을 기반으로 지리 정보의 저장 및 전송을 위한 인코딩 표준으로 제안된 GML은 점차 그 활용도가 증가하고 있다. 이에 웹 환경에서 지리 정보의 상호 운용성을 제공하기 위해 다양한 모델링, 저장 및 질의에 관한 연구가 수행되어 왔으며, 특히 구조적인 특성을 갖는 GML 문서를 효율적으로 저장하는 연구는 필수적이다. 따라서, 본 논문에서는 GML 스키마를 기반으로 작성된 GML 문서를 공간 데이터베이스로 저장하기 위한 GML 문서 변환 기법을 제안한다. 제안 기법에서는 GML 스키마를 방향성을 갖는 그래프 구조로 변환하고 이를 기반으로 공간 스키마로의 매핑에 대해 기술한다. 그리고 GML 문서를 공간 데이터베이스로 변환할 때 발생하는 의미적 손실을 보상하기 위해 GML 스키마에 존재하는 제약 조건을 변환된 공간 스키마에서 유지하기 위한 규칙을 제안한다. 또한 제안 기법은 공간 데이터베이스를 GML 문서의 저장소로 활용할 수 있도록 함으로써 이질적인 지리 정보의 상호 운용성 제공뿐 아니라 대량의 GML 문서에 대해 효과적인 저장과 관리가 가능하게 한다.

  • PDF