• Title/Summary/Keyword: 데이터 중복 관리

Search Result 282, Processing Time 0.024 seconds

Building a Biological Genomic Database Management System in Laboratory Level (실험실 레벨의 유전체 생물학 데이터베이스 관리시스템 구축)

  • 차효성;정광수;박성희;류근호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.28-30
    • /
    • 2004
  • 대부분의 생물학 실험실에서는 스퀸싱 실험으로 얻어진 서열조각에 대해 어셈블리 과정을 통해 획득된 일치된 서열을 서열 실험파일 형태로 저장한다. 이러한 서열 파일형태로 서열 데이터를 저장하면 사용자의 임의로 서열 정보 수정 및 서열 정보의 중복 등 서열 데이터에 대한 일관성 있고 무결성 있는 저장 관리가 어렵다 또한 이질적 데이터 및 포맷을 통한 다양한 생물학적 분석이 요구된다. 따라서 이 논문에서는 시퀸싱을 통해 생성된 유전체 및 단백질 서열 데이터의 자장관리를 위해 서열 정보의 편집, 저장 및 검색과 서열 파일 포멧 변환을 수행하는 서열 정보관리 시스템의 구현을 목적으로 한다. 서열 저장시 서열 버전의 생성 및 검출을 위해 능동 데이터베이스의 트리거를 이용하여 시스템의 성능을 향상시킨다. 또한 서열정보 분석을 위해 이질적인 서열 포맷간의 포맷 변환은 서열 및 관련된 정보를 XML로 표현하고 포맷간의 매핑정보를 XML의 스타일 언어인 XSL을 적용하여 수행한다. 그러므로 원시 소스 변경시 영향을 적게 받으므로 이질적인 포맷간의 파서를 이용한 포맷 변환 보다 효율적이다.

  • PDF

A Study on Metadata-based Data Quality Management in a Container Terminal (컨테이너터미널의 메타데이터 기반 데이터 품질관리 방안에 관한 연구)

  • Kang, Yang-Suk;Choi, Hyung-Rim;Kim, Hyun-Soo;Hong, Soon-Goo;Jung, Jae-Un;Park, Jae-Young
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.13 no.2
    • /
    • pp.321-329
    • /
    • 2009
  • Due to the massive increase of data that should be managed, the problems in data quality management have been issued. In addition the lack of integrated management of the data causes duplication of data, low qualify services, and, missing data. To overcome these problems, this study attempts to examine the way of the data qualify management. To do this, metadata was defined, and its current management status in various view points was analyzed, and finally the metadata management was applied to the container terminal. for the "A" container terminal, we performed data standardization, and reflected major constraints and developed the pilot metadata repository. The contributions of this study are in improvement of the data qualify in the container terminal, and its practical application with metadata management method. Limitations of this study is its partial implementation of the metadata management to the company and interoperability of the metadata management for business to business data integration for the future research.

Design on DTD-independent Data Model for XML Document (XML 문서를 위한 DTD 독립적인 데이터 모델 설계)

  • 김정은;신판섭;이재호;임해철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.69-71
    • /
    • 2000
  • XML은 사용자가 문서를 적절히 구조화해서 저장시킬 수 있는 장점으로 인해 기존의 HTML로 구축된 웹서비슬 환경을 데이터베이스화하여 다양하고 복잡한 검색 환경을 제공한다. 이러한 이유로 최근에 XML 문서를 데이터베이스에 저장하고 효율적인 관리 및 검색을 지원하는 연구들이 많이 진행되고 있다. 기존 연구를 살펴보면 XML의 구조적 특징을 문서 독립적으로 모델링하지 않아 갱신 및 검색 효율이 떨어지고, 생성되는 테이블의 수가 증가하며, 원문 복원 능력의 저하와 데이터 중복이 발생하는 문제점을 안고 있다. 따라서 본 논문에서는 관계 데이터베이스를 기반으로 XML문서의 구조 정보를 DTD 독립적으로 구성하여 테이블 생성 수와 갱신의 문제점을 개선하고, DTD 구조의 경로 정보 표현을 제안하여 탐색 및 원문 복원 능력을 강화하며, 테이블 중복 문제를 해결한 데이터 모델을 제안한다.

  • PDF

DOI를 활용한 디지털 콘텐츠의 전자저작권 관리와 유통에 관한 연구 - 학위논문을 중심으로 -

  • 박희숙;이응봉
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2002.08a
    • /
    • pp.81-87
    • /
    • 2002
  • 본 고에서는 국내 대학에서 생산되고 있는 학위논문의 원문 구축에 대한 중복투자를 방지하고 학위논문의 생산, 관리, 유통을 전자적으로 관리하기 위한 모형을 제시하고자 한다. 이를 위하여 Verginia Tech에서 주도하는 NDLTD(Networked Digital Library of Thesis and Dissertations) 사례를 참고하여 전자적 논문제출을 위한 ETD의 표준화를 제안하였으며, 학위논문에 디지털 콘텐츠 서비스 식별체계인 DOI를 부여하고 DOI와 메타데이터를 통합관리하기 위한 방안을 기술하였다.

  • PDF

LTRE: Lightweight Traffic Redundancy Elimination in Software-Defined Wireless Mesh Networks (소프트웨어 정의 무선 메쉬 네트워크에서의 경량화된 중복 제거 기법)

  • Park, Gwangwoo;Kim, Wontae;Kim, Joonwoo;Pack, Sangheon
    • Journal of KIISE
    • /
    • v.44 no.9
    • /
    • pp.976-985
    • /
    • 2017
  • Wireless mesh network (WMN) is a promising technology for building a cost-effective and easily-deployed wireless networking infrastructure. To efficiently utilize limited radio resources in WMNs, packet transmissions (particularly, redundant packet transmissions) should be carefully managed. We therefore propose a lightweight traffic redundancy elimination (LTRE) scheme to reduce redundant packet transmissions in software-defined wireless mesh networks (SD-WMNs). In LTRE, the controller determines the optimal path of each packet to maximize the amount of traffic reduction. In addition, LTRE employs three novel techniques: 1) machine learning (ML)-based information request, 2) ID-based source routing, and 3) popularity-aware cache update. Simulation results show that LTRE can significantly reduce the traffic overhead by 18.34% to 48.89%.

A Study on Financial Management for Total Research Management System (연구통합관리시스템에서 재무관리에 관한 연구)

  • Yang, Dong-Suk
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.05a
    • /
    • pp.667-670
    • /
    • 2005
  • 본 연구에서는 연구통합관리시스템에서 다루는 예산 및 자금관리부분을 통합재무정보시스템과의 연동할 수 있도록 시스템을 구현하였다. 또한, 연동에 따른 문제점 및 해결방안을 제시하였다. 시스템 구현을 통하여 사용자들은 중복입력 및 재무데이터의 불일치로 겪는 불편을 해소할 수 있었으며, 예산 및 자금관리의 일관성 및 효율을 높일 수 있었다.

  • PDF

Efficient Management of Statistical Information of Keywords on E-Catalogs (전자 카탈로그에 대한 효율적인 색인어 통계 정보 관리 방법)

  • Lee, Dong-Joo;Hwang, In-Beom;Lee, Sang-Goo
    • The Journal of Society for e-Business Studies
    • /
    • v.14 no.4
    • /
    • pp.1-17
    • /
    • 2009
  • E-Catalogs which describe products or services are one of the most important data for the electronic commerce. E-Catalogs are created, updated, and removed in order to keep up-to-date information in e-Catalog database. However, when the number of catalogs increases, information integrity is violated by the several reasons like catalog duplication and abnormal classification. Catalog search, duplication checking, and automatic classification are important functions to utilize e-Catalogs and keep the integrity of e-Catalog database. To implement these functions, probabilistic models that use statistics of index words extracted from e-Catalogs had been suggested and the feasibility of the methods had been shown in several papers. However, even though these functions are used together in the e-Catalog management system, there has not been enough consideration about how to share common data used for each function and how to effectively manage statistics of index words. In this paper, we suggest a method to implement these three functions by using simple SQL supported by relational database management system. In addition, we use materialized views to reduce the load for implementing an application that manages statistics of index words. This brings the efficiency of managing statistics of index words by putting database management systems optimize statistics updating. We showed that our method is feasible to implement three functions and effective to manage statistics of index words with empirical evaluation.

  • PDF

Integrity Metadata Based of Multi CMSs System Providing Protection Copyright of Web Contents (웹 콘텐츠 저작권 보호를 제공하는 통합 메타데이터 기반의 다중 CMS 시스템)

  • Cho, Young-Bok;Li, Yong-Zhen;Sun, Ning;Lee, Sang-Ho
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.33 no.6C
    • /
    • pp.520-528
    • /
    • 2008
  • At present Content Management Systems (CMS) with various and diverse web contents have been in wide applications. But, for CMS of each enterprise has its own metadata which is very different from others, it causes the serious problem of web contents repetition. Also, it's a difficult technology to support protecting copyright of web contents which are in separated CMSs. Therefore, in this paper, we solved the problem of contents repetition through metadata integration between mutually heterogeneous CMSs. We also propose the technology of web contents authentication code for avoiding contents repetition and applying digital rights protection by supporting safe ship in vast quantity of contents.

항로표지 관리운영시스템 표준 S/W 개발

  • Yeo, Ji-Min;Yu, Yong-Su;Han, Ju-Seop;Kim, Jong-Uk
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2018.11a
    • /
    • pp.92-94
    • /
    • 2018
  • 항로표지 관리운영시스템은 항로표지 상태정보 및 해양기상정보의 감시제어 및 정보 제공 등을 위하여 지방청별로 설치 시기 및 용역사에 따라 다양하게 개발되어 운영하고 있다. 항로표지 관리운영시스템을 도입한 지방청들은 표준화되지 않은 관리운영 S/W 및 데이터 베이스를 현장 상황에 맞게 변경하여 각 지방청별로 관리운영 S/W의 유지보수 예산의 중복투자 및 관리자의 관리 운영측면에서 어려움이 있다. IALA(국제항로표지협회)는 해사 안전 분야 데이터 교환 국제표준인 S-100에 따른 항로표지 정보 표준인 S-201 규격의 개발이 진행중이다. 이에 e-Navigation 도입을 대비하여 고도화된 항로표지 정보의 체계적이고 원활한 제공을 위해 S-201을 적용한 일원화된 항로표지 관리운영시스템의 표준 S/W 개발이 필요하다. 본 연구에서는 S-201을 적용한 DB 구조를 설계하였으며, 사용자 편의성 및 시스템 관리 효율성을 개선한 새로운 항로표지 관리운영시스템 S/W를 개발하고 있다.

  • PDF

The Study of the Object Replication Management using Adaptive Duplication Object Algorithm (적응적 중복 객체 알고리즘을 이용한 객체 복제본 관리 연구)

  • 박종선;장용철;오수열
    • Journal of the Korea Society of Computer and Information
    • /
    • v.8 no.1
    • /
    • pp.51-59
    • /
    • 2003
  • It is effective to be located in the double nodes in the distributed object replication systems, then object which nodes share is the same contents. The nodes store an access information on their local cache as it access to the system. and then the nodes fetch and use it, when it needed. But with time the coherence Problems will happen because a data carl be updated by other nodes. So keeping the coherence of the system we need a mechanism that we managed the to improve to improve the performance and availability of the system effectively. In this paper to keep coherence in the shared memory condition, we can set the limited parallel performance without the additional cost except the coherence cost using it to keep the object at the proposed adaptive duplication object(ADO) algorithms. Also to minimize the coherence maintenance cost which is the bi99est overhead in the duplication method, we must manage the object effectively for the number of replication and location of the object replica which is the most important points, and then it determines the cos. And that we must study the adaptive duplication object management mechanism which will improve the entire run time.

  • PDF