• 제목/요약/키워드: 중복 객체 관리

검색결과 60건 처리시간 0.026초

주기억장치 DBMS를 위한 인덱스 관리자의 설계 및 구현 (Design and Implementation of an Index Manager for a Main Memory DBMS)

  • 김상욱;염상민;김윤호;이승선;최완
    • 한국통신학회논문지
    • /
    • 제25권4B호
    • /
    • pp.661-674
    • /
    • 2000
  • 주기억장치 DBMS(MMDBMS)는 디스크가 아닌 주기억장치를 주요 저장 매체로서 사용하므로 고속의 처리를 요구하는 다양한 데이터베이스 응용을 효과적으로 지원한다. 본 논문에서는 차세대 MMDBMS Tachyon의 인덱스 관리자 개발에 관하여 논의한다. 인덱스 관리자는 객체에 대한 빠른 검색 기능을 지원하는 필수적인 DBMS 서브 컴포넌트이다. 기존의 연구 결과로서 다양한 인덱스 구조가 제안된 바 있으나, 실제 DBMS 상에서 인덱스 관리자를 개발하는 경우에 발생하는 실질적인 이슈들에 대해서는 거의 언급하고 있지 않다. 본 논문에서는 Tachyon의 인덱스 관리자의 개발 중에 경험한 실질적인 구현 이슈들을 언급하고, 이들에 대한 해결 방안을 제시한다. 본 논문에서 다루는 주요 이슈들은 (1) 인덱스 엔트리의 집약적 표헌, (2) 가변 길이 키의 지원, (3) 다중 애트리뷰트 키의 지원, (4) 중복 키의 지원, (5) 외부 API의 정의, (6) 동시성 제어, (7) 백업 및 회복 등이다. 본 연구 결과를 통하여 향후 MMDBMS 개발자들의 시행 착오를 최소화할 수 있으리라 생각된다.

  • PDF

스마트 데이터베이스 설계를 위한 연관성 기반 개념적 모형화 (Association-Based Conceptual Modeling for Smart Database Design)

  • 이상원
    • 지능정보연구
    • /
    • 제17권3호
    • /
    • pp.169-185
    • /
    • 2011
  • 데이터 중복은 과중한 저장관리비용을 유발할 뿐만 아니라, 정보시스템의 질적 저하를 초래한다. 불행히도, 업무 규정에 적합하지 않은 데이터를 방지하기 위해서, 업무에 충실한 개념적 설계를 위한 시간과 노력을 투자하는 기업이 극소수에 불과하다. 즉, 대부분의 기업들은 데이터 품질에 대한 인식에 관심을 갖지 않는다. 우리 연구의 주요 동기는, 업무에 대한 사전지식이 없이 업무에 충실한 기업전사 데이터를 설계하는 방식을 연구하는 것이다. 본 논문에서는 업무기술서에 나온 각 문장 내의 객체들 간의 연관성을 이용해서, 데이터설계를 자동화하는 데이터설계방법론을 제안한다. 자동화 설계도구를 위해 제안된 에이전트는 자연어 상태의 업무설계서만을 입력 받아, 특정한 규칙을 이용하여 개체관계도를 설계한다. 우리는 본 에이전트의 전체 범위와 자세한 절차를 약간의 예를 가지고 설명을 할 것이고, 그 다음에 객체 간에 추출된 연관성의 적법성을 검증할 것이다. 또한, 고안된 에이전트의 실무 적용성을 평가하기 위한 사례연구를 진행할 것이다.

연구지원 데이터베이스에서 최적화된 데이터모델링을 통한 데이터 비만도 개선에 관한 연구 (A Study on Reducing Data Obesity through Optimized Data Modeling in Research Support Database)

  • 김희완
    • 한국인터넷방송통신학회논문지
    • /
    • 제18권1호
    • /
    • pp.119-127
    • /
    • 2018
  • 현업에서 사용하고 있는 정형 데이터는 데이터모델링에 대한 이해부족 및 적용의 미흡으로 정규화되지 않은 채로 테이블 형태로 관리되고 있는 현실이다. 데이터베이스 설계의 균형이 파괴되면 데이터 질의에 대한 응답속도에 영향을 미치며, 데이터 비만도가 높아지게 된다. 본 논문에서는 최적화된 데이터모델링을 통한 데이터베이스 설계를 통하여 데이터 비만도가 어떻게 개선되었는지를 연구하였다. 데이터 비만도가 과다하게 나타나는 방사형 및 업무 중심의 고립형 설계에서 객체(데이터)와 객체간의 관계 중심의 데이터모델링을 통한 정방형 설계를 함으로 데이터 질의 경로가 선명하게 가시화되었다. 데이터비만도 면에서도 기존의 연구지원 데이터베이스의 비만도는 57.2%였으나, 새로운 연구지원 데이터베이스에서는 16.2%로 나타나 데이터 비만도가 40.5%가 개선되었으며, 데이터의 중복을 최소화함으로써 데이터의 정확성과 무결성이 보장되는 데이터베이스로 개선되었다.

클래스 계층구조 슬라이싱을 이용한 C++프로그램 최적화에 관한 연구 (A Study on the Optimization of C++ Program Using the Class Hierarchies Slicing)

  • 김운용;정계동;최영근
    • 한국정보처리학회논문지
    • /
    • 제6권6호
    • /
    • pp.1542-1555
    • /
    • 1999
  • 본 논문에서는 C++ 클래스 계층구조(상속관계를 가진 클래스들의 모음)를 대상으로 객체 지향 언어의 특성인 단일/다중 상속, 정적/동적 바인딩, 함수중복/함수재정의(Overloading & Overriding), 순수가상/가상함수, 생성자 문제를 고려하여 멤버데이터와 멤버함수를 최적화 할 수 있는 알고리즘을 제안한다. 프로그램 계층 구조와 그 계층 구조를 사용하는 프로그램은 일반적으로 클래스 계층 구조의 부분적인 기능만을 사용하기 때문에 많은 구성요소를 포함하는 클래스들에서 불필요한 기능을 제거하는 것이 필요하게 되었다. 지금까지 연구되어 왔던 고전적인 슬라이싱이나 다른 변형된 슬라이싱은 출력데이터를 선택하고 그와 관련된 프로그램 문장을 포함하는데 초점을 맞추고 있다. 그 대상은 대부분 구조적 프로그램 언어로 이루어졌으며 이러한 슬라이싱은 주로 오류 검출, 소프트웨어의 유지보수, 유연한 테스팅을 위한 주제로 연구가 되어 왔다. 본 논문에서는 그 대상 범위를 객체 지향 언어로 확장시키고, 분석단계에서 테이블 구성형태를 링크형태로 구성함으로써 보다 정보관리의 효율을 높일 수 있고, 이 테이블을 이용한 최적화 시스템 구현을 통해 필요한 알고리즘을 제시하였다. 이러한 과정을 통해 불필요한 멤버데이터, 멤버함수, 클래스 상속관계를 제거함으로 프로그램 코드의 간소화, 시스템 성능의 향상을 가져올 수 있다.

  • PDF

공간 데이터 웨어하우스에서 GML 데이터의 효율적인 적재를 위한 데이터 통합 기법 (GML Data Integration Method for Load Processing of Spatial Data Warehouse)

  • 전병윤;이동욱;유병섭;배해영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.27-30
    • /
    • 2006
  • GIS 분야에서 데이터 교환의 표준으로 OGC(Open Geospatial Consortium)에서 GML(Geography Markup Language)이 제안되어 웹 어플리케이션이나 공간 데이터 교환에서 사용이 일반화 되어가고 있다. 또한, 공간 데이터를 효과적으로 수집하여 의사결정을 지원하기 위한 시스템인 공간 데이터 웨어하우스에서도 GML 데이터를 추출하여 소스 데이터로 활용하는 것이 요구되고 있다. 하지만 GML 은 반구조형식(semi-structured)의 데이터 형식을 가진다. 따라서 기존 구조적인 데이터와는 추출하는 방식이 다르므로 GML 의 특징에 맞는 공간 데이터 추출이 수행되어야 한다. 본 논문에서는 공간 데이터 웨어하우스에서 GML 기반의 공간 데이터 소스를 추출할 때, 중복되는 공간 객체를 하나의 표현으로 통합하여 효율적으로 적재하는 기법을 제안한다. 이는 GQuery를 이용하여 GML 데이터를 추출한 후, GML 스키마를 메타데이터에서 관리하는 스키마 정보와 비교하여 공간 데이터 웨어하우스에 통합된 공간 데이터를 제공하는 기법이다. 성능평가에서는 기존의 GML 데이터를 추출하는 기법과 제안기법과의 비교를 통하여 제안 기법의 기존 기법에 비해 평균적으로 약 9.95%의 성능향상을 보였다.

  • PDF

과학기술전문인력 관리를 위한 인력정보 메타데이터 표준화 (Human Resource Metadata Standardization for Managing Science & Technology Personnel)

  • 김경옥;송인석;표순희;이미화;이재진
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2005년도 추계 종합학술대회 논문집
    • /
    • pp.48-52
    • /
    • 2005
  • 연구인력정보는 국내 과학기술 관련 기관별로 자관의 수요에 의해 구축되고 있으나, 상호 연계되지 않고 있어 시스템 및 예산의 낭비를 초래하고 있다. 본 연구에서는 국내 과학기술 전문인력을 위한 표준 메타데이터를 제시함으로써 국가 차원의 인력 데이터베이스 구축하고 인력 정보의 생산, 유통 및 관리에 이르는 전 생명주기에서 상호운용성을 지원하고자 한다. 이를 위해 국내 13개 국가연구기관의 인력정보 데이터베이스를 조사 분석하고, 이를 바탕으로 일본 문부과학성과 CERIF 인력 모델을 참조하여 데이터 모델링을 수행하여 11개 대항목과 151개 세부 항목으로 구성된 데이터 요소를 도출하였다. 인력정보와 연계 가능한 타분야 표준 메타데이터 및 데이터베이스를 최대한 고려하고 메타데이터 레지스트리(MDR) 국제 표준인 ISO/IEC 11179를 수용하여 서술하고자 하는 객체, 속성, 표현을 데이터 요소명에 반영하고 이에 대한 정의를 명확히 하여 의미의 모호함이나 중복을 피하고자 하였다. 향후 국가 연구개발정보의 공동 활용을 위하여 추진되고 있는 국가과학기술종합정보시스템(NTIS)에 연구 결과를 활용함으로써 효과적이고 표준화된 국가 과학기술인력의 이용을 기대할 수 있다.

  • PDF

TMDL 업무 지원을 위한 Korean Reach File 공간자료 설계 개선 연구 (A Study to Improve the Spatial Data Design of Korean Reach File to Support TMDL Works)

  • 이철용;김계현;박용길;이혁
    • 한국수자원학회논문집
    • /
    • 제46권4호
    • /
    • pp.345-359
    • /
    • 2013
  • TMDL에서 효율적이고 체계적인 수질관리를 위하여 하천 네트워크 공간자료 구축 및 이를 이용한 GIS기반의 수질모델링, 자료관리, 공간분석 등이 요구된다. 본 연구에서는 국내 하천 네트워크에 관한 프레임워크 데이터로서 TMDL 실무에서 다양한 활용이 가능하도록 KRF (Korean Reach File) 설계안을 개선하여 제시하는 것을 목표로 하였다. 이를 위해 우선 미국 EPA RF(River Reach File) 사례를 검토하였고, EPA RF 설계 내역을 참고하여 개선된 KRF의 도형 및 속성 설계안을 제시하였다. 결과 검증을 위해 한강수계를 대상으로 KRF를 시범 구축하였으며, 총2,047개의 stream reach 분할이 가능하였고, 총 2,048개 지점에 대한 노드 생성이 가능하였다. 각 공간객체에 대한 고유식별자가 중복 없이 입력됨이 확인되었고, 이를 통해 유관 DB와의 자료연계에도 KRF가 활용될 수 있을 것으로 판단되었다. 또한 KRF에 위상정보가 강화되어 입력됨에 따라 향후 다양한 네트워크 분석에도 활용이 가능할 것으로 판단되었다. 향후에는 KRF를 이용한 수질모델링 및 자료관리, 공간분석 등 다양한 TMDL 실무 활용에 대한 연구가 필요하다.

그래프 스트림에서 슬라이딩 윈도우 기반의 점진적 빈발 패턴 검출 기법 (Incremental Frequent Pattern Detection Scheme Based on Sliding Windows in Graph Streams)

  • 정재윤;서인덕;송희섭;박재열;김민영;최도진;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제18권2호
    • /
    • pp.147-157
    • /
    • 2018
  • 최근 네트워크 기술 발전과 함께 IoT 및 소셜 네트워크 서비스의 활성화로 인해 많은 그래프 스트림 데이터가 생성되고 있다. 이와 같은 그래프 스트림에서 객체들 사이의 관계가 동적으로 변화함에 따라 그래프의 변화를 탐지하거나 분석하기 위한 연구들이 진행되고 있다. 본 논문에서는 그래프 스트림에서 이전 슬라이딩 윈도우에서 검출한 빈발 패턴에 대한 정보를 이용해 빈발 패턴을 점진적으로 검출하는 기법을 제안한다. 제안하는 기법은 이전 슬라이딩 윈도우에서 검출된 패턴이 앞으로 몇 슬라이딩 윈도우동안 빈발할지 또는 빈발하지 않을지를 계산하여 빈발 패턴 관리 테이블에 저장한다. 그리고 이 값을 통해 다음 슬라이딩 윈도우에서는 필요한 계산만 수행함으로써 전체 연산량을 감소시킨다. 또한 패턴 간에 간선을 통해 연결되어있는 것만 하나의 패턴으로 인식함으로써 더 유의미한 패턴만을 검출한다. 본 논문에서는 제안하는 기법의 우수함을 보이기 위해 여러 성능 평가를 진행하였다. 그래프 데이터의 크기가 커지고 슬라이딩 윈도우의 크기가 커질수록 중복되는 데이터가 증가되기 때문에 기존 기법보다 빠른 처리 속도를 나타낸다.

UCN-트리: 제한된 망 구조 내의 이동체를 위한 통합 색인 (UCN-Tree: A Unified Index for Moving Objects in Constrained Networks)

  • 천종현;정명호;장용일;오영환;배해영
    • 한국공간정보시스템학회 논문지
    • /
    • 제8권1호
    • /
    • pp.37-57
    • /
    • 2006
  • 위치 기반 서비스(Location Based Services) 지원을 위해 이동체(Moving Objects)의 위치 정보를 효과적으로 저장 및 검색하기 위한 기술이 요구되었으며, 이러한 이동체를 효율적으로 관리하기 위한 이동체 색인에 대한 연구가 진행되어 왔다. 이러한 이동체 색인들은 실 세계에 응용이 많이 되는 제한된 망 구조(도로, 철도 선로 등)를 따라 움직이는 이동체에 대해 고려가 되어 있지 않기 때문에, 제한된 망 구조 기반 이동체 색인들이 제안되었다. 그러나 이 색인들은 다음과 같은 두 가지 문제점을 가지고 있다. 첫 번째로, 제한된 망 구조에 기반한 이동체 색인은 시간 도메인 별로 나뉘어져 있기 때문에 이동체의 현재부터 과거까지의 위치를 모두 필요로 하는 경우 현재 위치 색인과 과거 위치 색인에서 중복된 공간 탐색을 해야 하는 문제점이 있다. 두 번째로, 이러한 경우 현재 위치 색인과 과거 위치 색인을 모두 구축해 놓아야 하므로 색인의 공간적인 비용 및 갱신 비용에 대한 부담이 따른다. 본 논문에서는 이러한 문제점들을 해결하기 위해 제한된 망 구조 내의 이동체를 위한 통합 색인을 제안한다. 제안 색인은 이동체의 현재 위치뿐만 아니라 과거 위치까지 함께 지원하기 때문에 기존 이동체 색인의 문제점인 이동체의 현재 및 과거 위치 검색 시 별도의 계산 과정이 필요했던 점을 해결한다. 또한 현재 위치 색인 및 과거 위치 색인의 공통된 부분을 통합하였기 때문에 색인을 별도로 유지하는 것 보다 색인의 공간적인 비용 및 갱신 비용을 감소시킨다.

  • PDF

딥러닝기반 건축폐기물 이미지 분류 시스템 비교 (A Comparison of Image Classification System for Building Waste Data based on Deep Learning)

  • 성재경;양민철;문경남;김용국
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권3호
    • /
    • pp.199-206
    • /
    • 2023
  • 본 연구는 건축시 발생되는 폐기물의 자동분류를 위해 딥러닝 알고리즘을 활용해 건출 폐기물 데이터를 각각 목재 폐기물, 플라스틱 폐기물, 콘크리트 폐기물로 분류하는 두 모델들을 통해서 성능 비교를 한다. 건축 폐기물의 분류를 위해 사용된 딥러닝 알고리즘은 합성곱 신경망 이미지 분류 알고리즘 VGG-16과 NLP를 기반으로 이미지를 시퀀스화 시킨ViT, Vision Transformer 모델을 사용했다. 건축 폐기물 데이터 수집을 위해 이미지 데이터를 전 세계 검색엔진에서 크롤링 하였고, 육안으로도 명확히 구분하기 어렵거나, 중복되는 등 실험에 방해되는 이미지는 전부 제외하여 각 분류당 1천장씩 총 3천장의 이미지를 확보했다. 또한, 데이터 학습시에 모델의 정확도 향상에 도움을 주기 위해 데이터 확대 작업을 진행해 총 3만장의 이미지로 실험을 진행 하였다. 수집된 이미 데이터가 정형화 되어있지 않은 데이터 임에도 불구하고 실험 결과는 정확도가 VGG-16는 91.5%, ViT 는 92.7%의 결과가 나타났다. 이는 실제 건축폐기물 데이터 관리 작업에 실전 활용 가능성을 제시한 것으로 보인다. 본 연구를 바탕으로 추후에 객체 탐지 기법이나 의미론적 분할 기법까지 활용한다면, 하나의 이미지 안에서도 여러 세밀한 분류가 가능해 더욱 완벽한 분류가 가능할 것이다.