• Title/Summary/Keyword: 데이터 부분 중복

Search Result 79, Processing Time 0.035 seconds

Design and Implementation of Korean Geospatial Data Clearinghouse (한국형 지형공간 데이타 Clearinghouse의 설계 및 구현)

  • Baek, In-Gu;Lee, Kang-Jun;Han, Ki-Joon
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 1999.06a
    • /
    • pp.131-145
    • /
    • 1999
  • 최근 정보화 사회에서 정보의 처리와 공유에 대한 관심이 크게 증가하지만 기존 지리정보시스템(GIS)이 갖고 있던 상호 이질적인 지형공간데이타 포맷을 가지고는 효율적인 정보의 처리와 공유가 어려운 형편이다. 이러한 지형공간데이타 포맷의 문제로 인해 지형공간 데이터의 중복수집의 문제가 발생하였으며, 또한 많은 시간과 경비가 중복 투자퇴고 있다. 본 논문에서는 지형공간 데이타 중복수집의 문제점을 효과적으로 해결하고, 이미 구축되어 있는 지형공간 데이타를 필요로 하는 사람들과 공유하고 유통하기 위하여 KGDC(Korean Geospatial Data Clearinghouse)를 설계 및 구현하였다. KGDC를 통하여 ESRI와 Intergraph사의 상용 지리정보시스템들의 데이타를 별도의 처리과정 없이 공유할 수 있으며, 또한 OGC(OpenGIS Consortium)의 OpenGIS 구현명세에 기술되어 있는 표준 OpenGIS 인터페이스를 지원하는 지형공간 데이타 서버의 데이타도 효과적으로 공유할 수 있다. 특히, KGDC는 다양한 검색 기능과 다양한 정보를 제공하여 손쉬운 지형공간 데이타의 공유 및 유통을 가능하게 하며, 검색을 위한 정보와 검색의 결과로 이용하기 위해 ISO/TC211 표준 메타데이타를 부분적으로 지원하고 있다.

  • PDF

데이터베이스 테이터의 고장진단 및 복구를 위한 전문가 시스팀

  • Lee, Gil-Haeng;U, Wang-Don;Jo, Ju-Hyeon
    • ETRI Journal
    • /
    • v.14 no.4
    • /
    • pp.148-164
    • /
    • 1992
  • 본 논문에서는 TDX-10 데이터베이스 데이터의 고장을 주기적으로 진단하고 복구할 수 있는 고장진단 전문가 시스팀을 제안하고 구현하였다. 실시간 환경 및 분산구조를 갖는 데이터베이스 관리 시스팀에서 데이터베이스의 효과적인 접근을 위해서 필요한 데이터베이스의 데이터 즉, 디렉토리와 딕셔너리는 매우 중요하며 고장이 발생할 경우 데이터베이스 관리시스팀에 미치는 영향은 치명적이다. 따라서, 실시간 환경을 갖는 데이터베이스 관리 시스팀에서 데이터베이스 데이터에 대한 고장 진단 및 복구는 필수적이라고 할 수 있다. 본 논문에서 제안한 고장진단 전문가 시스팀은 데이터베이스 데이터를 운용중 변하는 부분과 변하지 않는 부분으로 분류하고 미리 주어진 고장진단 규칙에 따라 진단하는 방법이다. 데이터베이스 데이터의 고장진단 데이터, 고장진단 규칙, 고장진단 데이터 생성기, 고장진단 데이터 검증기, 그리고 고장진단기로 구성되어 있다. 고장진단 데이터는 고장진단기가 데이터베이스 데이터를 주기적으로 진단하기 위하여 사용하는 마스터 데이터로서 두개가 존재한다. 고장진단 데이터 생성기는 데이터베이스 데이터의 고장진단을 위한 데이터 구조를 생성하고 데이터베이스로부터 데이터베이스를 데이터를 중복하여 읽어들이는 역할을 한다. 이와 같은 과정은 시스팀이 초기에 동작을 시작하거나 운용중 운용자에 의해서 릴레이션의 추가 및 삭제, 그리고 튜플의 추가등과 같은 사건이 발생할 경우에 이루어진다. 데이터베이스 검증기는 고장진단 데이터 생성기가 중복하여 생성한 데이터에 대해서 데이터베이스 데이터의 제작시의 초기 오류를 검증해냄으로써 데이터베이스 관리 시스팀의 안전한 운용을 가능하게 하며 고장진단기가 데이터베이스 데이터를 주기적으로 진단할 데이터를 탄생시킨다. 마지막으로 고장진단기는 주기적으로 데이터베이스 데이터의 고장을 진단하여 고장이 발생한 데이터를 미리 분류한 규칙에 따라 원래의 데이터로 복구하거나 운용자에게 보고함으로써 고장에 대비하도록 한다. 그리고 데이터베이스 상의 운용자에 의한 변경을 감지하여 고장진단 데이터의 재생성을 지시한다. 본 논문에서 제시하고 구현한 데이터베이스 데이터의 고장진단 및 복구를 위한 전문가 시스팀은 실시간 환경과 고장허용 환경, 분산 구조 그리고 빈번한 접근을 갖는 데이터베이스 관리 시스팀에서 아주 중요한 역할을 할 수 있다.

  • PDF

Efficient RDF Provenance Compression Scheme Considering Duplication (중복을 고려한 효율적인 RDF 프로버넌스 압축 기법)

  • Han, ji-eun;Yook, mi-sun;Noh, yeon-woo;Kim, dae-yun;Lim, jong-tae;Bok, kyoung-soo;Yoo, jae-soo
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2015.05a
    • /
    • pp.75-76
    • /
    • 2015
  • 본 논문에서는 대용량의 프로버넌스를 압축 저장하기 위한 OPM 기반의 RDF 프로버넌스 압축 기법을 제안한다. 제안하는 기법은 이미 존재하는 데이터 프로버넌스 및 새로운 데이터 프로버넌스를 사전을 기반으로 숫자 데이터로 인코딩한다. 또한 데이터 처리의 중복되는 부분은 서브그래프를 통해 압축한다.

  • PDF

Dynamic Tree-Based Energy-Efficient Routing Algorithm in Sensor Networks (센서 네트워크에서의 동적 트리기반의 에너지 효율적인 라우팅 알고리즘)

  • Park, Hyung-Soon;Kim, Si-Gwan
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.06d
    • /
    • pp.267-272
    • /
    • 2007
  • 센서 네트워크는 일반적으로 지정된 지역 내에서 흩어져 있는 센서 노드들에 의해 주변 현상을 감지하여 싱크 노드로 전송한다. 각 센서 노드들은 요청된 질의나 사전에 지정된 질의의 결과를 주기적으로 싱크 노드로 전송한다. 하지만, 센서 노드들은 제한된 배터리 용량을 가지기 때문에 영구적인 수명을 보장할 수 없다. 따라서 중복된 데이터는 한번만 전송하거나, 대표 센서 노드가 값을 모아서 전송함으로서 네트워크 수명을 최대로 보장하는 것이 중요하다. 본 논문에서는 동적으로 데이터 전송 노드를 선정하는 라우팅 트리인 동적 트리기반의 에너지 효율적인 라우팅 알고리즘(EDRT)을 제안한다. 기존에 제안된 질의 기반 라우팅 트리(QSRT)는 질의의 결과들이 싱크 노드로 전송할 때, 데이터를 부분 집계 및 패킷 합병을 유도하여 데이터 전송 횟수를 줄였다. 본 논문에서는 각 센서 노드가 부모 노드뿐만 아니라 형제 노드 간에도 데이터를 부분 집계 및 패킷 합병을 할 수 있도록 하여 데이터 전송 횟수를 줄이고, 센서 노드의 에너지 소모량도 감소시킨다. 수행된 실험의 결과는 제안된 EDRT가 QSRT보다 향상된 성능을 보여 준다.

  • PDF

Efficient Storing and SPARQL Search Scheme for Large Scale RDF Data (대용량 RDF 데이터의 효율적인 저장방법과 SPARQL 기반 검색방안 연구)

  • Oh, Sangyoon;Park, Ji-Hoon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2016.07a
    • /
    • pp.195-197
    • /
    • 2016
  • 시멘틱웹을 구축하는 표준언어인 RDF (Resource Description Framework)는 언어의 그래프 기반 특성으로 인해 일반적인 방식들로는 효과적인 저장과 추출이 어렵다. 더욱이 대용량 RDF 데이터의 저장과 추출에는 성능문제가 더욱 커지므로 많은 연구들이 이루어지고 있다. 본 논문에서는 SPARQL을 지원하면서 RDF 파일들을 효과적으로 저장하고 검색할 수 있는 저장방식에 대해 연구한 결과를 제시한다. RDF 데이터를 전처리를 통해 RDF의 트리플(주어:subject, 술어:property, 목적어:Object)에서 중복되는 주어(S)나 목적어(O)를 묶고, 사용자가 SPARQL 형식으로 검색했을 때 이용자가 주어부분을 변수로 두었는지 아니면 서술어 부분을 변수로 두어 찾는지에 따라 검색어와 유사한 단어 클러스터를 찾아준다. 동일 단어에 대해 여러 번 검색되던 부분을 한 번 검색으로 처리할 수 있기 때문에 효율이 높아진다.

  • PDF

Non-Duplication Loading Method for supporting Spatio-Temporal Analysis in Spatial Data Warehouse (공간 데이터웨어하우스에서 시공간 분석 지원을 위한 비중복 적재기법)

  • Jeon, Chi-Soo;Lee, Dong-Wook;You, Byeong-Seob;Lee, Soon-Jo;Bae, Hae-Young
    • Journal of Korea Spatial Information System Society
    • /
    • v.9 no.2
    • /
    • pp.81-91
    • /
    • 2007
  • In this paper, we have proposed the non-duplication loading method for supporting spatio-temporal analysis in spatial data warehouse. SDW(Spatial Data Warehouse) extracts spatial data from SDBMS that support various service of different machine. In proposed methods, it extracts updated parts of SDBMS that is participated to source in SDW. And it removes the duplicated data by spatial operation, then loads it by integrated forms. By this manner, it can support fast analysis operation for spatial data and reduce a waste of storage space. Proposed method loads spatial data by efficient form at application of analysis and prospect by time like spatial mining.

  • PDF

Resource Sharing Method to Reduce Duplicate Operation Cost of Multiple Spatial Aggregates in u-GIS Environment (u-GIS 환경에서 다중 공간 집계 질의의 중복연산 비용을 감소시키기 위한 자원공유 기법)

  • Seo, Min-ho;Kim, Sang-Ki;Baek, Sung-Ha;Li, Yan;Lee, Dong-Wook;Bae, Hae-Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.04a
    • /
    • pp.344-347
    • /
    • 2009
  • 데이터 스트림을 처리하기 위한 연속집계질의 수행 시 중복연산 및 메모리의 절약을 위하여 큐를 공유하는 자원공유기법이 연구되었다. 기존의 자원공유 기법들은 질의의 프리디킷이 일치할 때만 처리하기 때문에, 질의의 프리디킷이 차이가 나는 경우가 많은 다중공간 집계질의가 자주 요청되는 u-GIS 환경에서 효율적으로 중복영역을 처리할 수 있는 자원공유 기법이 요구된다. 본 논문에서는 공간영역을 효율적으로 그룹화하는 R-tree 의 특징을 이용하여 질의간의 중복영역을 그룹화하고 중복영역의 자원을 패인(Pane)구조를 이용하여 공유한다. 노드 수에 제한이 없고 레벨을 1로 하는 R-tree 로 유사한 위치의 질의들을 그룹화 한 후, 그 질의들의 영역이 겹쳐지는 부분을 패인을 이용해 집계 값을 공유하여 중복계산을 피하는 방법이다. 제안 기법은 공간 집계질의를 처리할 수 있고, 기존의 계층구조의 자원공유 기법을 사용할 때에 비해 자원을 적게 사용하고 질의 처리 시간을 단축시켰다. 성능평가를 통하여 제안기법이 메모리 사용량을 감소시키는 것을 보였으며, 질의 처리 속도가 증가하였다.

Design and Implementation of CORBA-based Spatial Data Provider Components for Supporting Interoperability (상호운용을 지원하는 CORBA 기반의 공간 데이터 제공자 컴포넌트 설계 및 구현)

  • 김민석;안경환;홍봉희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.159-161
    • /
    • 1999
  • 분산환경에서 이종의 시스템 및 데이터베이스들의 통합을 위해 싸개(wrapper) 기술을 사용한다. 싸개 기술은 외부 클라이언트 응용프로그램에게 이질적인 데이터 소스들에 대해서 통합 데이터 모델을 제공함으로써 데이터와 정보처리의 공유를 가능하게 한다. 그러나 기존방법에서는 각 데이터 소스별로 싸개 객체를 작성해야 되는 중복 구현에 대한 문제가 있다. 이 논문에서는 싸개 역할을 하는 공간 데이터 제공자들의 공통부분을 추출하여 컴포넌트화하고 데이터 소스에 종속된 객체는 컴퍼넌트 기반의 CORBA 구현객체로 작성하여 공간 데이터 제공자 컴포넌트를 구현하는 방법을 제시한다. 그리고 표준 서비스를 위해 OGC의 OpenGIS 표준명세를 이용한다. 또한 공간 데이터 제공자 컴포넌트에서 질의결과에 대한 데이터 소스 접근 방법을 제시한다.

  • PDF

Min-Max Hash for Similarity Measurement based on Multiset (Min-Max Hash를 활용한 다중 집합 기반의 유사도 측정)

  • Yoon, Jin-Uk;Kim, Byoungwook
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.36-39
    • /
    • 2019
  • 데이터 마이닝에서 클러스터링은 서로 유사한 특징을 갖는 데이터들을 동일한 클래스로 분류하는 방법이다. 클러스터링에는 다양한 방법이 존재하지만 대표적으로 집합으로 표현된 데이터들의 유사도를 측정하기 위해서는 자카드 유사도(Jaccard Similarity)를 이용한다. 자카드 유사도는 서로 다른 집합 간의 공통된 부분을 상대적으로 평가하여 유사도를 측정하는 방법이다. 그러나 최근에는 데이터를 저장할 수 있는 기술과 매체의 발전으로 표현할 수 있는 데이터의 영역과 범위는 발전되고 있기 때문에 많은 연산과 시간의 비용이 발생하게 된다. 이를 해결하기 위해서 두 데이터의 표본의 유사도를 통해 실제 데이터들의 유사도를 추정할 수 있는 Min-Hash 가 제안되었다. 본 논문에서는 이를 활용하여 집합의 영역을 다중 집합(Multiset)으로 확장하여 중복되는 값을 가질 수 있는 두 데이터 간의 유사도를 효율적으로 추정할 수 있는 Min-Max Hash 를 제안한다.

The Design and Implementation of Update Protocol for Spatial Data based on the Middleware : OLE DB (미들웨어 : OLE DB를 기반으로 한 공간 데이터 변경 프로토콜의 설계 및 구현)

  • 박정하;김동현;홍봉희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.45-47
    • /
    • 2000
  • 지리정보시스템 클라이언트는 Open API를 이용한 개방형((Open)구조를 지향하고 있으며 OpenGIS는 다양한 데이터 소스간의 상호운용을 지우 하는 개방형 지리정보시스템의 표준으로 자리를 잡아가고 있다. 따라서 기존의 패쇄환경(Closed Environment)에서 행해졌던 공간 데이터 동시 수정의 연구는 OLE DB와 같은 개방환경(Open Environment)에서 연구될 필요가 있다. 기존의 기법을 OLE DB에 적용할 때 문제점으로 제기되는 것은 첫째, 공간데이터 수정을 위한 변경 제어가 서버측에 위치함으로써 서버에 따라 재작성 되어야 하는 문제가 있고, 둘째, 서버의 데이터를 중복 저장하고 있는 클라이언트 데이터에 대한 일관성 유지를 위해 클라이언트의 변경 내용은 다른 클라이언트에게 통보되어야 하지만 OLE DB의 통보 메커니즘은 Rowset을 공유하는 동일 클라이언트 내에서의 통보만 가능한 구조이다. 본 논문은 공간데이터베이스 서버에 의존적인 서버부분의 기능을 미들웨어에서 구현함으로써 서버 모듈의 재작성 문제를 해결하고 서로 다른 클라이언트간의 변경 전파 프로토콜을 제시하여 서버와 독립적으로 운용할 수 있는 공간데이터 변경을 위한 OLE DB서비스 제공자 프로토콜을 설계하고 구현한 결과를 보인다.

  • PDF