• 제목/요약/키워드: 데이터 확장 기법

검색결과 835건 처리시간 0.025초

데이터 웨어하우스의 성장에 따른 문제 해결을 위한 개선된 메타데이타 모델 (Enhanced Metadata Model for Growing Data)

  • 박석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.386-388
    • /
    • 1998
  • 본 논문에서는 필드의 추가, 삭제에 의해 데이터 큐브의 확장과 서로 다른 시간구간의 뷰가 존재함을 밝히고 이에 따른 두 가지 문제점을 제안한다. 첫째 새로 추가된 필드에 따라 이전 데이터를 변화할 것인가\ulcorner 둘째 필드의 추가로 불필요해진 실체화된 뷰를 계속 유지할 것인가\ulcorner 이를 해결하기 위해 메타데이타를 통하여 데이터 큐브의 재구성이나 불필요한 뷰의 실체와 없이 다른 시간구간의 실체화된 뷰를 효과적으로 사용하는 기법을 제안한다. 본 논문에서 제안한 기법은 시간 축을 고려함으로써 데이터 큐브의 격자구조를 따라 의존관계의 뷰들을 부분적으로 사용하고 결과를 결합하는 방식이다. 성능평가를 통하여 데이터 웨어하우스의 변화 시 기존의 기법보다 좋은 질의처리 성능을 가짐을 보인다. 보다 빠른 질의처리를 위하여 데이터 큐브를 사용하고, 큐브를 구성하는 뷰들을 실체화 한다. 하지만 새로운 필드의 추가나 삭제와 같은 데이터 웨어하우스의 변화, 성장에 의해 구조변화 등의 문제가 발생하고, 이에 대하여 적절해 대응할 필요가 있다.

고차원 벡터 데이터 색인을 위한 시그니쳐-기반 Hybrid Spill-Tree의 설계 및 성능평가 (Design and Performance Analysis of Signature-Based Hybrid Spill-Tree for Indexing High Dimensional Vector Data)

  • 이현조;홍승태;나소라;장유진;장재우;심춘보
    • 인터넷정보학회논문지
    • /
    • 제10권6호
    • /
    • pp.173-189
    • /
    • 2009
  • 최근 UCC를 중심으로 동영상 데이터에 대해 사람들의 관심이 증가하고 있다. 따라서 동영상 데이터의 내용-기반 검색을 지원하는 효율적인 색인 기법이 요구된다. 그러나 Hybrid Spill-Tree를 제외한 대부분의 색인 기법들은 대용량의 고차원 데이터를 다루는데 비효율적이다. 본 논문에서는 동영상 데이터의 내용-기반 검색을 지원하기 위한 효율적인 고차원 색인 기법을 제안한다. 제안하는 고차원 색인 기법은 기존 Hybrid Spill-Tree을 기반으로 새롭게 제안하는 클러스터링 방법과 시그니쳐를 이용한 데이터 저장 방법을 결합하여 확장된 색인 기법이다. 또한 제안하는 시그니쳐-기반 고차원 색인 기법이 기존 M-Tree 및 Hybrid Spill-Tree에 비해 성능이 우수함을 보인다.

  • PDF

준근사를 이용한 공간 인덱스 압축 기법 (A Spatial Index Compression Scheme Using Semi-Approximation)

  • 김종완
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권1호
    • /
    • pp.97-105
    • /
    • 2006
  • 수 년간 GIS가 발전하면서 위치 속성을 갖는 공간 데이터에 대한 인덱스 연구가 활발히 진행되어 왔다. 특히, R-tree기반의 인덱스들이 많이 연구되어 왔으며, 주된 이슈는 데이터 검색 성능의 향상이다. 본 논문에서는 공간 데이터에 대한 검색성능 향상을 위해 R-tree의 키 값을 압축하는 준근사(Semi-Approximation) 기법을 제안한다. 이 기법의 기본적인 아이디어는 위치 정보를 포함하는 2-차원 공간 데이터에 대한 인덱스를 압축하여 데이터 검색 성능을 향상시키는 것이다. 이 기법은 MBR의 시작 좌표를 상대좌표로 압축하고 끝 좌표는 전체 탐색영역에 대한 양자화(Quantization)를 통해 계산함으로써 MBR의 확장을 QMBR(quantization of MBR)의 반으로 줄임으로써 노드의 공간 이용률을 높이고 전체적인 탐색 성능을 향상시킨다. 기존에도 인덱스 크기를 줄임으로써 탐색 성능을 향상시키는 방법이 있었지만 본 논문과 같이 양자화의 확장공간을 반으로 축소시키는 연구는 처음이다. 성능평가는 실제 공간데이터를 기반으로 진행하였으며, 실험결과는 SA 기법이 MBR을 압축하는 기존의 연구보다 향상된 성능을 나타낸다.

  • PDF

Multimedia Data를 위한 병렬 파일 시스템 (Parallel File System for Multimedia Data)

  • 박시용;석창규;박성호;김영주;정기동
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (A)
    • /
    • pp.600-602
    • /
    • 2000
  • 본 논문에서는 여러 개의 디스크를 클러스트화한 메시지 전송 기반의 병렬 멀티미디어 파일 시스템(PMFS: Parallel Multimedia File System)을 제안하고 설계, 구현하였다. 본 논문에서 구현한 PMFS는 이식성, 유연성 그리고 확장성을 고려한 멀티미디어 데이터를 지원하는 병렬 파일 시스템으로 2계층 분산 클러스트 구조에 적합하다. 그리고 제어 메시지와 TCP를 기반으로 서버들간에 통신을 하고 다양한 방법의 데이터 배치 기법을 제공한다. PMFS의 성능 평가 결과 데이터들이 임의 시작 블록과 DIS배치 기법으로 저장된 경우 가장 좋은 성능을 보였다.

  • PDF

튜플 단위 메시지 다이제스트를 이용한 이기종 모바일 데이터 동기화 기법 (A Heterogeneous Mobile Data Synchronization Technique Using the Tuple Based Message Digest)

  • 박성진
    • 인터넷정보학회논문지
    • /
    • 제7권5호
    • /
    • pp.1-12
    • /
    • 2006
  • 모바일 데이터베이스 환경에서는 서로 다른 데이터베이스 안에 동일한 데이터가 중복되는 상황이 발생하므로, 이러한 중복된 데이터의 일관성을 유지시켜 주기 위한 효율적인 동기화 기법이 요구된다. 본 논문에서는 모바일 환경하에서 클라이언트 데이터베이스와 서버 데이터베이스간의 중복된 데이터의 일관성을 유지시키기 위한 메시지 다이제스트 기반의 동기화 기법을 제안하였다. 제안한 데이터 동기화 기법은 내부적으로 튜플 단위의 메시지 다이제스트 결과를 충돌을 탐지하기 위한 정보로 사용함으로써 기존 동기화 방법에 비하여 범용성 및 확장성 측면에서 이점이 있다.

  • PDF

웹 기반 데이터베이스로부터의 유용한 데이터 추출 기법의 설계 및 응용 (Design and application of effective data extraction technique from Web databases)

  • 황두성
    • 한국산학기술학회논문지
    • /
    • 제6권4호
    • /
    • pp.309-314
    • /
    • 2005
  • 본 논문에서는 생명공학 정보를 포함하는 분산 웹 데이터베이스들로부터 관련성에 기반하여 목표 데이터를 추출하는 기법들을 분석한다. 더불어 이 분석을 기본으로 단백질 데이터의 지식 확장 방법의 설계 및 구현을 제안한다. 웹 데이터베이스를 위한 데이터 추출기는 수동 추출, 반자동 추출, 자동 추출 방법 등의 구현방법이 가능하다. 웹 데이터 추출기는 해당 웹 페이지에서 목표 데이터를 검색 및 추출하기 위하여 식별자를 이용하는 것이 일반적이다. 본 논문은 웹 데이터 추출 기법을 이용한 유기체 단백질 관련 데이터베이스 시스템의 설계와 구현을 기술한다.

  • PDF

Quadtree와 영역확장법에 의한 LiDAR 데이터의 지면점 추출 (Extraction of Ground Points from LiDAR Data using Quadtree and Region Growing Method)

  • 배대섭;김진남;조기성
    • 대한공간정보학회지
    • /
    • 제19권3호
    • /
    • pp.41-47
    • /
    • 2011
  • 원시 LiDAR 데이터는 벡터 구조이기 때문에 직접 활용 시 처리과정이 복잡해지지만, LiDAR 데이터를 필터링을 통해 정규 가상 격자 형태로 변환하면 데이터 용량이 감소되고 처리 속도가 빠르기 때문에 저가의 장비에서도 처리가 가능하다. 특히 Quadtree와 같은 영상 압축 처리 기법을 적용할 경우, 평활화를 통하여 비지면 요소인 자동차, 수목등이 제거되어 모델링에 유리하다는 장점이 있다. 따라서 본 연구에서는 대용량의 LiDAR 데이터로부터 Quadtree와 영역확장법을 활용하여 지면점을 자동 추출할 수 있는 알고리즘을 제시하였으며, 오차분류기법을 활용하여 정확도를 분석하였다. 그 결과, 지면점 분류 정확도는 98%이상으로 나타나, 지면점 추출에 유리함을 알 수 있었다. 또한 Quadtree와 영역확장법을 활용시 자동차, 수목등의 비지면 요소들을 효과적으로 제거할 수 있었다.

이름 공간을 이용한 질의 검색 시스템 설계 및 구현 (Design of retrieval system using Namespace)

  • 이원철;이상민
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.208-210
    • /
    • 2002
  • xml 이 확산되면서 이를 저장하고 검색하는 방법들이 많이 제안되었다. 또한 데이터의 통합에 대하여 여러가지 방법을 제시하고 있다. 그러나 이런 방법들은 xml 이 가지고 있는 자유로운 확장성과 데이터의 통합이라는 관점에서 서로 상반된 면을 나타낸다. 이런 문제의 해결을 위해 W3C에서 제안한 이름공간에 대한 기존의 기능을 확장하고, 검색에 있어 사용자의 편리성을 위한 재질의 기법과 정확한 검색 결과를 위한 이름공간을 이용한 검색 시스템을 설계하였다.

  • PDF

차세대 저장 장치를 위한 메모리 확장 (Memory Extension with Next-Generation Storage Device)

  • 한혁
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2014년도 추계 종합학술대회 논문집
    • /
    • pp.3-4
    • /
    • 2014
  • 현대 운영 체제에서 가상 메모리 관리 기술은 응용 프로그램에게 가상의 큰 주소 공간을 제공하는 방법이다. 이러한 기술은 메인 메모리와 저장 장치를 이용하여 자주 접근되는 데이터는 메인 메모리에 덜 접근되는 데이터는 저장 장치에 저장한다. 본 연구는 차세대 저장 장치를 메모리 확장을 위한 장치로 가정했을 때의 성능 향상 기법을 제안한다. 본 연구진은 제안된 방법을 Linux 3.14.3을 구현하였고, 초고속 저장 장치를 이용하여 평가한 결과 기존 SWAP 시스템에 비해 20% 정도의 성능 향상 효과가 있음을 보였다.

  • PDF

메일 서버의 성능과 확장성 향상을 위한 SIRMS 기법 (SIRMS Techniques for Improving Performance and Scalability in a Mail Server)

  • 송영호;권택근
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (3)
    • /
    • pp.727-729
    • /
    • 2001
  • 최근 전자 메일에서 여러 타입의 데이터를 지원함으로 인하여 메일의 용량이 커지고, 사용자는 다양한 통신 단말을 통하여 메일을 송수신하고 있어 메일 서버의 용량 및 처리 성능에 대한 고속화의 요구가 활발하다. 따라서 이러한 요구에 부흥하기 위한 새로운 기법으로 본 논문은 소스 IP 라우팅과 저렴한 PC의 클러스터를 기반으로 하는 메일 서버를 구현하여 메일 서버의 성능과 확장성을 실현할 수 있게되었다.

  • PDF