• 제목/요약/키워드: Data Locality

검색결과 237건 처리시간 0.031초

HA-PVFS : 시간적 지역성에 적응적인 데이터 고가용성을 지원하는 PVFS 파일 시스템 (HA-PVFS : A PVFS File System supporting High Data Availability Adaptive to Temporal Locality)

  • 심상만;한세영;박성용
    • 정보처리학회논문지A
    • /
    • 제13A권3호
    • /
    • pp.241-252
    • /
    • 2006
  • 클러스터 파일 시스템에서 가용성 지원을 위해 파일 복제 방법과 패리티 서버 방식이 사용되어 왔으나, 공간과 시간적 비용이 매우 크고 대량 장애 상황에 적절히 대처하지 못하는 문제가 있다. 따라서 시간적 지역성이 높은 중요한 파일에 대해서만 복제를 하거나 패리티를 생성하게 하여 효율적으로 데이터의 고가용성을 지원하는 HA-PVFS 파일 시스템을 제안한다. 이 파일 시스템에서는 동적으로 주어지는 파일 접근 빈도를 적응적으로 추정해 내기 위하여, 제한적인 정보를 통해 실제 접근 패턴을 정확히 판단하는 알고리즘을 사용하고, 성능 저하를 최소화하기 위해 지연 업데이트 방식과 릴레이식 복제를 사용한다.

센서의 불균일한 배포밀도를 고려한 효율적인 데이터 중심 저장기법 (An Efficient Data Centric Storage Scheme with Non-uniformed Density of Wireless Sensor Networks)

  • 성동욱;이석재;송석일;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
    • /
    • pp.135-139
    • /
    • 2007
  • 최근 자연 환경 조사, 군사 응용 시스템, 환경 변화 감시 등의 여러 응용 분야에서 무선 센서 네트워크 자체를 데이터 저장 장치로 활용하는 데이터 중심 저장기법(DCS)에 대한 연구들이 진행되고 있다. 기존에 제안된 데이터 중심 저장기법들은 데이터들의 지역성이 고려되지 않아 범위질의 처리에 비효율적인 문제점(Q-NiGHT)과 센서 배포밀도가 불균일한 경우 각 센서의 데이터에 대한 저장 부하가 불균등해지는 문제점(KDDCS)을 갖는다. 본 논문에서는 이러한 기존의 문제점을 해결하고자, 데이터 저장 위치의 지역성(Locality)를 만족시키며 센서 배포 밀도를 고려한 새로운 데이터 중심 저장 기법을 제안한다. 제안하는 기법은 전체 센서 영역을 그리드로 나누고, 각 셀의 센서 밀도정보를 비트로 표현하는 배포 밀도 비트맵을 만들어 배포한다. 센서들은 데이터를 저장 하거나 탐색할 때 배포 밀도 비트맵을 이용하여 데이터 저장위치를 계산함으로써 별도의 통신 없이 최적의 저장위치를 선정할 수 있다. 본 논문에서는 시뮬레이션을 통해 기존 연구와의 성능 평가 하여 센서들의 배포밀도가 균일한 환경뿐만 아니라 불균일한 환경에서도 각 센서들의 데이터 저장부하를 고르게 분산시키고, 범위질의 처리 또한 효율적으로 처리됨을 보였다.

  • PDF

CORE-Dedup: 내용보존 접근 지역성 활용한 IO 크기 분할 기반 중복제거 (CORE-Dedup: IO Extent Chunking based Deduplication using Content-Preserving Access Locality)

  • 김명식;원유집
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권6호
    • /
    • pp.59-76
    • /
    • 2015
  • 고성능 내장형 기기의 대중화 및 광대역 통신기술의 발달로 생성-관리되는 데이터가 증가하고 있다. 중복제거 기법은 중복된 저장 요청을 판별하여 유일한 데이터만을 저장함으로써 저장 공간을 절약하는 방법으로 폭증하는 데이터의 저장과 처리 시스템을 경제적으로 구축 할 수 있다. 본 연구는 입출력 크기 (IO Extent) 단위 기반 분할 방법을 사용한 CORE-Dedup을 제안한다. CORE-Dedup의 Extent 단위 분할은 접근한 Content가 보존하는 접근 단위의 속성을 활용 한다. 가상머신에서 IO 경향을 수집하고 고정 크기 분할과 새로운 Extent 분할 방법에 대해 중복제거 성능을 비교 평가하였다. 동일 크기 워크로드 경우 4 KB 고정 분할 대비 적은 색인 버퍼를 가지고 유사한 수준의 중복 비교를 성능을 얻을 수 있다. 특히 다수 유저의 유사 IO 중복 접근을 가정한 워크로드 경우에는 CORE-Dedup이 Extent 단위 분할의 넓은 워크로드 Coverage에 의해 고정 크기 분할을 사용한 동일 조건의 Inline-Dedup에 비해 1/10 수준 버퍼를 가지고도 유사 중복제거 성능을 얻었다. 10명 사용자의 동일 compile 입출력을 가정한 병합 워크로드에서 4 KB 고정 크기 분할에서는 14,500개 분할 색인에서 최대 60.4%의 중복 발견율을 얻었으나 Extent 분할에서는 1,700개 색인만으로 57.6%를 얻었다.

플래시 파일시스템에서 wear-leveling 개선을 위한 블록 할당 정책 (A Block Allocation Policy to Enhance Wear-leveling in a Flash File System)

  • 장시웅
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 추계종합학술대회
    • /
    • pp.574-577
    • /
    • 2007
  • 디스크에서는 데이터가 변경되면 해당 영역에 겹쳐 쓰기를 수행하나 플래시 메모리에서는 겹쳐 쓰기가 수행되지 않아 데이터가 변경될 때 새로운 영역에 데이터를 갱신한다. 따라서 이전의 데이터는 쓸모없는 데이터가 되기 때문에 가비지 컬렉션을 통해 지움 연산을 수행하여 새로운 영역을 확보하게 된다. 지움(erase) 연산을 수행할 수 있는 회수가 플래시 메모리의 특성에 의해 일정 회수로 제한을 받게 되므로 플래시 메모리의 모든 블록은 고르게 쓰여 지고 지워져야 한다. 본 논문은 지역성을 가지는 접근에서 wear-leveling을 개선하기 위한 방법으로 hot 데이터와 cold 데이터를 서로 다른 뱅크에 저장하고 시간이 흐름에 따라 일정주기로 cold 뱅크와 hot 뱅크를 교환하는 CB-MB(Cost Benefit between Multi Bank) 방법을 제안하고 성능을 평가하였다. CB-MB는 uniform한 작업부하에 대해서는 다른 방법들과 유사한 성능을 보이는 반면 접근 지역성을 가지는 작업부하에 대해서는 상대적으로 월등한 성능을 제공하는 것으로 분석되었다.

  • PDF

멀티미디어 내장형 시스템을 위한 저전력 데이터 캐쉬 설계 (An Area Efficient Low Power Data Cache for Multimedia Embedded Systems)

  • 김정길;김신덕
    • 정보처리학회논문지A
    • /
    • 제13A권2호
    • /
    • pp.101-110
    • /
    • 2006
  • 대용량의 데이터 처리가 요구되는 내장형 시스템에서 메모리의 비중은 아주 중요하며, 특히 제한적인 메모리를 최적으로 이용하기 위하여 응용의 특성을 활용하는 온칩(on-chip) 메모리 구조의 설계가 필요하다. 본 논문에서는 멀티미디어 응용을 위한 내장형 시스템에서 저전력을 위하여 작은 용량으로 설계되었으나 우수한 성능을 보이는 데이터 캐쉬(data cache)가 제안된다. 제안되는 캐쉬는 컴파일러의 도움 없이 구조적인 특징과 간단한 동작 메커니즘만을 이용하여 해당 응용의 데이터 지역성(data locality)을 효과적으로 반영할 수 있도록 작은 블록 크기를 지원하는 4KB 용량의 직접사상 캐쉬(direct-mapped cache)와 큰 블록을 지원하는 1KB 용량의 완전연관 버퍼(fully-associative buffer)로 구성되어 진다. 전체 5KB의 작은 캐쉬 용량으로 인한 성능 저하를 보완하기 위하여 멀티미디어 응용의 알고리즘 특성을 기반으로 응용 적응적인 다중 블록 선인출(adaptive multi-block prefetching) 기법과 효과적 블록 필터링(effective block filtering) 기법이 제안되었다 시뮬레이션 결과에 따르면 제안된 5KB 캐쉬는 기존의 16KB 4-way 집합연관 캐쉬와 동등한 성능을 보이면서 소비 전력 면에서는 40% 이상의 감소를 보이고 있다.

압축 지역성 수준에 기반한 캐쉬 인식 압축 색인 (A Cache-Conscious Compression Index Based on the Level of Compression Locality)

  • 김원식;유재준;이진수;한욱신
    • 한국멀티미디어학회논문지
    • /
    • 제13권7호
    • /
    • pp.1023-1043
    • /
    • 2010
  • 최근 메인 메모리의 용량 증가와 가격하락으로 데이터베이스 시스템에서 사용하고 있는 색인 전체를 메인 메모리상에 상주시키는 것이 가능해지고 있다. 그러나 CPU와 메인 메모리의 연산속도와 메인 메모리의 접근 속도의 차이는 해마다 커지고 있다. 이러한 접근 속도 차이로 생기는 문제를 해결하기 위한 많은 연구가 진행 중에 있다. 이러한 연구 중 캐시 인식 트리는 데이터 압축을 통해서 캐시 미스를 줄이고, 메인 메모리의 접근 비용을 감소시킬 수 있다. 기존의 캐시 인식 트리는 데이터의 특성과 관계없이 오직 한 가지 방법의 압축방법을 사용하는 한계가 있다. 본 논문에서는 이러한 한계를 극복 할 수 있는 방법을 제안한다. 첫 번째로, 데이터의 특성을 설명 할 수 있는 압축 지역성의 개념을 제안한다. 두 번째로, 데이터의 특성에 따라 최대한 캐시 미스를 줄일 수 있도록 여러 가지 압축 방법을 지원하는 DC-Tree를 제안한다. 캐시 미스 수 측면에서 DC-Tree는 B+-Tree, Simple prefix DC-Tree, pkB-Tree에 비해 각각 1.7배, 1.5배, 1.3배의 성능 향상을 보였다. 본 논문에서 제안한 DC-Tree는 사업 데이터베이스 시스템에 적용 할 수 있을 것으로 예상되며, 실제 응용에서도 성능 향상을 보일 수 있을 것이다.

리눅스 상에서 멀티미디어 데이타를 고려한 지역 버퍼 할당 기법 (A Local Buffer Allocation Scheme for Multimedia Data on Linux)

  • 신동재;박성용;양지훈
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제9권4호
    • /
    • pp.410-419
    • /
    • 2003
  • 리눅스와 같은 범용 운영체제의 버퍼 캐시(buffer cache)는 전역적(global) 블록 교체 및 미리읽기(read ahead) 정책 등을 사용하여 파일 블록을 관리한다. 따라서, 참조의 지역성(locality)을 가지지 않고 다양한 소비율(consumption rate)을 갖고 있는 멀티미디어 데이타의 경우 캐시 시스템의 적중률이 낮을 뿐만 아니라 미리읽기의 특성으로 인하여 필요보다 과도하게 버퍼를 소비하기도 한다. 본 논문에서는 리눅스 상에서 멀티미디어 데이타를 위한 새로운 버퍼 할당 기법을 설계하고 구현하였다. 제안된 방법에서는 멀티미디어 파일마다 독립적인 미리읽기 캐시를 유지하며 미리읽기 그룹의 크기를 소비율에 비례하도록 동적으로 조절한다. 이는 공정한 자원 분배가 이루어지도록 하며, 버퍼의 소비량을 최적화되도록 한다. 본 논문에서는 구현된 시스템과 최신의 리눅스 커널 2.4.17 버전 상에서 각각 소비되는 버퍼 수와 캐시 적중률을 실험을 통하여 비교함으로써 시스템의 성능을 평가한다.

접근 지역성을 가지는 작업부하에서 플래시 파일시스템의 wear-leveling 향상 기법 (A method for improving wear-leveling of flash file systems in workload of access locality)

  • 장시웅
    • 한국정보통신학회논문지
    • /
    • 제12권1호
    • /
    • pp.108-114
    • /
    • 2008
  • 플래시 메모리는 디스크와는 달리 덮어쓰기가 불가능하므로, 새로운 데이터는 새로운 영역에 갱신이 된다. 데이터가 빈번히 변경되면 새로운 영역을 확보하기 위해 가비지 컬렉션을 통하여 데이터를 지우게 되는데, 이때 지움(erase) 연산을 수행 할 수 있는 회수가 플래시 메모리의 특성에 의해 일정 회수로 제한을 받게 되므로 플래시 메모리의 모든 블록은 고르게 쓰여지고 지워져야 한다. 그러나 지역 접근성을 가지는 데이터를 Cost-benefit 방법으로 처리하면 성능은 좋으나 wear-leveling은 매우 나빠지는 문제점이 있다. 본 논문에서는 wear-leveling을 개선하기 위해 멀티 뱅크에서 하나의 뱅크는 cold 데이터를 다른 뱅크는 hot 데이터를 할당하고, 시간이 흐름에 따라 일정주기로 cold 뱅크와 hot 뱅크를 교환하는 CB-MB(Cost Benefit between Multi Bank) 방법을 제안하고 성능을 평가하였다. CB-MB방법은 hot 데이터와 cold 데이터를 블록단위로 분리하여 관리하는 Cost-benefit방법에 비해 성능에 있어 30% 성능향상을 보이고 wear-leveling측면에서 1/3이하로 표준편차를 줄였다.

k-NN Join Based on LSH in Big Data Environment

  • Ji, Jiaqi;Chung, Yeongjee
    • Journal of information and communication convergence engineering
    • /
    • 제16권2호
    • /
    • pp.99-105
    • /
    • 2018
  • k-Nearest neighbor join (k-NN Join) is a computationally intensive algorithm that is designed to find k-nearest neighbors from a dataset S for every object in another dataset R. Most related studies on k-NN Join are based on single-computer operations. As the data dimensions and data volume increase, running the k-NN Join algorithm on a single computer cannot generate results quickly. To solve this scalability problem, we introduce the locality-sensitive hashing (LSH) k-NN Join algorithm implemented in Spark, an approach for high-dimensional big data. LSH is used to map similar data onto the same bucket, which can reduce the data search scope. In order to achieve parallel implementation of the algorithm on multiple computers, the Spark framework is used to accelerate the computation of distances between objects in a cluster. Results show that our proposed approach is fast and accurate for high-dimensional and big data.

New record of Codium lucasii (Bryopsidales, Chlorophyta) in Korea

  • An, Jae Woo;Nam, Ki Wan
    • Journal of Ecology and Environment
    • /
    • 제38권4호
    • /
    • pp.647-654
    • /
    • 2015
  • A prostrate species of Codium (Bryopsidales, Chlorophyta) was collected from Daejin on the eastern coast of Korea. This alga is morphologically characterized by a prostrate, adherent or pulvinate, dark green thallus that is tightly attached to substratum. The utricles are strongly grouped and cylindrical to slightly clavate. Their apex is rounded to capitated, and it frequently has an alveolate ornament. Hair scars are found in the upper portion of the utricle. The gametangia grow on a short pedicel in the upper part of the utricle. In the phylogenetic tree based on molecular data, this alga is placed in the same clade as C. mozambiquense in UPGMA analysis, and nests in a sister clade of C. lucasii subsp. capense and C. mozambiquense in ML and NJ analyses. However, the genetic distance between the sequences of the Korean alga and the two species is 1.3-1.9%, while that between the Korean alga and C. lucasii from Japan is 1.1% within intraspecific range. The divergence value between the Korean alga and C. lucasii from the type locality (Australia) is 2.7% considered to be interspecific range. As based on this genetic divergence value, the Korean alga together with Japanese C. lucasii can be separated from genuine C. lucasii from the type locality. However, the Korean alga is identified as C. lucasii until those entities are morphologically characterized in species level. This is the first record of C. lucasii in Korea