• Title/Summary/Keyword: 데이터 감소 기법

Search Result 1,311, Processing Time 0.034 seconds

Spatial Transformation Schemes supporting Location Data Privacy for Databases Outsourcing (데이터베이스 아웃소싱을 위한 위치 데이터 보호를 지원하는 공간 좌표 변환 기법)

  • Yoon, Min;Kim, Hyeong-Il;Chang, Jaw-Woo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06c
    • /
    • pp.218-220
    • /
    • 2012
  • 최근 클라우드 컴퓨팅이 발전함에 따라 공간 데이터베이스의 아웃소싱(outsourcing)에 대한 관심이 급증하고 있다. 따라서 데이터베이스 아웃소싱에서의 위치 데이터 보호를 위한 공간 좌표 변환 기법이 활발히 연구되어 왔다. 그러나 기존 공간 좌표 변환 기법들은 근접(proximity) 공격에 취약하기 때문에, 데이터 베이스 아웃소싱을 통해 서비스를 제공받는 사용자의 프라이버시를 보호하지 못한다는 문제점이 존재한다. 따라서 사용자의 안전하고 편리한 서비스 사용을 위한 공간 좌표 변환 기법이 요구된다. 이를 위해, 본 논문에서는 선대칭 이동 기반 공간 좌표 변환 기법을 제안한다. 제안하는 기법은 위치 데이터 보호를 위해 데이터 분포 변환 및 에러 삽입을 수행하고 근접 공격의 효율적인 방지를 위해 선대칭 이동을 이용한 공간 좌표 변환을 수행한다. 또한, 성능평가를 통해 제안하는 기법이 근접 공격에의 노출 확률을 크게 감소시키면서, 빠르게 공간 좌표 변환을 수행함을 검증한다.

Data De-duplication and Recycling Technique in SSD-based Storage System for Increasing De-duplication Rate and I/O Performance (SSD 기반 스토리지 시스템에서 중복률과 입출력 성능 향상을 위한 데이터 중복제거 및 재활용 기법)

  • Kim, Ju-Kyeong;Lee, Seung-Kyu;Kim, Deok-Hwan
    • Journal of the Institute of Electronics and Information Engineers
    • /
    • v.49 no.12
    • /
    • pp.149-155
    • /
    • 2012
  • SSD is a storage device of having high-performance controller and cache buffer and consists of many NAND flash memories. Because NAND flash memory does not support in-place update, valid pages are invalidated when update and erase operations are issued in file system and then invalid pages are completely deleted via garbage collection. However, garbage collection performs many erase operations of long latency and then it reduces I/O performance and increases wear leveling in SSD. In this paper, we propose a new method of de-duplicating valid data and recycling invalid data. The method de-duplicates valid data and then recycles invalid data so that it improves de-duplication ratio. Due to reducing number of writes and garbage collection, the method could increase I/O performance and decrease wear leveling in SSD. Experimental result shows that it can reduce maximum 20% number of garbage collections and 9% I/O latency than those of general case.

ATS-DA : Adaptive Timeout Scheduling for Data Aggregation in Wireless Sensor Networks (ATS-DA : 무선 센서 네트워크에서 데이터 병합을 위한 적응적 타임아웃 스케줄링 기법)

  • Baek, Jang-Woon;Nam, Young-Jin;Seo, Dae-Wha
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10d
    • /
    • pp.765-768
    • /
    • 2006
  • 센서 네트워크에서 데이터 병합 시 타임아웃 스케줄링은 각 센서노드가 자식노드로부터 메시지를 받기 위해 기다려야하는 시간을 조절하는 것이다. 본 논문에서는 데이터 패턴의 변화에 따라 타임아웃을 적응적으로 조절하는 새로운 타임아웃 스케줄링 기법인 ATS-DA(Adaptive Timeout Scheduling for Data Aggregation)를 제안한다. ATS-DA는 자식노드로부터 수신한 데이터가 특별한 이벤트 없이 기준 데이터 변동률 범위 내에 있게 되면 타임아웃 값을 줄인다. 타임아웃을 작게 하면 파워 소모가 감소하고 전송 지연도 짧아진다. 센싱 데이터가 기준 데이터 변동률을 벗어나면 보다 정확한 데이터 병합 값을 얻기 위해 타임아웃 값을 늘린다. 시뮬레이션 결과에서 제안하는 ATS-DA 기법이 기존 캐스케이딩 타임아웃 스케줄링 기법에 비해 데이터 정확도와 파워 소모 측면에서 우수한 성능을 보여주었다.

  • PDF

An Efficient Spatial Data Transformation Method Using Caching on S-XML Middleware (S-XML 미들웨어에서 캐싱을 이용한 효율적인 공간 데이터 변환 기법)

  • Lee, Dong-Wook;Jang, Yong-Il;Park, Soon-Young;Oh, Young-Hwan;Bae, Hae-Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.05a
    • /
    • pp.47-50
    • /
    • 2005
  • 본 논문에서는 S-XML 미들웨어에서 캐싱을 이용한 효율적인 공간 데이터 변환 기법을 제안한다. 공간 데이터베이스 관리 시스템(SDBMS)을 기반으로 하여 S-XML 을 지원하는 시스템은 SDBMS 에서 사용되는 이진 데이터와 S-XML 간의 상호 변환 과정이 필요하다. 특히 변환 과정에서 공간 데이터는 비공간 데이터에 비해 데이터 크기가 크고, 복잡한 동시에 다양한 데이터 형식을 가지고 있어 비공간 데이터에 비해 변환 비용이 크다. 따라서 공간 데이터의 특성을 고려한 변환 비용 감소 기법이 필요하다. 제안 기법은 SDBMS 의 질의 처리 결과인 이진 데이터를 S-XML 문서로 변환하고, S-XML 미들웨어의 캐싱 관리자에서 공간 데이터에 해당하는 부분만을 캐싱 한다. 캐싱 관리자는 질의를 점 질의와 영역 질의로 구분한다. 점 질의의 결과에 대해서는 공간 데이터의 OID 를 키 값으로 하는 해쉬 색인을 사용하며, 영역 질의 결과에 대해서는 질의에서 표현된 MBR 에 따라 R-Tree 색인을 사용한다. 변환 과정에서 요구되는 공간 데이터가 캐싱된 데이터로 존재하면 질의 종류에 따른 색인을 사용하여 데이터를 추출하고 이를 S-XML 데이터로 치환한다. 캐싱 데이터를 이용한 공간 데이터 변환 기법에 의해 공간 데이터의 변환 비용을 줄임으로써 S-XML 미들웨어 에서의 변환 시간을 단축할 수 있다.

  • PDF

A study on data scaling and feature selection techniques for XGBoost-based intrusion detection model (XGBoost 기반 침입탐지모델을 위한 데이터 스케일링 및 특성선택 기법 연구)

  • Kim, Young-Won;Lee, Soo-Jin
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.251-254
    • /
    • 2022
  • 본 논문은 XGBoost 알고리즘 기반의 침입탐지모델의 성능을 향상하기 위한 스케일링(scaling) 및 특성선택(feature selection) 기법을 제안한다. 머신러닝 모델 개발 중 전처리 단계에서 스케일링 및 특성선택을 수행하면 데이터세트의 조건수가 감소하여 모델의 성능을 향상할 수 있다. 각 과정별로 다양한 기법이 있지만 기존의 연구에서는 이러한 기법들을 적용한 결과를 비교·분석하지 않고 특정 기법을 적용한 결과만을 나열하였고 스케일링 및 특성선택에 대해 최적의 조합은 제시하지 못하였다. 따라서 본 논문에서는 다양한 전처리 기법들의 적용결과를 비교하고 최적의 조합을 제안한다. 또한 기존의 연구들이 특정 데이터세트에만 적용 가능한 전처리 기법을 제안하는데 비해 본 논문은 다양한 데이터세트에 대해 공통적으로 적용 가능한 전처리 기법을 제안함으로써 제안 기법의 범용성과 실세계 적용 가능성을 증명한다.

  • PDF

An Energy-Efficient Data Gathering Method in Wireless Sensor Networks Based on Mobile Sinks (모바일 싱크 기반 무선 센서 네트워크에서 에너지 효율적인 데이터 수집 기법)

  • Kim, Sang-Lae;Park, Jun-Ho;Seong, Dong-Ook;Yoo, Jae-Soo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06d
    • /
    • pp.205-207
    • /
    • 2012
  • 무선 센서 네트워크에서 에너지 효율적인 네트워크 구성을 위해 데이터를 수집하는 싱크 노드에 이동성을 적용시킨 모바일 싱크를 이용한 데이터 수집 기법이 활발하게 연구되고 있다. 하지만 최근 모바일 싱크를 적용한 데이터 수집 기법에서는 무선 센서 노드들의 에너지 소모를 분산시켜 네트워크의 수명은 증가시켰지만 고정적인 경로를 기반으로 하여 이벤트 데이터의 신속한 수집이 불가능하거나 이동성을 갖는 모바일 싱크로의 동적 라우팅 패스의 빈번한 설정으로 인해 최적화된 에너지 효율을 제공하지 못한다. 본 논문에서는 이와 같은 문제점을 해결하기 위해 모바일 싱크 기반의 무선 센서 네트워크 환경에서 에너지 효율성을 고려하여 이벤트 데이터를 우선 수집하는 데이터 수집 기법을 제안한다. 제안하는 기법은 특정 이벤트가 발생할 경우, 모바일 싱크의 이동성을 이용하여 특정 이벤트 데이터를 빠르게 수집하며 일반적인 모니터링 데이터의 압축과 전송 주기를 변경함으로써 전반적인 QoS를 향상시킨다. 성능평가 결과, 제안하는 기법은 기존 기법에 비해 이벤트 데이터에 대한 응답시간이 평균 57% 감소하였고, 네트워크의 수명이 평균 19% 증가하였다.

데이터 클러스터링 기법을 이용한 퍼지 질의 처리

  • 김태희;김선경
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 1997.03a
    • /
    • pp.129-139
    • /
    • 1997
  • 다양한 실세계의 표현은 주관적인 의미가 내포되어 있어 데이터의 모델링 과정이 보다 중요하며 이 과정에서 데이터 손실을 최소화시켜야 한다. 이러한 성향의 모든 데이터를 수용하기위한 퍼지데이터베이스 시스템 구축시에는 데이터가 퍼지 집합으로 표현되어야 하고 불확실하고 다양한 형태의 질의가 가능하며 신뢰성 있는 응답 제시되어야 한다. 본 논문에서는 불활실함의 의미를 최대한 반영하여 표현을 다양화 시키고 사용자의 주관적인 인식수용을 위한 데이터의 개별화와 레벨의 다양화를 위한 클러스터링(clustering)기법을 보인다. 이를 통해 영역구조를 병합 분리시켜 데이터베이스의 릴레이션에서의 도메인요소의 첨가와 삭제를 통하여 자유로운 질의에 대한 불확실성이 감소된 응답과 융통성이 부여된 퍼지질의 처리를 보여준다.

Polar Wavelet Method for Efficient Similarity Search in Time Series Databases (시계열 데이터 베이스에서의 효율적인 유사 검색을 위한 Polar Wavelet 기법)

  • 이범기;강성구;이상준;이석호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.85-87
    • /
    • 2004
  • 유클리드 거리에 기반하여 유사한 시퀀스 검색을 하는 기법들은 각 시퀀스에서 특징을 추출하여 차원을 감소시킨 후, R-tree 같은 다차원 인덱싱 기법을 사용하여 검색을 수행한다. 본 논문에서는 시계열 데이터 베이스에서의 유사 검색 성능 향상을 위한 새로운 특징 추출 기법인 Polar Wavelet 기법을 제안한다. 이 기법은 유사 검색 시 후보 시퀀스의 개수를 줄임으로써 검색 성능을 향상시킬 수 있고, 특징 추출을 위해 시퀀스의 길이를 2$^n$으로 만들 필요가 없는 장점을 갖고 있다.

  • PDF

Privacy Preserving Distributed Data Mining of Sequential Patterns on Horizontally Partitioned Databases (수평 분산 데이터베이스 상의 세부 데이터 유출이 없는 순차 패턴 마이닝 기법)

  • Kim, Seung-Woo;Won, Jung-Im;Park, Sang-Hyun
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.61-63
    • /
    • 2005
  • 본 논문에서는 수평 분산 데이터베이스에서 각 로컬 데이터베이스의 세부 데이터를 유출하지 않는 순차패턴 마이닝 기법을 제안한다. 데이터 마이닝은 대용량 데이터베이스에서 유용한 지식을 추출하는 기법으로서 각광을 받고 있다. 그러나 분산 데이터베이스를 대상으로 마이닝을 수행하는 경우, 데이터 공유에 따른 개인 혹인 집단의 프라이버시가 유출될 수 있다는 문제점이 존재한다. 따라서 본 논문에서는 프라이버시 보호를 위하여 각 로컬 데이터베이스의 세부 데이터를 보호하면서도, 마이닝 결과의 정확성을 보장할 수 있는 새로운 순차 패턴 마이닝 기법을 제안한다. 제안된 기법에서는 우선, 세부 데이터의 유출을 방지하기 위하여 마이닝의 대상이 되는 항목과 항목간의 시간 선후 관계의 성립 여부를 벡터로 표현한 후, 이들 벡터간의 스칼라 프로덕트 연산을 수행하여 얻어진 결과를 패턴의 지지도로 활용하는 방안을 제안하였다. 또한, 연산 결과에 영향을 미치지 않는 벡터를 미리 제거하여 스칼라 프로덕트 연산에 따른 비용을 감소시키는 방안을 제안하였다.

  • PDF

Delay Improvement Greedy Forwarding in Low-Duty-Cycle Wireless Sensor Networks (로우듀티사이클 환경을 고려한 무선센서네트워크에서 데이터 전송지연을 향상한 그리디 포워딩)

  • Choe, Junseong;Le, Huu Nghia;Shon, Minhan;Choo, Hyunseung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.04a
    • /
    • pp.609-611
    • /
    • 2012
  • 논문에서는 로우듀티사이클 환경을 고려하여 목적지까지 데이터 전송의 신뢰성뿐만 아니라 낮은 데이터 지연도 보장하는 DIGF (Delay Improvement Greedy Forwarding) 기법을 제안한다. 초기에 제안된 그리디 포워텅 기법들은 무선링크가 갖는 비신뢰성 및 비대칭성의 문제점을 해결하기 위해 데이터 전송 성공률과 에너지 효율을 높이는 기법이 제안되었다. 하지만 많은 그리디 포워텅 기법들은 노드들이 데이터를 송수신하기 위해 대기하고 있는 수신대기상태로 인한 많은 에너지 소모를 고려하지 않아 네트워크 라이프타임을 감소시킨다. 이러한 문제점을 해결하고자 제안기법인 DIGF는 무선링크의 비신뢰성과 비대칭성을 고려할 뿐만 아니라 로우듀티사이클 환경을 고려한다. 또한 로우듀티사이클 환경을 고려할 때 발생되는 높은 수면지연성 (Sleep latency) 을 해결하기 위한 알고리즘을 제안하여 낮은 전송지연과 신뢰성 있는 데이터 전송을 보장한다.