• 제목/요약/키워드: 데이타

검색결과 4,094건 처리시간 0.029초

센서 네트워크에서 저장 공간의 활용성과 에너지 효율성을 위한 시간 매개변수 기반의 데이타 중심 저장 기법 (A Time-Parameterized Data-Centric Storage Method for Storage Utilization and Energy Efficiency in Sensor Networks)

  • 박용훈;윤종현;서동민;김준;유재수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권2호
    • /
    • pp.99-111
    • /
    • 2009
  • 최근 무선 센서 네트워크 환경에서 감지되는 데이타를 네트워크상에 효과적으로 저장하고 처리하기 위한 다양한 기법들이 제안되었다. 데이타 중심 저장(Data-Centric Storage : DCS) 기법은 분할된 데이타 영역을 센서들에게 할당하고, 수집된 데이타를 해당 데이타 영역을 담당하는 센서에 저장하는 기법이다. 기존 연구된 DCS 기반 기법들은 데이타 전송을 위한 통신비용의 감소와 정합 질의(Exact Query) 및 영역 질의(Range Query)의 효과적인 처리를 위해 제안되었다. 하지만 방대한 데이타가 발생하는 데이타 영역을 담당하는 센서의 저장 부하 문제는 고려되지 않았다. 최근 이와 같은 저장 부하 문제를 해결하기 위해 K-D 트리를 기반으로 동적 분할 데이타 영역을 사용하는 KDDCS가 제안되었다. 하지만 KDDCS를 포함한 모든 기존 DCS 기반 기법들은 인기 있는(많은 질의 요청을 받는) 데이타 영역에 대한 질의 부하가 고려되지 않았기 때문에, 결과적으로 전체 센서 네트워크의 수명이 단축된다. 그래서 본 논문에서는 저장 부하뿐만 아니라 질의 부하도 효과적으로 해결할 수 있는 새로운 DCS 기반 기법인 TPDCS(Time parameterized DCS)를 제안한다. 제안하는 기법은 데이타 차원뿐만 아니라 시간 차원을 함께 고려하여 센서에 할당되는 데이타 영역을 분할한다. 제안하는 방법은 데이타 저장과 질의 처리 분산을 통해 전체 센서 네트워크의 수명을 크게 연장시킨다. 또한 본 논문에서는 대표적인 기존 DES기반 기범들과 다양한 성능 비교 평가를 통해 제안하는 기법의 우수성을 보인다.

데이타 웨어하우스에서 데이타 큐브를 위한 효율적인 점진적 관리 기법 (An Efficient Incremental Maintenance Method for Data Cubes in Data Warehouses)

  • 이기용;박창섭;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권2호
    • /
    • pp.175-187
    • /
    • 2006
  • 데이타 큐브는 차원 애트리뷰트의 모든 가능한 조합에 대해 데이타를 집단화하는 연산자이다. 차원 애트리뷰트의 수가 n일 때, 데이타 큐브는 $2^n$개의 group-by를 계산한다. 데이타 큐브에 포함된 각각의 group-by를 큐보이드(cuboid)라 부른다. 데이타 큐브는 흔히 미리 계산되어 형태 뷰(materialized view)의 형태로 데이타 웨어하우스에 저장된다. 이러한 데이타 큐브는 소스 릴레이션이 변경되면 이를 반영하기 위해 갱신되어야 한다. 데이타 큐브의 점진적 관리는 데이타 큐브의 변경될 내용만을 계산하여 이를 데이타 큐브에 반영하는 방법을 의미한다. $2^n$개의 큐보이드로 이루어진 큐브의 변경될 내용을 계산하기 위하여, 기존의 방법들은 데이타 큐브와 동일한 개수의 큐보이드를 가지는 변경 큐브를 계산한다. 따라서, 차원 애트리뷰트의 수가 증가할수록 변경 큐브를 계산하는 비용이 매우 커지게 된다. 변경 큐브에 포함된 각 큐보이드들을 변경 큐보이드(delta cuboid)라 부른다. 본 논문에서는 $2^n$개의 변경 큐보이드 대신 $_nC_{{\lceil}n/2{\rceil}}$개의 변경 큐보이드만을 사용하여 데이타 큐브를 갱신하는 방법을 제안한다. 이에 따라 제안하는 방법은 변경 큐브를 계산하는 비용을 크게 줄일 수 있다. 성능 평가 결과는 제안하는 방법이 기존의 방법에 비해 더 좋은 성능을 가지고 있음을 보여준다.

시간 데이타마이닝 프레임워크 (Temporal Data Mining Framework)

  • 이준욱;이용준;류근호
    • 정보처리학회논문지D
    • /
    • 제9D권3호
    • /
    • pp.365-380
    • /
    • 2002
  • 시간 데이타마이닝은 기존 데이타마이닝에 시간 개념을 추가하여 "시간값을 가진 대용량 데이타로부터 이전에 잘 알려지지는 않았지만, 묵시적이고 잠재적으로 유용한 시간 지식을 탐사하는 기술"로 정의된다. 시간 지식이란 주기적 패턴, 캘린더 패턴, 경향 등과 같이 시간 의미와 시간 관계를 가진 지식을 말한다. 실세계에서는 환자의 병력, 상품 구매 이력, 웹 로그 등과 같은 다양한 시간 데이타가 존재하며 이로부터 여러 형태의 유용한 시간 지식을 찾아낼 수 있다. 데이타마이닝에 대한 연구가 진행되면서 순차 패턴, 유사 시계열 탐사, 주기적 연관규칙 탐사 등과 같이 시간 지식을 탐사하고자 하는 시간 데이타마이닝에 대한 부분적인 연구가 수행되었다. 그러나 기존 연구는 단순히 데이타의 발생 순서 및 유사한 패턴을 찾아내는데 중점을 두고 있어 데이타가 포함하고 있는 시간 의미와 시간 관계를 탐사하는데 부족하며, 시간 지식의 전체적인 측면보다는 연관 규칙과 같은 일부분만을 다루고 있다는 문제점을 가지고 있다. 따라서 이 논문에서는 시간 데이타마이닝에 대한 체계적인 연구를 위하여 시간 데이타마이닝에 대한 기존 연구 내용과 해결해야 할 문제점을 분석하고 이를 바탕으로 전체적인 프레임워크를 제시하였다. 또한 그 구현 방안 및 적용평가를 수행하였다. 프레임워크에서는 시간 데이타마이닝 모델을 제안하고, 이를 바탕으로 시간 데이타마이닝 질의어와 시간 지식을 탐사할 수 있는 시간 데이타마이닝 시스템을 설계하였다.

혼합형 이미지 메타데이타를 이용한 지능적 이미지 검색 시스템 설계 및 구현 (A Design and Implementation of Intelligent Image Retrieval System using Hybrid Image Metadata)

  • 홍성용;나연묵
    • 한국멀티미디어학회논문지
    • /
    • 제3권3호
    • /
    • pp.209-223
    • /
    • 2000
  • 멀티미디어 데이타의 중요성과 활용도가 증가됨에 따라 데이타베이스에서 멀티미디어 데이타를 표현하고 관리하기 위한 연구가 필요하게 되었다. 따라서, 본 논문은 혼합형 이미지 메타데이타를 이용하여 이미지 데이타베이스에서 이미지 데이타에 대한 검색 기법을 지능화하고 시스템을 효율적으로 관리할 수 있는 시스템을 제시한다. 개념 계층을 기반으로 이미지 정보를 지능적인 형태로 저장, 검색하고, 이미지 마이닝을 하기위해 사용자의 정보와 사용자가 이용한 질의 정보 그리고 이 미지정보를 통합하여 검색한다. 즉, 사용자 메타데이타와 이미지 메타데이타를 추출하고 통합하여 사용자에게 좀더 많은 부가 정보를 제공할 수 있는 지능적 이미지검색 시스템을 제공한다.

  • PDF

구간 데이타에 대한 히스토그램 구축 알고리즘의 확장 (Extensions of Histogram Construction Algorithms for Interval Data)

  • 이호석;심규석;이병기
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권4호
    • /
    • pp.369-377
    • /
    • 2007
  • 히스토그램은 원본 데이타를 효과적으로 요약하는 기법중의 하나이며, 선택도 측정과 근사 질의 처리 등에 널리 사용되고 있다. 기존의 히스토그램 구축 알고리즘들은 하나의 값으로 표현되는 점 데이타에 대하여 적용 가능한 알고리즘이었다. 그러나 일상생활에서는 하루 동안의 온도, 주식 가격과 같은 구간 데이타들도 점 데이터만큼 흔하게 접할 수 있다. 본 논문에서는 점 데이타에 대한 히스토그램 구축 알고리즘을 구간 데이타에 대하여 확장한다. 합성 데이타를 사용한 실험을 통하여 기존의 점 데이타에 대한 히스토그램을 초보적으로 확장하는 방법보다 본 논문에서 제시된 알고리즘의 성능이 좋다는 것을 보였다.

데이타베이스 튜닝을 위한 로그 분석 도구 (A Log Analyzer for Database Tuning)

  • 이상협;김성진;이상호
    • 정보처리학회논문지D
    • /
    • 제11D권5호
    • /
    • pp.1041-1048
    • /
    • 2004
  • 데이타베이스 시스템의 로그는 데이타베이스에서 수행된 연산에 관한 다양한 정보를 기록하고 있으나, 주로 장애시의 시스템 복구용으로 사용되고 있다. 본 논문은 데이타베이스 튜닝에 도움이 되는 내용을 제공하는 로그 분석 도구를 제안한다. 본 도구는 사용자에게 로그 분석을 통해 데이타베이스에 수행되는 워크로드 구성, 데이타베이스 스키마 특징, 질의의 자원 사용 상태를 제공한다. 본 논문에서는 개발된 로그 분석 도구의 구조, 특징적 기능, 구현, 검증절차 등을 기술한다. 본 로그 분석 도구의 검증은 TPC-W 벤치마크를 이용하여 수행하였으며 주요 분석 결과를 보인다.

속성분할이 없는 향상된 협력학습 방법 (An Improved Co-training Method without Feature Split)

  • 이창환;이소민
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권10호
    • /
    • pp.1259-1265
    • /
    • 2004
  • 분류학습에서 높은 정확도를 유지하기 위해서는 충분한 분류 데이타가 필요하게 되는데 분류 데이타는 미 분류 데이타보다 생성하기가 어려운 경우가 많다. 따라서 미 분류 데이타를 활용하여 분류의 정확도를 향상시키는 것은 큰 효용성을 가지며 이러한 미 분류 데이타를 활용하는 대표적인 학습방법 중의 하나는 협력학습(co-training) 알고리즘이다. 이는 데이타를 두 개의 독립적인 속성그룹으로 나누어 두개의 분류자로 학습한 후 미 분류 데이타를 분류하고 그중 가장 신뢰성이 높은 데이타를 분류 데이터에 포함하고 이를 반복하는 학습모델이다. 하지만 이 방법은 전체 데이타의 속성을 독립적인 두개의 집합으로 분할하여야하는 제약이 있다. 따라서 본 연구에서는 이와 같은 문제점을 개선하여 보통의 데이터베이스에 적용시킬 수 있는 새로운 협력학습방법을 제시 하고자한다. 즉. 두 개의 독립적인 속성 그룹으로 나누는 가정을 따르지 않고 전체 속성을 사용할 수 있으며 두 개 이상의 분류자를 사용하는 새로운 협력학습방법을 제안하였다.

풀 기반 데이타 방송 시스템에서의 데이타 인기도를 고려한 캐싱 전략 (A Caching Strategy Considering Data Popularity in Pull-Based Data Broadcast Systems)

  • 신동천
    • 한국정보과학회논문지:정보통신
    • /
    • 제33권4호
    • /
    • pp.324-332
    • /
    • 2006
  • 캐싱은 데이타 방송 시스템에서 방송 요청의 경쟁을 줄임으로써 좁은 대역폭으로 인한 시스템 성능의 저하를 완화할 수 있는 유용한 방법이다. 본 논문에서는, 풀 기반 방송 시스템에서 클라이언트들간의 데이타 인기도를 반영하는 캐싱 전략을 제안한다. 아울러, 데이타 방송 버전을 이용하여 데이타 접근의 최근성을 반영할 수 있도록 하고 제안한 전략의 성능을 시뮬레이션을 통하여 평가한다. 성능 평가에 따르면, 히트율과 미스 비용을 함께 고려한 전략이 전통적 전략인 LRU 보다 성능 우위를 보이고 있다. 클라이언트들의 데이타 인기도를 고려한 전략은 일부 경우에 있어 성능 우위를 보여 주고 있다.

MLR 트리 : 다중 레벨 지리정보 데이터의 윈도우 질의를 위한 공간 인덱싱 기법 (MLR-tree : Spatial Indexing Method for Window Query of Multi-Level Geographic Data)

  • 권준희;윤용익
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권5호
    • /
    • pp.521-531
    • /
    • 2003
  • 다중 레벨 지리정보 데이타는 화면 확대와 축소와 같은 윈도우 질의를 통해 다루어질 수 있다. 다중 레벨 지리정보 데이타를 효율적으로 다루기 위해서는 이러한 윈도우 질의를 지원하는 공간 인덱싱 기법이 필요하다. 그러나, 기존의 전통적인 공간 인덱싱 기법은 다중 레벨 지리정보 데이타를 액세스하는데 비효율적이다. 이를 위해 다중 레벨 지리정보 데이타를 위한 몇 가지 공간 인덱싱 기법이 알려진다. 그러나. 이 공간 인덱싱 기법은 모든 유형의 다중 레벨 지리정보 데이타를 지원하지 못한다는 문제점을 가진다. 본 논문에서는 다중 레벨 지리정보 데이타의 윈도우 질의를 위한 공간 인덱싱 기법, MLR 트리를 제안한다. MLR 트리는 우수한 검색 성능을 보이면서도 데이타 중복성이 발생하지 않으며, 이를 실험을 통해 보인다. 이 외에도 MLR 트리는 모든 유형의 다중 레벨 지리정보 데이타를 지원한다.

멀티미디어 데이타 처리기의 효율적인 데이타 전달 방법 (On the Efficient Data Transfer Method of Multimedia Data Processor)

  • 정하재
    • 한국정보처리학회논문지
    • /
    • 제4권8호
    • /
    • pp.1921-1929
    • /
    • 1997
  • 본 논문은 멀티미디어 데이타 스트림이 시스템 메모리를 거치지 않고 멀티미디어 데이타 처리기와 통신망 접속기 간에 직접 전달될 수 있는 방법에 대한 연구이다. 멀티미디어 플랫폼에서 통신망 접속기와 멀티미디어 데이타 처리기 간에 추가적인 데이타 전송로 도입이 없이 기존의 단일 데이타 전송로를 통한 양자간의 직접 데이타 전달방법을 제안한다. 그리고 직접전달을 위해 필요한 하드웨어적 구조와 기능을 정의하고, 멀티미디어 데이타가 상호간 전송/반입되는 과정을 제어 흐름도로 기술한다. 제안된 방법과 기존의 일반적인 방법과의 비교 검토를 위해, 직접전달 방법이 시스템 버스의 사용 회수와 사이클을 줄일 수 있음을 보인다.

  • PDF