통합 검색 | Korea Science

데이터 스트림 정보 요약 기법 (A Summarization Method for Data Streams)

한상길;이원석
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2006년도 추계학술발표대회
- /
- pp.657-660
- /
- 2006
최근까지 데이터웨어하우스와 OLAP 에 관한 연구와 더불어 데이터 큐브(data cube)는 많은 다차원 데이터웨어하우스에서 데이터 분석과 의사 결정 지원을 위해 빠르게 OLAP 연산을 처리하기 위한 중요한 역할을 수행해 왔다. 최근에는 빠른 속도로 생성됨과 동시에 지속적으로 발생되는 연속적인 데이터로 구성된 데이터 스트림이 네트워크 트래픽 모니터링, 증권, 날씨, 콜 센터 등과 같은 많은 분야에서 생성된다. 데이터 스트림은 무한의 집합이기 때문에 기존의 데이터 큐브 방법은 처리시간과 저장공간의 문제 때문에 데이터 스트림에 적용하기 어렵다. 이에 본 논문에서는 기존의 데이터 큐브와 같은 데이터의 요약 정보를 데이터 스트림 환경에서 제한된 메모리를 이용하여 관리 할 수 있는 전원트리를 이용한 데이터 스트림 요약 기법을 제안하고, 실험을 통해 본 논문에서 제안한 방법이 데이터 스트림 환경에서 적응적으로 동작함을 증명한다.
PDF

공간 데이터웨어하우스에서 통합된 다차원 개념 계층 지원을 위한 데이터 큐브 색인 (Data Cude Index to Support Integrated Multi-dimensional Concept Hierarchies in Spatial Data Warehouse)

이동욱;백성하;김경배;배해영
- 한국멀티미디어학회논문지
- /
- 제12권10호
- /
- pp.1386-1396
- /
- 2009
공간 데이터 웨어하우스에서 의사 결정 지원을 위한 공간 데이터 큐브는 크기가 방대하기 때문에 이를 효율적으로 관리하고 질의 처리의 수행 속도를 높이기 위한 공간 데이터 큐브 색인 기법이 요구된다. 제안된 데이터 큐브 색인 기법들 중 Hierarchical Dwarf는 사실 테이블의 튜플 필드 값의 중복을 이용하여 큐브를 압축하여 저장 비용과 질의응답 속도 면에서는 우수하지만 공간 차원을 지원하지 않으며, OLAP-favored Search 기법은 R-tree기반으로 공간 차원에 대한 계층적 집계 값을 제공하고 공간 OLAP 연산을 지원하지만 공간 및 비공간 차원들을 통합한 의사결정을 지원하지 못한다. 본 논문에서는 통합된 다차원 개념 계층지원을 위한 데이터 큐브 색인을 제안한다. 이는 개념 계층에 대한 정보와 사실 테이블에 지장된 튜플들을 참조하여 각각의 차원에 대해 생성된 개념 계층 트리들이 연결되어 통합된 색인이다. 이 때, 중복되는 개념계층 트리가 존재할 경우 이를 공유함으로써 저장 비용을 줄인다. 특히 제안 기법은 공간 및 비공간 차원이 통합된 개념 계층 트리들을 사용하므로, 공간 및 비공간 차원에 대한 OLAP 연산 비용이 감소한다.
PDF

지자체 산림정보 표준화 서비스를 위한 공간 데이터웨어하우스 구축 (Constructing Spatial Data Warehouse for Forest Information Standardization Service of Municipal Governments)

조윤원
- 한국지리정보학회지
- /
- 제12권2호
- /
- pp.11-22
- /
- 2009
최근 공간정보기술의 발달과 산림지리정보의 확산으로 기 구축된 산림행정 자료의 갱신과 수정에 대한 요구는 급격히 증가하고 있으나 여전히 많은 자료가 종이 형태의 수기 대장으로 관리되고 있는 실정이다. 더욱이 FGIS 등의 다양한 응용시스템이 현재 개발되고는 있으나 실제 산림행정 담당자들은 DB자료의 구축과 갱신에 있어 많은 부분을 수작업에 의존하고 있다. 본 연구에서는 현업에서 작성 및 관리되고 있는 산림주제도 자료를 GIS기반의 공간 데이터베이스 구축절차에 의해 구축함으로써 표준화 및 일관성 있는 데이터 생산과 관리가 가능하도록 하였다. 또한 시, 군에서 담당하고 있는 산림 업무프로세스를 인터넷 환경에서 시스템화하여 서비스 할 수 있는 웹기반 산림정보 데이터웨어하우스를 구축하였다. 이를 통하여 국내에서는 처음으로 실제 지자체에서 활용되고 있는 다양한 산림정보 표준 서비스 방안을 제시하여 일원화된 산림행정 의사결정 지원과 전사적인 관점에서 산림정보 구축 통합 프로토타입을 제시할 수 있을 것으로 기대된다.
PDF

다차원 개념 계층을 지원하는 공간 데이터 큐브의 점진적 일괄 갱신 기법 (Incremental Batch Update of Spatial Data Cube with Multi-dimensional Concept Hierarchies)

옥근형;이동욱;유병섭;이재동;배해영
- 한국멀티미디어학회논문지
- /
- 제9권11호
- /
- pp.1395-1409
- /
- 2006
공간 데이터 웨어하우스에서는 OLAP(On-Line Analytical Processing) 연산을 제공하기 위해 다차원 데이터를 공간 데이터 큐브의 형태로 관리한다. 개념 계층을 지원하는 공간 데이터 큐브의 크기는 삽입되는 데이터에 비해 방대하기 때문에 구축된 큐브의 구조를 최대한 유지하면서 새로 삽입되는 데이터를 반영시킬 수 있는 점진적 갱신 기법이 연구되어 왔다. 하지만 접두 및 접미의 중복을 제거하여 데이터를 압축 저장하는 큐브에서는 병합된 경로 간의 충돌로 인해 큐브 갱신 시 갱신 내용과 상관없는 셀까지 동시에 갱신되어 갱신이상 현상이 발생한다. 본 논문에서는 공간 데이터 큐브의 점진적 일괄 갱신 기법을 제안한다. 제안 기법은 갱신에 필요한 노드 복사본을 관리하는 자료 구조 및 재귀 탐색을 이용하여, 경로 간의 충돌이 발생할 경우 해당 노드의 복사본을 생성한 후 이를 갱신함으로써 갱신이상 현상을 방지한다. 이를 통해 다차원 개념 계층이 포함된 공간 데이터 큐브를 효율적으로 갱신할 수 있다. 성능 평가를 통해 기존 갱신 기법에 비해 제안 기법의 갱신 속도가 향상되었음을 보인다.
PDF

공간 데이터 웨어하우스에서 공간 데이터의 개념계층기반 사전집계 색인 기법 (Pre-aggregation Index Method Based on the Spatial Hierarchy in the Spatial Data Warehouse)

전병윤;이동욱;유병섭;김경배;배해영
- 한국멀티미디어학회논문지
- /
- 제9권11호
- /
- pp.1421-1434
- /
- 2006
공간 데이터 웨어하우스는 SOLAP(Spatial On-Line Analytical Processing)을 이용하여 의사 결정에 필요한 분석 정보를 제공한다. SOLAP은 대용량 데이터를 분석하기 때문에 사전집계를 이용하여 분석비용을 줄이기 위한 많은 연구가 진행되었다. 기존 기법들은 고정크기노드를 갖는 색인을 이용하여 개념계층을 지원하였다. 따라서 산개분포 영역에는 빈 공간이 많이 발생하며, 밀집분포 영역에는 개념계층을 지원할 수 없다. 본 논문은 공간 데이터의 개념계층기반으로 사전집계 색인의 동적 구성 기법을 제안한다. 제안 기법은 트리구조를 이용하여 개념계층의 레벨을 트리의 레벨과 같도록 지원한다. 하나의 노드는 데이터가 적을 경우 엔트리를 분할하여 서로 다른 부모 엔트리를 가질 수 있으며, 데이터가 많을 경우 노드의 연결리스트를 이용하여 같은 레벨에 순차적으로 저장한다. 따라서 데이터가 산개된 분포의 노드에 대해서 저장 공간의 낭비를 최소화하며, 데이터가 밀집한 영역의 노드에 대해서도 노드의 연결리스트로 노드가 분할되지 않으므로 개념계층을 지원할 수 있다. 성능평가를 통하여 색인 구축 시간이 다른 기법과 비슷하고, 색인의 저장 공간이 감소하며, 집계정보의 검색 성능이 다른 기법에 비해 우수한 것을 보인다.
PDF

데이터웨어하우스에서 단순화된 격자를 이용한 데이터큐크의 실체뷰 선택 (Materialized View Selection for Datacube using Simplified Lattice in Datawarehouse)

장지숙;서은주;이전영
- 한국정보과학회논문지:소프트웨어및응용
- /
- 제26권5호
- /
- pp.604-612
- /
- 1999
데이터웨어하우스는 데이터분석을 위한 특수 목적의 데이터베이스로, 주로 데이터분석을 위한 질의(이하 OLAP 질의)가 던져진다. 그런데 OLAP질의는 수백만개의 레코드를 가지 테이블에 대해 하나 이상의 aggregation 함수와 group-by 연산자가 포함되므로, 질의 처리 시간은 수 분에서 수 시간이 걸린다. 이를 개선하기위하여 데이터 큐브를 구현함에 있어서의 문제는 디스크 공간이 한정되어 있기 때문에 평균 질의 처리 시간이 훨씬 짧아진다하더라도 모든 셀들을 실체화할수 없다. 따라서 한정된 디스크 공간을 최대한 활용하면서 가능한 빠른 평균 질의 처리 시간을 얻을 수 있도록 데이터 큐브의 일부만을 실체화 시켜야한다. 본 논문의 주제와 관련된 연구로는 Harinarayan[4] 이 제안한 greedy 알고리즘이 있다. 이 알고리즘은 1) 데이터 큐브를 격자구조로 표현한후, 2) 격자의 위에서부터 아래로 차례로 뷰들을 방문하면서 방문한 뷰가 실체화되 경우 데이터 큐브에 주는 이익을 계산한다. 3) 그 중 가장 이익이 큰 것을 선택한다. 3) 그중 가장 이익이 큰 것을 선택한다. 2)와 3)의 과정은 k개의 뷰를 선택할 경우, k번 반복된다. 이 알고리즘의 운영 시간은 데이터 큐브를 구성하는 뷰의 개수가 n개이고 그 중에서 k개를 실체화할 경우에 O(kn2)이다. 본 논문에서는 운영 시간을 향상시킨 수정된 greedy 알고리즘을 제안한다. 알고리즘 내부에서 실체화할 뷰를 선택할 때 격자를 단순화시킨 트리를 사용함으로써, 알고리즘 운영시간을 O(kn2)에서 O(kn)으로 향상시켰다.

데이터베이스 클러스터 기반의 데이터 웨어하우스에서 실체화 뷰 저장 기법 (The Materialized View Storage Method in a Data Warehouse using Database Cluster)

최준호;장용일;박순영;배해영
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
- /
- pp.106-108
- /
- 2004
데이터 웨어하우스는 OLAP의 질의 처리 성능을 놓이고 사용자에게 빠른 응답을 제공하기 위긴 데이터 큐브의 결과를 실체화된 뷰로 저장한다. 최적의 사용자 응답 시간을 제공하기 위해서는 데이터 큐브의 전체를 저장하는 것이 졸지만 실체화 뷰는 일반적으로 물리적 저장소에 저장되기 때문에 데이터 큐브 전체를 저장하는 것은 저장 공간의 오버헤드를 초래하는 문제점을 가진다. 본 논문에서는 데이터베이스 클러스터에 대용량의 실제화 부를 저장하는 기법을 제안한다. 제안하는 기법은 실체화 뷰의 선택 기준으로 부의 실체화 이익과 뷰들 간의 의존성을 데이터베이스 클러스터 환경에 맞게 제시하고 선택 기준에 따라 실체화 뷰를 서로 다른 노드에 저장함으로서 각 노드들의 실체화 이익을 균등하게 유지한다. 이는 질의가 하나의 노드에 집중되는 현상을 방지함으로서 각 노드의 효율성을 최대로 높일 수 있는 기법이다.
PDF

데이타 웨어하우스 환경에서 최적 실체뷰 구성을 위한 효율적인 탐색공간 생성 기법 (An Efficient Search Space Generation Technique for Optimal Materialized Views Selection in Data Warehouse Environment)

이태희;장재영;이상구
- 한국정보과학회논문지:데이타베이스
- /
- 제31권6호
- /
- pp.585-595
- /
- 2004
데이타 웨어하우스에서의 분석 질의는 대체로 복잡한 연산을 포함하고 있기 때문에 질의 처리 과정이 매우 중요하다. 성능 향상을 위해서 데이타 웨어하우스에서 보편적으로 쓰이고 있는 방법은 실체뷰를 구축하는 것이다. 어떤 실체뷰를 구축하느냐 하는 문제는 데이타 웨어하우스 전체의 질의처리 성능과 유지보수 비용에 중요한 영향을 미친다. 실체뷰 구성 문제란 이러한 질의처리 비용과 유지보수비용을 고려하여 최적의 실체뷰를 선택하는 것이다. 본 논문에서는 이러한 최적의 실체뷰를 구성하는 효율적인 해결방안을 제시한다. 최적 실체뷰의 구성문제는 일반적으로 NP-hard 문제이지만, 본 논문에서는 관계형 데이터 베이스에서 사용되는 조인, 선택, 그룹, 집계 연산의 특성을 고려하여 문제해결을 위한 탐색 공간을 획기적으로 줄이는 방법을 제안한다.
PDF KSCI

데이터 웨어하우스에서 클러스터링 기법을 이용한 실체화 뷰 선택 알고리즘 (Materialized View Selection Algorithm using Clustering Technique in Data Warehouse)

양진혁;정인정
- 한국정보처리학회논문지
- /
- 제7권8호
- /
- pp.2273-2286
- /
- 2000
데이터 웨어하우스에서 실체화 할 뷰들을 알맞게 선택하는 것은 분석적인 질의에 대한 정확하고 신속한 응답을 얻기 위해서 대단히 중요한 문제이다. 기존의 뷰 선택 알고리즘들에서는 릴레이션 전체가 실체화 뷰들로서 고려되었다. 그러나, 릴레이션의 부분 대신 전체를 실체화한다는 것은 시간과 공간 비용측면에서 좋지 못한 성능을 초래한다. 따라서, 우리는 기존 뷰 선택 알고리즘들에서의 문제점을 극복하기 위해서 개선된 실체화 뷰 선택 알고리즘을 제안한다. 제안된 알고리즘 ASVMRT(Algorithm for Selection on Views to Materialize using Reduced Table)에서는 먼저 속성-값들의 농도에 기반을 둔 자동 클러스터링을 사용하여 축약 테이블들을 데이터 웨어하우스에서 생성한 다음, 원래의 베이스 릴레이션들의 조합 대신에 축약 테이블들의 조합을 실체화 뷰들로 고려한다. 제안한 알고리즘의 타당성 검증을 위하여 우리는 실험결과에서 시간 및 공간 모두에서 기존 알고리즘들보다 약 1.8배의 성능향상이 있음을 보인다.
PDF

고성능 뷰 관리르 지원하는 새로운 데이터 웨어하우징 시스템 구조 (A New Data Warehousing System Architecture Supporting High Performance View Maintenance)

김점수;이도헌;이동익
- 한국정보과학회논문지:소프트웨어및응용
- /
- 제26권10호
- /
- pp.1156-1166
- /
- 1999
의사결정 시스템은 전사적인 의사결정과 전략적 정보수집을 위해 거대한 량의 정보를 빠른 시간내에 제공할 것을 요구한다. 데이타 웨어하우스는 이러한 정보를 신속히 제공하기 위해 여러 지역 데이타베이스로부터 필요한 정보를 사전에 추출하고 가공 및 통합하여 별도의 저장공간에 저장한다. 일반적으로, 웨어하우스 내의 정보는 지역 데이타베이스에 저장된 정보에 대한 실체화된 뷰로서 간주하며 지역 데이타의 변경에 따라 일관성을 유지하도록 반영해야 한다. 본 논문에서는 일관성을 유지하기 위해 정보 공유가 가능한 데이타 웨어하우스 시스템의 구조와 비-보상 실체 뷰 관리 기법을 제안한다. 본 논문에서 제안한 데이타 웨어하우스 시스템의 구조는 지역 데이타베이스에서 추출된 정보를 관리하는 별도의 지역 정보 관리자를 두어 뷰 관리자들 간의 정보 공유가 가능하게 한다. 비-보상 실체 뷰 관리 기법은 지역 데이타 변경 사건에 따른 뷰 관리 시 다른 사건에 의해 영향을 받지 않도록 하기 때문에 기본의 사전 보상이나 나중 보상 기법과는 달리 추가적인 질의 처리를 요구하지 않는 기법이다.Abstract A decision support system(DSS) commonly requires fast access to tremendous volume of information. A data warehouse is a database storing the information that is extracted, filtered and integrated from several relevant local databases to reply upon aggregated queries. The information stored in the data warehouse can be regarded as materialized views. The materialized view has to be modified according to the change of the corresponding local databases to preserve the data consistency. In this paper, we propose a data warehousing system architecture allowing information sharing (DAWINS), and a non-compensating materialized view maintenance algorithm(NCA). DAWINS architecture allows relevant information to be shared by individual view managers with local data manager for each local database. Unlikely to the pre- or post-compensating algorithms, which are required to remove the effects of some events to other view in the process of view maintenance, NCA does not require any additional query processing, since a local data manager in DAWINS already maintains the effects of update events occurring in local systems.

검색결과 46건 처리시간 0.023초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)