통합 검색 | Korea Science

데이터 웨어하우스에서 해쉬 테이블을 이용한 효율적인 데이터 큐브 생성 기법 (Efficient Creation of Data Cube Using Hash Table in Data Warehouse)

김형선;유병섭;이재동;배해영
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
- /
- pp.211-213
- /
- 2005
데이터 웨어하우스는 축적된 대량의 데이터를 분석하여 의사결정을 지원하는 시스템이다. 의사결정을 위한 대량의 데이터 분석은 많은 비용을 요구하므로, 질의 처리 성능을 높이고 의사 결정자에게 빠른 응답을 제공하는 효율적인 데이터 큐브 생성 기법이 연구되었다. 기존 기법으로는 Multiway Array 기법과 H-Cubing 기법이 있다. Multiway Array 기법은 다차원 집계 연산에 필요한 모든 데이터를 배열로 저장하는 것으로 데이터의 양이 많아질수록 메모리 사용이 증가한다. H-Cubing 기법은 Hyper-Tree를 기반으로 튜플을 트리로 구축하므로 모든 튜플을 트리로 구축해야 하는 비용이 증가한다. 본 논문에서는 데이터 웨어하우스에서 해쉬 테이블을 이용한 효율적인 데이터 큐브 생성 기법을 제안한다. 제안 기법은 데이터 큐브 생성 시 필드 해쉬 테이블과 레코드 해쉬 테이블을 사용한다. 필드 해쉬 테이블은 저장될 레코드 순서 계산을 위하여 각 필드에 대해 레벨 값을 해쉬 테이블로 관리한다. 레코드 해쉬 테이블은 데이터 큐브 테이블에 저장될 레코드의 순서와 데이터 큐브 테이블에 저장하기 위한 임시 레코드의 위치를 관리한다. 필드 해쉬 테이블을 이용하여 다차원 데이터의 저장될 레코드 순서를 빠르게 찾아 저장함으로서 데이터 큐브의 생성속도가 향상된다. 또한 해쉬 테이블 만을 유지하면 되므로 메모리 사용량이 감소한다. 따라서 해쉬 테이블의 사용으로 데이터의 빠른 검색과 데이터 큐브 생성 요청에 빠른 응답이 가능하다.
PDF

공간 데이터 웨어하우스 구축기에서 사실테이블 사전 계산 기법 (Pre-Computation of Fact table in a Spatial Data Warehouse Builder.)

최유신;유병섭;박순영;배해영
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2004년도 추계학술발표논문집(상)
- /
- pp.165-170
- /
- 2004
공간 데이터 웨어하우스에서 구축기는 의사절정을 위한 기반 데이터의 구축을 담당한다. 일반적으로 공간 데이터 웨어하우스의 데이터 적재는 잦은 갱신으로 인한 서버의 부하를 줄이기 위하여 구축기에 적재할 데이터를 임시 저장하고 일정주기마다 적재하는 방법을 이용한다. 이때 구축기의 정보는 차원테이블에 대한 갱신정보와 사실 테이블의 일부 갱신정보만을 유지하므로 여러 차원 테이블로 구성된 사실 테이블의 갱신은 공간 데이터 웨어하우스 서버에서 수행해야 한다. 사실 테이블의 갱신연산은 연관된 차원 테이블들에 의해 처리되므로 높은 처리 비용이 필요하다. 따라서 사실테이블의 처리로 인해 적재시간이 증가하며, 이는 사용자의 의사결정 응답시간을 증가시킨다. 본 논문에서는 공간 데이터 웨어하우스의 구축기에서 사실테이블의 사전 계산 기법을 제안한다. 이 기법은 차원 테이블 및 사실 테이블에 대한 메타정보와 추가적으로 기록되어야할 데이터 정보를 구축기에 유지한다. 구축기는 이 정보를 이용하여 삽입 연산시 사실 테이블에 적재할 갱신 정보를 사전에 계산하고, 이를 적재주기에 함께 적재한다. 따라서 사실 테이블의 신을 데이터 적재 이전에 구축기에서 계산하므로 공간 데이터 웨어하우스 서버에서 발생하는 높은 처리 비용을 감소시킬 수 있다. 공간 데이터 웨어하우스 사용자의 의사결정 응답시간을 감소시킨다.
PDF

데이터 웨어하우스에서 의사결정 트리를 이용한 실체화 뷰 선택 기법 (Materialized View Selection using Decision Tree in Data Warehouse)

장윤경;유병섭;어상훈;김경배;배해영
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2006년도 춘계학술발표대회
- /
- pp.63-66
- /
- 2006
실체화 뷰 선택은 질의 수행 시간과 제한된 저장 공간 등의 유지 비용을 고려하여 최적의 실체화 뷰 집합을 선택하고 유지하는 것이다. 본 논문에서는 의사결정 트리를 이용한 실체화 뷰 선택기법을 제안한다. 제안기법은 의사결정 트리를 이용하여 실체화 뷰로 생성될 질의를 판단하고 실체화 뷰 교체가 필요한 경우 메타데이터 테이블을 이용하여 교체 대상을 결정한다. 의사결정 트리는 높은 우선순위를 가진 속성으로부터 차례대로 데이터를 분류하기 때문에 이용도가 높은 실체화 뷰를 선택하는 방법을 제공하고 메타데이터 테이블은 실체화 뷰 집합의 빠른 교체 수행과 효율적인 유지보수를 제공한다. 성능평가를 통해 제안된 기법은 실체화 뷰 비율에 따른 질의처리 시간이 기존기법보다 약 13%의 성능 향상을 보였다.
PDF

시각화된 스키마 생성기를 이용한 데이터 웨어하우스의 실체 뷰 생성 (Generation of Materialized View for Data Warehouse Using Visualized Schema Generator)

정병화;이현창;김경창;지원철
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
- /
- pp.392-394
- /
- 1998
데이터 웨어하우스 시스템은 의사 결정의 지원에 필요한 요약, 분석 작업을 수행하여 다양한 고품질의 정보 서비스를 사용자에게 제공한다[1]. 이러한 데이터 웨어하우스에 사용자가 질의를 요청할 경우 다차원 모델을 고려해 보면 여러 테이블을 조인해야 할 경우가 발생하고 이때 방대한 양의 사실 테이블을 가지고 있는 데이터 웨어하우스는 질의 처리시 성능 저하를 초래 할 수 있다. 그러므로 본 연구에서는 사용자의 질의에서 자주 요구되는 집계사실을 미리 저장하여 데이터 웨어하우스에 대한 질의 처리 성능향상을 기대할 수 있도록 집계사실이 저장될 효율적인 집계 테이블 생성에 따른 설계와 구현을 한다. 이를 수행하기 위해 본 논문에는 집계 사실의 저장방법에 대해 살펴보고, 집계 계획에 근거한 집계테이블 생성 인터페이스의 프로토타입 설계 및 구현을 살펴본다. 이렇게 함으로서 사용자의 의사결정에 필요한 정보를 데이터 웨어하우스에서 더욱 신속하게 얻을 수 있다.

건설분야 텍스트 인식시스템의 매칭알고리즘 개발 (Development of Matching Algorism for System Recognizing Text in the Construction Field)

송종관;정숙
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2011년도 춘계학술발표대회
- /
- pp.1525-1527
- /
- 2011
현재 모든 분야에 IT산업이 융합되어 있지만 건설분야에서는 IT산업과의 융합이 많이 시도되고 있음에도 불구하고 타 산업에 비해 미비한 실정이다. 특히, 설계단계 공사비정보는 설계자의 의사결정을 지원하는 중요한 자료원임에도 불구하고 작성자에 따라 내역서에 쓰이는 작업항목 및 규격의 표현방식이 다르고 외래어 표음 및 오타, 그리고 부가정보 표기로 인해 단가축적의 시스템 및 DB화 가 이루어지지 않고 있다. 따라서 본 연구는 시공단계에서 발생된 실적단가를 설계단계에서 효과적으로 활용하기 위해 동일한 작업항목의 상이한 표현을 동일하게 인식할 수 있는 텍스트 인식시스템의 알고리즘을 제시한다. 텍스트 인식알고리즘에는 "유사어 및 단어테이블", "기준작업항목 테이블", "인식된 작업항목 테이블" 등으로 구성된 DB, 최소의미단위 단어를 비교 분절하기 위한 문자열 매칭 알고리즘, 그리고 동일하지 않은 텍스트를 인식하고 사용자의 의사결정을 지원하기 위한 유사도 계산으로 구성하였다.
https://doi.org/10.3745/PKIPS.y2011m04a.1525 인용 PDF

공간 데이터 웨어하우스에서 공간 분석을 위한 공간 집계연산 (Spatial Aggregations for Spatial Analysis in a Spatial Data Warehouse)

유병섭;김경배;이순조;배해영
- 한국공간정보시스템학회 논문지
- /
- 제9권3호
- /
- pp.1-16
- /
- 2007
공간 데이터 웨어하우스는 공간 의사결정을 지원하는 시스템으로 공간 데이터 큐브를 이용한다. 공간 데이터 큐브에는 분석의 기준이 되는 공간 차원테이블과 분석의 대상이 되는 공간 사실테이블들로 구성되는데 의사결정 지원을 위해서는 공간 차원테이블의 개념계층 지원과 공간 사실테이블의 요약정보 제공이 필요하다. 그러나 기존의 연구들은 공간 개념계층에 대해서만 연구하였을 뿐 공간 요약정보에 대한 연구가 미비하였다. 따라서 본 논문에서는 공간 데이터 웨어하우스에서 공간 공간 요약정보를 위한 공간 집계연산에 대하여 제안한다. 본 논문에서는 공간 집계연산을 숫자화 집계연산과 객체화 집계연산으로 나누어 제안한다. 숫자화 집계연산은 공간 분석의 결과로 숫자 형태의 데이터를 반환하며, 객체화 집계연산은 공간 객체 형태로 결과를 반환한다. 본 논문에서는 확장된 공간 데이터 자료구조를 제공하여 공간 집계연산의 효율성을 높인다.
PDF

일상 활동에서의 상황변수를 고려한 대중교통 정보서비스 이용 유형 연구 (A Contextual Study of Public Transport Information Service Use Behavior in Daily Activity)

조창현;이백진;빈미영
- 대한교통학회지
- /
- 제28권4호
- /
- pp.19-30
- /
- 2010
정보화의 진전에 따라 공공 서비스인 대중교통 정보서비스 제공의 올바른 방향 제시가 필요하게 되었다. 이에 본 연구는 상황에 따른 의사결정 특성이 강한 대중교통 정보서비스의 내용과 매체 이용 행태를 분석하였다. 이를 위해 본 연구는 주로 개인의 사회 인구학적 특성과 정보이용의 특정 행태 간 상관관계를 분석하는 전통적 접근 방법론을 보완하여, 상황에 따라 가변적인 의사결정 특성 분석이 가능한 접근 방법론을 채택하였다. 보다 구체적으로, 인지심리학적 의사결정 테이블(decision table)을 바탕으로 하는 분석도구인 CHAID의 귀납적 의사결정트리 추론(decision tree induction)을 이용하여 대중교통 이용자의 활동패턴과 정보이용 행태에 대해 분석하였다. 주요 연구결과로, 대중교통 정보서비스 이용은 사회 인구학적 변수 이외에도 정보 이용 당시의 상황 변수가 큰 영향을 미침을 확인하였다. 본 연구의 결과는 효율적 대중교통 정보서비스 제공을 위한 시장세분화(market segmentation)에 대한 중요한 시사점을 제공할 것으로 기대된다.
PDF KSCI

스키마간 연관성을 이용한 테이블 군집화 기법 (Table Clustering Using Inter-schema Association)

조순이;이도헌
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
- /
- pp.85-87
- /
- 2001
업무 데이터 분석을 통한 종합적인 의사결정을 지원할 수 있도록 데이터웨어하우스, OLAP, 데이터마이닝을 적용하려는 기업의 요구가 많아졌다. 그래서 기초 데이터의 이해, 선별, 수집, 가공, 정제가 매우 중요한 과정이나 테이블명 및 속성명이 표준화되어있지 않고 코드나 시스템 카탈로그와 같은 기본 데이터는 부정확하고 부족하다. 본 논문에서는 거의 스키마 정보에만 의존하여 테이블의 의미적 연관성에 근거한 유사한 특성을 가진 집단끼리 분류하는 대략적인 군집분석 방법을 제안한다. 질의 수행시 사용자가 설정한 임계 거리에 ㄸ라 관련된 군집만 검색함으로써 신속한 응답시간을 보장하고, 분석시점에서 다양한 질의에 유연하게 대처할 수 있다는 장점이 있다. 또한 실제 데이터에 본 연구를 적용하여 산출한 군집결과와 사람이 매뉴얼하게 그룹핑한 군집결과와 비교한다.
PDF

GIS 의사결정을 지원하기 위한 Spatial OLAP 구현 - 도시계획을 중심으로 - (Spatial OLAP Implementation for GIS Decision-Making - With emphasis on Urban Planning -)

경민주;염재홍
- 한국측량학회지
- /
- 제27권6호
- /
- pp.689-698
- /
- 2009
SOLAP은 OLAP과 GIS 기능을 수정, 보완한 것으로 사용자들이 빠르고 쉽게 데이터에 접근하고, 다차원 분석 및 계층 분석을 통해 다양한 목적에 맞는 의사결정을 지원 해 주는 시스템이다. 본 연구에서는 도시계획을 중심으로 GIS 의사결정을 지원하는 SOLAP을 구축하였다. 특히, 우리나라의 경우 급속한 도시화에 따른 도시 불균형 현상이 초래되었기 때문에 선 계획, 후 개발 방법을 통한 계획적인 도시 개발 및 국토이용 전반에 걸쳐 체계적인 정비가 필요하게 되었다. 이는 제한된 국토를 얼마나 효율적, 합리적으로 이용하여 잘 정비된 도시계획을 수립할 것인지 판단하는 중요한 요소로 이를 도시계획 의사결정에 실험 적용하기 위하여 통계청으로부터 도시계획사업, 개발제한구역 해지 및 지정, 용도지역현황 데이터를 제공받았다. 그후, 데이터를 활용하여 도시계획 수립에 관한 차원 테이블과 사실 테이블을 설계하였으며, SOLAP 구현에 필요한 DB를 구축하였다. 최종적으로 SOLAP 구성에 따라 다차원 분석을 수행하기 위한 차원과 Measure를 설정하고, 보다 체계적이고 과학적인 방법으로 도시계획을 중심으로 한 GIS 의사결정을 지원하기 위한SOLAP 시스템을 제시하였다.
PDF KSCI

공간 데이터 웨어하우스에서 해쉬 테이블을 이용한 데이터큐브의 생성 기법 (Data Cube Generation Method Using Hash Table in Spatial Data Warehouse)

이연;김형선;유병섭;이재동;배해영
- 한국멀티미디어학회논문지
- /
- 제9권11호
- /
- pp.1381-1394
- /
- 2006
축적된 데이터를 기반으로 의사결정을 지원하는 데이터 웨어하우스에서 빠른 응답을 제공하기 위하여 데이터큐브 생성기법에 대한 많은 연구가 진행되었다. 대표적으로 다차원 배열을 사용한 기법과 hyper-tree를 기반으로 하는 H-cubing 기법이 연구되었다. 하지만 전자는 다차원 집계 연산에 필요한 모든 데이터를 배열로 저장하여 데이터의 양이 많아질수록 메모리 사용이 증가하였으며 후자는 hyper-tree를 기반으로 모든 튜플을 트리로 구축하여 트리 구축비용이 증가하였다. 본 논문에서는 데이터 웨어하우스에서 해쉬 테이블을 이용한 효율적인 데이터큐브 생성 기법을 제안한다. 제안 기법은 데이터큐브 생성 시 가중치 맵핑 테이블과 레코드 해쉬 테이블을 사용하여 다차원 데이터의 저장될 레코드 순서를 빠르게 찾아 저장한다. 따라서 데이터큐브의 생성속도가 향상되며 해쉬 테이블 만을 유지하여 메모리 사용량이 감소한다. 이는 성능평가를 통해 기존 기법보다 데이터의 빠른 검색과 데이터큐브 생성 요청에 빠른 응답을 보였다.
PDF

검색결과 41건 처리시간 0.027초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)