• Title/Summary/Keyword: 데이터 집계

Search Result 215, Processing Time 0.024 seconds

Determining Optimal Aggregation Interval Size for Travel Time Estimation and Forecasting with Statistical Models (통행시간 산정 및 예측을 위한 최적 집계시간간격 결정에 관한 연구)

  • Park, Dong-Joo
    • Journal of Korean Society of Transportation
    • /
    • v.18 no.3
    • /
    • pp.55-76
    • /
    • 2000
  • We propose a general solution methodology for identifying the optimal aggregation interval sizes as a function of the traffic dynamics and frequency of observations for four cases : i) link travel time estimation, ii) corridor/route travel time estimation, iii) link travel time forecasting. and iv) corridor/route travel time forecasting. We first develop statistical models which define Mean Square Error (MSE) for four different cases and interpret the models from a traffic flow perspective. The emphasis is on i) the tradeoff between the Precision and bias, 2) the difference between estimation and forecasting, and 3) the implication of the correlation between links on the corridor/route travel time estimation and forecasting, We then demonstrate the Proposed models to the real-world travel time data from Houston, Texas which were collected as Part of the Automatic Vehicle Identification (AVI) system of the Houston Transtar system. The best aggregation interval sizes for the link travel time estimation and forecasting were different and the function of the traffic dynamics. For the best aggregation interval sizes for the corridor/route travel time estimation and forecasting, the covariance between links had an important effect.

  • PDF

An Energy-Efficient Multiple Path Data Routing Scheme Using Virtual Label in Sensor Network (센서 네트워크 환경에서 가상 식별자를 이용한 에너지 효율적인 다중 경로 데이터 라우팅 기법)

  • Park, Jun-Ho;Yeo, Myung-Ho;Seong, Dong-Ook;Kwon, Hyun-Ho;Lee, Hyun-Jung;Yoo, Jae-Soo
    • The Journal of the Korea Contents Association
    • /
    • v.11 no.7
    • /
    • pp.70-79
    • /
    • 2011
  • The multi-path routing schemes that assigns labels to sensor nodes for the reliability of data transmission and the accuracy of an aggregation query over the sensor networks where data transfer is prone to defect have been proposed. However, the existing schemes have high costs for reassigning labels to nodes when the network topology is changed. In this paper, we propose a novel routing method that avoids duplicated data and reduces the update cost of a sensor node. In order to show the superiority of the proposed scheme, we compare it with the existing scheme through the various experiments. Our experimental results show that our proposed method reduces about 95% the amount of the transmitted data for restoration to node failure and about 220% the amount of the transmitted data for query processing over the existing method on average.

Supporting temporal data using the layered architecture in a Data Warehouse (데이터 웨어하우스에서 계층화 구조를 이용한 시간 데이터의 지원)

  • 신영옥;백두권;류근호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10b
    • /
    • pp.389-391
    • /
    • 1998
  • 데이터 웨어하우스에서는 시간에 따라 변화되는 데이터를 관리함으로써 좀더 정확하게 요약화된 정보를 제공할 수 있다. 거의 모든 데이터 웨어하우스는 원시 데이터로 관계형 데이터베이스를 사용하지만, 관계형 데이터베이스는 시간 데이터에 대해 실제적인 지원을 하지 않는다. 그러므로 시간 변이 데이터에 대한 정확한 정보를 얻기가 어렵다. 본 논문에서는 이러한 시간 변이 데이터의 지원이 가능한 시간지원 데이터 웨어하우스를 설계하고자 한다. 이를 위해, 기존의 데이터 웨어하우스에서 원시 데이터로 사용하는 관계형 데이터베이스에 시간지원질의 처리 계층을 결합하는 방법을 보이고, 시간지원 데이터의 간격 시간에 대한 요약화 방법으로 시간지원 집계 트리 전략을 소개한다.

Design of an Inference Control Process in OLAP Data Cubes (OLAP 데이터 큐브에서의 추론통제 프로세스 설계)

  • Lee, Duck-Sung;Choi, In-Soo
    • Journal of the Korea Society of Computer and Information
    • /
    • v.14 no.5
    • /
    • pp.183-193
    • /
    • 2009
  • Both On-Line Analytical Processing (OLAF) data cubes and Statistical Databases (SDBs) deal with multidimensional data sets. and both are concerned with statistical summarizations over the dimensions of the data sets. However, there is a distinction between the two that can be made. While SDBs are usually derived from other base data, OLAF data cubes often represent directly the base data. In other word, the base data of SDBs are the macro-data, whereas the core cubiod data in OLAF data cubes are the micro-data. The base table in OLAF is used to populate the data cube with values of the measure attribute, and each record in the base tables is used to populate a cell of the core cuboid. The fact that OLAF data cubes mostly represent the micro-data may make some records be absent in the base table. Some cells of the core cuboid remain empty, if corresponding records are absent in the base table. Wang and others proposed a method for securing OLAF data cubes against privacy breaches. They assert that the proposed method does not depend on specific types of aggregation functions. In this paper, however, it is found that their assertion on aggregate functions is wrong whenever any cell of the core cuboid remains empty. The objective of this study is to design an inference control process in OLAF data cubes which rectifying Wang's error.

Collection of NC Machining Time using Scene Change Detection Algorithm (영상변화판별 알고리즘을 이용한 NC 가공시간 집계)

  • Ko, Key-Hoon;Kim, Bo-Hyun;Choi, Byoung-Kyu
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.05a
    • /
    • pp.793-796
    • /
    • 2005
  • 금형공장의 생산 일정관리에 있어서 실제 가공작업에 대한 실적데이터의 집계는 매우 중요하지만, 이러한 작업상황을 기록하는 것에 대해서 현장 작업자는 비협조적이고 반감을 갖고 있는 실정이다. 현장에서는 작업자의 개입없이 CNC 장비의 컨트롤러와의 직접적인 인터페이스를 통해서 신호를 추출하고 자동으로 작업상황을 파악할 수 있는 시스템을 구축하려고 시도하고 있지만, 컨트롤러 메이커마다 다르게 적용해야 하고 많은 비용을 요구한다. 이러한 이유로 본 연구에서는 저가의 PC 카메라를 장비에 설치하여 가공상황에 대한 동영상을 수집하고 영상처리 알고리즘을 적용하여 가공시간을 집계하는 방법을 제안한다. 제안된 방법은 CNC 컨트롤러에 독립적으로 운용되며 저렴하게 시스템을 구축할 수 있는 장점이 있다. 본 연구에서는 무인가공과 유인가공 상황에 시범적으로 적용 및 운영함으로써 시스템의 활용가능성을 살펴보았다.

  • PDF

A Design Method of Storage Structures for MOLAP Systems (MOLAP 시스템을 위한 다차원 저장구조의 설계기법)

  • Lee Jong-Hak;Lee Seong-Won
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.130-132
    • /
    • 2005
  • 다차원 온라인 분석처리 시스템(MOLAP)에서 집계 연산은 중요한 기본 연산이다. 기존의 MOLAP 집계 연산은 다차원 배열구조를 기반으로 한 파일구조에 대해서 연구되어 왔다. 다차원 배열구조는 편중된 분포를 갖는 데이터에서는 잘 동작하지 못한다는 단점이 있다. 본 논문에서는 편중된 분포에도 잘 동작하는 다차원 파일구조를 사용한 MOLAP 저장구조의 물리적 설계기법을 제안한다. 실험결과에 의하면 이차원 파일구조의 경우 집계 연산처리를 위한 저장구조의 성능이 일곱 배 이상까지 향상됨을 확인하였다. 삼차원 이상의 파일구조에 대해서는 더욱더 큰 성능향상이 예상된다. 이러한 성능의 향상은 제안된 MOLAP 저장구조의 물리적 설계기법이 매우 유용함을 나타내는 것이다.

  • PDF

A Physical Design Method of Storage Structures for MOLAP Systems of Data Warehouse (데이터 웨어하우스의 다차원 온라인 분석처리 시스템을 위한 저장구조의 물리적 설계기법)

  • Lee Jong-Hak
    • Journal of Korea Multimedia Society
    • /
    • v.8 no.3
    • /
    • pp.297-312
    • /
    • 2005
  • Aggregation is an operation that plays a key role in multidimensional OLAP (MOLAP) systems of data warehouse. Existing aggregation operations in MOLAP have been proposed for file structures such as multidimensional arrays. These tile structures do not work well with skewed distributions. This paper presents a physical design methodology for storage structures ni MOLAP that use the multidimensional tile organizations adapting to a skewed distribution. In uniform data distribution, we first show that the performance of multidimensional analytical processing is highly affected by the similarity of the shapes between query regions and page regions in the domain space of the multidimensional file organizations. And than, in skewed distributions, we reflect the effect of data distributions on the design by using the shapes of the normalized query regions that are weighted with data density of those query regions. Finally, we demonstrate that the physical design methodology theoretically derived is indeed correct in real environments. In the two-dimensional file organizations, the results of experiments indicate that the performance of the proposed method is enhanced by more than seven times over the conventional method. We expect that the performance will be more enhanced when the dimensionality is more than two. The result confirms that the proposed physical design methodology is useful in a practical way.

  • PDF

Market Research - 전국 커피자판기 설치 현황, 베일을 벗다

  • 한국자동판매기공업협회
    • Vending industry
    • /
    • v.10 no.2
    • /
    • pp.27-29
    • /
    • 2010
  • "전국에 설치되어 운영 중인 커피자판기가 몇 대가되나요?" 협회로 이런 문의를 하는 전화들이 가끔씩 걸려 온다. 이렇게 외부에서는 실질적으로 자판기 운영대수를 궁금해 하는 경우가 많다. 하지만 협회에서 내는 통계는 매년 생산량기준으로 집계가 되기 때문에 이런 궁금증을 흡족하게 풀어주지 못했다. 실제 운영 중인 커피자판기의 추정대수 정도만을 이야기 할 수 있었지, 객관적인 데이터를 제공하지 못해 왔다. 이 같은 현상은 전국에 산재해 있는 커피자판기들의 대수를 합산하여 통계를 내는 시스템을 구축하기가 힘들기 때문이다. 국내의 경우 전문 운영업자들의 수도 무척 많은 데다가, 거미줄처럼 연계된 개인 운영자까지 포함을 하면 통계 대상이 엄청 광범위해 진다. 따라서 이들을 대상으로 통계 데이터를 합산하는 일은 거의 불가능에 가깝다. 캔음료자판기의 경우는 그래도 대형 음료업체의 수량 데이터를 제공받으면 객관적인 집계가 가능한 점과는 차이가 있다. 이런 탓에 국내는 커피자판기 운영 통계에 대한 갈증이 컸다. 전국에 몇 대 커피자판기가 운영되는지 지역별 분포는 어떻게 되는지 알고자 하는 수요는 많았지만 정보공급자는 없었다. 이러한 현실에서 금호 '마켓 리서치'에서는 운영 통계에 대한 정보갈증을 해소시키는 데이터를 공개한다. 이번에 공개하는 자료는 전국에 영업 신고된 식품자판기의 전체 통계이다. 본지에서 이미 지난 2009년 여름호에 '서울시 영업신고된 식품자판기 운영 현황'을 분석한 기사를 게재하여 큰 반향을 일으킨바 있다. 하지만 이번에 공개되는 데이터는 전국을 대상으로 해 정보가치가 더 크다. 과연 전국에는 몇 대의 식품자판기가 설치되어 있고, 지역별 어떠한 분포와 특징을 나타내고 있는지를 살펴보기로 하자.

  • PDF

A Study on Temporal Data Models and Aggregate Functions (시간지원 데이터 모델 및 집계함수에 관한 연구)

  • Lee, In-Hong;Moon, Hong-Jin;Cho, Dong-Young;Lee, Wan-Kwon;Cho, Hyun-Joon
    • The Transactions of the Korea Information Processing Society
    • /
    • v.4 no.12
    • /
    • pp.2947-2959
    • /
    • 1997
  • Temporal data model is able to handle the time varying information, which is to add temporal attributes to conventional data model. The temporal data model is classified into three models depending upon supporting time dimension, that are the valid time model to support valid time, the transaction time model to support transaction model, and the bitemporal data model to support valid time and transaction time. Most temporal data models are designed to process the temporal data by extending the relational model. There are two types or temporal data model, which are the tuple timestamping and the attribute timestamping depending on time dimension. In this research, a concepts of temporal data model, the time dimension, types of thc data model, and a consideration for the data model design are discussed Also, temporal data models in terms of the time dimension are compared. And the aggregate function model of valid time model is proposed, and then logical analysis for its computing consts has been done.

  • PDF

An Approximate Query Answering Method using a Knowledge Representation Approach (지식 표현 방식을 이용한 근사 질의응답 기법)

  • Lee, Sun-Young;Lee, Jong-Yun
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.12 no.8
    • /
    • pp.3689-3696
    • /
    • 2011
  • In decision support system, knowledge workers require aggregation operations of the large data and are more interested in the trend analysis rather than in the punctual analysis. Therefore, it is necessary to provide fast approximate answers rather than exact answers, and to research approximate query answering techniques. In this paper, we propose a new approximation query answering method which is based on Fuzzy C-means clustering (FCM) method and Adaptive Neuro-Fuzzy Inference System (ANFIS). The proposed method using FCM-ANFIS can compute aggregate queries without accessing massive multidimensional data cube by producing the KR model of multidimensional data cube. In our experiments, we show that our method using the KR model outperforms the NMF method.