• 제목/요약/키워드: multidimensional data

검색결과 657건 처리시간 0.033초

Restricted maximum likelihood estimation of a censored random effects panel regression model

  • Lee, Minah;Lee, Seung-Chun
    • Communications for Statistical Applications and Methods
    • /
    • 제26권4호
    • /
    • pp.371-383
    • /
    • 2019
  • Panel data sets have been developed in various areas, and many recent studies have analyzed panel, or longitudinal data sets. Maximum likelihood (ML) may be the most common statistical method for analyzing panel data models; however, the inference based on the ML estimate will have an inflated Type I error because the ML method tends to give a downwardly biased estimate of variance components when the sample size is small. The under estimation could be severe when data is incomplete. This paper proposes the restricted maximum likelihood (REML) method for a random effects panel data model with a censored dependent variable. Note that the likelihood function of the model is complex in that it includes a multidimensional integral. Many authors proposed to use integral approximation methods for the computation of likelihood function; however, it is well known that integral approximation methods are inadequate for high dimensional integrals in practice. This paper introduces to use the moments of truncated multivariate normal random vector for the calculation of multidimensional integral. In addition, a proper asymptotic standard error of REML estimate is given.

데이터 웨어하우스의 다차원 온라인 분석처리 시스템을 위한 저장구조의 물리적 설계기법 (A Physical Design Method of Storage Structures for MOLAP Systems of Data Warehouse)

  • 이종학
    • 한국멀티미디어학회논문지
    • /
    • 제8권3호
    • /
    • pp.297-312
    • /
    • 2005
  • 데이터 웨어하우스의 다차원 온라인 분석처리 시스템(MOLAP)에서 집계 연산은 중요한 기본 연산이다. 기존의 MOLAP 집계 연산은 다차원 배열구조를 기반으로 한 파일구조에 대해서 연구되어 왔다. 다차원 배열구조는 편중된 분포를 갖는 데이터에서는 잘 동작하지 못한다는 단점이 있다. 본 논문에서는 편중된 분포에도 잘 동작하는 다차원 파일구조를 사용한 MOLAP 저장구조의 물리적 설계기법을 제안한다. 먼저, 균일분포를 갖는 데이터에 대해서 집계 연산처리 성능이 다차원 파일구조상의 질의 영역의 모양과 다차원 파일구조의 도메인 공간을 이루는 페이지 영역의 모양 사이의 유사성에 따라 크게 영향 받음을 보이고, 이러한 특성을 이용하여 다차원 파일구조를 설계함으로써 다차원 온라인 분석처리의 성능을 향상시킨다. 그리고 편중된 분포에 대해서는 질의 영역별로 가중치를 부여한 정규화된 질의 영역의 모양을 이용함으로써 데이터의 분포에 따른 영향을 설계에 반영한다. 또한 본 논문에서는 실험을 통하여 이론적으로 제안한 MOLAP 저장구조의 물리적 설계기법이 실제 환경에서 정확히 동작함을 보인다. 실험결과에 의하면 이차원 파일구조의 경우 집계 연산처리를 위한 저장구조의 성능이 일곱 배 이상으로 향상됨을 확인하였다. 삼차원 이상의 파일구조에 대해서는 더욱더 큰 성능향상이 예상된다. 이러한 성능의 향상은 제안된 MOLAP 저장구조의 물리적 설계기법이 매우 유용함을 나타내는 것이다.

  • PDF

청크 기반 MOLAP 큐브를 위한 비트맵 인덱스 (A Bitmap Index for Chunk-Based MOLAP Cubes)

  • 임윤선;김명
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권3호
    • /
    • pp.225-236
    • /
    • 2003
  • 다차원 온라인 분석처리 (MOLAP, Multidimensional On-line Analytical Processing) 시스템은 데이타를 큐브라고 불리는 다차원 배열에 저장하고 배열 인덱스를 이용하여 데이타를 엑세스한다. 큐브를 디스크에 저장할 때 각 변의 길이가 같은 작은 청크들로 조각내어 저장하게 되면 데이타 클러스터링 효과를 통해 모든 차원에 공평한 질의 처리 성능이 보장되며, 이러한 큐브 저장 방법을 ‘청크기반 MOLAP 큐브’ 저장 방법이라고 부른다. 공간 효율성을 높이기 위해 밀도가 낮은 청크들은 또한 압축되어 저장되는데 이 과정에서 데이타의 상대 위치 정보가 상실되며 원하는 청크들을 신속하게 엑세스하기 위해 인덱스가 필요하게 된다. 본 연구에서는 비트맵을 사용하여 청크기반 MOLAP 큐브를 인덱싱하는 방법을 제시한다. 인덱스는 큐브가 생성될 때 동시에 생성될 수 있으며, 인덱스 수준에서 청크들의 상대 위치 정보를 보존하여 청크들을 상수 시간에 검색할 수 있도록 하였고, 인덱스 블록마다 가능한 많은 청크들의 위치 정보가 포함되도록 하여 범위 질의를 비롯한 OLAP 주요 연산 처리 시에 인덱스 엑세스 회수를 크게 감소시켰다. 인덱스의 시간 공간적 효율성은 다차원 인덱싱 기법인 UB-트리, 그리드 파일과의 비교를 통해 검증하였다.

효율적인 공간 데이타 웨어하우스에 관한 연구 (A Study on the Effective Spatial Data Warehouse)

  • 이기영
    • 한국컴퓨터정보학회논문지
    • /
    • 제3권4호
    • /
    • pp.126-131
    • /
    • 1998
  • 최근 의사결정 지원 시스템의 필요성과 중요성이 크게 대두되어 활발히 연구가 진행되고 있는 공간 데이타 웨어하우스는 요약˙분석 작업을 통해 의사 결정에 필요한 정보를사용자에게 효율적으로 제공하기 위하여 과거로부터 누적된 이질적이고 다양한 대용량의 공간 데이타로 구성된다. 본 논문에서는 공간 데이타 웨어하우스 모델링을 위해서 가상적인 시나리오를 토대로 효과적인 공간 다차원 모델을 고찰한다. 또한 사용자가 요구하는 기본적이고 핵심적인 분석 기능들을 모두 표현할 수 있는 공간 다차원 분석 질의의 여러 형태에 대하여 살펴본다.

  • PDF

웹 로그 분석을 위한 OLAP 시스템 및 성능 평가 (OLAP System and Performance Evaluation for Analyzing Web Log Data)

  • 김지현;용환승
    • 한국멀티미디어학회논문지
    • /
    • 제6권5호
    • /
    • pp.909-920
    • /
    • 2003
  • CRM을 위해서는 다차원 분석이 가능한 OLAP (On-Line Analysis Processing)기술을 적 용한 방법 그리고 데이타 마이닝을 이용한 방법들이 각광 받고 있다. 고객 데이터 중에서 웹 로그 데이터를 실시간에 다차원 분석을 하기 위해서는 OLAP을 사용해야 한다. 그러나 OLAP을 적용하게 되면 웹 로그 데이터 자체가 가지고 있는 특성에 의해 희박성이 발생되고, 사전 집계 연산을 수행 할 시 데이터의 폭발(Explosion)현상이 일어난다. 이는 저장공간의 낭비 뿐 아니라 다차원 질의 시 성능 저하를 발생 시킨다. 본 논문에서는 웹 로그 데이터의 희박성에 대한 체계적인 접근을 위해 희박성을 발생시키는 원인과 2,3 차원의 희박성 형태들에 대해 밝혀보고, 이러한 분석을 기반으로 성능 평가를 위한 테스트 데이터 모델과 질의 모델을 설계하였다. 그리고 희박성 처리를 위해 청크 방식을 사용한 MOLAP시스템을 구현해 보고, 이 시스템과 MS SQL 2000 Analysis Services, Oracle Express의 성능을 평가 및 분석 해보았다. 이는 웹 로그 데이터내의 희박성을 효율적으로 처리할 수 있는 저장구조와 인덱스 방식을 발견하는데 토대가 될 수 있다.

  • PDF

Multidimensional Adaptive Noise Cancellation of Stress ECG Signal

  • Gautam, Alka;Lee, Young-Dong;Chung, Wan-Young
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 춘계종합학술대회 A
    • /
    • pp.285-288
    • /
    • 2008
  • In ubiquitous computing environment the biological signal ECG (Electrocardiogram signal) is usually recorded with noise components. Adaptive interference (or noise) canceller do adaptive filtering of the noise reference input to maximally match and subtract out noise or interference from the primary (signal plus noise) input thereby adaptively eliminate unwanted interference from the ECG signal. Measured Stress ECG (or exercise ECG signal) signal have three major noisy component like baseline wander noise, motion artifact noise and EMG (Electro-mayo-cardiogram) noise. These noises are not only distorted signal but also root of incorrect diagnosis while ECG data are analyzed. Motion artifact and EMG noises behave like wide band spectrum signals, and they considerably do overlapping with the ECG spectrum. Here the multidimensional adaptive method used for filtering which is more effective to improve signal to noise ratio.

  • PDF

Multidimensional Differential-Linear Cryptanalysis of ARIA Block Cipher

  • Yi, Wentan;Ren, Jiongjiong;Chen, Shaozhen
    • ETRI Journal
    • /
    • 제39권1호
    • /
    • pp.108-115
    • /
    • 2017
  • ARIA is a 128-bit block cipher that has been selected as a Korean encryption standard. Similar to AES, it is robust against differential cryptanalysis and linear cryptanalysis. In this study, we analyze the security of ARIA against differential-linear cryptanalysis. We present five rounds of differential-linear distinguishers for ARIA, which can distinguish five rounds of ARIA from random permutations using only 284.8 chosen plaintexts. Moreover, we develop differential-linear attacks based on six rounds of ARIA-128 and seven rounds of ARIA-256. This is the first multidimensional differential-linear cryptanalysis of ARIA and it has lower data complexity than all previous results. This is a preliminary study and further research may obtain better results in the future.

조선 성과 측정을 위한 다차원 생산성의 분석 (An Analysis of Multidimensional Productivity for the Shipbuilding Performance)

  • 김연민
    • 경영과학
    • /
    • 제34권2호
    • /
    • pp.57-66
    • /
    • 2017
  • The purpose of this study is to analyze the multidimensional productivity of the shipbuilding performance and to explain the role of different factors, such as man-hour, dock period, number of building block, launching process rate, automatic welding percent, and drawing fault rate which are important production-related variables in most shipbuilding companies. The shipbuilding productivity is obtained using Data Envelopment Analysis (DEA) approach. Then, a Tobit model is considered to measure the influence of different factors on the measured productivity. The results reveal that this productivity measure can substitute a representative shipbuilding productivity index (CGT/man-hour) in shipbuilding industries. Also, this multidimensional productivity analysis using DEA and Tobit reveals complex relationships between production-related variables and CGT and sale.

전자상거래 개인화 추천을 위한 다차원척도법의 활용 (Application of Multidimensional Scaling Method for E-Commerce Personalized Recommendation)

  • 김종우;유기현
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 2002년도 춘계공동학술대회
    • /
    • pp.93-97
    • /
    • 2002
  • In this paper, we propose personalized recommendation techniques based on multidimensional scaling (MDS) method for Business to Consumer Electronic Commerce. The multidimensional scaling method is traditionally used in marketing domain for analyzing customers' perceptional differences about brands and products. In this study, using purchase history data, customers in learning dataset are assigned to specific product categories, and after then using MDS a positioning map is generated to map product categories and alternative advertisements. The positioning map will be used to select personalized advertisement in real time situation. In this paper, we suggest the detail design of personalized recommendation method using MDS and compare with other approaches (random approach, collaborative filtering, and TOP3 approach)

  • PDF

국내 28개 국공립대학교의 연구성과에 대한 평가 (Evaluation of research performances for 28 national universities)

  • 정동빈
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권6호
    • /
    • pp.1241-1251
    • /
    • 2014
  • 국내 28개 국공립대학교를 대상으로 대학정보공시제에 근거하여 제시된 교육지표 중 연구성과에 관련된 4개의 양적평가 우량성속성 (1인당 연구비 수혜금액, 1인당 연구재단등재지 (KCI) 실적, 1인당 SCI/SCOUP급 실적, 1인당 저역서 실적)에 대해, 유사한 속성을 지닌 대학들을 유사성있는 군집끼리 분류 및 세분화하고 다차원 공간상에 시각적으로 배치시켰다. 이를 통해서 국내 28개 국공립대학은 4개 군집으로 유형화가 가능하며, 각 군집간 또는 군집내에 속한 대학들 간의 유형 및 특성을 평가할 수 있다.