• 제목/요약/키워드: random data analysis

검색결과 1,698건 처리시간 0.03초

On prediction of random effects in log-normal frailty models

  • Ha, Il-Do;Cho, Geon-Ho
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권1호
    • /
    • pp.203-209
    • /
    • 2009
  • Frailty models are useful for the analysis of correlated and/or heterogeneous survival data. However, the inferences of fixed parameters, rather than random effects, have been mainly studied. The prediction (or estimation) of random effects is also practically useful to investigate the heterogeneity of the hospital or patient effects. In this paper we propose how to extend the prediction method for random effects in HGLMs (hierarchical generalized linear models) to log-normal semiparametric frailty models with nonparametric baseline hazard. The proposed method is demonstrated by a simulation study.

  • PDF

랜덤 투영 앙상블 기법을 활용한 적응 최근접 이웃 판별분류기법 (Random projection ensemble adaptive nearest neighbor classification)

  • 강종경;전명식
    • 응용통계연구
    • /
    • 제34권3호
    • /
    • pp.401-410
    • /
    • 2021
  • 판별분류분석에서 널리 이용되는 k-최근접 이웃 분류 방법은 고정된 이웃의 수만을 고려하여 자료의 국소적 특징을 반영하지 못하는 한계가 있다. 이에 자료의 국소적 구조를 고려하여 이웃의 개수를 선택하는 적응 최근접이웃방법이 개발된 바 있다. 고차원 자료의 분석에 있어서는 k-최근접 이웃 분류를 사용하기 전에 랜덤 투영 기법 등을 활용하여 차원 축소를 수행하는 것이 일반적이다. 이렇게 랜덤 투영시킨 다수의 분류 결과들을 면밀히 조합하여 투표를 통해 최종 할당을 하는 기법이 최근 개발된 바 있다. 본 연구에서는 고차원 자료에서의 분석을 위해 적응 최근접이웃방법과 랜덤 투영 앙상블 기법을 조합한 새로운 판별분류 기법을 제안하였다. 제안된 방법은 기존에 개발된 방법에 비해 분류 정확성 측면에서 더 뛰어남을 모의실험 및 실제 사례 분석을 통해 확인하였다.

시간-주파수 분석을 이용한 고속철도차량 윤축에서 발생하는 소음과 진동의 동적 특성 (Dynamic Characteristics of the Noise and Vibration of High-speed Train's Wheelset using Time-varying Frequency Analysis)

  • 이준석;최성훈;김상수;박춘수
    • 한국철도학회논문집
    • /
    • 제12권4호
    • /
    • pp.465-471
    • /
    • 2009
  • 본 논분에서는 보다 적은 실험으로 고속철도차량의 윤축에서 발생하는 소음과 진동의 동적 특성을 알기 위해 불규칙 신호처리와 시간-주파수 해석을 이용하여 분석하였다. 윤축의 소음과 진동은 대부분 차륜과 궤도의 비정상상호작용이 원인이다. 이를 분석하기 위해 마이크로폰과 가속도계를 이용하여 데이터를 수집하고 붙규칙 신호처리와 시간-주파수 분석을 이용하여 분석하였다. 분석한 결과, 이 방법들은 고속철도차량의 윤축에서 발생하는 소음과 진동의 동적특성을 분석하는데 유용함을 확인하였다.

대형 안테나의 Random Vibration 해석에 관한 연구 (A Study on the Random Vibration Analysis of Large Scale Antenna)

  • 신건호;허장욱
    • 한국기계가공학회지
    • /
    • 제20권6호
    • /
    • pp.44-50
    • /
    • 2021
  • This study analyzed the stability of antenna equipped on vehicles by the link of modal analysis and random vibration analysis with the vibration data of MIL-STD-810H, METHOD 514.8. As a result of the random vibration analysis of antenna, the maximum equivalent stress 41.9MPa and minimum margin of safety 8.37 was generated in the bracket of antenna by the vertical direction vibration. Thus, it was found that antenna has enough stability during the operation.

BINARY RANDOM POWER APPROACH TO MODELING ASYMMETRIC CONDITIONAL HETEROSCEDASTICITY

  • KIM S.;HWANG S.Y.
    • Journal of the Korean Statistical Society
    • /
    • 제34권1호
    • /
    • pp.61-71
    • /
    • 2005
  • A class of asymmetric ARCH processes is proposed via binary random power transformations. This class accommodates traditional nonlinear models such as threshold ARCH (Rabemanjara and Zacoian (1993)) and Box-Cox type ARCH models(Higgins and Bera (1992)). Stationarity condition of the model is addressed. Iterative least squares(ILS) and pseudo maximum like-lihood(PML) methods are discussed for estimating parameters and related algorithms are presented. Illustrative analysis for Korea Stock Prices Index (KOSPI) data is conducted.

PPNC: Privacy Preserving Scheme for Random Linear Network Coding in Smart Grid

  • He, Shiming;Zeng, Weini;Xie, Kun;Yang, Hongming;Lai, Mingyong;Su, Xin
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권3호
    • /
    • pp.1510-1532
    • /
    • 2017
  • In smart grid, privacy implications to individuals and their families are an important issue because of the fine-grained usage data collection. Wireless communications are utilized by many utility companies to obtain information. Network coding is exploited in smart grids, to enhance network performance in terms of throughput, delay, robustness, and energy consumption. However, random linear network coding introduces a new challenge for privacy preserving due to the encoding of data and updating of coefficients in forwarder nodes. We propose a distributed privacy preserving scheme for random linear network coding in smart grid that considers the converged flows character of the smart grid and exploits a homomorphic encryption function to decrease the complexities in the forwarder node. It offers a data confidentiality privacy preserving feature, which can efficiently thwart traffic analysis. The data of the packet is encrypted and the tag of the packet is encrypted by a homomorphic encryption function. The forwarder node random linearly codes the encrypted data and directly processes the cryptotext tags based on the homomorphism feature. Extensive security analysis and performance evaluations demonstrate the validity and efficiency of the proposed scheme.

A Continuation-Ratio Logits Mixed Model for Structured Polytomous Data

  • Choi, Jae-Sung
    • Journal of the Korean Data and Information Science Society
    • /
    • 제17권1호
    • /
    • pp.187-193
    • /
    • 2006
  • This paper shows how to use continuation-ratio logits for the analysis of structured polytomous data. Here, response categories are considered to have a nested binary structure. Thus, conditionally nested binary random variables can be defined in each step. Two types of factors are considered as independent variables affecting response probabilities. For the purpose of analyzing categorical data with binary nested strutures a continuation-ratio mixed model is suggested. Estimation procedure for the unknown parameters in a suggested model is also discussed in detail by an example.

  • PDF

전기 차 운행 데이터를 활용한 인공지능 기반의 배터리 분석 및 평가 방법 연구 (Research on artificial intelligence based battery analysis and evaluation methods using electric vehicle operation data)

  • 홍승모
    • 한국정보전자통신기술학회논문지
    • /
    • 제16권6호
    • /
    • pp.385-391
    • /
    • 2023
  • 최근 탄소배출을 최소화하기 위해 전기자동차의 사용이 증가함에 따라 핵심 부품인 리튬이온 배터리의 상태 및 성능 분석의 중요성이 대두되고 있다. 따라서 배터리의 상태 및 성능에 영향을 줄 수 있는 배터리의 전압, 전류 및 온도뿐만 아니라 전기 자동차의 운행 데이터 및 충전 패턴 데이터를 활용한 종합적인 분석이 필요하다. 따라서 전기적 이동 수단에서 수집되는 배터리 데이터 수집 및 데이터 전처리, 단순 배터리 데이터에 추가적인 운전자 운전 습관에 대한 데이터 수집 및 전처리, 분석된 영향인자를 기반으로 인공지능 알고리즘 세부 설계 및 수정, 해당 알고리즘을 기반으로 하는 배터리 분석 및 평가 모델 설계하였다. 본 논문에서는 실시간 전기버스를 대상으로 운행 데이터와 배터리 데이터를 수집하여 Random Forest 알고리즘 활용하여 학습시킨 후, XAI 알고리즘을 통해 배터리 상태 중요 영향인자로 배터리의 상태, 운행 및 충전 패턴 데이터 등을 종합적으로 고려하여 운행 패턴에서 급가속, 급 감속, 급정지와 충 방전 패턴에서 일 주행횟수, 일일 누적 DOD와 셀 방전에서 셀 전압 차 , 셀 최대온도, 셀 최소온도의 요소가 배터리 상태에 많은 영향을 미치는 인자로 확인되었으며, Random Forest 알고리즘 기반으로 배터리 분석 및 평가 모델을 설계하고 평가하였다.

불규칙 하중하의 확률론적 피로 해석의 신뢰성 평가

  • 송삼홍;장두수
    • 한국정밀공학회:학술대회논문집
    • /
    • 한국정밀공학회 1993년도 춘계학술대회 논문집
    • /
    • pp.365-369
    • /
    • 1993
  • The reliability assessment of a simple porbabilistic fatigue analysis under random loading is proposed. Using the crack closure concept, the crack opening stress is assumed to be constant during random loading. The available loading history and test data are used for the comparison with the results of the reliability assessment of probabilistic fatigue analysis.

Finding a plan to improve recognition rate using classification analysis

  • Kim, SeungJae;Kim, SungHwan
    • International journal of advanced smart convergence
    • /
    • 제9권4호
    • /
    • pp.184-191
    • /
    • 2020
  • With the emergence of the 4th Industrial Revolution, core technologies that will lead the 4th Industrial Revolution such as AI (artificial intelligence), big data, and Internet of Things (IOT) are also at the center of the topic of the general public. In particular, there is a growing trend of attempts to present future visions by discovering new models by using them for big data analysis based on data collected in a specific field, and inferring and predicting new values with the models. In order to obtain the reliability and sophistication of statistics as a result of big data analysis, it is necessary to analyze the meaning of each variable, the correlation between the variables, and multicollinearity. If the data is classified differently from the hypothesis test from the beginning, even if the analysis is performed well, unreliable results will be obtained. In other words, prior to big data analysis, it is necessary to ensure that data is well classified according to the purpose of analysis. Therefore, in this study, data is classified using a decision tree technique and a random forest technique among classification analysis, which is a machine learning technique that implements AI technology. And by evaluating the degree of classification of the data, we try to find a way to improve the classification and analysis rate of the data.