Identification of the origins of Panax ginseng has been issued in Korea scientifically and economically. We describe a metabolomics approach used for discrimination and prediction of ginseng roots from different origins in Korea. The fresh ginseng roots from six ginseng cooperative associations (Gangwon, Gaeseong, Punggi, Chungbuk, Jeonbuk, and Anseong) were analyzed by UPLC-MS-based approach combined with orthogonal projections to latent structure-discriminant analysis multivariate analysis. The ginsengs from Gangwon and Gaeseong were easily differentiated. We further analyzed the metabolomics results in subgroups. Punggi, Chungbuk, Jeonbuk, and Anseong ginseng could be easily differentiated by the first two orthogonal components. As a validation of the discrimination model, we performed blind prediction tests of sample origins using an external test set. Our model predicted their geographical origins as 99.7% probability. The robust discriminatory power and statistical validity of our method suggest its general applicability for determining the origins of P. ginseng samples.
Value at Risk (VaR) is the most popular measure for market risk. In this paper, we consider the VaR estimation of portfolio consisting of a variety of assets based on multivariate copula model known as vine copula. In particular, sparse vine copula which penalizes too many parameters is considered. We show in the simulation study that sparsity indeed improves out-of-sample forecasting of VaR. Empirical analysis on 60 KOSPI stocks during the last 5 years also demonstrates that sparse vine copula outperforms regular copula model.
Proceedings of the Korea Water Resources Association Conference
/
2021.06a
/
pp.373-373
/
2021
Rainfall forecasting is an important issue that is applied in many areas, such as agriculture, flood warning, and water resources management. In this context, this study proposed a statistical and machine learning-based forecasting model for monthly rainfall. The Bayesian Gaussian process was chosen to optimize the hyperparameters of the Stacked Long Short-term memory (SLSTM) model. The proposed SLSTM model was applied for predicting monthly precipitation of Seoul station, South Korea. Data were retrieved from the Korea Meteorological Administration (KMA) in the period between 1960 and 2019. Four schemes were examined in this study: (i) prediction with only rainfall; (ii) with deseasonalized rainfall; (iii) with rainfall and minimum temperature; (iv) with deseasonalized rainfall and minimum temperature. The error of predicted rainfall based on the root mean squared error (RMSE), 16-17 mm, is relatively small compared with the average monthly rainfall at Seoul station is 117mm. The results showed scheme (iv) gives the best prediction result. Therefore, this approach is more straightforward than the hydrological and hydraulic models, which request much more input data. The result indicated that a deep learning network could be applied successfully in the hydrology field. Overall, the proposed method is promising, given a good solution for rainfall prediction.
Sung D.;Kim J.;Jung W.;Lee S.;Cheung W.;Lim J.;Chung K.
Journal of the Korean Vacuum Society
/
v.15
no.4
/
pp.338-346
/
2006
In semiconductor process, it is so hard to predict an exact failure point of the vacuum pump due to its harsh operation conditions and nonlinear properties, which may causes many problems, such as production of inferior goods or waste of unnecessary materials. Therefore it is very urgent and serious problem to develop diagnostic models which can monitor the operation conditions appropriately and recognize the failure point exactly, indicating when to replace the vacuum pump. In this study, many influencing factors are totally considered and eventually the monitoring model using multivariate statistical methods is suggested. The pivotal algorithms are Multiway Principal Component Analysis(MPCA), Dynamic Time Warping Algorithm(DTW Algorithm), etc.
Kim, Jong Soo;Hong, Soon Mo;Kim, Myoung Sook;Kim, Yo Yong;Shin, Eun Sang
Journal of Korean Society for Atmospheric Environment
/
v.30
no.3
/
pp.281-290
/
2014
This study was conducted to evaluate the distribution characteristics of $PM_{10}$ and heavy metals concentrations in the ambient air of Gyeonggi-do area by region and season from February, 2013 to March, 2014. The regression model for the prediction of formation characteristics and contamination degree of $PM_{10}$ and heavy metals by correlation analysis and regression analysis for using the multivariate statistical analysis was also established. The main wind direction during the investigation period was South East (SE) and West South West (WSW) winds, and the concentration of $SO_2$ at Ansan with industrial region showed 1.6 times higher than Suwon, Euiwang with residential region. The concentrations (median) of Pb, Cu and Ni at Ansan showed 3.2~4.5, 1.9~2.2 and 1.7~2.6 times respectively higher than those at Suwon. By the seasonal concentration variation, the concentrations of $PM_{10}$, Pb, Fe and As in winter and spring (December to May) showed 1.7, 1.9, 1.9 and 2.7 times respectively higher than those in summer and fall (June to November). As, Fe and $PM_{10}$ had a big difference by the seasonal factors, and Cu and Ni were evaluated to be influenced by the regional factors. From the results of correlation analysis among the target items, the correlation coefficient of PM and Mn had 0.82 (p/0.01) and that of Fe and Mn had 0.82 (p/0.01), which showed high correlation. And the correlation coefficients for $SO_2$ and Pb, CO and $PM_{10}$ were 0.66 (p/0.01) and 0.62 (p/0.01) respectively. The multiple linear regression models for $PM_{10}$, Pb, Cu, Cr, As, Ni, Fe and Mn were established by independent variables of CO, $SO_2$ and meteorological factors (wind speed, relative humidity). In the regression models, independent variable $SO_2$ was in cause-and-effect relationship with all dependent variables, and $PM_{10}$, Fe and Mn were influenced by CO and wind speed, and Pb, Cu, Ni and As had a main factor of $SO_2$.
Recently we frequently analyze multivariate data with quite large number of variables. In such data sets, virtually duplicated variables may exist simultaneously even though they are conceptually distinguishable. Duplicate variables may cause problems such as the distortion of principal axes in principal component analysis and factor analysis and the distortion of the distances between observations, i.e. the input for cluster analysis. Also in supervised learning or regression analysis, duplicated explanatory variables often cause the instability of fitted models. Since real data analyses are aimed often at multiple purposes, it is necessary to reduce the number of variables to a parsimonious level. The aim of this paper is to propose a practical algorithm for selection of a subset of variables from a given set of p input variables, by the criterion of minimum trace of partial variances of unselected variables unexplained by selected variables. The usefulness of proposed method is demonstrated in visualizing the relationship between selected and unselected variables, in building a predictive model with very large number of independent variables, and in reducing the number of variables and purging/merging categories in categorical data.
Journal of the Korea Society of Computer and Information
/
v.19
no.10
/
pp.125-133
/
2014
This paper develops a bankruptcy prediction model on an Artificial Neural Network for hotel management. A bankruptcy prediction model has a specific feature to predict a bankruptcy of the whole hotel business after evaluate bankruptcy possibility on the basis of business performance data of each branch. here are many traditional statistical models for bankruptcy prediction such as Multivariate Discriminant Analysis or Logit Analysis. However, we chose Artificial Neural Network because the method has accuracy rates of prediction better than those of other methods. We first selected 100 good enterprises and 100 bankrupt enterprises as experimental data and set up a bankruptcy prediction model by use of a tool for Artificial Neural Network, NeuroShell. The model and its experiments, which demonstrated high efficiency, can certainly provide great help in decision making in the field of hotel management and in deciding on the bankruptcy or financial solidity of each branch of serviced residence hotel.
Italian Ryegrass (IRG), which is known as high yielding and the highest quality winter annual forage crop, is grown in mid-south area in Korea. This study aims to analyze the cause-and-effect relationship between IRG yield and climate variables such as temperature and precipitation by using IRG data and climate data of Korea Weather Bureau. From path analysis of structural equation model under multivariate normality, we found that there was a weather effect on IRG yield that the winter grass IRG yield was directly affected by spring temperature and indirectly affected by spring rainfall. These results showed that IRG can be sown in early spring in the area where it is hard to prepare for winter due to low temperature. This paper can contribute to increase IRG yield by showing the cause-and-effect relationship and this study can be extended to various structural equation models for other crops.
Objectives: Self-rated health is a measure of perceived health widely used in epidemiological studies. Our study investigated the determinants of poor self-rated health in middle-aged Korean adults with diabetes. Methods: A cross-sectional study was conducted based on the Health Examinees Study. A total of 9759 adults aged 40 to 69 years who reported having physician-diagnosed diabetes were analyzed with regard to a range of health determinants, including sociodemographic, lifestyle, psychosocial, and physical variables, in association with self-rated health status using multivariate logistic regression models. A p-value <0.05 was considered to indicate statistical significance. Results: We found that negative psychosocial conditions, including frequent stress events and severe distress according to the psychosocial well-being index, were most strongly associated with poor self-rated health (odds ratio $[OR]_{\text{Frequent stress events}}$, 5.40; 95% confidence interval [CI], 4.63 to 6.29; $OR_{\text{Severe distress}}$, 11.08; 95% CI, 8.77 to 14.00). Moreover, younger age and being underweight or obese were shown to be associated with poor self-rated health. Physical factors relating to participants' medical history of diabetes, such as a younger age at diagnosis, a longer duration of diabetes, insulin therapy, hemoglobin A1c levels of 6.5% or more, and comorbidities, were other correlates of poor reported health. Conclusions: Our findings suggest that, in addition to medical variables, unfavorable socioeconomic factors, and adverse lifestyle behaviors, younger age, being underweight or obese, and psychosocial stress could be distinc factors in predicting negative perceived health status in Korean adults with diabetes.
Introduction and aim: To compare reproductive factor influence on patients with pathological diagnosed malignant and benign tumor in the Breast Department, The First Peoples' Hospital of Kunming in Yunnan province, China. Methods: A hospital-based case-control study was conducted on 263 breast cancer (BC) cases and 457 non-breast cancer controls from 2009 to 2011. The cases and controls information on demographics, medical history, and reproductive characteristics variables were collected using a self-administered questionnaire and routine medical records. Histology of breast cancer tissue and benign breast lesion were documented by pathology reports. Since some variables in data analysis had zero count in at least one category, binomial-response GLM using the bias-reduction method was applied to estimate OR's and their 95% confidence intervals (95% CI). To adjust for age and menopause status, a compound variable comprising age and menopausal status was retained in the statistical models. Results: multivariate model analysis revealed significant independent positive associations of BC with short menstrual cycle, old age at first live birth, never breastfeeding, history of oral contraception experience, increased number of abortion, postmenopausal status, and nulliparity. Categorised by age and menopausal status, perimenopausal women had about 3-fold and postmenopausal women had more than 5-fold increased risk of BC compared to premenopausal women. Discussion and Conclusion: This study has confirmed the significant association of BC and estrogen related risk factors of breast cancer including longer menstrual cycle, older age of first live birth, never breastfeeding, nulliparity, and number of abortions more than one. The findings suggest that female hormonal factors, especially the trend of menopause status play a significant role in the development of BC in Yunnan women.
본 웹사이트에 게시된 이메일 주소가 전자우편 수집 프로그램이나
그 밖의 기술적 장치를 이용하여 무단으로 수집되는 것을 거부하며,
이를 위반시 정보통신망법에 의해 형사 처벌됨을 유념하시기 바랍니다.
[게시일 2004년 10월 1일]
이용약관
제 1 장 총칙
제 1 조 (목적)
이 이용약관은 KoreaScience 홈페이지(이하 “당 사이트”)에서 제공하는 인터넷 서비스(이하 '서비스')의 가입조건 및 이용에 관한 제반 사항과 기타 필요한 사항을 구체적으로 규정함을 목적으로 합니다.
제 2 조 (용어의 정의)
① "이용자"라 함은 당 사이트에 접속하여 이 약관에 따라 당 사이트가 제공하는 서비스를 받는 회원 및 비회원을
말합니다.
② "회원"이라 함은 서비스를 이용하기 위하여 당 사이트에 개인정보를 제공하여 아이디(ID)와 비밀번호를 부여
받은 자를 말합니다.
③ "회원 아이디(ID)"라 함은 회원의 식별 및 서비스 이용을 위하여 자신이 선정한 문자 및 숫자의 조합을
말합니다.
④ "비밀번호(패스워드)"라 함은 회원이 자신의 비밀보호를 위하여 선정한 문자 및 숫자의 조합을 말합니다.
제 3 조 (이용약관의 효력 및 변경)
① 이 약관은 당 사이트에 게시하거나 기타의 방법으로 회원에게 공지함으로써 효력이 발생합니다.
② 당 사이트는 이 약관을 개정할 경우에 적용일자 및 개정사유를 명시하여 현행 약관과 함께 당 사이트의
초기화면에 그 적용일자 7일 이전부터 적용일자 전일까지 공지합니다. 다만, 회원에게 불리하게 약관내용을
변경하는 경우에는 최소한 30일 이상의 사전 유예기간을 두고 공지합니다. 이 경우 당 사이트는 개정 전
내용과 개정 후 내용을 명확하게 비교하여 이용자가 알기 쉽도록 표시합니다.
제 4 조(약관 외 준칙)
① 이 약관은 당 사이트가 제공하는 서비스에 관한 이용안내와 함께 적용됩니다.
② 이 약관에 명시되지 아니한 사항은 관계법령의 규정이 적용됩니다.
제 2 장 이용계약의 체결
제 5 조 (이용계약의 성립 등)
① 이용계약은 이용고객이 당 사이트가 정한 약관에 「동의합니다」를 선택하고, 당 사이트가 정한
온라인신청양식을 작성하여 서비스 이용을 신청한 후, 당 사이트가 이를 승낙함으로써 성립합니다.
② 제1항의 승낙은 당 사이트가 제공하는 과학기술정보검색, 맞춤정보, 서지정보 등 다른 서비스의 이용승낙을
포함합니다.
제 6 조 (회원가입)
서비스를 이용하고자 하는 고객은 당 사이트에서 정한 회원가입양식에 개인정보를 기재하여 가입을 하여야 합니다.
제 7 조 (개인정보의 보호 및 사용)
당 사이트는 관계법령이 정하는 바에 따라 회원 등록정보를 포함한 회원의 개인정보를 보호하기 위해 노력합니다. 회원 개인정보의 보호 및 사용에 대해서는 관련법령 및 당 사이트의 개인정보 보호정책이 적용됩니다.
제 8 조 (이용 신청의 승낙과 제한)
① 당 사이트는 제6조의 규정에 의한 이용신청고객에 대하여 서비스 이용을 승낙합니다.
② 당 사이트는 아래사항에 해당하는 경우에 대해서 승낙하지 아니 합니다.
- 이용계약 신청서의 내용을 허위로 기재한 경우
- 기타 규정한 제반사항을 위반하며 신청하는 경우
제 9 조 (회원 ID 부여 및 변경 등)
① 당 사이트는 이용고객에 대하여 약관에 정하는 바에 따라 자신이 선정한 회원 ID를 부여합니다.
② 회원 ID는 원칙적으로 변경이 불가하며 부득이한 사유로 인하여 변경 하고자 하는 경우에는 해당 ID를
해지하고 재가입해야 합니다.
③ 기타 회원 개인정보 관리 및 변경 등에 관한 사항은 서비스별 안내에 정하는 바에 의합니다.
제 3 장 계약 당사자의 의무
제 10 조 (KISTI의 의무)
① 당 사이트는 이용고객이 희망한 서비스 제공 개시일에 특별한 사정이 없는 한 서비스를 이용할 수 있도록
하여야 합니다.
② 당 사이트는 개인정보 보호를 위해 보안시스템을 구축하며 개인정보 보호정책을 공시하고 준수합니다.
③ 당 사이트는 회원으로부터 제기되는 의견이나 불만이 정당하다고 객관적으로 인정될 경우에는 적절한 절차를
거쳐 즉시 처리하여야 합니다. 다만, 즉시 처리가 곤란한 경우는 회원에게 그 사유와 처리일정을 통보하여야
합니다.
제 11 조 (회원의 의무)
① 이용자는 회원가입 신청 또는 회원정보 변경 시 실명으로 모든 사항을 사실에 근거하여 작성하여야 하며,
허위 또는 타인의 정보를 등록할 경우 일체의 권리를 주장할 수 없습니다.
② 당 사이트가 관계법령 및 개인정보 보호정책에 의거하여 그 책임을 지는 경우를 제외하고 회원에게 부여된
ID의 비밀번호 관리소홀, 부정사용에 의하여 발생하는 모든 결과에 대한 책임은 회원에게 있습니다.
③ 회원은 당 사이트 및 제 3자의 지적 재산권을 침해해서는 안 됩니다.
제 4 장 서비스의 이용
제 12 조 (서비스 이용 시간)
① 서비스 이용은 당 사이트의 업무상 또는 기술상 특별한 지장이 없는 한 연중무휴, 1일 24시간 운영을
원칙으로 합니다. 단, 당 사이트는 시스템 정기점검, 증설 및 교체를 위해 당 사이트가 정한 날이나 시간에
서비스를 일시 중단할 수 있으며, 예정되어 있는 작업으로 인한 서비스 일시중단은 당 사이트 홈페이지를
통해 사전에 공지합니다.
② 당 사이트는 서비스를 특정범위로 분할하여 각 범위별로 이용가능시간을 별도로 지정할 수 있습니다. 다만
이 경우 그 내용을 공지합니다.
제 13 조 (홈페이지 저작권)
① NDSL에서 제공하는 모든 저작물의 저작권은 원저작자에게 있으며, KISTI는 복제/배포/전송권을 확보하고
있습니다.
② NDSL에서 제공하는 콘텐츠를 상업적 및 기타 영리목적으로 복제/배포/전송할 경우 사전에 KISTI의 허락을
받아야 합니다.
③ NDSL에서 제공하는 콘텐츠를 보도, 비평, 교육, 연구 등을 위하여 정당한 범위 안에서 공정한 관행에
합치되게 인용할 수 있습니다.
④ NDSL에서 제공하는 콘텐츠를 무단 복제, 전송, 배포 기타 저작권법에 위반되는 방법으로 이용할 경우
저작권법 제136조에 따라 5년 이하의 징역 또는 5천만 원 이하의 벌금에 처해질 수 있습니다.
제 14 조 (유료서비스)
① 당 사이트 및 협력기관이 정한 유료서비스(원문복사 등)는 별도로 정해진 바에 따르며, 변경사항은 시행 전에
당 사이트 홈페이지를 통하여 회원에게 공지합니다.
② 유료서비스를 이용하려는 회원은 정해진 요금체계에 따라 요금을 납부해야 합니다.
제 5 장 계약 해지 및 이용 제한
제 15 조 (계약 해지)
회원이 이용계약을 해지하고자 하는 때에는 [가입해지] 메뉴를 이용해 직접 해지해야 합니다.
제 16 조 (서비스 이용제한)
① 당 사이트는 회원이 서비스 이용내용에 있어서 본 약관 제 11조 내용을 위반하거나, 다음 각 호에 해당하는
경우 서비스 이용을 제한할 수 있습니다.
- 2년 이상 서비스를 이용한 적이 없는 경우
- 기타 정상적인 서비스 운영에 방해가 될 경우
② 상기 이용제한 규정에 따라 서비스를 이용하는 회원에게 서비스 이용에 대하여 별도 공지 없이 서비스 이용의
일시정지, 이용계약 해지 할 수 있습니다.
제 17 조 (전자우편주소 수집 금지)
회원은 전자우편주소 추출기 등을 이용하여 전자우편주소를 수집 또는 제3자에게 제공할 수 없습니다.
제 6 장 손해배상 및 기타사항
제 18 조 (손해배상)
당 사이트는 무료로 제공되는 서비스와 관련하여 회원에게 어떠한 손해가 발생하더라도 당 사이트가 고의 또는 과실로 인한 손해발생을 제외하고는 이에 대하여 책임을 부담하지 아니합니다.
제 19 조 (관할 법원)
서비스 이용으로 발생한 분쟁에 대해 소송이 제기되는 경우 민사 소송법상의 관할 법원에 제기합니다.
[부 칙]
1. (시행일) 이 약관은 2016년 9월 5일부터 적용되며, 종전 약관은 본 약관으로 대체되며, 개정된 약관의 적용일 이전 가입자도 개정된 약관의 적용을 받습니다.