• Title/Summary/Keyword: 비교 기여 순수 신뢰도

Search Result 8, Processing Time 0.03 seconds

The proposition of compared and attributably pure confidence in association rule mining (연관 규칙 마이닝에서 비교 기여 순수 신뢰도의 제안)

  • Park, Hee Chang
    • Journal of the Korean Data and Information Science Society
    • /
    • v.24 no.3
    • /
    • pp.523-532
    • /
    • 2013
  • Generally, data mining is the process of analyzing big data from different perspectives and summarizing it into useful information. The most widely used data mining technique is to generate association rules, and it finds the relevance between two items in a huge database. This technique has been used to find the relationship between each set of items based on the interestingness measures such as support, confidence, lift, etc. Among many interestingness measures, confidence is the most frequently used, but it has the drawback that it can not determine the direction of the association. The attributably pure confidence and compared confidence are able to determine the direction of the association, but their ranges are not [-1, +1]. So we can not interpret the degree of association operationally by their values. This paper propose a compared and attributably pure confidence to compensate for this drawback, and then describe some properties for a proposed measure. The comparative studies with confidence, compared confidence, attributably pure confidence, and a proposed measure are shown by numerical example. The results show that the a compared and attributably pure confidence is better than any other confidences.

The development of symmetrically and attributably pure confidence in association rule mining (연관성 규칙에서 활용 가능한 대칭적 기여 순수 신뢰도의 개발)

  • Park, Hee Chang
    • Journal of the Korean Data and Information Science Society
    • /
    • v.25 no.3
    • /
    • pp.601-609
    • /
    • 2014
  • The most widely used data mining technique for big data analysis is to generate meaningful association rules. This method has been used to find the relationship between set of items based on the association criteria such as support, confidence, lift, etc. Among them, confidence is the most frequently used, but it has the drawback that we can not know the direction of association by it. The attributably pure confidence was developed to compensate for this drawback, but the value was changed by the position of two item sets. In this paper, we propose four symmetrically and attributably pure confidence measures to compensate the shortcomings of confidence and the attributably pure confidence. And then we prove three conditions of interestingness measure by Piatetsky-Shapiro, and comparative studies with confidence, attributably pure confidence, and four symmetrically and attributably pure confidence measures are shown by numerical examples. The results show that the symmetrically and attributably pure confidence measures are better than confidence and the attributably pure confidence. Also the measure NSAPis found to be the best among these four symmetrically and attributably pure confidence measures.

Nomogram building to predict dyslipidemia using a naïve Bayesian classifier model (순수 베이지안 분류기 모델을 사용하여 이상지질혈증을 예측하는 노모 그램 구축)

  • Kim, Min-Ho;Seo, Ju-Hyun;Lee, Jea-Young
    • The Korean Journal of Applied Statistics
    • /
    • v.32 no.4
    • /
    • pp.619-630
    • /
    • 2019
  • Dyslipidemia is a representative chronic disease affecting Koreans that requires continuous management. It is also a known risk factor for cardiovascular disease such as hypertension and diabetes. However, it is difficult to diagnose vascular disease without a medical examination. This study identifies risk factors for the recognition and prevention of dyslipidemia. By integrating them, we construct a statistical instrumental nomogram that can predict the incidence rate while visualizing. Data were from the Korean National Health and Nutrition Examination Survey (KNHANES) for 2013-2016. First, a chi-squared test identified twelve risk factors of dyslipidemia. We used a naïve Bayesian classifier model to construct a nomogram for the dyslipidemia. The constructed nomogram was verified using a receiver operating characteristics curve and calibration plot. Finally, we compared the logistic nomogram previously presented with the Bayesian nomogram proposed in this study.

Water Supply and Reliability Increment by Dams Connection (댐간 연결을 통한 공급량 증대 및 신뢰도 향상)

  • Lee, Gwang-Man;Lee, Seung-Yoon;Lee, Eul-Rae
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2010.05a
    • /
    • pp.317-321
    • /
    • 2010
  • 대부분의 유역에는 다수의 댐이 건설되어 운영되고 있는 것이 일반적이며, 이들 댐 군의 효과를 극대화하기 위하여 연계최적운영 기법의 적용이 일반화 되고 있다. 2000년 수립된 국가장기수 자원계획에서도 이미 4대강 수계의 댐 군의 연계운영 효과로 2011년까지 6억 $m^3$를 반영하고 있다. 또한 프론티어 연구개발사업을 통해 순수한 시스템적인 개선으로 30억 $m^3$의 용수를 추가적으로 확보하는 방안이 오래전부터 진행되어 오고 있다. 이와 같은 방법론의 핵심은 수문기상의 예측정도를 높이고 장단기 강우-유출을 사전 혹은 실시간으로 예측하여 수자원시설물의 기능을 최대화시키는 전략으로 현재와 같이 댐과 같은 수리구조물을 신규로 건설하는데 어려움이 많은 경우 유용한 대안이 될 수 있다. 그러나 수리구조물의 운영에 필요한 많은 변수 중에서 가장 예측이 어려우며 또한 효과를 평가할 수 있는 가장 핵심적인 요소인 수문사상에 대한 정보의 신뢰도에는 한계가 있다. 다시 말하면 현재와 같은 상황에서 수자원시설물의 시스템적인 개선을 통한 편익의 신뢰도가 구조물적인 효과의 신뢰도를 보장하기 어렵다는 것이다. 결국 주어진 여건에서 수자원이용의 효과를 극대화시키기 위해서는 구조적 대안과 시스템적인 기법을 같이 적용할 수밖에 없으며 상호 보완적으로 활용하는 것이 가장 합리적일 것이다. 이와 같은 측면에서 구조적인 댐간 연결은 일정범위까지는 확실한 효과를 담보할 수 있으며 이 또한 시스템적으로도 유용할 것이다. 본 연구에서는 이와 같은 개념을 안동댐과 임하댐이 도수터널로 연결될 경우로 가정하여 예상되는 효과에 대하여 평가하였다. 평가방법은 일간연계모의모형과 일간도수연결모의모형을 개발하여 적용하였으며 무효방류량의 감소정도와 용수공급 증가량과 공급의 신뢰도, 부족량의 크기 등을 비교 평가하였다.

  • PDF

Prediction of the Intensity of Vibration Around the Crossing Part of Manganese Turnout (망간분기기 크로싱부 인근의 진동 발생수준 예측)

  • Eum, Ki-Young
    • Journal of the Korean Society of Hazard Mitigation
    • /
    • v.8 no.6
    • /
    • pp.61-66
    • /
    • 2008
  • In railroad operation, turnout is the device designed to provide very critical functions of moving the train to the neighboring rail. It's the only movable section among the rail and track equipment, which has a complicated structure and as rapid movement between the wheel and rail during operation is unavoidable, the safety and the vibration caused by the impact load of the passing train becomes always the major concern. Response to rail vibration tends to vary depending on physical properties of the rail, rail base and the ground, making it difficult to estimate the quantitative outcome through the measurement. Thus, experimental or empirical approach, rather than an analytic method, has been more commonly employed to deal with the ground vibration. To predict the vibration of the turnout, an experimental value and the measured values are applied in parallel to the factors with a high degree of uncertainty. This study hence was intended to compare and analyze the vibration values measured at the crossing part of manganese turnout by type of train and turnout and distance, as well as predict the intensity of vibration generated at the crossing part of manganese turnout when tilting train accelerates.

실시간 수문자료의 특성분리를 통한 예측성능의 향상

  • Hwang, Seok-Hwan;Kim, Chi-Yeong;Cha, Jun-Ho;Jeong, Seong-Won
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2011.05a
    • /
    • pp.128-128
    • /
    • 2011
  • 본 연구에서는 자동유량측정시설에 의하여 실시간으로 생산되는 자동유량측정 자료의 정상성 여부를 판단하는데 중요한 적정 측정 신뢰구간을 실시간으로 예측할 수 있는 기술을 개발하였다. 전세계적으로, 현대적인 유량측정이 시작된 이래 연속유량 산정을 위한 방법은 수위-유량관계곡선을 이용하는 방법 외에 실무적으로 활용 가능한 방법은 거의 전무한 실정이다. 수위-유량관계곡선을 이용하는 방법은 연속수위를 계측하여 이에 해당하는 연속유량을 산정하는 방법으로 수위와 유량간에 일정한 관계를 가지는 정상적인 흐름을 보이는 자연하천의 경우에 정확도가 매우 높다. 그러나 감조나 구조물 등에 의해 유량이 조절되는 경우에 유량산정의 정확도는 현저히 떨어지게 된다. 따라서 수위에서 유량을 환산하는 방법이 아닌 유량을 직접 연속으로 측정하는 방법이 꾸준히 연구되어 왔고, 이 중 가장 대표적인 방법이 자동유량측정 방법이다. 그러나 자동유량측정 방법은 유량을 연속으로 측정할 수 있다는 장점에 반해 측정된 유량의 정확도를 높이기가 매우 어렵다는 단점도 가지고 있다. 계측 자체의 기술적 한계는 주로 계측기기적인 문제로 이는 전자기, 통신 기술 등 첨단 기술의 발전과 함께 다양한 현장 시험을 통해 폭넓은 개선이 이루어지고 있다. 그러나 아직 기술적 완성도가 완전하지 못한 현실에서, 현재 설치되어 있는 자동유량측정 유량자료의 신뢰도를 높이기 위해서는 각각의 계측 시점에서 자료가 정상적으로 산정되고 있는지에 대한 검정이 필요하고, 이는 자동유량측정 자료의 정확도 확보에 매우 중요한 관건으로 작용할 수밖에 없다. 이러한 배경에서 본 연구에서는 조석성분과 유출성분을 분리하여 예측하는 방법을 새롭게 개발 적용하였다. 자료는 자료의 시간해상도 증감에 따른 실제 예측의 정확도 증감을 고려하여 가장 적절하다고 판단되는 시자료를 사용하였으며, 자료간 상관을 분석하여 주 입력 자료로 팔당댐 방류량, 한강대교 지점 수위, 전류 수위를 이용하였다. 모형의 예측 능력을 극대화하기 위하여 조석 영향을 받는 자료의 경우는 웨이블릿 변환(wavelet transform)을 이용하여 순수 유출성분과 조위성분을 분리하여 별도로 적용하였다. 그리고 예측을 위한 모형은 실시간 자료기반 모형으로 그 안정성이 인정된 서포트벡터머신(support vector machine)을 이용하였다. 이러한 과정을 통해 한강대교 지점의 순수 유출성분과 조위성분의 유량을 각각 예측한 후 두 결과를 합성하여 최종 한강 대교 지점의 유량을 산정하였다. 조석성분을 분리하여 한강대교 지점의 유량을 예측한 결과 대부분의 예측치가 95% 예측구간에 포함되었다. 그리고 조석성분을 분리하지 않은 모형과 조석성분을 분리한 모형의 예측 능력을 비교한 결과, 조석성분을 분리한 모형이 예측이 정확도가 높았다. RMSE의 경우 분리하지 않은 모형대비 23%의 예측오차가 감소하였고, NSC의 경우 0.92에서 0.95로 예측의 정확도가 증가하였다.

  • PDF

The Effect of Green Foundation on the Visual Preference (시각적 선호에 있어서 Green Foundation의 효과에 관한 연구)

  • 조동범;염도의
    • Journal of the Korean Institute of Landscape Architecture
    • /
    • v.13 no.1
    • /
    • pp.95-107
    • /
    • 1985
  • This study is purposed to investigate the role of grasses as the Green Foundation effect on the visual preference to flowering tree and shrub being the principal elements of natural landscape early in the spring. As the flowering shrub materials, Rhododendron mucronulatum and Forsythia Kreana were adopted. Total 48 slides were photographed at the 8 different lawn areas with the 6 planting combinations of flowering shrub materials, and 10 landscape variables - dimensional and color - were measured and preference scores were taken by slide evaluations. The results were : 1) The visual preference to the landscape of flowering shrub in the lawn area was changed with the different lawn situations. 2) With important 4 variables, multilinear regression model was established, hence Y =40.4 + 9.6($X_1$) -7.8($X_2$) -26.8($X_3$) + 15.2($X_4$) where, Y : estimated preference score $X_1$: perimeter of flower zone $X_2$: value of green covered zone $X_3$: hue of green covered zone $X_4$: chroma of green covered zone 3) Most effective variable was 'hue of green covered zone', hence the more green the lawn area ism the more preferred landscape or the more effective green foundation is.

  • PDF

Preparation of Pure CO2 Standard Gas from Calcium Carbonate for Stable Isotope Analysis (탄산칼슘을 이용한 이산화탄소 안정동위원소 표준시료 제작에 대한 연구)

  • Park, Mi-Kyung;Park, Sunyoung;Kang, Dong-Jin;Li, Shanlan;Kim, Jae-Yeon;Jo, Chun Ok;Kim, Jooil;Kim, Kyung-Ryul
    • The Sea:JOURNAL OF THE KOREAN SOCIETY OF OCEANOGRAPHY
    • /
    • v.18 no.1
    • /
    • pp.40-46
    • /
    • 2013
  • The isotope ratios of $^{13}C/^{12}C$ and $^{18}O/^{16}O$ for a sample in a mass spectrometer are measured relative to those of a pure $CO_2$ reference gas (i.e., laboratory working standard). Thus, the calibration of a laboratory working standard gas to the international isotope scales (Pee Dee Belemnite (PDB) for ${\delta}^{13}C$ and Vienna Standard Mean Ocean Water (V-SMOW) for ${\delta}^{18}O$) is essential for comparisons between data sets obtained by other groups on other mass spectrometers. However, one often finds difficulties in getting well-calibrated standard gases, because of their production time and high price. Additional difficulty is that fractionation processes can occur inside the gas cylinder most likely due to pressure drop in long-term use. Therefore, studies on laboratory production of pure $CO_2$ isotope standard gas from stable solid calcium carbonate standard materials, have been performed. For this study, we propose a method to extract pure $CO_2$ gas without isotope fractionation from a solid calcium carbonate material. The method is similar to that suggested by Coplen et al., (1983), but is better optimized particularly to make a large amount of pure $CO_2$ gas from calcium carbonate material. The $CaCO_3$ releases $CO_2$ in reaction with 100% pure phosphoric acid at $25^{\circ}C$ in a custom designed, evacuated reaction vessel. Here we introduce optimal procedure, reaction conditions, and samples/reactants size for calcium carbonate-phosphoric acid reaction and also provide the details for extracting, purifying and collecting $CO_2$ gas out of the reaction vessel. The measurements for ${\delta}^{18}O$ and ${\delta}^{13}C$ of $CO_2$ were performed at Seoul National University using a stable isotope ratio mass spectrometer (VG Isotech, SIRA Series II) operated in dual-inlet mode. The entire analysis precisions for ${\delta}^{18}O$ and ${\delta}^{13}C$ were evaluated based on the standard deviations of multiple measurements on 15 separate samples of purified $CO_2$. The pure $CO_2$ samples were taken from 100-mg aliquots of a solid calcium carbonate (Solenhofen-ori $CaCO_3$) during 8-day experimental period. The multiple measurements yielded the $1{\sigma}$ precisions of ${\pm}0.01$‰ for ${\delta}^{13}C$ and ${\pm}0.05$‰ for ${\delta}^{18}O$, comparable to the internal instrumental precisions of SIRA. Therefore, we conclude the method proposed in this study can serve as a way to produce an accurate secondary and/or laboratory $CO_2$ standard gas. We hope this study helps resolve difficulties in placing a laboratory working standard onto the international isotope scales and does make accurate comparisons with other data sets from other groups.