• Title/Summary/Keyword: 피어슨 상관도

Search Result 472, Processing Time 0.026 seconds

User Simility Measurement Using Entropy and Default Voting Prediction in Collaborative Filtering (엔트로피와 Default Voting을 이용한 협력적 필터링에서의 사용자 유사도 측정)

  • 조선호;김진수;이정현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.115-117
    • /
    • 2001
  • 기존의 인터넷 웹사이트에서는 사용자의 만족을 극대화시키기 위하여 사용자별로 개인화 된 서비스를 제공하는 협력적 필터링 방식을 적용하고 있다. 협력적 필터링 기술은 사용자의 취향에 맞는 아이템을 예측하여 추천하며, 비슷한 선호도를 가진 다른 사용자들과의 상관관계를 구하기 위하여 일반적으로 피어슨 상관계수를 많이 이용한다. 그러나, 피어슨 상관계수를 이용한 방법은 사용자가 평가를 한 아이템이 있을 때에만 상관관계를 구할 수 있다는 단점과 예측의 정확성이 떨어진다는 단점을 가지고 있다. 따라서, 본 논문에서는 피어슨 상관관계 기반 예측 기법을 보완하여 보다 정확한 사용자 유사도를 구하는 방법을 제안한다. 제안된 방법에서는 사용자들을 대상으로 사용자가 평가를 한 아이템의 선호도를 사용해서 엔트로피를 적용하였고, 사용자가 선호도를 표시하지 않은 상품에 대해서는 Default Voting 방법을 이용하여 보다 정확한 헙력적 필터링 방식을 구현하였다.

  • PDF

Statistical Analysis of Experimental Results on Emission Characteristics of Biodiesel Blended Fuel (바이오디젤 혼합연료의 배기특성 실험결과에 대한 통계학적 해석)

  • Yeom, Jeong Kuk;Yoon, Jeong Hwan
    • Transactions of the Korean Society of Mechanical Engineers A
    • /
    • v.39 no.12
    • /
    • pp.1199-1206
    • /
    • 2015
  • In this study, the exhaust gas of a diesel engine operating on biodiesel(BD) fuel(a mixture of diesel and soybean oil) was investigated for different fuel mixing ratios in the range of BD3 to BD100. The experiments were conducted using injection pressures of 400, 600, 800, 1000, and 1200 bar. The Pearson correlation coefficient and Spearman rank-order correlation coefficient were used to quantify the NOx and Soot emissions based on the fuel mixing ratio and injection pressure. Consequently, the Pearson correlation coefficient obtained for NOx and Soot emissions according to the mixing ratio and injection pressure was -0.811 and the corresponding Spearman rank-order correlation coefficient was -0.884, which indicated that the correlation of the NOx and Soot emissions was linear. Thus, the NOx and Soot have a trade-off relationship. Moreover, at each injection pressure, the Pearson correlation coefficient was a negative number, which indicated an inversely proportional relationship between NOx and Soot.

A comparison of bibliometric indicators using Pearson's correlation (피어슨 상관분석을 이용한 계량서지 지수 비교)

  • Son, Gyeong-Mi;Lee, Yong-Gu
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2015.08a
    • /
    • pp.29-32
    • /
    • 2015
  • 연구자의 연구 성과와 저널의 영향력을 평가 할 수 있는 계량서지 지수는 매우 중요하다. 하지만 이들은 특징이 모두 다르기 때문에 저널을 선택할 때 여러 가지 지수를 함께 고려할 필요가 있다. 이를 위해 본 연구에서는 피어슨 상관분석을 통해 각 지수들을 비교 분석하여 이들 간의 관계를 보여주고자 한다. 이를 위해 상관 분석을 주제와 Article Influence Score(AIS) 순위에 따라 수행하였다. Total Cites와 Eigenfactor Score, Article influence Score와 5-Year Impact Factor의 상관분석 결과를 주제에 따른 평균값으로 살펴보았을 때, 이들은 매우 높은 상관관계가 있었다. 또한 Article influence Score와 5-Year Impact Factor의 경우, 모든 주제에서 AIS 순위에 따른 상위 25% 구간에서 두 지수 간에 상관관계가 매우 높은 것으로 나타났다.

  • PDF

Secure Multi-Party Computation of Correlation Coefficients (상관계수의 안전한 다자간 계산)

  • Hong, Sun-Kyong;Kim, Sang-Pil;Lim, Hyo-Sang;Moon, Yang-Sae
    • Journal of KIISE
    • /
    • v.41 no.10
    • /
    • pp.799-809
    • /
    • 2014
  • In this paper, we address the problem of computing Pearson correlation coefficients and Spearman's rank correlation coefficients in a secure manner while data providers preserve privacy of their own data in distributed environment. For a data mining or data analysis in the distributed environment, data providers(data owners) need to share their original data with each other. However, the original data may often contain very sensitive information, and thus, data providers do not prefer to disclose their original data for preserving privacy. In this paper, we formally define the secure correlation computation, SCC in short, as the problem of computing correlation coefficients in the distributed computing environment while preserving the data privacy (i.e., not disclosing the sensitive data) of multiple data providers. We then present SCC solutions for Pearson and Spearman's correlation coefficients using secure scalar product. We show the correctness and secure property of the proposed solutions by presenting theorems and proving them formally. We also empirically show that the proposed solutions can be used for practical applications in the performance aspect.

Correlation analysis of traffic and crack in concrete lining (교통량과 콘크리트 라이닝 균열 상관관계 분석)

  • Gyu-Phil Lee
    • Journal of Korean Tunnelling and Underground Space Association
    • /
    • v.25 no.5
    • /
    • pp.345-355
    • /
    • 2023
  • An analysis of covariance and Pearson correlation coefficient were performed to identify the relationship between both variables: traffic volume and crack. For this, it was carried out to analyse 216 tunnel inspection/diagnosis results with respect to the traffic. As a result, it has been proven that traffic volume and cracks in concrete linings are highly correlated. Therefore, it is recommended to consider traffic volume in planning of preemptive maintenance such as crack repair, etc.

Assessment of National Groundwater Monitoring wells for River Level using Variation Types (국가 지하수 관측정의 지하수위를 활용한 하천수위 변화 평가방법)

  • Jeon, Ju Young;Jun, Sang Mi;Park, Jae Hyeon;Park, Chang Kun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2016.05a
    • /
    • pp.127-127
    • /
    • 2016
  • 지난 수년간 4대강 살리기 사업으로 해당 하천은 16개 보로 막혔고 이로 인해 하천수위는 과거 대비 보상류지역은 높아지고 보 하류지역은 낮아졌다. 이에 따라 수문학적 관점에서 기존의 지표수-지하수 연계 특성에 많은 변화가 발생하였다. 이러한 특성 변화 등을 관측하기 위하여 4대강 사업 전, 후로 주요하천 주변 제내지에 지하수 관측정이 설치되었다. 본 연구에서는 4대강 주변 관측정을 대상으로 각 관측정의 지하수위와 지하수위 영향인자들 간의 상관관계를 분석하고, 관측정의 주요영향인자를 판단할 수 있는 지하수 관측정 평가방법을 제시하였다. 각 인자별 상관관계 분석은 피어슨 상관계수를 이용하였으며, 관측정 수위와 주요 영향인자(하천수위, 강우량)의 피어슨 상관계수가 0.7 이상이면 상관성이 높은 것으로 평가하였다. 낙동강 하천 주변 30개소 관측정에 적용한 결과, 10개소는 지하수위와 하천수위와의 상관계수가 0.70~0.93로 상관도가 높은 것으로 평가되었고, 20개소는 지하수와 하천수위와의 상관계수, 지하수와 강우량과의 상관계수 모두 낮은 것으로 분석되었다. 본 연구 결과는 대상 관측정의 모니터링 지속여부 결정, 목적에 맞는 대체 관측정 설치 등 향후 관측정들의 효율적이고 합리적인 관리를 위한 기초자료로 활용할 수 있을 것으로 판단된다.

  • PDF

Enumeration of Weissella cibaria phage with cytometry, epifluorescence microscopy, and plaque assay (유세포분석기, 형광현미경, 용균반검사 분석을 이용한 Weissella cibaria 박테리오파지 정량분석 및 상관관계분석)

  • Park, Won Jeong;Lim, Ga-Yeon;Park, Jong-Hyun
    • Korean Journal of Food Science and Technology
    • /
    • v.50 no.2
    • /
    • pp.244-247
    • /
    • 2018
  • Quantitative analysis for non-host infection bacteriophage was conducted for their enumeration. Flow cytometry and epifluorescence microscopy (EPM) were selected as counting methods. Correlation analysis was performed based on the plaque assay method on the existing host infection and consisted of Pearson correlation statistical analysis, regression analysis, and difference analysis. Analyses of 12 samples with flow cytometry and plaque assay methods showed that there was a correlation of 96.7% with Pearson correlation value r=0.967, $R^2$ 0.9352, and difference value of 1.063. Analyses of 12 samples with EPM and plaque assay methods showed that there was a correlation of 99.0% with Pearson correlation value r=0.990, $R^2$ 0.9811, and difference value of 1.605. Therefore, flow cytometry and epifluorescence microscopy would be effective for enumeration of Weissella cibaria bacteriophage with plaque assay.

Estimation of the Exhaust Characteristics of Biodiesel Used in Diesel Engine (디젤엔진에서 바이오디젤의 배기가스 특성 평가)

  • Baek, Seok Heum;Yoon, Jeong Hwan;Jung, Woo Sung;Ha, Hyeong Soo;Chung, Sung Sik;Yeom, Jeong Kuk
    • Transactions of the Korean Society of Mechanical Engineers B
    • /
    • v.38 no.2
    • /
    • pp.129-137
    • /
    • 2014
  • In this study, the characteristics of exhaust gas as a function of the biodiesel mixing ratio were investigated. Diesel and waste oil were used for preparing mixed fuel, and the ratios of the mixed fuel were varied in the BD3~BD100 range. The injection pressures(${\Delta}p_{inj}$) was considered as an experimental variable and was set to 400 bar, 600 bar, 800 bar, 1000 bar, and 1200 bar. Furthermore, for quantitatively analyzing the characteristics of exhaust gas(NOx and Soot), the concepts of Pearson correlation coefficient and Spearman rank-order correlation coefficient based on statistics were introduced. Consequently, it was found that the correlation of the emission of NOx and Soot is linear, and the Pearson and Spearman coefficients are -0.732 and -0.724, respectively, under all analysis conditions. Especially, for the injection pressure of 800 bar, a simultaneous reduction in NOx and Soot emission is possible by controlling the biodiesel mixing ratio. This is because the correlation coefficients of NOx and Soot emissions were nearly 0, as the Pearson correlation coefficient was -0.089.

Correlation Analysis Between Hydrolocgic and Ecologic Indices in the Han River Basin (한강유역의 수문지수와 생태지수 상관성 분석)

  • Kim, Siyeon;Lee, Jiwan;Jeon, Seol;Lee, Moonyoung;Jung, Wonwoo;Jung, Kichul;Kim, Seongjoon;Park, Daeryong
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2021.06a
    • /
    • pp.440-440
    • /
    • 2021
  • 본 연구에서는 다양한 수문지수와 생태지수간의 상관성 분석을 통해 하천의 유량이 하천 생태계와 하천 건강성에 어떤 영향을 끼치는지 분석했다. 수문지수는 각 유역의 유량 자료를 이용하여 구하였다. 각 유역의 평균 일일 유량, 평균 월 유량, 일 중앙 유량, 월 중앙 유량, 유량의 왜곡, 유량의 변동계수, 유량 빈도 등을 구하였다. 생태지수는 Benthic Macroinvertebrates Index (BMI)를 이용하였다. 피어슨 상관계수 분석(Pearson's correlation coefficient analysis)을 통해 수문지수와 생태지수 간의 상관성을 분석했다. 또한 Gaussian Process Regression(GPR) Model을 이용하여 수문지수와 유역의 지형적 특성을 이용한 회귀모형을 통해 미래의 BMI를 예측할 수 있었다. 각 수문지수별로 생태지수와 높은 상관성을 보이는 것과 낮은 상관성을 보이는 것을 확인할 수 있었다. GPR 모형을 이용하여 미래의 BMI의 값을 예측해 하천 건강성 평가로 이용될 수 있는 수문지수를 얻을 수 있었다. 본 연구를 통해서 수문학적 지수와 생태지수를 이용해 정량적으로 건강성을 평가할 수 있을 것으로 기대한다. 또한 GPR 모형을 통해 미래 생태지수의 값을 예측해보고 해당 연구 유역의 하천 건강을 위한 하나의 지표를 제안 할 수 있을 것으로 예상된다.

  • PDF

Classification of Cancer-related Gene Expression Data Using Neural Network Classifiers (신경망 분류기를 이용한 암 관련 유전자 발현정보를 분류)

  • 권영준;류중원;조성배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.295-297
    • /
    • 2001
  • 최근 생물 유전자 정보를 효과적으로 분석하기 위한 적절한 도구의 필요성이 대두되고 있다. 본 논문에서는 백혈병 환자의 골수로부터 얻어낸 DNA Microarray 유전 정보를 분류하여 환자가 가지고 있는 암의 종류를 예측하기 위한 최적의 특징추출방법과 분류 방법을 찾고자 한다. 이를 위해 피어슨 상관관계, 유클리디안 거리, 코사인 계수, 스피어맨 상관관계, 정보 이득, 상호 정보, 신호 대잡음비의 7가지 특징 추출 방법을 사용하였으며, 역전과 신경망, 의사결정 트리, 구조 적응형 자기구성 지도, $textsc{k}$-최근접 이웃 등 가지의 기계학습 분류기를 이용하여 분류 실험을 하였다. 실험결과, 피어슨 상관관계와 역전파 신경망을 이용한 분류 방법이 97.1%의 인식률을 보임을 알 수 있었다.

  • PDF