• Title/Summary/Keyword: 피어슨 상관관계

Search Result 349, Processing Time 0.031 seconds

User Simility Measurement Using Entropy and Default Voting Prediction in Collaborative Filtering (엔트로피와 Default Voting을 이용한 협력적 필터링에서의 사용자 유사도 측정)

  • 조선호;김진수;이정현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.115-117
    • /
    • 2001
  • 기존의 인터넷 웹사이트에서는 사용자의 만족을 극대화시키기 위하여 사용자별로 개인화 된 서비스를 제공하는 협력적 필터링 방식을 적용하고 있다. 협력적 필터링 기술은 사용자의 취향에 맞는 아이템을 예측하여 추천하며, 비슷한 선호도를 가진 다른 사용자들과의 상관관계를 구하기 위하여 일반적으로 피어슨 상관계수를 많이 이용한다. 그러나, 피어슨 상관계수를 이용한 방법은 사용자가 평가를 한 아이템이 있을 때에만 상관관계를 구할 수 있다는 단점과 예측의 정확성이 떨어진다는 단점을 가지고 있다. 따라서, 본 논문에서는 피어슨 상관관계 기반 예측 기법을 보완하여 보다 정확한 사용자 유사도를 구하는 방법을 제안한다. 제안된 방법에서는 사용자들을 대상으로 사용자가 평가를 한 아이템의 선호도를 사용해서 엔트로피를 적용하였고, 사용자가 선호도를 표시하지 않은 상품에 대해서는 Default Voting 방법을 이용하여 보다 정확한 헙력적 필터링 방식을 구현하였다.

  • PDF

Statistical Analysis of Experimental Results on Emission Characteristics of Biodiesel Blended Fuel (바이오디젤 혼합연료의 배기특성 실험결과에 대한 통계학적 해석)

  • Yeom, Jeong Kuk;Yoon, Jeong Hwan
    • Transactions of the Korean Society of Mechanical Engineers A
    • /
    • v.39 no.12
    • /
    • pp.1199-1206
    • /
    • 2015
  • In this study, the exhaust gas of a diesel engine operating on biodiesel(BD) fuel(a mixture of diesel and soybean oil) was investigated for different fuel mixing ratios in the range of BD3 to BD100. The experiments were conducted using injection pressures of 400, 600, 800, 1000, and 1200 bar. The Pearson correlation coefficient and Spearman rank-order correlation coefficient were used to quantify the NOx and Soot emissions based on the fuel mixing ratio and injection pressure. Consequently, the Pearson correlation coefficient obtained for NOx and Soot emissions according to the mixing ratio and injection pressure was -0.811 and the corresponding Spearman rank-order correlation coefficient was -0.884, which indicated that the correlation of the NOx and Soot emissions was linear. Thus, the NOx and Soot have a trade-off relationship. Moreover, at each injection pressure, the Pearson correlation coefficient was a negative number, which indicated an inversely proportional relationship between NOx and Soot.

A comparison of bibliometric indicators using Pearson's correlation (피어슨 상관분석을 이용한 계량서지 지수 비교)

  • Son, Gyeong-Mi;Lee, Yong-Gu
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2015.08a
    • /
    • pp.29-32
    • /
    • 2015
  • 연구자의 연구 성과와 저널의 영향력을 평가 할 수 있는 계량서지 지수는 매우 중요하다. 하지만 이들은 특징이 모두 다르기 때문에 저널을 선택할 때 여러 가지 지수를 함께 고려할 필요가 있다. 이를 위해 본 연구에서는 피어슨 상관분석을 통해 각 지수들을 비교 분석하여 이들 간의 관계를 보여주고자 한다. 이를 위해 상관 분석을 주제와 Article Influence Score(AIS) 순위에 따라 수행하였다. Total Cites와 Eigenfactor Score, Article influence Score와 5-Year Impact Factor의 상관분석 결과를 주제에 따른 평균값으로 살펴보았을 때, 이들은 매우 높은 상관관계가 있었다. 또한 Article influence Score와 5-Year Impact Factor의 경우, 모든 주제에서 AIS 순위에 따른 상위 25% 구간에서 두 지수 간에 상관관계가 매우 높은 것으로 나타났다.

  • PDF

Classification of Cancer-related Gene Expression Data Using Neural Network Classifiers (신경망 분류기를 이용한 암 관련 유전자 발현정보를 분류)

  • 권영준;류중원;조성배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.295-297
    • /
    • 2001
  • 최근 생물 유전자 정보를 효과적으로 분석하기 위한 적절한 도구의 필요성이 대두되고 있다. 본 논문에서는 백혈병 환자의 골수로부터 얻어낸 DNA Microarray 유전 정보를 분류하여 환자가 가지고 있는 암의 종류를 예측하기 위한 최적의 특징추출방법과 분류 방법을 찾고자 한다. 이를 위해 피어슨 상관관계, 유클리디안 거리, 코사인 계수, 스피어맨 상관관계, 정보 이득, 상호 정보, 신호 대잡음비의 7가지 특징 추출 방법을 사용하였으며, 역전과 신경망, 의사결정 트리, 구조 적응형 자기구성 지도, $textsc{k}$-최근접 이웃 등 가지의 기계학습 분류기를 이용하여 분류 실험을 하였다. 실험결과, 피어슨 상관관계와 역전파 신경망을 이용한 분류 방법이 97.1%의 인식률을 보임을 알 수 있었다.

  • PDF

Correlation analysis of traffic and crack in concrete lining (교통량과 콘크리트 라이닝 균열 상관관계 분석)

  • Gyu-Phil Lee
    • Journal of Korean Tunnelling and Underground Space Association
    • /
    • v.25 no.5
    • /
    • pp.345-355
    • /
    • 2023
  • An analysis of covariance and Pearson correlation coefficient were performed to identify the relationship between both variables: traffic volume and crack. For this, it was carried out to analyse 216 tunnel inspection/diagnosis results with respect to the traffic. As a result, it has been proven that traffic volume and cracks in concrete linings are highly correlated. Therefore, it is recommended to consider traffic volume in planning of preemptive maintenance such as crack repair, etc.

Enumeration of Weissella cibaria phage with cytometry, epifluorescence microscopy, and plaque assay (유세포분석기, 형광현미경, 용균반검사 분석을 이용한 Weissella cibaria 박테리오파지 정량분석 및 상관관계분석)

  • Park, Won Jeong;Lim, Ga-Yeon;Park, Jong-Hyun
    • Korean Journal of Food Science and Technology
    • /
    • v.50 no.2
    • /
    • pp.244-247
    • /
    • 2018
  • Quantitative analysis for non-host infection bacteriophage was conducted for their enumeration. Flow cytometry and epifluorescence microscopy (EPM) were selected as counting methods. Correlation analysis was performed based on the plaque assay method on the existing host infection and consisted of Pearson correlation statistical analysis, regression analysis, and difference analysis. Analyses of 12 samples with flow cytometry and plaque assay methods showed that there was a correlation of 96.7% with Pearson correlation value r=0.967, $R^2$ 0.9352, and difference value of 1.063. Analyses of 12 samples with EPM and plaque assay methods showed that there was a correlation of 99.0% with Pearson correlation value r=0.990, $R^2$ 0.9811, and difference value of 1.605. Therefore, flow cytometry and epifluorescence microscopy would be effective for enumeration of Weissella cibaria bacteriophage with plaque assay.

Secure Multi-Party Computation of Correlation Coefficients (상관계수의 안전한 다자간 계산)

  • Hong, Sun-Kyong;Kim, Sang-Pil;Lim, Hyo-Sang;Moon, Yang-Sae
    • Journal of KIISE
    • /
    • v.41 no.10
    • /
    • pp.799-809
    • /
    • 2014
  • In this paper, we address the problem of computing Pearson correlation coefficients and Spearman's rank correlation coefficients in a secure manner while data providers preserve privacy of their own data in distributed environment. For a data mining or data analysis in the distributed environment, data providers(data owners) need to share their original data with each other. However, the original data may often contain very sensitive information, and thus, data providers do not prefer to disclose their original data for preserving privacy. In this paper, we formally define the secure correlation computation, SCC in short, as the problem of computing correlation coefficients in the distributed computing environment while preserving the data privacy (i.e., not disclosing the sensitive data) of multiple data providers. We then present SCC solutions for Pearson and Spearman's correlation coefficients using secure scalar product. We show the correctness and secure property of the proposed solutions by presenting theorems and proving them formally. We also empirically show that the proposed solutions can be used for practical applications in the performance aspect.

Effect of Adding Freeze-Dried Kimchi Powder on Flavor and Taste of Kimchi Snacks (동결김치분말을 첨가한 스낵류의 맛과 품질에 미치는 영향)

  • Cho, Yong-Bum;Park, Woo-Po;Hur, Min-Su;Lee, Yang-Bong
    • Korean Journal of Food Science and Technology
    • /
    • v.36 no.6
    • /
    • pp.919-923
    • /
    • 2004
  • Effects of adding 0, 2, 4, 6, and 8% freeze-dried kimchi powder (FDKP) on kimchi snack quality were examined. Headspace volatile compounds of 4% FDKP snack, receiving highest overall preference in sensory evaluation results, were analyzed, and 26 compounds were identified, including 13 aldehydes, 3 sulfides, a ketone, an acid, a terpene, and 7 other compounds. Pearson correlation analyses were carried out to determine a correlation between the concentration of FDKP and the amount of each volatile compound. Acetaldehyde, propanal, dimethyl sulfide, dimethyl disulfide, acetic acid, and d-limonene showed correlation coefficients above 0.90; selective ion move (SIM) analysis also showed above 0.97 for highly correlated compounds. Results suggest that these compounds can be used as indicators fur kimchi flavor of FDKP snack.

Assessment of National Groundwater Monitoring wells for River Level using Variation Types (국가 지하수 관측정의 지하수위를 활용한 하천수위 변화 평가방법)

  • Jeon, Ju Young;Jun, Sang Mi;Park, Jae Hyeon;Park, Chang Kun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2016.05a
    • /
    • pp.127-127
    • /
    • 2016
  • 지난 수년간 4대강 살리기 사업으로 해당 하천은 16개 보로 막혔고 이로 인해 하천수위는 과거 대비 보상류지역은 높아지고 보 하류지역은 낮아졌다. 이에 따라 수문학적 관점에서 기존의 지표수-지하수 연계 특성에 많은 변화가 발생하였다. 이러한 특성 변화 등을 관측하기 위하여 4대강 사업 전, 후로 주요하천 주변 제내지에 지하수 관측정이 설치되었다. 본 연구에서는 4대강 주변 관측정을 대상으로 각 관측정의 지하수위와 지하수위 영향인자들 간의 상관관계를 분석하고, 관측정의 주요영향인자를 판단할 수 있는 지하수 관측정 평가방법을 제시하였다. 각 인자별 상관관계 분석은 피어슨 상관계수를 이용하였으며, 관측정 수위와 주요 영향인자(하천수위, 강우량)의 피어슨 상관계수가 0.7 이상이면 상관성이 높은 것으로 평가하였다. 낙동강 하천 주변 30개소 관측정에 적용한 결과, 10개소는 지하수위와 하천수위와의 상관계수가 0.70~0.93로 상관도가 높은 것으로 평가되었고, 20개소는 지하수와 하천수위와의 상관계수, 지하수와 강우량과의 상관계수 모두 낮은 것으로 분석되었다. 본 연구 결과는 대상 관측정의 모니터링 지속여부 결정, 목적에 맞는 대체 관측정 설치 등 향후 관측정들의 효율적이고 합리적인 관리를 위한 기초자료로 활용할 수 있을 것으로 판단된다.

  • PDF

Improvement on Similarity Calculation in Collaborative Filtering Recommendation using Demographic Information (인구 통계 정보를 이용한 협업 여과 추천의 유사도 개선 기법)

  • 이용준;이세훈;왕창종
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.9 no.5
    • /
    • pp.521-529
    • /
    • 2003
  • In this paper we present an improved method by using demographic information for overcoming the similarity miss-calculation from the sparsity problem in collaborative filtering recommendation systems. The similarity between a pair of users is only determined by the ratings given to co-rated items, so items that have not been rated by both users are ignored. To solve this problem, we add virtual neighbor's rating using demographic information of neighbors for improving prediction accuracy. It is one kind of extentions of traditional collaborative filtering methods using the peason correlation coefficient. We used the Grouplens movie rating data in experiment and we have compared the proposed method with the collaborative filtering methods by the mean absolute error and receive operating characteristic values. The results show that the proposed method is more efficient than the collaborative filtering methods using the pearson correlation coefficient about 9% in MAE and 13% in sensitivity of ROC.