• 제목/요약/키워드: Spearman correlation coefficients

검색결과 135건 처리시간 0.028초

상관계수의 안전한 다자간 계산 (Secure Multi-Party Computation of Correlation Coefficients)

  • 홍선경;김상필;임효상;문양세
    • 정보과학회 논문지
    • /
    • 제41권10호
    • /
    • pp.799-809
    • /
    • 2014
  • 본 논문에서는 분산 컴퓨팅 환경에서 데이터 제공자들이 각자 소유한 데이터의 프라이버시는 보호하면서도 피어슨(Pearson) 상관계수와 스피어만(Spearman)의 순위상관계수를 안전하게 계산하는 해결책을 각각 제안한다. 분산 컴퓨팅 환경에서 마이닝(또는 데이터 분석)을 수행하기 위해서는 원본 데이터를 상대방에게 제공해야 한다. 그러나, 원본 데이터는 민감한 정보를 포함하는 경우가 많고, 이때 데이터 제공자(소유자)는 프라이버시 보호를 이유로 정확한 값을 직접 노출하기를 원하지 않는다. 본 논문에서는 분산 컴퓨팅 환경의 데이터 제공자들이 각자 소유한 데이터는 상대방에게 공개하지 않으면서 상관관계를 계산하는 문제, 즉 안전한 상관관계 계산(SCC: Secure Correlation Computation) 문제를 정형적으로 정의한다. 그리고, 임의 행렬 기반 안전한 스칼라 곱을 사용하여 피어슨 상관계수와 순위상관계수에 대한 SCC 문제를 해결하는 방법을 각각 제안한다. 제안한 해결책이 바르게 수행함을 보이기 위해, 정확성과 안전성을 정리로 제시하고 증명한다. 또한, 실험을 통해 제안한 기법이 수행 시간 측면에서도 실용적인 방법임을 보인다.

스피어만 상관계수를 이용한 디지털 융합 강의 전략 시스템 (Digital Convergence Teaching Strategy System using Spearman Correlation Coefficients)

  • 이병욱
    • 인터넷정보학회논문지
    • /
    • 제11권6호
    • /
    • pp.111-122
    • /
    • 2010
  • 디지털 융합을 위한 교육은 다양한 학문과 기술들이 컴퓨터를 중심으로 융합하는 것이므로 교육 범위와 방법이 매우 상이하다. 따라서 교육 계획과 강의전략을 정형화하기 어렵기 때문에 개념적인 정보를 제한적으로 추천하는 문제점이 있다. 본 논문에서는 스피어만 상관 계수를 이용하여 교육 계획과 강의 전략을 제시하기 위한 시스템을 제안한다. 이 시스템은 학계와 산업계의 요구를 기반으로 한 정보로부터 강의 전략 연관성을 찾아 서열화하고, 사용자의 상황과 특성에 적합한 강의 전략 정보를 목록으로 제공하여, 제한적인 개념적 정보 추천의 단점을 해결한다. 성능 실험은 기존의 서비스 시스템들과 비교하여 효과성을 측정하여 정확도와 재현율로 표현하였으며, 성능 실험 결과 정확도는 90.4%, 재현율은 77.6%로 나타났다.

텍스트 유사성을 위한 파라미터 및 비 파라미터 측정 (Parametric and Non Parametric Measures for Text Similarity)

  • 존 믈랴히루;김종남
    • 융합신호처리학회논문지
    • /
    • 제20권4호
    • /
    • pp.193-198
    • /
    • 2019
  • 인터넷상에서의 진짜 및 가짜 정보의 범람이 수많은 텍스트 분석에 대한 연구를 이끌었다. 문헌 표기 없이 타인의 저작물을 무단 복제 및 관련 없는 연구결과 조작 등이 한동안 세간의 주목을 이끌었다. 연구 분야에서 표절과 이의 대항 및 감소를 위해 다양한 도구들이 개발되었다. Pearson Spearman 본 연구에서는 코사인 유사성과 및 상관관계를 이용하는 파라미터 및 비 파라미터 방법을 이용하여 문장 유사성을 측정한다. Pearson 코사인 유사성과 상관관계는 가장 높은 유사성 계수를 얻었으나 Spearman 상관관계는 낮은 유사성 계수를 보여주었다. 본 논문에서는 정상성 가정과 편향성에 의존하는 파라미터 방법들에 반하도록 비정상성 가정으로 인한 문장 유사도를 측정하는 데 있어 비 파라미터 방법들을 사용하는 것을 제안한다.

Reproducibility of a food frequency questionnaire: Korea Nurses' Health Study

  • Song, Sihan;Kim, Bohye;Pang, Yanghee;Kim, Oksoo;Lee, Jung Eun
    • Nutrition Research and Practice
    • /
    • 제16권1호
    • /
    • pp.106-119
    • /
    • 2022
  • BACKGROUND/OBJECTIVES: This study aimed to examine the reproducibility of food frequency questionnaires (FFQs) designed for young female nurses in the Korea Nurses' Health Study. SUBJECTS/METHODS: The reproducibility of web-based, self-administered FFQs was evaluated among 243 Korean female nurses. The first FFQ (FFQ1) was administered from March 2014 to February 2019 and the second FFQ (FFQ2) from November 2019, with a mean interval of 2.8 years between the FFQs (range, 9 months-5.6 years). Pearson and Spearman correlation coefficients (r values) and quartile agreements between FFQ1 and FFQ2 were calculated for intakes of energy, nutrients, and foods. RESULTS: Pearson correlation coefficients ranged from 0.41 to 0.55 (median r = 0.51) for energy and raw nutrients and from 0.16 to 0.46 (median r = 0.36) for energy-adjusted nutrients. Spearman correlation coefficients ranged from 0.25 to 0.72 (median r = 0.41) for food items. The percentages of women who were classified into the same or adjacent quartile were 77% to 84% (median = 82%) for raw nutrients and 69% to 86% (median = 78%) for foods. CONCLUSIONS: The results indicated that the web-based FFQ used in the Korea Nurses' Health Study has acceptable reproducibility.

스피어만 장관계수를 이용한 사용자 상황 및 특성 처리 개선 (Improvement of User's Context Aware and Characteristic Process using spearman correlation coefficients)

  • 안찬식;오상엽
    • 한국멀티미디어학회논문지
    • /
    • 제13권10호
    • /
    • pp.1444-1452
    • /
    • 2010
  • CRUMPET과 같은 모바일 단말기 서비스 시스템은 사용자의 상황과 특성이 사용자마다 서로 달라 정보가 매우 적고 이 또한 연관성을 찾기가 매우 어렵다. 사용자의 상황과 특성에 따른 정보 선호도를 제공하기 힘든 단점과 사용자가 원하는 정확한 정보를 추천하기 어렵기 때문에 개념적인 정보를 제한적으로 추천한다. 따라서 본 논문에서는 스피어만 상관 계수를 이용하여 사용자 상황과 특성에 적합한 정보를 추천하는 시스템을 제안하였다. 사용자 정보로부터 연관성을 찾아 서열화하고 사용자의 상황과 특성에 적합한 정보를 목록으로 제공하여 제한적인 개념적 정보 추천의 단점을 해결하였다. 성능 실험은 기존의 서비스 시스템들과 비교하여 효과성인 정확도와 재현율로 측정하였으며, 성능 실험 결과 정확도는 92.3%, 재현율은 73.8%로 나타났다.

Correlation Analysis of General Parameters and Metals in the Lake Sediments of Geum River Basin

  • Lee, Jun-Bae;Cho, Yoon-Hae;Huh, In-Ae;Khan, Jong-Beom;Oh, Da-Yeon;Yang, Yoon-Mo;Gil, Gi-Beom;Lee, Soo-Hyung;Cheon, Se-Yeok;Lee, Bo-Mi
    • 한국토양비료학회지
    • /
    • 제50권6호
    • /
    • pp.684-696
    • /
    • 2017
  • An investigation of grain size, organic compounds and metal distribution in lakes from Geum river basin (Republic of Korea) was conducted in two years (2014 and 2015). The samples of sediment were collected from the 3 lakes (12 sites). The samples were analyzed the concentration of metals (Pb, Zn, Cu, Cr, Ni, As, Cd, Hg, Al, and Li) and general indices including grain size. Spearman correlation coefficients were determined using general indices and metal concentrations respectively. The organic qualities of sediments were improved in 2015 compared with 2014. The concentrations of metals were lower than Sediment Criteria of Lakes in Korea. The significant Spearman correlation coefficients were presented only sand-clay, clay-water content, COD-TOC, Cu-Ni, Cd-Li, Zn-Li, and Cr-Ni of general and metal parameters in 2014, 2015 and both of two years.

온톨로지 기술과 스피어만 상관계수를 적용한 시맨틱 정보 검색 향상 (Improvement of the Semantic Information Retrieval using Ontology and Spearman Correlation Coefficients)

  • 이병욱
    • 디지털융복합연구
    • /
    • 제11권11호
    • /
    • pp.351-357
    • /
    • 2013
  • 질의 키워드의 정보 검색은 키워드의 의미가 다양하여 검색된 문서들이 사용자의 요구에 부합되지 않는 문제점을 가지며, 사용자의 상황과 특성이 사용자 마다 달라 정보가 매우 적고 연관성을 찾기 어렵다. 또한, 일반 상관 계수의 사용은 정보에 대한 연관성을 나타내지 못하는 문제가 있다. 본 연구에서는 시맨틱 웹 기술을 기반으로 인선에 필요한 다양한 개념들과 지식으로 구성된 인선 온톨로지와 인선 규칙들을 구축하고 규칙들을 지원하는 인선 절차와 인선 결과의 적합성을 확인할 수 있는 지식검색 시스템을 제안한다. 제안된 시스템에서는 스피어만 상관계수를 이용하여 사용자의 상황과 특성에 적합한 정보를 제공하여 제한적인 정보 추천의 단점을 해결하였다. 키워드 기반 검색과 시맨틱 기반 검색 실험 결과 시맨틱 기반 검색이 키워드 검색에 비하여 정확도는 90.3%, 재현율은 71.8%의 성능을 보였다.

성인의 식이섭취 조사를 위한 반정량 식품섭취빈도조사지의 타당도 연구 -건강증진센터 내원 성인을 대상으로 - (A Study on Validity of a Semi-Quantitative Food Frequency Questionnaire for Korean Adults)

  • 심지선;오경원;서일;김미양;손춘영;이은주;남정모
    • 대한지역사회영양학회지
    • /
    • 제7권4호
    • /
    • pp.484-494
    • /
    • 2002
  • This study was conducted to validate the semi-quantitative food frequency questionnaire that was developed to assess the intakes of fatty acids, as well as energy, carbohydrates, fat, protein, minerals and vitamins in Korean adults. The validity of the semi-quantitative food frequency questionnaire was tested on 78 subjects (31 men,47 women) aged 34 to 66 years. The semi-quantitative food frequency questionnaire included 93 food items and was validated on two 3-day dietary records. The mean intakes and the Spearman Correlation Coefficients between the semi-quantitative food frequency questionnaire and the two 3-day dietary records were analyzed for each nutrient and food group level. The mean nutrient intakes obtained from the semi-quantitative food frequency questionnaire were estimated to be greater than those of the two 3-day dietary records. The Spearman Correlation Coefficients between the energy-adjusted nutrient intakes from the semi-quantitative food frequency questionnaire and the two 3-day dietary records ranged from 0.24 for polyunsaturated fatty acids to 0.55 for fat in men and from 0.29 for polyunsaturated fatty acids to 0.55 for saturated fatty acids in women, respectively. The Spearman Correlation Coefficients for food intake ranged from 0.11 for teas and beverages to 0.58 for grains and their products in men,-0.04 for potatoes and starches to 0.73 for milk and dairy products in women. Foods consumed regularly had lower intra-person variation and tended to have higher observed correlation coefficients. These results indicate that the semi-quantitative food frequency questionnaire is a useful tool for estimating nutrient intakes, particularly of total fat and saturated fatty acid intakes.

디젤엔진에서 바이오디젤의 배기가스 특성 평가 (Estimation of the Exhaust Characteristics of Biodiesel Used in Diesel Engine)

  • 백석흠;윤정환;정우성;하형수;정성식;염정국
    • 대한기계학회논문집B
    • /
    • 제38권2호
    • /
    • pp.129-137
    • /
    • 2014
  • 본 연구에서는 바이오디젤연료 혼합비변화에 대한 디젤엔진의 배기특성에 대해 조사하였다. 실험에 사용된 연료는 경유와 바이오디젤(폐식용유) 혼합연료 BD3, BD5, BD20, BD50 및 BD100을 사용하였으며, 실험변수로서 분사압력(${\Delta}p_{inj}$)을 400bar, 600bar, 800bar, 1000bar 및 1200bar로 설정하였다. 분사압력과 바이오디젤 혼합연료 혼합비에 따른 정량적인 NOx와 Soot의 배기특성 해석을 위하여 통계학에 기초한 피어슨 상관계수와 스피어만 상관계수의 개념을 도입하였다. 본 연구의 결과로서 실험 조건 전체에 대한 피어슨 상관계수는 -0.732, 스피어만 상관계수는 -0.724로 NOx와 Soot 발생의 상관관계가 선형적이다. 특히 분사압력 800bar 조건에서 피어슨 상관계수가 -0.089으로 NOx와 Soot 배출량 상관관계가 0에 가깝기 때문에, 바이오디젤 연료 혼합비 제어를 통한 NOx와 Soot의 동시저감이 가능하다고 판단된다.

Validity and Reliability of a Dish-based, Semi-quantitative Food Frequency Questionnaire for Korean Diet and Cancer Research

  • Park, Min-Kyung;Noh, Hwa-Young;Song, Na-Yeun;Paik, Hee-Young;Park, So-Hee;Joung, Hyo-Jee;Song, Won-O;Kim, Jeong-Seon
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제13권2호
    • /
    • pp.545-552
    • /
    • 2012
  • This study evaluated the validity and reliability of applying a newly developed dish-based, semi-quantitative food frequency questionnaire (FFQ) for Korean diet and cancer research. The subjects in the present study were 288 Korean adults over 30 years of age who had completed two FFQs and four 3-day diet records (DRs) from May 2008 to February 2009. Student's t-tests, Chi-square tests, and Spearman's rank correlation coefficients were used to estimate and compare intakes from different dietary assessment tools. Agreement in quintiles was calculated to validate agreement between the results of the second FFQ (FFQ-2) conducted in February 2009 and the DRs. Median Spearman's correlation coefficients between the intake of nutrients and foods assessed by the FFQ-1 and FFQ-2 were 0.59 and 0.57, respectively, and the coefficients between the intake of nutrients and foods assessed by the FFQ-2 and the DRs were 0.31 and 0.29, respectively. The quintile classifications of same or adjacent quintile for intake of nutrients and foods were 64% and 65%, respectively. Misclassification into opposite quintiles occurred in less than 5% for all dietary factors. Thus this newly-developed, Korean dish-based FFQ demonstrated moderate correspondence with the four 3-day DRs. Its reliability and validity are comparable to those reported in other studies.