• 제목/요약/키워드: 피어슨 상관계수

검색결과 282건 처리시간 0.028초

사용자 기반과 아이템 기반 협업여과 추천기법에 관한 실증적 연구 (A Empirical Study on Recommendation Schemes Based on User-based and Item-based Collaborative Filtering)

  • 김예나;최인복;박태근;이재동
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.714-717
    • /
    • 2008
  • 협업여과 추천기법에는 사용자 기반 협업여과와 아이템 기반 협업여과가 있으며, 절차는 유사도 측정, 이웃 선정, 예측값 생성 단계로 이루어진다. 유사도 측정 단계에는 유클리드 거리(Euclidean Distance), 코사인 유사도(Cosine Similarity), 피어슨 상관계수(Pearson Correlation Coefficient) 방법 등이 있고, 이웃 선정 단계에는 상관 한계치(Correlation-Threshold), 근접 N 이웃(Best-N-Neighbors) 방법 등이 있다. 마지막으로 예측값 생성 단계에는 단순평균(Simple Average), 가중합(Weighted Sum), 조정 가중합(Adjusted Weighted Sum) 등이 있다. 이처럼 협업여과 추천기법에는 다양한 기법들이 사용되고 있다. 따라서 본 논문에서는 사용자 기반 협업여과와 아이템 기반 협업여과 추천기법에 사용되는 유사도 측정 기법과 예측값 생성 기법의 최적화된 조합을 알아보기 위해 성능 실험 및 비교 분석을 하였다. 실험은 GroupLens의 MovieLens 데이터 셋을 활용하였고 MAE(Mean Absolute Error)값을 이용하여 추천기법을 비교 하였다. 실험을 통해 유사도 측정 기법과 예측값 생성 기법의 최적화된 조합을 찾을 수 있었고, 사용자 기반 협업여과와 아이템 기반 협업여과의 성능비교를 통해 아이템 기반 협업여과의 성능이 보다 우수했음을 확인 하였다.

SPSS를 이용한 대기질과 기상인자와의 미세먼지 상관관계 분석 (Analysis of fine dust correlation between air quality and meteorological factors using SPSS)

  • 차진욱;김장영
    • 한국정보통신학회논문지
    • /
    • 제22권5호
    • /
    • pp.722-727
    • /
    • 2018
  • 현재까지 미세먼지에 대한 연구는 예측, 분석, 측정 등으로 나눠지는데, 주로 대기환경 분야에서 이루어져 왔다. 미세먼지는 대기질 인자와 기상인자 그리고 배출 등 여러가지 원인으로 인해 발생한다. 각 요소들이 미세먼지에 얼마나 많은 영향을 끼치는지 상관관계를 분석하는 것이 우선이라고 판단하였고, 이를 실험하였다. 이 상관 분석에는 기상청과 에어코리아를 통해 확보한 대기질 인자와 기상인자 데이터를 이용, IBM사의 SPSS라는 Tool을 사용하여 이루어졌다. 그 결과 각 대기질 인자와 기상인자들이 미세먼지 수치에 미치는 영향정도와 상관관계를 좀 더 명확하게 알 수 있었다. 본 논문에서는 미세먼지 수치와 영향요소 및 상관관계의 정확한 분석을 위해 상관분석 및 피어슨 상관계수로 결과를 나타낸다.

물리.화학적 및 효소적 방법에 의한 참돔(Pagrus major)의 품질판정 지표 설정

  • 심길보;정호진;여해경;배진한;김태진;조영제
    • 한국양식학회:학술대회논문집
    • /
    • 한국양식학회 2003년도 추계학술발표대회 논문요약집
    • /
    • pp.151-152
    • /
    • 2003
  • 물리ㆍ화학적 및 효소적 방법을 이용한 근육의 품질판정 지표로써 수분함량, 지질함량 그리고 콜라겐 함량등을 살펴보았으며, AEC 수치로써 건강도를 측정하고자 하였다. 즉, 이런 지표들을 이용하여 양식산 활어의 품질에 가장 큰 요인으로 작용하는 파괴강도와의 상관관계를 살펴보고자 하였다. 지금까지 조사된 양식산 활어성분 중 파괴강도가 어떠한 독립변수들에 의하여 크게 영향을 받으며, 파괴강도와 독립변수와의 관계식은 무엇인가를 규명하기 위하여 회귀분석을 실시하였다 여기서 독립변수로 사용된 것은 아래와 같다. X$_1$ : 수분함량(moisture content) X$_2$ : 지질함량(lipid content) X$_3$ : 콜라겐 함량(collagen content) 각 성분간의 상관관계를 피어슨 상관계수로 나타낸 것으로, 파괴강도와 수분 함량, 지질함량사이에는 상관성이 있으나(r=0.66, r=-0.69: p<0.05), 콜라겐의 함량과는 상관성을 가지지 못하였다. 또한, 콜라겐과 수분함량(r=0.19), 콜라겐과 지질함량(r=-0.29)로 각 성분간의 상관성이 존재하지 않았다. 그러므로, 파괴 강도값은 지질과 수분함량간의 상관관계가 형성된다. 즉, 수분함량이 크고 지질함량이 작아지면 파괴강도간은 커진다는 결론이다. 이 결과를 이용하여 파괴감도, 수분함량 그리고 지질함량간의 회귀분석을 실시한 결과 다음과 같다. Y = 0.74481 + 0.01323 X$_1$- 0.05821 X$_2$ 이 회귀식을 이용하여, 참돔의 수분함량과 지질함량을 측정함으로써 참돔의 품질을 결정할수 있는 파괴강도값이 계산으로 얻어진다. 또한 효소적방법으로써 품질지표인 AEC수치를 측정함으로써 건강도를 판정할 수 있다. 그러므로, 파괴강도값을 이용하여 품질의 등급을 선정하며, AEC수치를 건강도의 등급을 선정하여야 된다. 파괴강도값에 의한 등급은 1.4kg이상은 상급, 1.2~l.4kg은 중급, 1.2kg이하를 하급으로 선정하며, AEC수치는 1.0~0.9는 상급, 0.9~0.8는 중급, 0.8이하를 하급으로 선정하여 등급화를 분류할 수 있을 것으로 판단된다.

  • PDF

뇌졸중 후 강직 평가를 위한 진자검사 측정값의 상관관계 (Relationship Between Pendulum Test Measurements of Post-Stroke Spasticity)

  • 김용욱
    • 한국콘텐츠학회논문지
    • /
    • 제10권5호
    • /
    • pp.325-332
    • /
    • 2010
  • 본 연구의 목적은 뇌졸중 후 발생하는 강직을 평가하는데 사용되는 진자검사에서 세 가지 정량적 측정값 사이의 상관관계를 알아보는 것이다. 세 가지 측정값은 이완 지수, 진동 횟수, 그리고 진동 시간이다. 뇌졸중 환자 26명이 본 연구에 참여하였고, 측정값들 사이의 상관관계를 검증하기 위하여 피어슨 상관계수를 사용하였다. 본 연구의 결과 이완 지수와 진동 횟수 사이에서 통계적으로 유의한 양적 상관관계를 보였다(r=.881, p<.01). 또한 이완 지수와 진동 시간 사이에서도 유의한 양적 상관관계를 보였으며(r=.896, p<.01), 진동 횟수와 진동 시간 사이에서도 유의한 양적 상관관계를 보였다(r=.938, p<.01). 진자검사를 통한 강직의 정량적 측정치인 진동 횟수와 진동 시간은 복잡한 계산 과정을 통해 구해지는 이완 지수보다 비교적 쉽고 간단히 구할 수 있다. 따라서 간단하면서도 객관적인 측정값으로서 진자검사의 진동 횟수와 진동 시간의 사용이 향후 임상에서 강직의 정량적인 측정방법으로 유용할 것으로 사료된다.

소셜 북마킹 서비스의 태그를 이용한 개인화 콘텐츠 (Personalized Contents using the Tags of the Social Bookmarking Service)

  • 한주현;정문열
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.267-272
    • /
    • 2009
  • 웹 2.0 이라 불리는 현 웹의 패러다임은 개방, 공유, 참여로 압축하여 말할 수 있다. 이 속에서는 사용자의 참여와 공유로 콘텐츠가 생산 또는 재생산된다. 이러한 콘텐츠는 사용자의 관심을 반영하기 때문에 사용자가 어떠한 콘텐츠를 만들어 냈는지, 수집했는지 등을 분석하면 사용자의 관심 범주를 추출할 수 있다. 본 논문에서는 사용자가 소셜 북마킹 서비스를 이용하며 생성한 태그를 바탕으로 사용자의 관심 범주를 추출하여 이를 통해 개인화 콘텐츠 제공 서비스를 제안한다. 우선, 웹 서비스에서 제공하는 피드를 이용하여 사용자가 생성한 태그 중 가장 많이 쓰인 10개의 태그와 그것들과 관련 있는 태그들만 모아서 관심 범주을 추출하기 위한 태그 집합을 구성한다. 구성된 태그 집합을 바탕으로 피어슨 상관 계수를 통해 태그 간 동시 사용률을 조사한다. 이후 사용자 흥미에 부합하는 콘텐츠를 검색하기 위해 조사된 동시 사용률을 바탕으로 검색 키워드 그룹을 추출한다. 이렇게 만들어진 키워드 그룹들은 사용자의 평소 관심사와 관련된 콘텐츠를 검색하는데 사용되며, 이를 통해 사용자의 관심 있는 내용의 콘텐츠를 사용자의 특별한 검색 절차 없이 제공받는다. 이러한 방식을 통해 사용자가 원하는 정보를 입력하는 절차 없이도 웹에 축적된 사용자의 정보를 사용하여 자동으로 개인화된 콘텐츠를 제공할 수 있을 것으로 기대 된다.

  • PDF

연관 관계 군집에 의한 협력적 여과 방법 (A New Collaborative Filtering Using Associative Relation Clustering)

  • 김진현;정경용;김태용;이정현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.331-333
    • /
    • 2002
  • 협력적 여과 방법은 사용자의 평가 데이터를 이용하므로, 항상 초기 평가 문제(First-Rating Problem)와 희박성 문제(Sparsity Problem)가 발생한다. 최근 이러한 문제를 해결하기 위해 많은 연구가 진행되고 있는 데, 본 논문에서는 연관 규칙을 이용하여 이러한 문제를 해결하고자 한다. 사용자의 평가 데이터를 이용하여 아이템간의 연관성을 산출하고, 연관성이 높은 아이템끼리 군집한다. 사용자와 군집간에 피어슨 상관 계수(Pearson Correlation Coefficient)를 이용하여 가중치를 구하고, 이것으로 선호도를 예측한다. 이러한 방법을 기존의 협력적 여과 방법과 함께 속성에 의한 군집 방식과 비교 평가하였다. 또한, 효율적인 군집을 위한 Split Cluster Method를 제안하고, 기존의 트리 방식의 군집과 비교 평가하였다.

  • PDF

마이크로어레이 기반 종양 분류 모델 설계와 구현 (The Design and Implement on Tumor Classification Model Based on Microarray)

  • 박수영;정채영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.713-716
    • /
    • 2007
  • 오늘날 인간 프로젝트와 같은 종합적인 연구의 궁극적 목적을 달성하기 위해서는 이들 연구로부터 획득한 대량의 관련 데이터에 대해 새로운 현실적 의미를 부여할 수 있어야 한다. 따라서 현재의 마이크로어레이 기술을 이용해서 효과적으로 종양을 분류하기 위해서는 특정 종양 분류와 밀접하게 관련이 있는 정보력 있는 유전자를 선택하는 과정이 필수적이다. 본 논문에서는 암에 걸린 흰쥐 외피 기간 세포 분화 실험에서 얻어진 3840 유전자의 마이크로어레이 cDNA를 이용해 데이터의 정규화를 거쳐 유사성 척도 방법으로 정보력 있는 유전자들을 추출한 후, DT, NB, SVM, MLP 알고리즘을 이용하여 클래스 분류 모델을 구축하고, 성능을 비교분석하였다. 피어슨 적률 상관 계수를 이용하여 선택된 50 유전자들을 멀티퍼셉트론 분류기로 분류한 결과 94.8%의 정확도를 보여 가장 최적의 조합을 보였다.

거창화강암의 역학적 특성에 관한 연구 (The Mechanical Properties of the Geochang Granite)

  • 김명균
    • 터널과지하공간
    • /
    • 제25권1호
    • /
    • pp.24-36
    • /
    • 2015
  • 거창화강암은 국내 주요 석재자원의 하나로서 토목 및 건축사업에 널리 사용되고 있다. 본 연구에서는 거창화강암을 대상으로 수많은 실내시험을 실시하여 암석의 단위중량, 흡수율, P파 속도, S파 속도, 일축압축강도, 인장강도, 영률, 포아송비, 점착력, 내부마찰각, 점하중강도지수 등의 물리적 성질을 조사하였다. 일축압축강도는 인장강도의 19.5배, 점착력의 8.6배이고, P파 속도는 S파 속도의 1.5배 수준이었다. 실험결과로 얻어진 각종 물성간의 상호관계를 분석하였으며, 일축압축강도는 포아송비, 점하중강도지수, 영률과 0.8 이상의 피어슨 상관계수를 보였다. 또한, 단순회귀분석과 다중회귀분석을 통해 물성간의 각종 회귀식을 구하였으며, 특히 결정계수 0.7이상의 회귀식을 정리하여 나타내었다.

간호학생의 간호사이미지, 생명윤리의식 및 간호전문직관의 상관관계 (The Correlation between Nurse's image, Biomedical ethics and Professionalism in Nursing Students)

  • 구혜자;이외선
    • 한국산학기술학회논문지
    • /
    • 제16권11호
    • /
    • pp.7356-7366
    • /
    • 2015
  • 본 연구의 목적은 간호학생의 간호사이미지, 생명윤리의식, 간호전문직관의 정도와 상관관계를 파악하기 위함이다. 본 연구는 G도의 간호학생 223명에게 설문지를 이용하여 2014년 9월 4일부터 9월 19일까지 자료를 수집하였다. 수집된 자료는 SPSS Win 20 program을 이용하여 빈도, t-test, ANOVA로 분석하였고, 피어슨의 상관계수를 구하였다. 연구결과 간호학생의 간호사이미지와 생명윤리의식의 관계는 정적 상관관계가(r=.279, p<.001), 간호사이미지와 간호전문직관의 관계는 정적 상관관계가 있는 것으로 나타났다(r=.568, p<.001). 또한, 생명윤리의식과 간호전문직관의 관계도 정적 상관관계가 있는 것으로 나타났다(r=.384, p<.001). 따라서 간호학생의 간호사이미지, 생명윤리의식, 간호전문직관을 향상시킬 수 있는 프로그램의 개발 및 적용이 필요하다.

아동감각처리척도(Sensory Processing Scale for Children; SPS-C)의 표준화를 위한 예비연구 (A Pilot Study for Standardization of the Sensory Processing Scale for Children (SPS-C))

  • 신지은;김경미;장문영;홍은경
    • 대한감각통합치료학회지
    • /
    • 제18권2호
    • /
    • pp.42-54
    • /
    • 2020
  • 목적 : 아동감각처리척도(Sensory Processing Scale-Children; SPS-C)의 표준화를 위한 예비연구로써, 도구의 결과 해석을 위한 표준점수를 제시하고 단축감각프로파일(Short Sensory Profile; SSP)과의 상관관계를 통해 공인타당도를 알아보고자 한다. 연구방법 : 부산·경남 지역 소재의 일반 어린이집과 유치원을 다니고 있는 일반 아동 만 3~5세 337명을 대상으로 표준점수와 공인타당도를 확인하였다. 연구도구는 아동의 감각처리능력을 평가하기 위한 도구로 아동감각처리척도(SPS-C)와 단축감각프로파일(SSP)을 사용하였다. 아동감각처리척도(SPS-C)의 표준점수를 확인하기 위해 기술통계를 실시하여 평균-1 표준편차, 평균-2 표준편차를 확인하였고, 공인타당도 검증을 위해 아동감각처리척도(SPS-C)와 단축감각프로파일(SSP)간의 피어슨 상관분석을 하였다. 결과 : 아동감각처리척도의 총점에 대한 표준점수를 확인한 결과, 총점이 115~150점일 때 '정상', 105~114점일 때 '문제 가능성', 50~104점일 때 '확실한 문제'로 선별할 수 있다. 아동감각처리척도(SPS-C)와 단축감각프로파일(SSP)간의 피어슨 상관관계를 통해 공인타당도를 확인한 결과, 총점 간의 상관계수는 .755로 강한 양의 관계가 있는 것으로 나타났다. 결론 : 아동감각처리척도(SPS-C)의 임상적 사용을 위해 결과 해석을 위한 표준점수를 제시하였고, 다른 평가도구와 공인타당도를 검증하여 만3~5세 아동의 감각처리능력을 평가하기에 타당한 도구임을 확인한 점에서 의미가 있다.