• 제목/요약/키워드: Pearson similarity

검색결과 80건 처리시간 0.022초

문헌정보학과 학생의 직장으로서의 도서관·정보센터 이미지 분석 (Study about Library and Information Center's Image of Library and Information Science Students as Workplace)

  • 조재인;이지원
    • 한국문헌정보학회지
    • /
    • 제50권3호
    • /
    • pp.113-132
    • /
    • 2016
  • 소비자에게 형성된 심상 분석을 통해 마케팅 전략을 수립하는데 주로 활용되고 있는 포지셔닝(Positioning) 기법은 공공시설, 기업, 대학이 공중에게 주는 이미지 분석을 비롯해 다양한 영역에서 활용되고 있다. 본 연구는 문헌정보학과 학생이 직장으로서 도서관 정보센터에 대하여 가지고 있는 이미지를 포지셔닝 기법을 통하여 분석하였다. 분석 결과, 학생들은 공공, 대학, 학교, 국가도서관을 유사한 이미지의 직장으로 인식하는 반면, 포털과 전문도서관은 이들과는 이질적인 진출처로 인식하고 있었으며, 직무에 있어서는 이용자봉사업무와 기술업무, 문화프로그램 업무를 각각 상이한 직무 군집으로 인식하고 있는 것으로 나타났다. 한편, 만족스러운 업무와 고용안정성이라는 이미지는 국가도서관과 공공도서관이 가장 크게 나타났으며, 보수가 가장 높을 것으로 기대되는 곳은 포털 업체, 성장가능성이 가장 높을 것으로 기대되는 곳은 전문도서관으로 포지셔닝되었다. 한편, 학생들이 가장 중요하게 생각하는 직장선택준거는 고용안정성으로 나타났으며, 가장 선호하는 직장으로는 공공도서관이 선택되었는데, 이러한 공공도서관 선호 집중 현상은 수도권대학보다는 지방대학 학생들에게 더욱 강하게 나타났다.

Cancer: Scenario and Relationship of Different Geographical Areas of the Globe with Special Reference to North East-India

  • Sharma, Jagannath Dev;Kalit, Manoj;Nirmolia, Tulika;Saikia, Sidhartha Protim;Sharma, Arpita;Barman, Debanjana
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제15권8호
    • /
    • pp.3721-3729
    • /
    • 2014
  • Background: Cancer is becoming the most important public health burden around the globe. As per the GLOBOCAN 2008 estimates, about 12.7 million cancer cases and 7.6 million cancer deaths were estimated to have occurred in 2008. The burden of cancer cases for India in the year 2020 is calculated to be 1,148,757 (male 534,353; female 614,404) compared to 979,786 in 2010. The pattern of cancer incidence is varying among geographical regions, esophageal cancer for example being high in China, lung cancer in USA, and gallbladder cancer in Chile. The question remains why? Is it due to the diversity in genome pool, food habits, risk factor association and role of genetic susceptibility or some other factors associated with it? In India, the North East (NE)-India region is seeing a marked increase in cancer incidence and deaths, with a very different cancer incidence pattern compared to mainland India. The genome pool of the region is also quite distinct from the rest of India. Northeastern tribes are quite distinct from other groups; they are more closely related to East Asians than to other Indians. In this paper an attempt was made to see whether there is any similarity among the pattern of cancer incidence cases for different sites of NE-India region to South or East-Asia. Materials and Methods: Principal Component Analysis (PCA), Hierarchical Cluster Analysis (HCA), Pearson Correlation coefficient test was assessed to evaluate the linkage of North-East India region to other regions. A p value <0.05 was considered as statistically significant. Results: The results clearly shows that there are similarities in occurrence of cancer incidence patterns for various cancer sites of NE-India with South and East-Asian regions, which may lead to the conclusion that there might be a genetic linkage between these regions.

선호도 재계산을 위한 연관 사용자 군집 분석과 Representative Attribute -Neighborhood를 이용한 협력적 필터링 시스템의 성능향상 (Performance Improvement of Collaborative Filtering System Using Associative User′s Clustering Analysis for the Recalculation of Preference and Representative Attribute-Neighborhood)

  • 정경용;김진수;김태용;이정현
    • 정보처리학회논문지B
    • /
    • 제10B권3호
    • /
    • pp.287-296
    • /
    • 2003
  • 추천 시스템에 있어서 협력적 필터링 기술은 많은 연구가 되고 있다. 그러나 협력적 필터링 기술을 이용한 추천 시스템은 초기 평가 문제와 희박성 문제가 발생한다. 이를 해결하기 위해서 본 논문에서는 선호도 재 계산을 위한 연관 사용자 군집과 베이지안 추정치를 이용한 사용자 선호도 예측 방법을 제안한다. 제안한 방법에서는 협력적 필터링 시스템에서 아이템의 속성을 고려하지 않는 단점을 보완하기 위해서 선호도에 가장 크게 영향을 미치는 대표 장르를 추출하여 유사한 이웃을 찾아 낼 때 예측에 이용하는 Representative Attribute-Neighborhood 방법을 사용한다. 협력적 필터링의 알고리즘에 군집 아이템 백터 내의 특정 아이템의 선호도를 재계산 하기 위한 연관 사용자 군집 분석을 적용하여 성능 향상을 하였다. 또 초기 평가 문제와 희박성 문제를 해결하기 위하여 Association Rule Hypergraph Partitioning 알고리즘을 사용하여 사용자를 장르별로 군집한다. 새로운 사용자는 Naive Bayes 분류자에 의해 이들 장르 중 하나로 분류된다. 또한, 분류된 장르 내에 속한 사용자들과 새로운 사용자의 유사도를 구하기 위해 Naive Bayes 학습을 통해 사용자가 평가한 아이템에 추정치를 달리 부여한다. 추정치가 부여된 선호도를 피어슨 상관 관계에 적용할 경우 결측치(Missing Value)로 인한 예측의 오류를 적게하여 예측의 정확도를 높일 수 있다. 제안된 방법은 기존의 방법보다 높은 성능을 나타냄을 보인다.

경기도 지역 미세먼지 관리를 위한 권역 범주화 연구 (Regional Categorization of Gyeonggi Province for Fine Dust Management)

  • 이수민;이태정;오종민;김상철;조영민
    • 환경영향평가
    • /
    • 제30권4호
    • /
    • pp.237-246
    • /
    • 2021
  • 경기도 도시대기측정망의 시간별 PM10과 PM2.5 농도에 대하여 측정소별로 상관성을 분석하여 측정소별 미세먼지 농도자료의 유사성을 파악해보았다. 미세먼지 경보제를 위해 사용되고 있는 기존의 권역구분을 그대로 이용했을 때, 동일한 권역 내의 측정소들은 PM10의 경우 0.68, PM2.5는 0.70 이상의 피어슨 상관계수 값을 보였으나, 일부 측정소는 타 권역과 높은 상관성(예, 0.80 이상)을 보여주고 있었다. 또한, 현재 구분하고 있는 권역은 주로 고농도 사례 횟수에 따른 군집분석 결과와 지리적 요인 등을 복합적으로 고려하여 결정된 것이므로, 미세먼지 관리를 위해서는 농도 특성에 따라 권역을 재분류할 필요성이 있다. 따라서 본 연구에서는 다차원척도법을 이용하여 미세먼지의 시간별 농도변화와 지역별 배출 기여율을 고려한 재범주화를 진행할 수 있었고, 이를 시각적으로 도시화할 수 있었다. 그 결과, PM10은 5개의 권역으로 분류되고, PM2.5는 4개의 권역으로 구분되었다.

Opcode와 API의 빈도수와 상관계수를 활용한 Cerber형 랜섬웨어 탐지모델에 관한 연구 (A Study on the Cerber-Type Ransomware Detection Model Using Opcode and API Frequency and Correlation Coefficient)

  • 이계혁;황민채;현동엽;구영인;유동영
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제11권10호
    • /
    • pp.363-372
    • /
    • 2022
  • 최근 코로나 19 팬더믹 이후 원격근무의 확대와 더불어 랜섬웨어 팬더믹이 심화하고 있다. 현재 안티바이러스 백신 업체들이 랜섬웨어에 대응하고자 노력하고 있지만, 기존의 파일 시그니처 기반 정적 분석은 패킹의 다양화, 난독화, 변종 혹은 신종 랜섬웨어의 등장 앞에 무력화될 수 있다. 이러한 랜섬웨어 탐지를 위한 다양한 연구가 진행되고 있으며, 시그니처 기반 정적 분석의 탐지 방법과 행위기반의 동적 분석을 이용한 탐지 연구가 현재 주된 연구유형이라고 볼 수 있다. 본 논문에서는 단일 분석만을 이용하여 탐지모델에 적용하는 것이 아닌 ".text Section" Opcode와 실제 사용하는 Native API의 빈도수를 추출하고 K-means Clustering 알고리즘, 코사인 유사도, 피어슨 상관계수를 이용하여 선정한 특징정보들 사이의 연관성을 분석하였다. 또한, 타 악성코드 유형 중 웜과 Cerber형 랜섬웨어를 분류, 탐지하는 실험을 통해, 선정한 특징정보가 특정 랜섬웨어(Cerber)를 탐지하는 데 특화된 정보임을 검증하였다. 위와 같은 검증을 통해 최종 선정된 특징정보들을 결합하여 기계학습에 적용하여, 최적화 이후 정확도 93.3% 등의 탐지율을 나타내었다.

폐수처리 시설의 영향에 따른 영산강 수계의 생물학적 수질 평가 (Biological Water Quality Assessments in Wastewater-impacted and Non-impacted Streams)

  • 안광국;김강일;김자현
    • 생태와환경
    • /
    • 제40권1호
    • /
    • pp.82-92
    • /
    • 2007
  • 본 연구는 2003년 영산강 수계내 12개 조사지점에서 어류 군집분석, 개체 특성분석 및 생태 건강성 지수(IBI) 산정을 통해 하천의 생물학적 수질을 비교 분석하였다. 12개 조사정점 중 4개 지점은 오염의 영향이 없는 대조군 지점이었고, 나머지 8개 지점은 농공폐수 및 하수처리장 배출수의 영향을 받는 지점이었다. 본 조사수역 12개 지점에서 산정된 평균 생태 건강성 지수(IBI)는 28(n=12, 범위: $18{\sim}44$)로서 U.S. EPA(1993)의 기준에 의거할 때 악화${\sim}$보통상태$(Fair{\sim}poor)$를 보였다. 한편, 대조군 지점(S3, S5, S6, S11)의 평균 생태 건강성 지수는 42(n=4, 변이폭: $38{\sim}44$)로서 양호상태(Good)를 보인 반면, 농공 폐수 및 하수처리장 배출수의 영향을 받는 나머지 8개 지점에서 평균 건강성 지수는 21(n=8, $18{\sim}24$)로서 악화상태(Poor)를 보여 2배 정도의 뚜렷한 차이를 보였다. 이런 건강도 지수의 지점별 변이는 종 풍부도 지수 및 종 다양도 지수와 거의 일치하였으나,1차 하천인 S11은 불일치하였다. 즉, 하천차수가 낮은 상류의 1차 하천은 종 다양도 혹은 군집 풍부도 지수에 의해 생태건강도가 평가될 경우 하천의 크기를 고려하지 않아 상대적으로 과소평가 되는 것으로 나타났다. 군집 유사도 분석 결과에 따르면, 유사도 수준 80%(p<0.05)에서 지점은 3개 그룹으로 대별되었다. 하나의 그룹은 폐수에 의해 영향을 받는 지점이었고, 나머지 2개의 그룹은 오염에 의해 영향 받지 않는 2개 대조군 그룹으로 대별되었다. 상관도 분석에 따르면, 생물학적 건강성 지수는 내성종의 상대빈도와 역상관 관계(r=-0.899, p<0.001)를 보였으며, 민감종과는 정상관 관계(r=0.890, p<0.001)를 보였다. 이런 결과는 본 수역에서 농공폐수 및 하수처리장 배출수 방류는 하천의 생물학적 수질 악화에 직접적인 영향을 주며, 수자원의 보호를 위해서는 이러한 배출수와 같은 오염원의 관리를 강화해야 한다는 것을 제시한다.

구조적 공백과 협업필터링을 이용한 추천시스템 (Recommender Systems using Structural Hole and Collaborative Filtering)

  • 김민건;김경재
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.107-120
    • /
    • 2014
  • 본 연구에서는 사회연결망분석기법 중 하나인 구조적 공백 분석 결과를 이용하여 추천과정에 사용자의 정성적이고 감성적인 정보를 반영할 수 있는 협업필터링 기반의 추천시스템을 제안한다. 협업필터링은 추천기술 중 가장 많이 활용되고 있지만 전통적으로 확장성과 희박성 등의 문제점뿐 만 아니라 사용자-상품 매트릭스의 선호도만을 이용하여 추천을 함으로써 사용자의 정성적이고 감성적인 정보를 추천과정에 반영하지 못한다는 한계점이 있다. 본 연구에서 제안하는 추천시스템은 사회연결망분석에서 중심성 분석과 함께 연결망 내의 주요개체를 탐지할 수 있는 구조적 공백 분석을 이용하여 연결망 내의 대표 사용자들을 추출한 후 이들을 중심으로 군집을 형성한 후 각 군집색인 협업필터링을 수행하는 과정을 통해 전통적인 협업필터링에서 반영하지 못했던 정성적, 감성적 정보를 반영한다. 한편, 군집색인 협업필터링을 수행함으로써 추천의 효율성을 높일 수 있는 장점도 있다. 본 연구에서는 실제 사용자들의 상품에 대한 선호도 평가점수와 사용자들의 사회연결망 정보를 수집하여 실험을 수행하고 전통적인 협업필터링과 다양한 형태의 협업필터링과의 추천성과 비교를 통하여 제안하는 시스템의 유용성을 확인한다. 비교모형으로는 전통적인 협업필터링, 임의 군집색인 기반 협업필터링, k평균 군집색인 기반 협업필터링을 이용한 추천시스템이며, 실험 결과, 제안한 모형이 다른 비교모형에 비해 추천성과의 정확도가 가장 우수하였다. 추천성과의 차이에 대한 통계적 유의성 검정 결과, 제안 모형은 전통적인 협업필터링 기반의 추천시스템과는 통계적으로 유의한 성과 차이가 없었으나, 다른 두 모형에 대해서는 통계적으로 유의한 성과의 차이가 있는 것으로 나타났다.

열목어 서식지의 어류군집을 이용한 생태적 건강성 평가 (Ecological health assessments using fish communities in the habitat of Manchurian trout)

  • 고민섭;최준길;이황구
    • 환경생물
    • /
    • 제37권4호
    • /
    • pp.652-663
    • /
    • 2019
  • 본 연구는 홍천 명개리 열목어 서식지 일대의 어류군집을 이용하여 생태적 건강성 및 물리적 서식지를 평가하고자 하였다. 현지조사는 2018년 7월부터 9월 총 2회 조사를 실시하였다. 조사결과 계방천에서는 7과 15종 771개체, 내린천에서는 4과 13종 348개체로 총 7과 16종 1,119개체가 확인되었고, 금강모치가 우점, 참갈겨니가 아우점하였다. 계방천과 내린천의 한국고유종 빈도는 각각 73.33 (11종)%, 76.92 (10종)%의 매우 높은 고유성으로 나타났다. 군집분석 결과 조사지점별 평균 우점도지수는 0.63(±0.09)~0.97(±0.01), 다양도지수는 1.63(±0.23)~0.33(±0.09), 균등도지수는 0.79(±0.06)~0.24(±0.07), 풍부도지수는 0.67(±0.14)~1.80(±0.16)의 범위로 분석되었다. 내성도길드 분석 결과 민감종의 개체가 95.86~100.00%의 개체수 비율로 가장 많은 비율을 차지하였으며, 섭식길드 분석 결과 충식종이 65.09~98.56%의 개체수 범위로 가장 많은 비율을 차지하였다. FAI 지수는 71.9(±9.4)~96.9(±3.1)의 범위로 ~B등급으로 확인되었다. QHEI는 119.5(±0.5)~153.5(±0.5)의 범위인 '최적~양호' 등급으로 분석되었다. FAI와 다양한 항목간의 상관성 분석 결과 QHEI, 열목어 출현 개체수, 종수, 개체수, 다양도, 풍부도, 민감종, 육식종, 충식종, 잡식종과는 양의 상관성을 갖는 것으로 나타났으며, 우점도와는 음의 상관성을 갖는 것으로 분석되었다. 유사도 분석 결과 56.9%의 유사성을 기준으로 Group-A, Group-B, Group-C 세 그룹으로 나뉘었으며, Group-A는 계방천, Group-B는 내린천, Group-C는 계방천과 내린천의 합류부로 구분되었다.

다중 웹 데이터와 LSTM을 사용한 전염병 예측 (Prediction of infectious diseases using multiple web data and LSTM)

  • 김영하;김인환;장백철
    • 인터넷정보학회논문지
    • /
    • 제21권5호
    • /
    • pp.139-148
    • /
    • 2020
  • 전염병은 오래전부터 인류를 괴롭혀 왔으며 이를 예측 하고 예방하는 것은 인류에게 있어 큰 과제였다. 이러한 이유로 지금까지도 전염병을 예측하기 위해 다양한 연구가 진행되고 있다. 초기의 연구 중 대부분은 CDC(Centers for Disease Control and Prevention)의 역학 데이터에 의존한 연구였으며, CDC에서 제공하는 데이터는 일주일에 한 번만 갱신돼 실시간 질병 발생 건수를 예측하기 어렵다는 문제점을 갖고 있었다. 하지만 최근 IT 기술의 발전으로 여러 인터넷 매체들이 등장하면서 웹 데이터를 통해 전염병의 발생을 예측하고자 하는 연구가 진행되었고 이 중 우리가 조사한 연구 중 대부분은 단일 웹 데이터를 사용하여 질병을 예측하는 연구였다. 하지만 단일 웹 데이터를 통한 질병 예측은 "COVID-19" 같이 최근에 등장한 전염병에 대해서는 많은 양의 학습 데이터를 수집하기 어려우며 이러한 모델을 통해 정확한 예측을 하기 어렵다는 단점을 가지고 있다. 이에 우리는 전염병 발생을 LSTM 모델을 통해 예측할 때 여러 개의 웹 데이터를 사용하는 모델이 단일 웹 데이터를 사용하는 모델보다 정확도가 더 높음을 실험을 통해 증명하고 전염병 예측에 적절한 모델을 제안하고자 한다. 본 실험에서는 단일 웹 데이터를 사용하는 모델과 우리가 제안하는 모델을 사용하여 "말라리아"와 "유행성이하선염"의 발생을 예측했다. 우리는 2017년 12월 31 일부터 2019년 12월 28일까지 총 104주 분량의 NEWS, SNS, 검색 쿼리 데이터를 수집했는데, 이 중 75주는 학습 데이터로, 29주는 검증 데이터로 사용됐다. 실험 결과 우리가 제안한 모델의 예측 결과와 단일 웹 데이터를 사용한 모델의 예측 결과를 비교했을 때 검증 데이터에 대해서 피어슨 상관계수가 0.94, 0.86로 가장 높았고 RMSE 또한 0.19, 0.07로 가장 낮은 오차를 보여주었다.

사회 네트워크를 이용한 사용자 기반 유헬스케어 서비스 추천 시스템 개발 (Development of User Based Recommender System using Social Network for u-Healthcare)

  • 김혜경;최일영;하기목;김재경
    • 지능정보연구
    • /
    • 제16권3호
    • /
    • pp.181-199
    • /
    • 2010
  • 인구의 고령화 및 건강에 대한 관심이 증가됨에 따라 유헬스케어 서비스는 발병 후 관리관점에서 발병 전의 예방 관점으로 그 목적이 점차 이동하고 있다. 그러나 기존의 유헬스케어 서비스는 원격진료 차원의 의료 서비스 성격이 강하여, 만성 성인병과 같은 대사 증후군을 예방 및 관리하기에는 한계가 있을 뿐만 아니라, 관리자 중심의 단방향 서비스를 제공함으로 인해 사용들이 중도에 이용을 포기하는 비율이 높았다. 이와 같은 문제를 해결하기 위하여, 본 연구에서는 사회 네트워크를 이용한 사용자 기반 유헬스케어 서비스 추천 시스템을 제안하였으며, 실세계에서 유헬스케어 서비스 추천 시스템의 활용 가능성을 제시하기 위하여 실제 의료원에서 대사 증후군 예방 및 관리를 위해 처방한 식단 및 운동 정보를 기반으로 유비쿼터스 컴퓨팅 환경에서 적용가능한 시스템을 구현하였다. 본 연구에서 제안한 시스템은 사용자가 선호하지 않는 서비스가 네트워크를 통해 확산될 가능성을 낮추는 동시에 추천의 신뢰성 제고를 위해 네이버들이 이용한 서비스를 공유함으로써 전체적인 추천 품질을 높인다. 즉, 사용자의 식습관 및 운동습관 등과 같은 생활습관을 개선하기 위하여 사회 네트워크를 활용함으로써 사용자간의 자율협업을 통한 개인화된 추천이 가능하다. 따라서 본 연구에서 제안하는 유헬스케어 서비스 추천 시스템은 생활습관 개선을 위하여 사용자에게 적합한 식단 및 운동을 제공하고, 생활습관의 개선을 통해 만성 성인병과 같은 대사증후군을 사전에 예방할 수 있을 것으로 기대된다.