• 제목/요약/키워드: Jaccard Coefficient

검색결과 37건 처리시간 0.026초

Improving Performance of Jaccard Coefficient for Collaborative Filtering

  • Lee, Soojung
    • 한국컴퓨터정보학회논문지
    • /
    • 제21권11호
    • /
    • pp.121-126
    • /
    • 2016
  • In recommender systems based on collaborative filtering, measuring similarity is very critical for determining the range of recommenders. Data sparsity problem is fundamental in collaborative filtering systems, which is partly solved by Jaccard coefficient combined with traditional similarity measures. This study proposes a new coefficient for improving performance of Jaccard coefficient by compensating for its drawbacks. We conducted experiments using datasets of various characteristics for performance analysis. As a result of comparison between the proposed and the similarity metric of Pearson correlation widely used up to date, it is found that the two metrics yielded competitive performance on a dense dataset while the proposed showed much better performance on a sparser dataset. Also, the result of comparing the proposed with Jaccard coefficient showed that the proposed yielded far better performance as the dataset is denser. Overall, the proposed coefficient demonstrated the best prediction and recommendation performance among the experimented metrics.

Stagewise Weak Orthogonal Matching Pursuit Algorithm Based on Adaptive Weak Threshold and Arithmetic Mean

  • Zhao, Liquan;Ma, Ke
    • Journal of Information Processing Systems
    • /
    • 제16권6호
    • /
    • pp.1343-1358
    • /
    • 2020
  • In the stagewise arithmetic orthogonal matching pursuit algorithm, the weak threshold used in sparsity estimation is determined via maximum iterations. Different maximum iterations correspond to different thresholds and affect the performance of the algorithm. To solve this problem, we propose an improved variable weak threshold based on the stagewise arithmetic orthogonal matching pursuit algorithm. Our proposed algorithm uses the residual error value to control the weak threshold. When the residual value decreases, the threshold value continuously increases, so that the atoms contained in the atomic set are closer to the real sparsity value, making it possible to improve the reconstruction accuracy. In addition, we improved the generalized Jaccard coefficient in order to replace the inner product method that is used in the stagewise arithmetic orthogonal matching pursuit algorithm. Our proposed algorithm uses the covariance to replace the joint expectation for two variables based on the generalized Jaccard coefficient. The improved generalized Jaccard coefficient can be used to generate a more accurate calculation of the correlation between the measurement matrixes. In addition, the residual is more accurate, which can reduce the possibility of selecting the wrong atoms. We demonstrate using simulations that the proposed algorithm produces a better reconstruction result in the reconstruction of a one-dimensional signal and two-dimensional image signal.

OPAC에서 자동분류 열람을 위한 계층 클러스터링 연구 (Hierarchic Document Clustering in OPAC)

  • 노정순
    • 정보관리학회지
    • /
    • 제21권1호
    • /
    • pp.93-117
    • /
    • 2004
  • 본 연구는 OPAC에서 계층 클러스터링을 응용하여 소장자료를 계층구조로 분류하여 열람하는데 사용될 수 있는 최적의 계층 클러스터링 모형을 찾기 위한 목적으로 수행되었다. 문헌정보학 분야 단행본과 학위논문으로 실험집단을 구축하여 다양한 색인기법(서명단어 자동색인과 통제어 통합색인)과 용어가중치 기법(절대빈도와 이진빈도), 유사도 계수(다이스, 자카드, 피어슨, 코싸인, 제곱 유클리드), 클러스터링 기법(집단간 평균연결, 집단내 평균연결, 완전연결)을 변수로 실험하였다. 연구결과 집단간 평균연결법과 제곱 유클리드 유사도를 제외하고 나머지 유사도 계수와 클러스터링 기법은 비교적 우수한 클러스터를 생성하였으나, 통제어 통합색인을 이진빈도로 가중치를 부여하여 완전연결법과 집단간 평균연결법으로 클러스터링 하였을 때 가장 좋은 클러스터가 생성되었다. 그러나 자카드 유사도 계수를 사용한 집단간 평균연결법이 십진구조와 더 유사하였다.

비디오 영상에서 사전정보 기반의 도로 추적 (Road Tracking based on Prior Information in Video Sequences)

  • 이창우
    • 한국산업정보학회논문지
    • /
    • 제18권2호
    • /
    • pp.19-25
    • /
    • 2013
  • 본 논문에서는 실 도로 환경에서 획득한 영상으로부터 도로 영역을 추적하는 방법을 제안한다. 제안된 방법은 이전 처리 결과로부터 미리 알려진 정보를 이용하여 현재 영상에서 도로를 검출하고 추적하는 방법이다. 제안된 방법은 시스템의 효율을 위해 연속적인 입력 영상에서 하위 60%이내에 도로가 있다고 가정하여 관심의 대상이 되는 영역(Region of Interest, ROI)을 설정하고 이 영역에서만 도로를 검출하고 추적한다. 최초 분할은 플러드필 알고리즘(Flood-fill algorithm)을 수행한 결과로부터 주위 영역과의 유사성을 평가한 후 병합하여 분할한다. 사전 정보로 사용되는 이전 영상에서 분할 결과에서 시드점(Seed Point)을 추출하고 이 시드점을 기준으로 현재 영상을 분할한다. 이전 영상에서 분할된 도로 영역과 현재 영상에서 분할된 결과를 변형된 자카드 계수(Jaccard coefficient)를 이용한 유사도 측정 결과에 따라 다음 영상에서 도로영역을 정제하고 추적한다. 연속적인 입력 영상을 대상으로 실험한 결과는 잡음이 존재하는 영상에서도 도로를 추적하는데 효과적임을 보여준다.

산학연 협업 활성화를 위한 R&D 네트워크 연결 예측 연구 (Predicting link of R&D network to stimulate collaboration among education, industry, and research)

  • 박미연;이상헌;김국성;심홍매;김우주
    • 지능정보연구
    • /
    • 제21권3호
    • /
    • pp.37-52
    • /
    • 2015
  • 최근 전세계적으로 R&D 네트워크 및 산학연 협력 등을 강화하고 있는 추세이다. 네트워크 및 협업연구 부문에 대한 지원이 증가하면 학제간 융합 연구를 통한 새로운 이론의 창출과 새로운 학문 사업 분야로의 확장 가능성을 높일 수 있다. 우리나라도 정부의 R&D 과제 수행을 통해 형성된 R&D 네트워크를 효율적으로 지원할 수 있는 전략의 필요성이 증대되고 있다. 그럼에도 불구하고 우리나라는 국가 R&D 사업 참여자에 대한 개별인력정보와 일반화된 통계 자료에만 의존하여 네트워크 관점에서의 정책은 미흡한 실정이다. 이에 따라 R&D 사업에 참여하는 각 주체들 간의 관계를 분석하고 산학연 R&D 네트워크를 기반으로 향후 발생할 수 있는 네트워크의 변화를 예측하고자 한다. R&D 네트워크 변화 예측을 위해 Common Neighbor 모형과 Jaccard's Coefficient 모형을 기반 모델로서 채택하고자 하며, 이들의 한계점을 보완하고 Link Prediction 정확도를 향상시킨 새로운 예측 모형을 제안하고 이들간의 비교분석 결과를 도출하고자 한다. 이와 같은 연구 결과는 향후 R&D 네트워크의 변화에 대한 효과적인 예측을 통해 선제적인 산학연 사업 지원 전략을 수립하고, 융합 R&D사업 등을 효과적으로 지원할 수 있는 국가 정책을 도모하기 위한 방안을 제시한다는 점에서 의의가 있다. 본 연구결과 가중치의 적용은 Common Neighbor 모형과 Jaccard's coefficient 모형 모두에서 긍정적인 성과를 나타냈는데 상대적으로는 가중치가 적용된 Common Neighbor 모형에서의 정확도가 더 개선된 것으로 도출되었다. 즉, Common Neighbor 모형에서는 4,136개 중 650개를 예측한 반면, 가중치를 적용한 Common Neighbor 모형에서는50개의 정답이 증가한 700개를 예측하는 효과를 보였다. 한편, 상대적으로 Jaccard 계수의 경우는 약간의 성능 개선은 있으나 그 차이가 미미한 것으로 나타났다.

분할과 중첩 기법을 이용한 항공 사진 상의 빌딩 경계 추출 (Extraction of Building Boundary on Aerial Image Using Segmentation and Overlaying Algorithm)

  • 김용민;장안진;김용일
    • 한국측량학회지
    • /
    • 제30권1호
    • /
    • pp.49-58
    • /
    • 2012
  • 도심지의 빌딩들은 시간이 갈수록 형태가 다양해지고, 식생이나 도로와 같은 객체들과 유사한 분광 특성을 나타냄으로써 광학 영상만을 이용하여 추출하기가 어려워지고 있다. 본 연구에서는 이러한 문제를 해결하기 위해 항공 Light Detection and Ranging(LiDAR) 자료와 항공 사진의 융합을 통해 항공 사진상에서의 빌딩과 그 경계를 추출하는 방법을 제안한다. 먼저 항공 사진에 Adaptive dynamic range linear stretching 방사 강조 기법을 적용하고, 에디슨 에지 디텍터를 이용하여 이진 경계 지도를 생성하였다. 동시에 항공 LiDAR 자료로부터 normalized Digital Surface Model을 생성하고, 빌딩 영역을 추출하여 이진 경계 지도와의 중첩을 통해 임시 빌딩 영역을 추출하였다. 마지막으로 항공 LiDAR 자료와 항공 사진 간의 위치 오차를 고려하여 경계 강화 과정을 수행함으로써 최종 빌딩 경계를 추출하였다. 제안 방법의 검증을 위해 두 개의 실험 지역을 선정하여 제안 방법을 적용하였고, 정량적인 정확도평가에서 F-measure, Jaccard coefficient, Yule coefficient, Overall accuracy의 값이 모두 0.85 이상의 정확도를 보여주었다.

Longitudinal Variation of Fish Communities in the Geum River, Korea: Application of the Concept of Beta Diversity and Local Uniqueness

  • Kim, Jeong-Hui;Park, Sang-Hyeon;Baek, Seung-Ho;Hong, Donghyun;Jo, Hyunbin
    • Proceedings of the National Institute of Ecology of the Republic of Korea
    • /
    • 제3권2호
    • /
    • pp.122-128
    • /
    • 2022
  • To present the spatial variation of fish assemblages in the Geum River in Korea, the concept of beta diversity (β-diversity) estimates based on the variance of the community data table was applied. Fish communities and environmental variables were collected from 13 sampling sites along the in mid-low reaches of the River. We calculated the β-diversity and local contribution to beta diversity (LCBD) values at each site depending on the two types of data, 'occurrence' with Jaccard and Sørensen dissimilarity coefficients, and 'abundance' with Hellinger distance. Multivariate and correlation analyses were also performed to determine the relationships between LCBD and other variables, such as community indices and physicochemical and hydrological factors. The β-diversity values of fish communities in the River were estimated as 0.218 and 0.145 for occurrence data table with Jaccard and Sørensen respectively, and 0.268 for abundance data. Similar patterns of LCBD along the sampling sites were detected in two dissimilarity measurements of occurrence table, and LCBD values with abundance data were slightly different. The LCBD values are strongly correlated with community indices, and also suitable for indicating the uniqueness of fish assemblages. However, further research is needed to determine the LCBD value as an indicator of environmental variability.

트랜스포머 블록과 윤곽선 디코더를 활용한 딥러닝 기반의 피부 병변 분할 방법 (Deep Learning based Skin Lesion Segmentation Using Transformer Block and Edge Decoder)

  • 김지훈;박경리;김해문;문영식
    • 한국정보통신학회논문지
    • /
    • 제26권4호
    • /
    • pp.533-540
    • /
    • 2022
  • 전문의는 피부암을 조기에 발견하기 위해 피부경을 사용하여 진단하지만 다양한 형태로 인해 피부 병변을 판단하는 데 어려움이 있다. 최근 높은 성능을 보인 딥러닝을 이용한 피부 병변 분할 방법이 제안되었지만 피부와 피부 병변 경계가 명확하지 않아서 피부 병변을 분할하는 데 문제점이 있었다. 이러한 문제를 개선하기 위해 제안하는 방법은 효과적으로 피부 병변을 분할하기 위해 트랜스포머 블록을 구성하였으며, 네트워크의 각 계층마다 윤곽선 디코더를 구성하여 피부 병변을 자세히 분할하였다. 실험 결과, 제안하는 방법은 기존의 방법보다 Dice coefficient 기준 0.041 ~ 0.071, Jaccard Index 기준 0.067 ~ 0.112의 성능 향상을 보인다.

MODIS 클로로필 정보를 이용한 2단계 필터링 기반 적조 탐지 (Red Tide Detection Based on Two Stage Filtering with MODIS Chlorophyll Information)

  • 김용민;변영기;김용일;유기윤
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2008년도 춘계학술대회 논문집
    • /
    • pp.170-175
    • /
    • 2008
  • 본 연구는 MODIS에서 제공하는 클로로필 정보를 기반으로 하여 2단계 필터링을 통해 우리나라 동해, 남해 연안에 대규모로 발생했던 Cochlodinium polykrikoides 적조를 탐지하는 알고리즘을 제시한다. 일반적인 적조 탐지 연구들은 클로로필과 적조 발생의 상관성을 이용하여 클로로필의 농도가 높은 해역을 적조 발생 해역으로 탐지한다. 하지만 이 방법의 문제점은 적조가 발생하지 않은 해역을 적조 발생 해역으로 탐지함으로써 commission error를 발생시킨다는 것이다. 따라서 본 연구에서는 이러한 문제점을 극복하기 위해 MODIS에서 제공하는 클로로필 정보를 바탕으로 적조 발생 해역을 추출하고, 2단계 필터링 과정을 적용함으로써 진해, 여수, 남해도 부근 해역에서 발생한 commission error를 제거할 수 있었으며, 그 결과를 국립수산과학원의 적조속보자료와 함께 시각적 평가하여 본 연구에서 제안한 알고리즘의 효용성을 검증하였다. 향후 정량적인 평가를 위해 F-measure, JC(Jaccard coefficient), YC(Yule coefficient), 전체정확도를 탐지정확도 측정치로써 도입하여 정확도평가를 수행할 예정이다.

  • PDF

북서 지중해 Fos해역의 해양오염이 해양저서생물군집 Coralligenous Community에 미치는 영향 (Impact of the Pollution on the Benthic Community Environmental impact of the pollution on the benthic coralligenous community in the Gulf of Fos, northwestern Mediterranean)

  • 홍재상
    • 한국수산과학회지
    • /
    • 제16권3호
    • /
    • pp.273-290
    • /
    • 1983
  • 북서 지중해 Fos 해역에서의 해양 오염이 해양 저서 생들에 미치는 영향을 조사하기 위하여 Fos 지역의 해저에 발달하고 있는 저서생물군집 Coralligenous Community의 공간분포를 군집생태학적 측면에서 분석하였다. Fos 임해공업단지의 영향하에 있는 3개의 정점을 환경구배에 따라 설정하고(Arnette, Laurons, Auguette)마르세이유 동남쪽 Riou섬 서편 Moyade에 한 개의 대조정점을 택하여 분석한 결과 오염이 심한, Fos 해역의 내만으로 들어갈수록 출현종의 수나 개체수가 감소하는 현상을 관찰할 수 있었다. 또한 종의 다양도, numerical abundance, 다양성 지수 등의 생태학적 제 지수도 오염의 진전에 따라 함께 감소하고 있다. 특히 Fos 해역 가장 안 쪽에 위치하고 있는 Auguette 정점은 인근 대단위 Fos 공업단지의 산업폐수는 물론 도시의 생활하수로부터 심각할 정도로 영향을 받고 있음이 밝혀졌다. 이렇게 선업 폐수와 도시 하수가 복합적으로 작용하여 해양 저서생물에 미치는 영향을 Community Composition, Coralligenous Community 특유의 기능적 측면, 생태군별에 의한 분석 등을 통하여 조사하였다. 기타 Fourfold Point Correlation Coefficient와 Jaccard's Community Coefficient를 이용하여 정점간의 종류사도를 비교 검토하였으며 Coralligenous Community의 하부동물상과의 관계도 아울러 고찰하였다.

  • PDF