• 제목/요약/키워드: Dissimilarity

검색결과 269건 처리시간 0.031초

Geodesic Clustering for Covariance Matrices

  • Lee, Haesung;Ahn, Hyun-Jung;Kim, Kwang-Rae;Kim, Peter T.;Koo, Ja-Yong
    • Communications for Statistical Applications and Methods
    • /
    • 제22권4호
    • /
    • pp.321-331
    • /
    • 2015
  • The K-means clustering algorithm is a popular and widely used method for clustering. For covariance matrices, we consider a geodesic clustering algorithm based on the K-means clustering framework in consideration of symmetric positive definite matrices as a Riemannian (non-Euclidean) manifold. This paper considers a geodesic clustering algorithm for data consisting of symmetric positive definite (SPD) matrices, utilizing the Riemannian geometric structure for SPD matrices and the idea of a K-means clustering algorithm. A K-means clustering algorithm is divided into two main steps for which we need a dissimilarity measure between two matrix data points and a way of computing centroids for observations in clusters. In order to use the Riemannian structure, we adopt the geodesic distance and the intrinsic mean for symmetric positive definite matrices. We demonstrate our proposed method through simulations as well as application to real financial data.

한국산 길쭉먼지벌레족의 수리분류(II) (Numerical Taxonomy of the Tribe Pterostichini Sloane from Korea(II))

  • 박종균;권용정
    • Current Research on Agriculture and Life Sciences
    • /
    • 제14권
    • /
    • pp.1-14
    • /
    • 1996
  • 한국산(韓國産) 길쭉먼지벌레족(族)을 대상으로 "NC"값을 인정하지 않은 상태에서 정성적(定性的) 형태형질(形態形質)을 근거(根據)로 표현론적(表現論的) 수리분류방식(數理分類方式)을 이용(利用)한 군분석(群分析)을 실시하였다. 그 결과(結果), 비록 일부 종(種)에서는 전통분류(傳統分類) 결과(結果)와 다소 일치(一致)하지 않은 경우도 있었으나 대부분 경험적(經驗的) 분류(分類)와 유사(類似)한 경향(傾向)을 나타내었다. 그리고 대부분 종(種)들이 기대(期待)한 속(屬) 또는 아속(亞屬)내에 분포(分布)하였다.

  • PDF

Nearest Neighbor Based Prototype Classification Preserving Class Regions

  • Hwang, Doosung;Kim, Daewon
    • Journal of Information Processing Systems
    • /
    • 제13권5호
    • /
    • pp.1345-1357
    • /
    • 2017
  • A prototype selection method chooses a small set of training points from a whole set of class data. As the data size increases, the selected prototypes play a significant role in covering class regions and learning a discriminate rule. This paper discusses the methods for selecting prototypes in a classification framework. We formulate a prototype selection problem into a set covering optimization problem in which the sets are composed with distance metric and predefined classes. The formulation of our problem makes us draw attention only to prototypes per class, not considering the other class points. A training point becomes a prototype by checking the number of neighbors and whether it is preselected. In this setting, we propose a greedy algorithm which chooses the most relevant points for preserving the class dominant regions. The proposed method is simple to implement, does not have parameters to adapt, and achieves better or comparable results on both artificial and real-world problems.

A Survey of Advances in Hierarchical Clustering Algorithms and Applications

  • Munshi, Amr
    • International Journal of Computer Science & Network Security
    • /
    • 제22권5호
    • /
    • pp.17-24
    • /
    • 2022
  • Hierarchical clustering methods have been proposed for more than sixty years and yet are used in various disciplines for relation observation and clustering purposes. In 1965, divisive hierarchical methods were proposed in biological sciences and have been used in various disciplines such as, and anthropology, ecology. Furthermore, recently hierarchical methods are being deployed in economy and energy studies. Unlike most clustering algorithms that require the number of clusters to be specified by the user, hierarchical clustering is well suited for situations where the number of clusters is unknown. This paper presents an overview of the hierarchical clustering algorithm. The dissimilarity measurements that can be utilized in hierarchical clustering algorithms are discussed. Further, the paper highlights the various and recent disciplines where the hierarchical clustering algorithms are employed.

이미지 비유사도 기반의 개인화된 하이브리드 의류 추천 모델 (Personalized Hybrid Outfit Recommendation Based on Image Dissimilarity)

  • 양정원;백지혜;김현희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.459-460
    • /
    • 2023
  • 기존의 추천시스템은 상품간 혹은 사용자 간의 유사도를 기반으로 작동한다. 하지만 이는 사용자가 유사한 상품 추천 속에 갇히게 되는 필터 버블의 문제와 추천시스템의 고질적인 문제인 데이터 희소성 문제를 피할 수 없게 된다. 따라서 본 연구에서는 사용자의 취향과 체형 정보를 반영하여 사용자의 평점을 예측하는 협업 필터링 기반 딥러닝 추천과 상품간 비유사성을 고려하여 사용자의 평점을 예측하는 내용 기반 추천을 혼합한 하이브리드 추천 모델을 구축하여 기존 추천시스템의 문제점을 해결하였다. 모델의 성능평가를 위해 인터넷 의류 쇼핑몰을 대상으로 유사한 이미지를 활용한 하이브리드 추천 모델과 NDCG 값을 비교하였고 유사도가 낮은 이미지를 활용한 모델이 더 우수한 성능을 보였다. 이는 다른 제품과는 달리 소비자가 의류를 구매할 경우 이미 구매한 상품과 유사한 상품보다는 유사하지 않은 상품을 구매할 가능성이 크다는 것을 보여준다.

과학영재들이 문제발견 과정에서 나타내는 과학개념 연결방식과 융합적 사고의 특징 (How the Science Gifted Connect and Integrate Science Concepts in the Process of Problem Finding)

  • 박미진;서혜애
    • 과학교육연구지
    • /
    • 제42권2호
    • /
    • pp.256-271
    • /
    • 2018
  • 본 연구는 과학영재들이 문제발견 과정에서 나타내는 과학개념 연결방식과 융합적 사고의 특징을 분석하는데 목적을 두었다. 이를 위해 2015학년도 광역시 소재 대학부설 과학영재교육원 중등 심화과정 전공영역별로 지원한 228명을 모집단으로 설정하고, 연구대상은 선발과정 1차 전형에서 실시한 과학 창의적 문제해결력 검사도구 점수를 기준으로 상위 30%에 속하는 67명을 상위집단으로, 하위 30%에 속하는 64명을 하위집단으로 구분하고, 두 집단에 속하는 총131명을 표집하였다. 자료수집을 위한 검사도구 문항은 초등과학 교육과정에서 추출한 소리, 전기, 무게, 온도, 호흡, 광합성, 날씨, 지진의 과학개념 8개를 활용하여 개발하였다. 검사문항은 과학개념 8개 가운데 가장 선호하는 과학개념 2개를 연결하여 과학적 질문을 생성하도록 제시하였으며, 연구대상이 진술한 과학적 질문을 분석하였다. 연구결과 과학영재들은 심화과정 전공영역에 따라 과학개념 연결 선호도에서 차이를 나타냈다. 과학적 질문에서 나타난 과학개념 연결방식의 특징을 분석하기 위해 수집한 자료를 먼저 관계, 유사성, 비유사성에 근거한 연결방식으로 분류하였다. 나아가 관계에 근거한 과학개념 연결방식은 속성, 수단, 영향, 예측, 원인, 측정, 현상으로, 유사성에 근거한 과학개념 연결방식은 속성, 대상, 과학적 원리, 현상에 근거한 연결로, 비유사성에 근거한 과학개념 연결방식은 병렬, 자원, 제거에 근거한 연결로 세분화하였다. 상위집단과 하위집단 간에 과학개념 연결방식은 통계적으로 유의미한 (p<.000) 차이를 보였다. 상위집단은 하위집단에 비해 서로 다른 과학영역에 해당하는 개념을 연결하여 과학적 질문을 더 많이 생성하였으나, 하위집단은 상위집단에 비해 동일한 과학영역 내 개념들을 연결하여 과학적 질문을 더 많이 생성하였다. 상위집단은 하위집단에 비해 유사성에 근거한 과학개념 연결방식을 더 빈번하게 사용하는 특징을 나타낸 반면, 하위집단은 상위집단에 비해 비유사성에 근거하여 단순하게 병렬시키는 연결을 더 빈번하게 사용하는 것으로 나타났다.

Pulsed-field Gel Electrophoresis를 이용한 Mycobacterium fortuitum의 유전형 분석 (Genomic analysis of Mycobacterium fortuitum by pulsed-field gel electrophoresis)

  • 이태윤;도인아;김성광
    • Journal of Yeungnam Medical Science
    • /
    • 제12권2호
    • /
    • pp.366-385
    • /
    • 1995
  • 항산균 감염증의 예방 및 치료를 위하여는 역학적인 연구가 중요하다. 본 연구에서는 감염증의 분자역학적 연구를 위한 기법중 아직 항산균을 대상으로 pulsed-field gel electrophoresis (PFGE) 분석법을 확립하고자 하였다. PFGE분석에 적절한 제한효소는 DraI, AsnI 및 XbaI 등이었고 각 제한효소마다 최적의 PFGE조건은 서로 달랐다. DraI의 경우는 두단계로 나누어 전기영동을 시행하였다. 제1단계의 initial pulse는 10초 final pulse는 15초였으며 제2단계는 initial pulse는 60초 final pulse는 70초이었다. 전기영동시간은 각 단계마다 각각 14시간씩이었다. XbaI의 경우는 제2단계 없이 initial pulse가 3초 final pulse가 12초였고 전기영동시간은 22시간이었다. AsnI의 경우는 제2단계 없이 initial pulse가 5초 final pulse가 25초였고 전기영동시간은 22시간이었다. 모든 경우에 있어서 전압은 200V로 하였다. 표준균주로는 M. bovis BCG, M. tuberculosis 및 M. fortuitum등을 사용하였는데 PFGE분석상 동일균종내에서 표준균주들 간의 차이는 발견할 수 없었다. 임상에서 분리된 9주의 M. fortuitum 균주를 대상으로 AsnI 제한효소로 PFGE분석을 시행한 결과 2주만을 제외하고는 서로 간의 유전형 분류가 가능하였다. 균주간의 유전적 거리를 결정하기 위하여 cluster analysis를 시행한 결과 M. fortuitum 균주들은 크게 두 집단으로 나뉘었다. 제한효소 AsnI으로 동일 균종의 분류가 안되는 M. fortuitum 균주들은 XbaI 제한효소을 사용한 PFGE분석으로 유전형의 구분이 가능하였다. Cluster analysis를 시행한 결과 크게 두 집단으로 나뉘었던 M. fortuitum 균주들은 보다 복잡한 집단으로 분류되어 XbaI을 사용한 PFGE분석법이 M. fortuitum 균주분류를 위하여는 보다 적절함을 알 수 있었다. Cluster analysis에서 얻은 최대 % dissimilarity 값은 0.74(AsnI) 및 0.75(XbaI)로서 이 값은 arbitrarily primed polymerase chain reaction(AP-PCR)법보다는 높고 restriction fragment length polymorphism(RFLP) 법보다는 낮아 PFGE법이 RFLP를 보완하거나 대치할 수 있는 세균 유전형 분석법임을 알 수 있었다.

  • PDF

AFLP에 의한 한국산 새우난초속 식물과 그의 수종 돌연변이에 대한 분류학적 연구 (Taxonomy of Korean Calanthe species and few of its mutants based on AFLP data)

  • 스리칸스;구자춘;구자정;최경;박광우;소순구;최용국;황성수
    • 식물분류학회지
    • /
    • 제42권3호
    • /
    • pp.215-221
    • /
    • 2012
  • 5개의 한국산 새우난초류 즉 새우난초, 한라새우난초, 금새우난초, 여름새우난초, 신한새우난초의 분류학적 및 유전적 유연관계가 증폭길이다형성(AFLP) 자료를 근거로 조사되었다. 위의 5개 분류군 및 노란색에 흰 설엽을 갖는 몇몇 돌엽변이체 등 16 개체가 연구에 사용되었다. AFLP를 통해서 50개의 분자마커가 동정되었다. 다변량분석의 결과는 유전적 다양성이 종내에서 보다 종간에 크게 나타났다. 유전적 비유사성은 다른 분류군에 비해서 YW 돌연변이체들 간에 가장 낮았고, 여름새우난초 개체들 간에 가장 높았다. 돌연변이체들은 주된 유집군의 밖에 유집되었다. 한라새우난초는 새우난초와 먼저 유집되어 유전적 구성이 다른 종보다 새우난초에 더 가까운 것으로 판단된다. 비록 한라새우난초가 새우난초와 금새우난초의 자연잡종에 의해 기원되었다고 하여도 분자 마커, 유집분석 그리고 비유사도 자료를 통해서 유전자이입이 새우난초 쪽으로 이루어진 것으로 판단된다. 결론적으로 한국산 새우난초류는 유전적 다양성이 있고, 한라새우난초는 새우난초 쪽으로 유전자이입이 있으며, YW 돌연변이체들은 유전적으로 금새우난초에 보다 가깝다.

RAPD 자료에 근거한 태백제비꽃군의 분류학적 연구 (Taxonomic study of Viola albida complex based on RAPD data)

  • 구자춘;탁효진;황성수
    • 식물분류학회지
    • /
    • 제40권2호
    • /
    • pp.118-129
    • /
    • 2010
  • 태백제비꽃군내 태백제비꽃, 단풍제비꽃 그리고 남산제비꽃의 대표적인 개체들을 대상으로 RAPD 방법을 사용하여 분류학적 연구를 시도하였다. 7개의 OTU와 68개의 primers를 사용하여 얻은 증폭된 자위(amplified loci)의 숫자는 모두 476개 이었다. Nei의 유전적 비유사도 지수가 남산제비꽃 개체들에서는 0.051로, 태백제비꽃 개체들은 0.118-0.171로 비교적 낮게 나타난 반면, 단풍제비꽃 개체들은 0.348로 나타나서 상기의 두 종보다 높게 나타났다. 한편, 태백제비꽃 개체들과 단풍제비꽃 개체들, 태백제비꽃 개체들과 남산제비꽃개체들 그리고 단풍제비꽃 개체들과 남산제비꽃 개체들 사이의 유전적 비유사성은 전체적으로 0.214-0.463의 범주로 나타나서 분류군간 뚜렷한 특징을 나타내지 않았다. 유집분석에서 조사된 개체들의 유사도는 비교적 높게 나타나서 종내 복합체 설정을 지지하였으며, 두 개의 집단으로 유집되었다. 그러나 단풍제비꽃 개체들은 태백제비꽃 또는 남산제비꽃 집단에 각각 유집되어 형태적 변이와 함께 유전적 다양성도 높은 것으로 확인되었다.

RAPD와 ITS 영역에 의한 민자주방망이 버섯의 유전적 변이 (Genetic Variation Based on Random Amplified Polymorphic DNA (RAPD) and Internal Transcribed Spacer (ITS) Region Sequences in Lepista nuda)

  • 이양숙;김남우;김종봉
    • 생명과학회지
    • /
    • 제22권11호
    • /
    • pp.1470-1476
    • /
    • 2012
  • 본 연구는 유럽에서 식용버섯으로 선호도가 높은 Lepista nuda (민자주방망이버섯)에 대하여 random amplified polymorphic DNA (RAPD)와 internal transcribed spacer (ITS) 염기서열을 이용하여 종내 및 종간의 유전적 변이를 분석하였다. RAPD 분석 결과 40개의 random primer 중 다형성을 나타내는 primer는 22개 였으며, 증폭된 밴드는 355개, DNA 단편의 크기는 200~4,000 bp의 사이에 위치하였다. RAPD band들을 marker로 하여 Nei-Li's의 방법을 이용한 비유사도 지수행렬을 조사한 결과 L. nuda 종내 유전적 변이는 0~21.60%로 나타났으며, L. nuda와 L. sordida의 종간에는 16.93~24.82%, L. irina와는 20.62~25.54%로 나타났으며, L. sordida와 L. irina와의 종간 변이는 23.49%로 나타났다. ITS I 과 II 영역의 673 bp의 염기서열을 분석하여 비유사도 지수행렬을 조사한 결과, L. nuda의 종내 변이는 1.58~11.47%였으며, L. nuda와 L. sordida와는 3.83~12.88%로 나타났다. 그리고 L. nuda와 L. irina는 7.11~15.61%였으며, L. sordida와 L. irina와의 종간 변이는 4.79%로 나타났다. 본 실험결과 RAPD와 ITS실험을 통해 확인된 primer와 연기서열은 Lepista속의 종을 검색 및 분류 시 유전적 표지 marker로서 이용 할 수 있을 것으로 생각된다.