• 제목/요약/키워드: complete linkage

검색결과 69건 처리시간 0.028초

중복을 허용하는 계층적 클러스터링 기법에서 클러스터 간 유사도 평가 (A Novel Linkage Metric for Overlap Allowed Hierarchical Clustering)

  • 전준우;송광호;김유성
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.157-161
    • /
    • 2016
  • 본 논문에서는 클러스터 간의 중복을 허용한 계층적 클러스터링(hierarchical clustering) 기법에 적합한 클러스터 간 유사도 평가방법(linkage metric)을 제안하였다. 클러스터 간 유사도 평가방법은 계층적 클러스터링에서 클러스터를 통합하거나 분해하는데 쓰이며 사용된 방법에 따라 클러스터링의 결과가 다르게 형성된다. 기존의 클러스터 간 유사도 평가방법인 single linkage, complete linkage, average linkage 중 single linkage와 complete linkage는 클러스터 간 중복이 허용된 환경에서 정확도가 낮은 문제점이 있고, average linkage는 정확도가 두 방법에 비해 높지만 계산 시간 소요가 크다는 단점이 있다. 따라서 본 논문에서는 기존의 average linkage를 개선하여 중복된 데이터에 의한 필요 계산량을 크게 줄임으로써 시간적 성능이 우수한 클러스터 간 유사도 평가방법을 제안하였다. 또한, 제안된 방법을 기존 방법들과 비교실험하여 중복을 허용하는 계층적 클러스터링 환경에서 정확도는 비슷하거나 더 높고, average linkage에 비해 계산량이 감소됨을 확인하였다.

  • PDF

THE EFFECTS OF POPULATION SIZE AND DOMINANCE OF QUANTITATIVE TRAIT LOCI (QTL) ON THE DETECTION OF LINKAGE BETWEEN MARKERS AND QTL FOR LIVESTOCK

  • Jeon, G.J.
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제8권6호
    • /
    • pp.651-655
    • /
    • 1995
  • A simulation study on detection of linkage between genetic markers and QTL in backcross design was conducted. The effects of various sample sizes and the degree of QTL dominance on detention of linkage were examined by using a simple regression analysis. The results indicated that as sample size increased, the standard error of the estimated slope became smaller. When the dominance effect of QTL was complete, the estimated slope tended to be negative but was statistically not significant at all with type I error of greater than 50%. With complete linkage between genetic Marker and QTL, the estimated intercept value was smallest but the estimated slope was largest as expected. In most cases with various degree of dominance and sample sizes, when the actual recombination rate became larger, greater values were obtained for the slope except in the case of complete dominance of QTL.

중복을 허용하는 계층적 클러스터링 기법에서 클러스터 간 유사도 평가 (A Novel Linkage Metric for Overlap Allowed Hierarchical Clustering)

  • 전준우;송광호;김유성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.157-161
    • /
    • 2016
  • 본 논문에서는 클러스터 간의 중복을 허용한 계층적 클러스터링(hierarchical clustering) 기법에 적합한 클러스터 간 유사도 평가방법(linkage metric)을 제안하였다. 클러스터 간 유사도 평가방법은 계층적 클러스터링에서 클러스터를 통합하거나 분해하는데 쓰이며 사용된 방법에 따라 클러스터링의 결과가 다르게 형성된다. 기존의 클러스터 간 유사도 평가방법인 single linkage, complete linkage, average linkage 중 single linkage와 complete linkage는 클러스터 간 중복이 허용된 환경에서 정확도가 낮은 문제점이 있고, average linkage는 정확도가 두 방법에 비해 높지만 계산 시간 소요가 크다는 단점이 있다. 따라서 본 논문에서는 기존의 average linkage를 개선하여 중복된 데이터에 의한 필요 계산량을 크게 줄임으로써 시간적 성능이 우수한 클러스터 간 유사도 평가방법을 제안하였다. 또한, 제안된 방법을 기존 방법들과 비교 실험하여 중복을 허용하는 계층적 클러스터링 환경에서 정확도는 비슷하거나 더 높고, average linkage에 비해 계산량이 감소됨을 확인하였다.

  • PDF

컴플리트 링키지 알고리즘을 이용한 교육시설물 BTL사업 유지관리번들 구성방안에 관한 연구 (A Study on Maintenance Bundle Alternatives of BTL Project for Educational Facilities Using Complete Linkage Algorithm)

  • 조창연;손재호
    • 교육시설
    • /
    • 제15권3호
    • /
    • pp.4-16
    • /
    • 2008
  • BTL(Build-Transfer-Lease) Project for Education Facilities is contracted as a package which consists of several education facilities and its maintenance period is 20 years. Thus, total cost variation largely depends on the accuracy of the maintenance cost forecasting in the early stage in the life cycle of the BTL Projects. This research develops a method using complete linkage algorithm and branch & bound algorithm to help in finding optimal bundling combination. The result of this research suggests more reasonable and effective forecasting method for the maintenance bundle in BTL projects.

OPAC에서 자동분류 열람을 위한 계층 클러스터링 연구 (Hierarchic Document Clustering in OPAC)

  • 노정순
    • 정보관리학회지
    • /
    • 제21권1호
    • /
    • pp.93-117
    • /
    • 2004
  • 본 연구는 OPAC에서 계층 클러스터링을 응용하여 소장자료를 계층구조로 분류하여 열람하는데 사용될 수 있는 최적의 계층 클러스터링 모형을 찾기 위한 목적으로 수행되었다. 문헌정보학 분야 단행본과 학위논문으로 실험집단을 구축하여 다양한 색인기법(서명단어 자동색인과 통제어 통합색인)과 용어가중치 기법(절대빈도와 이진빈도), 유사도 계수(다이스, 자카드, 피어슨, 코싸인, 제곱 유클리드), 클러스터링 기법(집단간 평균연결, 집단내 평균연결, 완전연결)을 변수로 실험하였다. 연구결과 집단간 평균연결법과 제곱 유클리드 유사도를 제외하고 나머지 유사도 계수와 클러스터링 기법은 비교적 우수한 클러스터를 생성하였으나, 통제어 통합색인을 이진빈도로 가중치를 부여하여 완전연결법과 집단간 평균연결법으로 클러스터링 하였을 때 가장 좋은 클러스터가 생성되었다. 그러나 자카드 유사도 계수를 사용한 집단간 평균연결법이 십진구조와 더 유사하였다.

인용문헌 표제를 이용한 문헌 클러스터링에 관한 연구 (Document Clustering Using Reference Titles)

  • 최상희
    • 정보관리학회지
    • /
    • 제27권2호
    • /
    • pp.241-252
    • /
    • 2010
  • 본 연구에서는 원문헌의 표제가 문헌클러스터링에서 문헌의 주제를 나타내는데 효과적인 자질로 인식되고 있지만 동의어나 유사어를 포함하여 문헌의 주제를 대표하는데 한계가 있음을 인지하고 인용문헌의 표제로 클러스터링 자질을 확대하는 방안을 제시하였다. 문헌 클러스터링의 자질로 원 문헌의 표제 용어와 인용문헌의 표제 용어, 두 종류의 표제 용어를 혼합하여 적용하여 인용문헌의 표제가 클러스터링 성능을 향상시키는 정도를 측정하였다. 각 자질별로 계층적 클러스터링 기법 3개, within group average linkage, complete linkage, Ward 기법을 결합하여 클러스터를 생성하는 성능을 비교, 분석하였는데 원문헌과 인용문헌 표제어를 혼합하여 within group average linkage 기법으로 클러스터링 한 경우가 가장 좋은 결과를 나타내었다.

가축통계 표본조사설계 (A Sampling Design for the livestock (Korean Native Beef Cattle, Milk Cow, Pig, Chicken) Statistics)

  • 윤기중;박상언
    • 응용통계연구
    • /
    • 제11권2호
    • /
    • pp.233-246
    • /
    • 1998
  • 1995년 가축통계 총조사자료에 기초하여 1998년부터의 향후 5년간의 표본설계를 하였다. 먼저 본 설계에서는 시도별 변이계수가 목표인 점을 고려하여 농가별 사육마리수를 전체사육마리수로 나눈 사육비율을 구한 다음 이를 전수기준과 총화에 이용하였다. 전수농가기준은 전수농가를 제외 한 후 조사구의 축종별 사육비율의 분산이 일정하게 하는 기준을 정하였고, 층화는 네축종중 최 대사육비율이 비슷한 조사구를 complete linkage 방법에 의해 층화하였다. 충의 개수는 층화에 따른 표본개수를 최소화하는 충의 수를 선정하였다. 또한 표본설계과정상의 해결하기 힘들었던 문제점을 열거하였다.

  • PDF

An Alternative Way of Constructing Ancestral Graphs Using Marker Allele Ages from Population Linkage Disequilibrium Information

  • Park, Lee-Young
    • Genomics & Informatics
    • /
    • 제7권1호
    • /
    • pp.1-12
    • /
    • 2009
  • An alternative way of constructing ancestral graphs, which is different from the coalescent-based approach, is proposed using population linkage disequilibrium (LD) data. The main difference from the existing method is the construction of the ancestral graphs based on variants instead of individual sequences. Therefore, the key of the proposed method is to use the order of allele ages in the graphs. Distinct from the previous age-estimation methods, allele ages are estimated from full haplotype information by examining the number of generations from the initial complete LD to the current decayed state for each two variants depending on the direction of LD decay between variants. Using a simple algorithmic procedure, an ancestral graph can be derived from the expected allele ages and current LD decay status. This method is different in many ways from previous methods, and, with further improvement, it might be a good replacement for the current approaches.

A STRUCTURE THEOREM FOR A CLASS OF GORENSTEIN IDEALS OF GRADE FOUR

  • Cho, Yong S.
    • 호남수학학술지
    • /
    • 제36권2호
    • /
    • pp.387-398
    • /
    • 2014
  • In this paper, we give a structure theorem for a class of Gorenstein ideal of grade 4 which is the sum of an almost complete intersection of grade 3 and a Gorenstein ideal of grade 3 geometrically linked by a regular sequence. We also present the Hilbert function of a Gorenstein ideal of grade 4 induced by a Gorenstein matrix f.