• 제목/요약/키워드: Hierarchical Clustering Analysis

검색결과 250건 처리시간 0.032초

대학도서관의 종합목록 기여 활동 및 이용 정도에 대한 탐사적 연구 (Exploratory Study on the Activity about Utilization and Contribution to the Union Catalog)

  • 조재인
    • 한국비블리아학회지
    • /
    • 제26권1호
    • /
    • pp.35-50
    • /
    • 2015
  • 종합목록 활성화를 위해서는 서지네트워크 참여 도서관의 공동체 의식과 협력 정신이 가장 중요하겠으나, 기여에 대한 적절한 보상은 참여 동기를 유발시킬 수 있다. 따라서 본 연구는 해외 종합목록의 기여보상제도를 살펴보고, 우리나라 대학도서관 종합목록 참여 도서관의 기여 활동과 이용 정도를 탐사적으로 분석하였다. 연구의 내용을 구체적으로 기술하면 첫째, 기술통계 분석을 통해 종합목록 참여 도서관의 기여 활동과 이용도에 대한 전반적인 현황을 파악해 보며, 둘째, 피어슨 상관 분석(Pearson Correlation Analysis)을 통해 기여활동과 이용 정도간에 어떠한 상관관계가 존재하는지 분석해 보았다. 셋째, 계층적 군집 분석(Hierarchical Clustering)을 통해 참여 기관을 유형화하여 기여 집단의 규모, 특수 공헌 집단의 존재 여부 등을 분석하였다.

다변량기법을 활용한 용담호 수질측정지점 유사성 연구 (A Study on Measuring the Similarity Among Sampling Sites in Lake Yongdam with Water Quality Data Using Multivariate Techniques)

  • 이요상;권세혁
    • 환경영향평가
    • /
    • 제18권6호
    • /
    • pp.401-409
    • /
    • 2009
  • Multivariate statistical approaches to classify sampling sites with measuring their similarity by water quality data and understand the characteristics of classified clusters have been discussed for the optimal water quality monitering network. For empirical study, data of two years (2005, 2006) at the 9 sampling sites with the combination of 2 depth levels and 7 important variables related to water quality is collected in Yongdam reservoir. The similarity among sampling sites is measured with Euclidean distances of water quality related variables and they are classified by hierarchical clustering method. The clustered sites are discussed with principal component variables in the view of the geographical characteristics of them and reducing the number of measuring sites. Nine sampling sites are clustered as follows; One cluster of 5, 6, and 7 sampling sites shows the characteristic of low water depth and main stream of water. The sites of 2 and 4 are clustered into the same group by characteristics of hydraulics which come from that of main stream. But their changing pattern of water quality looks like different since the site of 2 is near to dam. The sampling sites of 3, 8, and 9 are individually positioned due to the different tributary.

데이터마이닝을 이용한 동의보감에서 경락의 주치특성 분석 (An Analysis of Indications of Meridians in DongUiBoGam Using Data Mining)

  • 채윤병;류연희;정원모
    • Korean Journal of Acupuncture
    • /
    • 제36권4호
    • /
    • pp.292-299
    • /
    • 2019
  • Objectives : DongUiBoGam is one of the representative medical literatures in Korea. We used text mining methods and analyzed the characteristics of the indications of each meridian in the second chapter of DongUiBoGam, WaeHyeong, which addresses external body elements. We also visualized the relationships between the meridians and the disease sites. Methods : Using the term frequency-inverse document frequency (TF-IDF) method, we quantified values regarding the indications of each meridian according to the frequency of the occurrences of 14 meridians and 14 disease sites. The spatial patterns of the indications of each meridian were visualized on a human body template according to the TF-IDF values. Using hierarchical clustering methods, twelve meridians were clustered into four groups based on the TF-IDF distributions of each meridian. Results : TF-IDF values of each meridian showed different constellation patterns at different disease sites. The spatial patterns of the indications of each meridian were similar to the route of the corresponding meridian. Conclusions : The present study identified spatial patterns between meridians and disease sites. These findings suggest that the constellations of the indications of meridians are primarily associated with the lines of the meridian system. We strongly believe that these findings will further the current understanding of indications of acupoints and meridians.

멀티홉 무선 센서 네트워크 환경에서 성능 향상을 위한 플러딩 레벨 클러스터 기반 계층적 라우팅 알고리즘 (Flooding Level Cluster-based Hierarchical Routing Algorithm For Improving Performance in Multi-Hop Wireless Sensor Networks)

  • 홍성화;김병국;엄두섭
    • 한국통신학회논문지
    • /
    • 제33권3B호
    • /
    • pp.123-134
    • /
    • 2008
  • 본 논문에서는 센서 노드의 에너지 소모의 효율성을 증대시키는 무선 센서 네트워크에 대한 라우팅 알고리즘을 제안한다. 각 센서 노드는 멀티 홉 센서 필드에서 최초의 플러딩 과정을 통해 싱크 노드로의 최소 홉수를 나타내는 플러딩 레벨 값을 얻는다. 이 값은 싱크 노드로의 연결을 보장하고 클러스터를 구성하는 동안 사용되며 라우팅 과정에서 효과적으로 사용되어 에너지 효율성을 증가시킨다. 이 알고리즘은 분석과 많은 실험을 통해 성능평가가 이루어진다.

저수지 수질조사 지점간 유사성 분석 (A Study on Measuring the Similarity Among Sampling Sites in Lake)

  • 이요상;고덕구;이현석
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2010년도 학술발표회
    • /
    • pp.957-961
    • /
    • 2010
  • Multivariate statistical approaches to classify sampling sites with measuring their similarity by water quality data. For empirical study, data of two years at the 9 sampling sites with the combination of 2 depth levels and 7 important variables related to water quality is collected in reservoir. The similarity among sampling sites is measured with Euclidean distances of water quality related variables and they are classified by hierarchical clustering method. The clustered sites are discussed with principal component variables in the view of the geographical characteristics of them and reducing the number of measuring sites. Nine sampling sites are clustered as follows; One cluster of 5, 6, and 7 sampling sites shows the characteristic of low water depth and main stream of water. The sites of 2 and 4 are clustered into the same group by characteristics of hydraulics which come from that of main stream. But their changing pattern of water quality looks like different since the site of 2 is near to dam. The sampling sites of 3, 8, and 9 are individually positioned due to the different tributary.

  • PDF

컴퓨터 문헌 분석 기법을 활용한 <적벽가> 이본의 계통 분류 연구 (A Study on the Classification of Jeokbyeok-ga's Version by the Computer Analysis Technique of Bibliographies)

  • 이진오;김동건
    • 한국콘텐츠학회논문지
    • /
    • 제19권6호
    • /
    • pp.1-9
    • /
    • 2019
  • 본 연구는 컴퓨터 문헌 분석 기법을 활용하여 <적벽가> 전체 이본의 계통을 파악하는 한편, 기존 이본론의 연구 성과를 검토하는 데에 목적을 둔다. 우선 분석의 기초자료를 마련하기 위해 <적벽가>의 이본 중 46종을 선정하고 이를 대상으로 원시 코퍼스를 구축하였다. 이를 통해서 <적벽가>의 공통 서사단위는 5개의 계층으로 파악할 수 있었으며, 146개의 개별 내용 단락을 추출할 수 있었다. 다음으로 인코딩 된 코퍼스를 바탕으로 이본간의 유사도와 거리 측정을 시도하였는데, <적벽가>의 계통과 이본간의 거리를 시각적으로 제시할 수 있었다. 이후 다차원 척도법, 계층적 군집 분석, 계통의 분기 분석 기법을 활용하여 이본군의 분포를 확인할 수 있었다. 이처럼 컴퓨터 문헌 분석 기법을 종합하여 적용해보면 <적벽가>의 이본군은 완판 계열과 창본 계열로 양분되어 있음을 확인할 수 있는데, 기존의 논의보다 더 세밀한 계통 구분을 할 수 있었다. 또한 판소리의 유파와 전승에 따른 영향 관계도 검토할 수 있었다.

Classification of Land Cover on Korean Peninsula Using Multi-temporal NOAA AVHRR Imagery

  • Lee, Sang-Hoon
    • 대한원격탐사학회지
    • /
    • 제19권5호
    • /
    • pp.381-392
    • /
    • 2003
  • Multi-temporal approaches using sequential data acquired over multiple years are essential for satisfactory discrimination between many land-cover classes whose signatures exhibit seasonal trends. At any particular time, the response of several classes may be indistinguishable. A harmonic model that can represent seasonal variability is characterized by four components: mean level, frequency, phase and amplitude. The trigonometric components of the harmonic function inherently contain temporal information about changes in land-cover characteristics. Using the estimates which are obtained from sequential images through spectral analysis, seasonal periodicity can be incorporates into multi-temporal classification. The Normalized Difference Vegetation Index (NDVI) was computed for one week composites of the Advanced Very High Resolution Radiometer (AVHRR) imagery over the Korean peninsula for 1996 ~ 2000 using a dynamic technique. Land-cover types were then classified both with the estimated harmonic components using an unsupervised classification approach based on a hierarchical clustering algorithm. The results of the classification using the harmonic components show that the new approach is potentially very effective for identifying land-cover types by the analysis of its multi-temporal behavior.

Impurity profiling and chemometric analysis of methamphetamine seizures in Korea

  • Shin, Dong Won;Ko, Beom Jun;Cheong, Jae Chul;Lee, Wonho;Kim, Suhkmann;Kim, Jin Young
    • 분석과학
    • /
    • 제33권2호
    • /
    • pp.98-107
    • /
    • 2020
  • Methamphetamine (MA) is currently the most abused illicit drug in Korea. MA is produced by chemical synthesis, and the final target drug that is produced contains small amounts of the precursor chemicals, intermediates, and by-products. To identify and quantify these trace compounds in MA seizures, a practical and feasible approach for conducting chromatographic fingerprinting with a suite of traditional chemometric methods and recently introduced machine learning approaches was examined. This was achieved using gas chromatography (GC) coupled with a flame ionization detector (FID) and mass spectrometry (MS). Following appropriate examination of all the peaks in 71 samples, 166 impurities were selected as the characteristic components. Unsupervised (principal component analysis (PCA), hierarchical cluster analysis (HCA), and K-means clustering) and supervised (partial least squares-discriminant analysis (PLS-DA), orthogonal partial least squares-discriminant analysis (OPLS-DA), support vector machines (SVM), and deep neural network (DNN) with Keras) chemometric techniques were employed for classifying the 71 MA seizures. The results of the PCA, HCA, K-means clustering, PLS-DA, OPLS-DA, SVM, and DNN methods for quality evaluation were in good agreement. However, the tested MA seizures possessed distinct features, such as chirality, cutting agents, and boiling points. The study indicated that the established qualitative and semi-quantitative methods will be practical and useful analytical tools for characterizing trace compounds in illicit MA seizures. Moreover, they will provide a statistical basis for identifying the synthesis route, sources of supply, trafficking routes, and connections between seizures, which will support drug law enforcement agencies in their effort to eliminate organized MA crime.

계량정보분석시스템으로서의 KnowledgeMatrix 개발 (Development of the KnowledgeMatrix as an Informetric Analysis System)

  • 이방래;여운동;이준영;이창환;권오진;문영호
    • 한국콘텐츠학회논문지
    • /
    • 제8권1호
    • /
    • pp.68-74
    • /
    • 2008
  • 데이터베이스로부터 지식을 발견하고 이를 연구기획자, 정책의사결정자들이 활용하는 움직임이 전세계적으로 활발해지고 있다. 이러한 연구분야 중 대표적인 것이 계량정보학이고 이 분야를 지원하기 위해서 주로 선진국을 중심으로 분석시스템이 개발되고 있다. 그러나 외국의 분석시스템은 실제 수요자의 요구를 충분히 반영하지 못하고 있고, 고가이면서 한글이 지원되지 않아 국내 연구기획자가 사용하기에 어려운 점이 있다. 따라서 한국과학기술정보연구원에서는 이러한 단점을 극복하기 위해서 계량정보분석시스템 KnowledgeMatrix를 개발하였다. KnowledgeMatrix는 논문 및 특허의 서지정보를 분석하여 지식을 발견하기 위한 목적으로 설계된 독립형(stand-alone) 시스템이다 KnowledgeMatrix의 주요 구성을 살펴보면 행렬 생성, 클러스터링, 시각화, 데이터 전처리로 요약된다. 본 논문에서 소개하고 있는 KnowledgeMatrix는 외국의 대표적인 정보분석시스템과 비교했을 때 다양한 기능을 제공하고 있고 특히 영문데이터 처리 이외에 한글데이터 처리가 가능하다는 장점을 갖고 있다.

컴퓨터 문헌 분석 기반의 토끼전 '어족회의' 대목 내용 유사도에 따른 이본 계통 분류 연구 (A Study of Computational Literature Analysis based Classification for a Pairwise Comparison by Contents Similarity in a section of Tokkijeon, 'Fish Tribe Conference')

  • 김동건;정화영
    • 한국콘텐츠학회논문지
    • /
    • 제22권5호
    • /
    • pp.15-25
    • /
    • 2022
  • 본 연구는 컴퓨터 문헌 분석 기법을 활용하여 <토끼전> '어족회의' 대목의 계열과 계통을 밝히는 데에 목적을 둔다. 우선 각 단락의 이본 유형을 인코딩하여 코퍼스를 구축하고, 이를 바탕으로 해밍 거리를 이용하여 각 이본 간의 거리 행렬을 산출하였다. 그다음 산출된 거리 행렬을 다차원 척도법, 계층적 군집 분석을 적용하여 이본의 군집 양상을 시각화하여, 기존에 토끼전 전체 단락을 대상으로 한 군집 분석 연구와 비교하여 '어족회의' 대목의 계열과 계통 특징을 살펴보았다. 그 결과 토끼전 전체 단락을 대상으로 한 군집 분석이 6개의 계열을 이루고 있는 것과는 달리, '어족회의' 대목은 5개의 계열을 이루고 있다는 점과 몇몇 이본의 계열 출입이 있다는 점을 확인할 수 있었다. 본 연구의 성과는 계산에 의한 객관적이고 실증적인 방법으로 이본 간의 상대적 거리 측정하고 계통 분류를 했다는 점과 토끼전 전체를 내용을 대상으로 한 계열 분석과 대비하여 어족회의 대목 계열의 특징을 밝혔다는 데에 있다.