• 제목/요약/키워드: Hierarchical Clustering Analysis

검색결과 250건 처리시간 0.031초

A methodology for evaluating human operator's fitness for duty in nuclear power plants

  • Choi, Moon Kyoung;Seong, Poong Hyun
    • Nuclear Engineering and Technology
    • /
    • 제52권5호
    • /
    • pp.984-994
    • /
    • 2020
  • It is reported that about 20% of accidents at nuclear power plants in Korea and abroad are caused by human error. One of the main factors contributing to human error is fatigue, so it is necessary to prevent human errors that may occur when the task is performed in an improper state by grasping the status of the operator in advance. In this study, we propose a method of evaluating operator's fitness-for-duty (FFD) using various parameters including eye movement data, subjective fatigue ratings, and operator's performance. Parameters for evaluating FFD were selected through a literature survey. We performed experiments that test subjects who felt various levels of fatigue monitor information of indicators and diagnose a system malfunction. In order to find meaningful characteristics in measured data consisting of various parameters, hierarchical clustering analysis, an unsupervised machine-learning technique, is used. The characteristics of each cluster were analyzed; fitness-for-duty of each cluster was evaluated. The appropriateness of the number of clusters obtained through clustering analysis was evaluated using both the Elbow and Silhouette methods. Finally, it was statistically shown that the suggested methodology for evaluating FFD does not generate additional fatigue in subjects. Relevance to industry: The methodology for evaluating an operator's fitness for duty in advance is proposed, and it can prevent human errors that might be caused by inappropriate condition in nuclear industries.

RESTful 웹 서비스에서 시맨틱 온톨로지를 구축하기 위한 클러스터링 및 패턴 분석 기법 (Clustering and Pattern Analysis for Building Semantic Ontologies in RESTful Web Services)

  • 이용주
    • 인터넷정보학회논문지
    • /
    • 제12권4호
    • /
    • pp.119-133
    • /
    • 2011
  • 웹 2.0의 등장과 함께 RESTful 웹 서비스의 활용이 전통적인 SOAP 기반 웹 서비스에 비해 크게 증가되고 있다. 최근 웹상에 이용 가능한 RESTful 웹 서비스들의 수가 급격하게 증가됨에 따라 사용자들이 적합한 웹 서비스를 찾는 것은 매우 중요한 이슈로 대두되었다. 그러나 기존의 키워드 기반 검색 방법은 나쁜 재현율과 나쁜 정확률 때문에 문제가 많다. 본 논문에서는 연관규칙 기반 클러스터링 기법에 패턴 기반 시맨틱 분석 기법을 추가한 하나의 새로운 시맨틱 온톨로지 구축 방법을 제안한다. 이를 통해 온톨로지를 자동 구축하여 시맨틱 정보의 주석처리 부담을 줄일 수 있고, 보다 효율적인 웹 서비스 검색을 지원한다. 본 논문에서 제안된 방법은 ProgrammableWeb 사이트로부터 168개의 RESTful 웹 서비스를 다운로드 받아 실험 분석을 수행한 결과, 기존의 키워드 기반 검색 방법에 비해 재현율과 정확률 두 측면에서 각각 35%, 18%의 성능 향상을 보였다.

데이터 마이닝을 이용한 한의비만변증 설문지 재평가: 실제 임상에서 수집한 설문응답 기반으로 (Re-evaluation of Obesity Syndrome Differentiation Questionnaire Based on Real-world Survey Data Using Data Mining)

  • 오지홍;왕징화;최선미;김호준
    • 한방비만학회지
    • /
    • 제21권2호
    • /
    • pp.80-94
    • /
    • 2021
  • Objectives: The purpose of this study is to re-evaluate the importance of questions of obesity syndrome differentiation (OSD) questionnaire based on real-world survey and to explore the possibility of simplifying OSD types. Methods: The OSD frequency was identified, and variance threshold feature selection was performed to filter the questions. Filtered questions were clustered by K-means clustering and hierarchical clustering. After principal component analysis (PCA), the distribution patterns of the subjects were identified and the differences in the syndrome distribution were compared. Results: The frequency of OSD in spleen deficiency, phlegm (PH), and blood stasis (BS) was lower than in food retention (FR), liver qi stagnation (LS), and yang deficiency. We excluded 13 questions with low variance, 7 of which were related to BS. Filtered questions were clustered into 3 groups by K-means clustering; Cluster 1 (17 questions) mainly related to PH, BS syndromes; Cluster 2 (11 questions) related to swelling, and indigestion; Cluster 3 (11 questions) related to overeating or emotional symptoms. After PCA, significant different patterns of subjects were observed in the FR, LS, and other obesity syndromes. The questions that mainly affect the FR distribution were digestive symptoms. And emotional symptoms mainly affect the distribution of LS subjects. And other obesity syndrome was partially affected by both digestive and emotional symptoms, and also affected by symptoms related to poor circulation. Conclusions: In-depth data mining analysis identified relatively low importance questions and the potential to simplify OSD types.

간성뇌증 환자의 뇌 자기공명영상에서 대칭적인 지역 뇌부종 양상의 군집화 (Pattern Clustering of Symmetric Regional Cerebral Edema on Brain MRI in Patients with Hepatic Encephalopathy)

  • 임춘근;이희중
    • 대한영상의학회지
    • /
    • 제85권2호
    • /
    • pp.381-393
    • /
    • 2024
  • 목적 간성뇌증(hepatic encephalopathy; 이하 HE)의 대사이상은 뇌부종 또는 탈수초성 질환을 일으켜 자기공명영상에서 대칭적인 지역 뇌부종을 유발한다. 본 연구에서 HE 환자의 뇌 자기공명영상에서 대칭적인 지역 뇌부종 패턴의 군집화 분석을 통해 뇌부전 발생 예측의 유용성을 조사하는 것을 목적으로 한다. 대상과 방법 연속적인 HE 환자 98명을 대상으로 MR 소견과 임상자료를 후향적으로 분석하였다. Symmetric regional cerebral edema (이하 SRCE)의 12개 영역 간의 상관관계는 파이(φ) 계수를 사용하여 계산하였고, φ2 거리 측정과 Ward의 방법을 사용하여 계층적 군집화를 사용하여 패턴을 분류하였다. SRCE의 분류된 패턴은 말기 간 질환 모델(model for endstage liver disease; 이하 MELD) 점수 및 HE 등급과 같은 임상과 상관관계를 조사하였다. 결과 적색 핵과 뇌량(φ = 0.81, p < 0.001), 대뇌 십자 및 적색 핵(φ = 0.72, p < 0.001), 적색핵과 치상핵(φ = 0.66, p < 0.001)을 포함한 22쌍의 관심영역 사이에 유의한 연관성이 발견되었다. 계층적 군집화 후 24건을 I군, 35건을 II군, 39건을 III군으로 분류하였다. 그룹 III은 그룹 I에 비해 MELD 점수(p = 0.04)와 HE 등급(p = 0.002)이 더 높았다. 결론 본 연구는 HE 환자에서 대칭적인 지역 뇌부종의 패턴은 간 보존 및 뇌부전 발생을 예측하는 데 유용할 수 있음을 보여주었다.

군집분석을 이용한 수도권 도시의 유형화에 관한 연구 (Charaterization of Cities in Seoul Metropolitan Area by Cluster Analysis)

  • 송민경;장훈
    • 대한공간정보학회지
    • /
    • 제18권1호
    • /
    • pp.83-88
    • /
    • 2010
  • 본 논문은 수도권 내 지역을 도시적 특성에 따라 군집 분석하여 수도권의 지역유형을 구분하고 그 특성을 파악하고자 하였다. 수도권 도시의 유형화를 위해 2005년을 시점으로 도시의 구성요소인 인구, 활동, 토지 및 시설을 나타내는 지표 10가지를 선정하였으며, 주성분분석을 통해 변수들의 공통된 특성이나 유사한 성질에 따라 공통인자를 추출하였다. 추출된 인자에 대한 인자득점을 이용하여 군집분석을 행하였고, 군집분석의 방법은 계층적 군집방법인 최단연결법, 최장연결법, 평균연결법, 와드법을 이용하였다. 그 결과 수도권을 5개의 군집으로 유형화 할 수 있었다.

FT-IR 스펙트럼 데이터 기반 다변량통계분석기법을 이용한 아티초크의 대사체 수준 품종 분류 (Establishment of discrimination system using multivariate analysis of FT-IR spectroscopy data from different species of artichoke (Cynara cardunculus var. scolymus L.))

  • 김천환;성기철;정영빈;임찬규;문두경;송승엽
    • 원예과학기술지
    • /
    • 제34권2호
    • /
    • pp.324-330
    • /
    • 2016
  • 본 연구는 FT-IR 스펙트럼 데이터를 기반한 다변량통계분석을 이용한 대사체 수준에서 아티초크(Cynara cardunculus var. scolymus L.) 품종 구분하였다. FT-IR 스펙트럼 데이터로부터 PCA(principal component analysis), PLS-DA(partial least square discriminant analysis) 그리고 HCA(hierarchical clustering analysis) 분석을 실시하였다. 아티초크 품종들은 1700-1500, 1500-1300, $1100-950cm^{-1}$ 부위에서 대사체의 양적, 질적 패턴 변화가 FT-IR 스펙트럼상에서 나타났다. FT-IR 스펙트럼의 $1700-1500cm^{-1}$ 부위는 주로 Amide I 과 II을 포함하는 아미노산 및 단백질계열의 화합물들의 질적, 양적 정보를 나타내고, $1700-1300cm^{-1}$ 부위는 phosphodiester group을 포함한 핵산 및 인지질의 정보가 반영이 되고, $1100-950cm^{-1}$ 부위는 단당류나 복합 다당류를 포함하는 carbohydrates 계열의 화합물들이 질적, 양적 정보가 반영되는 부위이다. PCA 상에 나타난 10품종의 아티초크들은 품종간에 중첩이 많이 이뤄지는 모습을 나타냈다. 아티초크 10개의 품종 중에서 'Cardoon'과 'Green Globe'가 계통분류학적으로 유연관계가 낮고, 서로간에 대사체 수준의 차이가 뚜렷하게 나타나는 것으로 보아 대사체 수준에서 마커 탐색에 가장 중요한 품종으로 작용할 것으로 판단된다. PLS-DA 분석의 경우 PCA 분석 보다 아티초크의 종간 식별이 뚜렷하게 나타났다. 따라서 본 연구에서 확립된 대사체 수준에서 아티초크의 품종 식별 기술은 품종, 계통의 신속한 선발 수단으로 활용이 가능할 것으로 기대되며 육종을 통한 품종개발 가속화에 기여 할 수 있을 것으로 예상된다.

FT-IR 스펙트럼 다변량통계분석을 이용한 파파야(Carica papaya L.)의 생육온도 변화에 따른 대사체 수준 식별 (Metabolic Discrimination of Papaya (Carica papaya L.) Leaves Depending on Growth Temperature Using Multivariate Analysis of FT-IR Spectroscopy Data)

  • 정영빈;김천환;임찬규;김성철;송관정;송승엽
    • 한국국제농업개발학회지
    • /
    • 제31권4호
    • /
    • pp.378-383
    • /
    • 2019
  • 본 연구는 FT-IR 스펙트럼 데이터를 기반으로 다변량통계분석을 이용하여 생육 온도변화에 따른 파파야(Carica papaya L.)의 대사체 수준 식별을 통해 기후 변화에 대응하여 작물의 육종 연구의 기초자료로 활용하고자 한다. 1. FT-IR 스펙트럼 데이터로부터 PCA(principal component analysis), PLS-DA(partial least square discriminant analysis) 그리고 HCA(hierarchical clustering analysis) 분석을 실시하였다. 2. 파파야 품종은 1700-1500, 1500-1300, 1100-950 cm-1부위에서 대사체의 양적, 질적 패턴 변화가 FT-IR 스펙트럼상에서 나타났다. FT-IR 스펙트럼의 1700-1500 cm-1부위는 주로 Amide I 과 II을 포함하는 아미노산 및 단백질계열의 화합물들의 질적, 양적 정보를 나타내고, 1500-1300 cm-1부위는 phosphodiester group을 포함한 핵산 및 인지질의 정보가 반영이 되고, 1100-950 cm-1부위는 단당류나 복합 다당류를 포함하는 carbohydrates 계열의 화합물들이 질적, 양적 정보가 반영되는 부위이다. 3. PCA score plot 상측으로부터 +0℃(A)에서 +4℃(C)로 변화하는 것을 볼 수 있다. (A) 그룹은 주로 현재 기온에서 재배되는 파파야가 분포되면서 그룹을 형성하고 있고, (B) 그룹은 평년 기온에서 +2℃ 증가한 것을 가정하여 재배된 파파야가 그룹을 형성하였다. 또한, (C) 그룹은 (B) 그룹에서 +2℃, 평년 기온에서 +4℃ 증가한 것을 가정하여 재배된 파파야가 그룹을 형성하였다. 4. PLS-DA 분석의 경우 PCA 분석보다 생육온도에 따른 그룹 간 식별이 뚜렷하게 나타났다. 5. 본 연구에서 확립된 파파야 생육온도에 따른 대사체 수준 식별 기술은 파파야의 품종, 계통의 신속한 선발 수단으로 활용이 가능할 것으로 기대되며 육종을 통한 신품종개발 가속화에 기여할 수 있을 것으로 예상된다.

Genetic Distances of Three Mollusk Species Investigated by PCR Analysis

  • Oh, Hyun;Yoon, Jong-Man
    • 한국발생생물학회지:발생과생식
    • /
    • 제18권1호
    • /
    • pp.43-49
    • /
    • 2014
  • Three species of Nortamea concinua (NC) and Haliotis discus hannai (HDH) from Tongyeong and Sulculus diversicolor supertexta (SDS) are widely distributed on the coast of the Yellow Sea, southern sea and Jeju Island in the Korean Peninsula under the innate ecosystem. There is a need to understand the genetic traits and composition of three mollusk species in order to evaluate exactly the patent genetic effect. PCR analysis was performed on DNA samples extracted from a total of 21 individuals using seven decamer oligonucleotides primers. Seven primers were shown to generate the unique shared loci to each species and shared loci by the three species which could be clearly scored. A hierarchical clustering tree was constructed using similarity matrices to generate a dendrogram, which was facilitated by the Systat version 10. 236 specific loci, with an average of 56.3 per primer, were identified in the NC species. 142 specific loci, with an average of 44.7 per primer, were identified in the HDH species. Especially, 126 numbers of shared loci by the three species, with an average of 18 per primer, were observed among the three species. Especially, the decamer primer BION-75 generated 7 unique loci to each species, which were identifying each species, in 700 bp NC species. Interestingly, the primer BION-50detected 42 shared loci by the three species, major and/or minor fragments of sizes 100 bp and 150 bp, respectively, which were identical in all samples. As regards average bandsharing value (BS) results, individuals from HDH species (0.772) exhibited higher bandsharing values than did individuals from NC species (0.655). In this study, the dendrogram obtained by the seven decamer primers indicates three genetic clusters: cluster 1 (CONCINNA 01~CONCINNA 07), cluster 2 (HANNAI 08~HANNAI 14), cluster 3 (SUPERTEXTA 15~SUPERTEXTA 21). Comparatively, individuals of HDH species were fairly closely related to that of SDS species, as shown in the hierarchical dendrogram of genetic distances.

군집분석 기법을 이용한 공공도서관 그룹화에 대한 연구 (A Study of Library Grouping using Cluster Analysis Methods)

  • 곽철완
    • 한국비블리아학회지
    • /
    • 제31권3호
    • /
    • pp.79-99
    • /
    • 2020
  • 이 연구의 목적은 공공도서관 그룹화를 위해 적합한 군집분석 모델을 파악하고 그 특징을 분석하는데 있다. 국가도서관통계시스템의 공공도서관 통계 데이터를 사용하였으며, 군집분석 기법의 3가지 모델을 적용하였다. 공공도서관 규모를 기준으로 군집분석을 실시한 결과 크게 2가지 군집으로 구분되었으며, 군집의 크기는 크게 한쪽으로 치우쳤다. 그룹화 모델로 도서관 규모를 기준으로 삼으면, 계층적 군집분석의 와드측정법과 k-평균군집분석 모델이 적합하였다. 공공도서관 그룹화 연구 결과에 대한 시사점은 다음과 같다. 첫째, 통계 데이터 외에 도서관 서비스 관련 다양한 데이터 수집이 진행되어야 한다. 둘째, 분석 대상이 되는 데이터 세트에 적합한 분석 모델이 적용되어야 한다. 셋째, 도서관 서비스 향상을 위해 군집분석 기법의 다양한 분야 적용 가능성에 대한 적극적인 연구가 필요가 있다.

Screening and classification of mulberry silkworm, Bombyx mori based on thermotolerance

  • Chandrakanth, Nalavadi;Moorthy, Shunmugam M.;Ponnuvel, Kangayam M.;Sivaprasad, Vankadara
    • International Journal of Industrial Entomology and Biomaterials
    • /
    • 제31권2호
    • /
    • pp.115-126
    • /
    • 2015
  • The tropical climate prevailing in India adversely affects temperate bivoltine silkworm rearing and causes crop loss especially during summer. Identification of high temperature tolerant bivoltine breeds by screening for thermotolerance in the silkworm, Bombyx mori (Lepidoptera: Bombycidae) is an essential prerequisite for the development of thermotolerant bivoltine breeds / hybrids. Therefore, in this study, 20 silkworm breeds were reared at different temperatures (25 ± 1℃,32 ± 1℃, 34 ± 1℃ and 36 ± 1℃) for 6 h every day from 3rd d of 5th instar to till spinning. Significant differences (p < 0.01) were found among all the rearing traits over temperature. Based on pupation percentage, SK4C and BHR3 were identified as thermotolerant bivoltine breeds. Hierarchical clustering analysis based on rearing traits at tested temperatures grouped 20 silkworm breeds in four clusters which included one cluster each of susceptible and tolerant, and two clusters of moderately tolerant silkworm breeds. This suggests that clustering based on rearing data at high temperatures by using Euclidean distance can be an effective approach in classifying the silkworm breeds on their thermotolerance capacity. The identified breeds would be used for development of thermo tolerant bivoltine silkworm breeds / hybrids.