• 제목/요약/키워드: Density-independent clustering

검색결과 11건 처리시간 0.017초

밀도에 무관한 클러스터링 기법의 개선 (Improvement on Density-Independent Clustering Method)

  • 김성훈;허경용
    • 한국정보통신학회논문지
    • /
    • 제21권5호
    • /
    • pp.967-973
    • /
    • 2017
  • 클러스터링은 균일한 특성을 가지는 데이터를 클러스터로 묶기 위해 사용되는 비교사 학습 방법 중 하나로 다양한 응용에 사용되고 있으며 FCM(Fuzzy C-Means)이 대표적인 방법 중 하나이다. 하지만 FCM에서 주로 사용되는 유클리드 거리 척도는 밀도가 높은 클러스터가 클러스터링 결과에 많은 영향을 미쳐 밀도가 높은 쪽으로 클러스터의 중심을 위치시키는 문제가 있으며, 이를 해결하기 위한 방법 중 하나가 클러스터 중심 사이의 거리가 가능한 멀어지도록 하는 밀도 무관 클러스터링이다. 하지만 밀도 무관 클러스터링 역시 클러스터 중심 사이의 거리를 정확히 제어하기가 어렵다. 이 논문에서는 클러스터 중심 사이의 거리가 멀어지도록 할뿐만이 아니라 클러스터 중심이 밀도가 높은 곳에 위치하도록 하는 항을 추가한 개선된 밀도 무관 클러스터링 방법을 제안한다. 제안하는 방법은 FCM이나 밀도 무관 클러스터링에 비해 실제 클러스터 중심으로 수렴하는 경우가 더 많다는 것을 실험 결과를 통해 확인할 수 있다.

레귤러라이제이션 기반 개선된 밀도 무관 퍼지 클러스터링 (Improved Density-Independent Fuzzy Clustering Using Regularization)

  • 한수환;허경용
    • 한국정보통신학회논문지
    • /
    • 제24권1호
    • /
    • pp.1-7
    • /
    • 2020
  • FCM(Fuzzy C-Means)으로 대표되는 퍼지 클러스터링은 간단하면서도 효율적인 클러스터링 방법이지만, FCM에서 사용하는 목적 함수에서는 밀도가 높은 클러스터가 클러스터링 결과에 많은 영향을 미치도록 함으로써 클러스터 사이의 밀도 차에 의해 클러스터링 결과에 왜곡이 발생할 수 있다. 이러한 밀도 문제를 완화하는 방법의 하나로 FCM의 목적 함수에 밀도 차이를 보정할 수 있는 항을 추가한 EDI-FCM(Extended Density-Independent FCM)이 있다. 이 논문에서는 레귤러라이제이션을 이용하여 EDI-FCM을 보완한 Regularized EDI-FCM을 제안한다. 레귤러라이제이션은 해공간을 평탄화하고 잡음 민감성을 줄이기 위해 흔히 사용되는 방법으로, 클러스터링에서는 특정 클러스터가 클러스터링 결과에 미치는 영향을 줄이는 역할을 한다. 제안하는 방법은 FCM이나 EDI-FCM과 비교했을 때 실제 클러스터 중심에 빠르고 정확하게 수렴한다는 것을 실험 결과를 통해 확인할 수 있다.

Study on mapping of dark matter clustering from real space to redshift space

  • Zheng, Yi;Song, Yong-Seon
    • 천문학회보
    • /
    • 제41권1호
    • /
    • pp.38.2-38.2
    • /
    • 2016
  • The mapping of dark matter clustering from real to redshift spaces introduces the anisotropic property to the measured density power spectrum in redshift space, known as the Redshift Space Distortion (hereafter RSD) effect. The mapping formula is intrinsically non-linear, which is complicated by the higher order polynomials due to the indefinite cross correlations between the density and velocity fields, and the Finger-of-God (hereafter FoG) effect due to the randomness of the peculiar velocity field. Furthermore, the rigorous test of this mapping formula is contaminated by the unknown non-linearity of the density and velocity fields, including their auto- and cross-correlations, for calculating which our theoretical calculation breaks down beyond some scales. Whilst the full higher order polynomials remains unknown, the other systematics can be controlled consistently within the same order truncation in the expansion of the mapping formula, as shown in this paper. The systematic due to the unknown non-linear density and velocity fields is removed by separately measuring all terms in the expansion using simulations. The uncertainty caused by the velocity randomness is controlled by splitting the FoG term into two pieces, 1) the non-local FoG term being independent of the separation vector between two different points, and 2) the local FoG term appearing as an indefinite polynomials which is expanded in the same order as all other perturbative polynomials. Using 100 realizations of simulations, we find that the best fitted non-local FoG function is Gaussian, with only one scale-independent free parameter, and that our new mapping formulation accurately reproduces the observed power spectrum in redshift space at the smallest scales by far, up to k ~ 0.3 h/Mpc, considering the resolution of future experiments.

  • PDF

ESTIMATION OF THE POWER PEAKING FACTOR IN A NUCLEAR REACTOR USING SUPPORT VECTOR MACHINES AND UNCERTAINTY ANALYSIS

  • Bae, In-Ho;Na, Man-Gyun;Lee, Yoon-Joon;Park, Goon-Cherl
    • Nuclear Engineering and Technology
    • /
    • 제41권9호
    • /
    • pp.1181-1190
    • /
    • 2009
  • Knowing more about the Local Power Density (LPD) at the hottest part of a nuclear reactor core can provide more important information than knowledge of the LPD at any other position. The LPD at the hottest part needs to be estimated accurately in order to prevent the fuel rod from melting in a nuclear reactor. Support Vector Machines (SVMs) have successfully been applied in classification and regression problems. Therefore, in this paper, the power peaking factor, which is defined as the highest LPD to the average power density in a reactor core, was estimated by SVMs which use numerous measured signals of the reactor coolant system. The SVM models were developed by using a training data set and validated by an independent test data set. The SVM models' uncertainty was analyzed by using 100 sampled training data sets and verification data sets. The prediction intervals were very small, which means that the predicted values were very accurate. The predicted values were then applied to the first fuel cycle of the Yonggwang Nuclear Power Plant Unit 3. The root mean squared error was approximately 0.15%, which is accurate enough for use in LPD monitoring and for core protection that uses LPD estimation.

추천시스템의 효과적 도입을 위한 소셜네트워크 분석 (Social Network Analysis for the Effective Adoption of Recommender Systems)

  • 박종학;조윤호
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.305-316
    • /
    • 2011
  • 협업필터링은 다양한 분야에서 널리 활용되고 있지만 협업필터링의 추천 성능은 적용하는 기업의 비즈니스 형태나 발생하는 거래 데이터의 특성에 따라 다르게 나타나고 있다. 기업에서 협업필터링 추천시스템을 구축하려면 상당한 시간과 비용이 소요되기 때문에 구축된 추천시스템의 성과가 높지 않다면 기업 자원의 낭비를 초래할 뿐만 아니라 부정확한 추천서비스를 받는 고객들의 불만을 살 수 있다. 따라서 추천시스템 도입을 검토할 때 기업이 갖고 있는 데이터의 특성을 파악하고 이를 통해 추천시스템을 도입하는 것이 타당한지 사전에 예측할 수 있다면 불필요한 도입으로 인한 경제적 손실과 고객 만족도 저하를 막을 수 있을 것이다. 기존 연구에서는 협업필터링 추천 성과에 희박성, 우연성, 커버리지 등이 영향을 미칠 수 있다고 설명하고 있지만 이러한 요인들이 어떻게 얼마나 추천 성과에 영향을 미치는지, 요인들 간에 어떠한 상관관계가 있는지는 현재까지 구체적으로 밝혀진 바가 없다. 본 연구에서는 구매 트랜잭션으로부터 생성된 소셜네트워크로부터 밀도, 군집화계수, 집중도 등의 구조적 지표를 측정한 후 이들이 추천성과에 어떻게 영향을 미치는지 통계적 분석을 통해 실증적으로 규명한다. 이를 통해 협업필터링 추천시스템에 대한 도입 여부를 결정하고자 할 때 유용하게 사용될 수 있는 지침을 제공하고자 한다.

투영 변환 블록 계수를 이용한 피부 색소 침착 검출 (Skin Pigmentation Detection Using Projection Transformed Block Coefficient)

  • 류양;이석환;권성근;권기룡
    • 한국멀티미디어학회논문지
    • /
    • 제16권9호
    • /
    • pp.1044-1056
    • /
    • 2013
  • 본 논문에서는 피부 색소 침착 영역을 검출하고 침착 정도를 측정하는 알고리즘을 제안한다. 제안한 알고리즘에서는 먼저 훈련 영상(training image)의 통계적 분석을 통해 피부 영역에 대한 GMM-EM 클러스터링 기반 컬러 모델을 구축하고 이를 통해 피부 영역을 추출한 후, 형태학적 처리(morphological processing)를 통해 피부 영역에 존재하는 잡음을 제거한다. 이후 ICA (independent component analysis) 알고리즘을 통해 피부 영역을 헤모글로빈 및 멜라닌 성분으로 분리하고, 각 성분에 대한 투영 변환 블록 계수에 의하여 색소 침착 영역 및 크기를 결정한다. 성능 평가를 위한 모의실험으로부터 제안한 색소 침착 검출 알고리즘은 피부 색소 침착 영역의 크기 및 침착 정도를 정확하게 검출할 수 있음을 확인하였다.

상업시설의 다양성이 소비중심지 형성에 미치는 영향에 관한 연구: 공간회귀모형의 적용 (A Study on the Influence of Commercial Facility Diversity on the Formation of Consumption Centre: Application of Spatial Regression Models)

  • 김설희;김흥순
    • 토지주택연구
    • /
    • 제15권1호
    • /
    • pp.57-75
    • /
    • 2024
  • 활기 넘치는 거리를 만들기 위해서는 다양한 종류의 상업시설의 입지가 필요하다. 상업시설은 지역 유동인구 증가에 영향을 미치는 가장 중요한 요소이다. 따라서 상업시설의 다양성이 높을수록 소비 활성화에 기여할 것이라는 추론이 가능하다. 이와 관련하여 본 연구는 상업시설의 혼합이 소비중심지수에 미치는 영향을 알아보았다. 본 연구는 2021년을 시간적 범위로 설정하였으며, 공간적 범위는 서울시로 하였다. 커널밀도분석을 통하여 산출한 소비중심지수를 종속변수로 하고, 상업 특성을 반영한 요인과 도시 특성 등을 반영한 요인을 독립변수로 설정하여 분석을 진행하였다. 분석 방법은 공간회귀분석을 활용하였고 분석단위는 행정동으로 설정하였다. 분석을 통하여 이종업종의 집적보다 동종업종의 집적이 소비 활성화에 긍정적인 영향을 미치는 것을 확인하였다. 또한 소비 활성화에 긍정적인 영향을 미치는 업종들의 집적이 필요하다는 시사점을 확인하였다. 본 연구의 분석 결과는 소비시장에서 상업시설 입지 정책의 효율적인 관리에 시사점을 제공할 수 있을 것으로 기대된다.

Application of Bioinformatics for the Functional Genomics Analysis of Prostate Cancer Therapy

  • Mousses, Spyro
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2000년도 International Symposium on Bioinformatics
    • /
    • pp.74-82
    • /
    • 2000
  • Prostate cancer initially responds and regresses in response to androgen depletion therapy, but most human prostate cancers will eventually recur, and re-grow as an androgen independent tumor. Once these tumors become hormone refractory, they usually are incurable leading to death for the patient. Little is known about the molecular details of how prostate cancer cells regress following androgen ablation and which genes are involved in the androgen independent growth following the development of resistance to therapy. Such knowledge would reveal putative drug targets useful in the rational therapeutic design to prevent therapy resistance and control androgen independent growth. The application of genome scale technologies have permitted new insights into the molecular mechanisms associated with these processes. Specifically, we have applied functional genomics using high density cDNA microarray analysis for parallel gene expression analysis of prostate cancer in an experimental xenograft system during androgen withdrawal therapy, and following therapy resistance, The large amount of expression data generated posed a formidable bioinformatics challenge. A novel template based gene clustering algorithm was developed and applied to the data to discover the genes that respond to androgen ablation. The data show restoration of expression of androgen dependent genes in the recurrent tumors and other signaling genes. Together, the discovered genes appear to be involved in prostate cancer cell growth and therapy resistance in this system. We have also developed and applied tissue microarray (TMA) technology for high throughput molecular analysis of hundreds to thousands of clinical specimens simultaneously. TMA analysis was used for rapid clinical translation of candidate genes discovered by cDNA microarray analysis to determine their clinical utility as diagnostic, prognostic, and therapeutic targets. Finally, we have developed a bioinformatic approach to combine pharmacogenomic data on the efficacy and specificity of various drugs to target the discovered prostate cancer growth associated candidate genes in an attempt to improve current therapeutics.

  • PDF

Fe-30%Ni-0.35%C 합금에서 Ausformed Martensite의 기계적 성질에 미치는 Tempering처리의 영향 (Effect of Tempering Treatment on Mechanical Properties of Ausformed Martensite in Fe-30% Ni-0.35%C Alloy)

  • 이인기;이규복;김학신
    • 열처리공학회지
    • /
    • 제7권1호
    • /
    • pp.44-52
    • /
    • 1994
  • In order to investigate the effect of tempring treatment on the mechanical properties of ausformed martensite in Fe-30%Ni-0.35%C alloy, the hardness, yield strength and elongation were examined by tensile test. 1. The strength of deformed austenite in Fe-30%Ni-0.35%C alloy was increased due to the work hardening induced from the dislocation density increased during deformation. The strength of ausformed martensite was increased because of defects inherited from deformed austenite by martensitic transformation. 2. The ductility of ausformed martensite was shown a nearly constant values independent of deformation degrees because of the interaction of multiple factors such as increased retained austenite, formation of void and decrement of twin in ausformed martensite. 3. The strength of ausformed martensite by tempering treatment was shown a little decrement up to $340^{\circ}C$, especially showed remarkable softening resistance in higher deformation degrees. 4. Virgin martensite and ausformed martensite were shown a maximum yield strength by clustering in tempering at $100^{\circ}C$ and above $100^{\circ}C$, yield strength was very small decreased due to the decrement of solute carbon by the destruction of clustering. 5. The decomposition of retained austenite was not shown up to $450^{\circ}C$ in ausformed martensite with tempering treatment, and the matrix was rapidly softening because of the decomposition of martensite and the formation of reversed austenite with tempering above $400^{\circ}C$.

  • PDF

Association between hemoglobin glycation index and cardiometabolic risk factors in Korean pediatric nondiabetic population

  • Lee, Bora;Heo, You Jung;Lee, Young Ah;Lee, Jieun;Kim, Jae Hyun;Lee, Seong Yong;Shin, Choong Ho;Yang, Sei Won
    • Annals of Pediatric Endocrinology and Metabolism
    • /
    • 제23권4호
    • /
    • pp.196-203
    • /
    • 2018
  • Purpose: The hemoglobin glycation index (HGI) represents the degree of nonenzymatic glycation and has been positively associated with cardiometabolic risk factors (CMRFs) and cardiovascular disease in adults. This study aimed to investigate the association between HGI, components of metabolic syndrome (MS), and alanine aminotransferase (ALT) in a pediatric nondiabetic population. Methods: Data from 3,885 subjects aged 10-18 years from the Korea National Health and Nutrition Examination Survey (2011-2016) were included. HGI was defined as subtraction of predicted glycated hemoglobin ($HbA1_c$) from measured $HbA1_c$. Participants were divided into 3 groups according to HGI tertile. Components of MS (abdominal obesity, fasting glucose, triglycerides, high-density lipoprotein cholesterol, and blood pressure), and proportion of MS, CMRF clustering (${\geq}2$ of MS components), and elevated ALT were compared among the groups. Results: Body mass index (BMI) z-score, obesity, total cholesterol, ALT, abdominal obesity, elevated triglycerides, and CMRF clustering showed increasing HGI trends from lower-to-higher tertiles. Multiple logistic regression analysis showed the upper HGI tertile was associated with elevated triglycerides (odds ratio, 1.65; 95% confidence interval, 1.18-2.30). Multiple linear regression analysis showed HGI level was significantly associated with BMI z-score, $HbA1_c$, triglycerides, and ALT. When stratified by sex, age group, and BMI category, overweight/obese subjects showed linear HGI trends for presence of CMRF clustering and ALT elevation. Conclusion: HGI was associated with CMRFs in a Korean pediatric population. High HGI might be an independent risk factor for CMRF clustering and ALT elevation in overweight/obese youth. Further studies are required to establish the clinical relevance of HGI for cardiometabolic health in youth.