• 제목/요약/키워드: optimal number of clusters

검색결과 79건 처리시간 0.031초

다변량 통계 분석법의 연속 적용에 의한 서부 지리산 천연림의 산림 피복형 분류 (The Classification of Forest Cover Types by Consecutive Application of Multivariate Statistical Analysis in the Natural Forest of Western Mt. Jiri)

  • 정상훈;김지홍
    • 한국산림과학회지
    • /
    • 제102권3호
    • /
    • pp.407-414
    • /
    • 2013
  • 본 연구는 다변량 통계 분석법을 이용하여 지리산 서부 천연림을 대상으로 산림 피복형을 분류하기 위해 실시하였다. 점표본법에 의한 식생자료를 바탕으로, 수종-표본점 곡선, 계층적 군집분석, 지표종분석, 다중판별분석 등의 다변량 통계 분석법을 이용하여 식생자료를 분석하였다. 수종-표본점 곡선에서는 산림 피복형 분류에서 전혀 영향력이 없는 수종들을 예외값으로 제거하였다. 예외값을 제외한 산림식생정보를 바탕으로 계층적 군집분석을 이용하여 연구대상지를 2~10개의 클러스터로 분류하였으며, 지표종분석을 통해 연구대상지의 적정 클러스터 수는 7개인 것으로 파악되었다. 이를 통계적으로 검증하기 위해 다중판별분석을 실시하였고, 91.3%가 정확하게 분류되어, 연구대상지 산림 피복형의 개수는 7개가 적당한 것으로 나타났다. 각 클러스터 상층의 우점수종 비율에 따라 신갈나무순림, 중생혼합림, 신갈나무-졸참나무림, 구상나무-신갈나무림, 들메나무림, 졸참나무림, 서어나무림으로 산림 피복형을 명명하였다.

식생 군집분석과 종간친화력 분석을 통한 서울형 다층구조 식재모델 제안 (Suggestions for Multi-Layer Planting Model in Seoul Area Based on a Cluster Analysis and Interspecific Association)

  • 김민경;심우경
    • 한국조경학회지
    • /
    • 제38권4호
    • /
    • pp.106-127
    • /
    • 2010
  • 최근 생태환경 조성을 위한 다층구조 식재는 식생복원 등 환경사업뿐만 아니라 군락식재의 방법으로서 활용이 확산되고 있으나, 실제 조경 식재 설계에 있어 다층식재 기법을 활용하는 데에는 어려움이 있었다. 본 연구는 서울지역의 숲 구조를 분석하여 다층식재 시 활용 가능한 기초적 다층 식재모델 개발을 목적으로 하고 있다. 이를 위해 생태분석프로그램인 PC ORD 4.0(MjM Soft, 2002) 프로그램을 활용, ISA(Indicator Species Analysis) 분석을 통한 적정 군집수를 설정하여 군집분석을 실시하였다. 그 결과 상수리나무군락, 신갈나무-팔배나무군락, 소나무-리기다소나무군락, 신갈나무-진달래군락, 선갈나무-노간주나무군락, 소나무-진달래군락, 선갈나무-철쭉나무군락 등의 7개의 자연 식생군락으로 분석되었다. 그리고 대상지에 출현한 빈도 10% 이상의 식물종간의 종간친화력 검정을 통하여, 자연식생에서의 수반종과 함께 수급 및 유통이 가능한 대체 유사종을 제시함으로써 활용도를 높였다. 위의 결과를 종합한 7개 자연식생군락을 기초로 하여, 군락 내 종간 친화력이 있는 식물종을 재선정하여 조경 식재 설계 시 활용할 수 있는 다층식재 모델을 제안하였다. 개발된 다층식재 모델은 변환우점도 값의 평균값을 기준으로 하여 평균 목표피도를 제시함으로써 식재설계 시 폭넓게 응용할 수 있도록 하였다.

리얼 서버의 실시간 서버 모니터에 의한 최적 로드 밸런싱 알고리즘에 관한 연구 (A Study for an Optimal Load Balancing Algorithm based on the Real-Time Server Monitor of a Real Server)

  • 한일석;김완용;김학배
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (상)
    • /
    • pp.201-204
    • /
    • 2003
  • At a consequence of WWW large popularity, the internet has suffered from various performance problems, such as network congestion and overloaded servers. These days, it is not uncommon to find servers refusing connections because they are overloaded. Web server performance has always been a key issue in the design and operation of on-line systems. With regard to Internet, performance is also critical, because users want fast and easy access to all objects (e.g., documents, graphics, audio, and video) available on the net. To solve this problem, a number of companies are exploring the benefits of having multiple geographically or locally distributed Internet sites. This requires a comprehensive scheme for traffic management, which includes the principle of an optimal load balancing of client requests across multiple clusters of real servers. This paper focuses on the performance analysis of Web server and we apply these results to load balancing in clustering web server. It also discusses the mam steps needed to carry out a WWW performance analysis effort and shows relations between the workload characteristics and system resource usage. Also, we will introduce an optimal load balancing algorithm base on the RTSM (Real-Time Server Monitor) and Fuzzy Inference Engine for the local status of a real server, and the benefits is provided with of the suggested method.

  • PDF

네트워크 침입 탐지를 위한 최적 특징 선택 알고리즘 (An optimal feature selection algorithm for the network intrusion detection system)

  • 정승현;문준걸;강승호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 추계학술대회
    • /
    • pp.342-345
    • /
    • 2014
  • 기계학습을 이용한 네트워크 침입탐지시스템은 선택된 특징 조합에 따라 정확성 및 효율성 측면에서 크게 영향을 받는다. 하지만 일반적으로 사용되는 침입탐지용 특징들로부터 최적의 조합을 찾아내는 일은 많은 계산량을 요구한다. 예를 들어 n개로 구성된 특징들로부터 가능한 특징조합은 $2^n-1$ 개이다. 본 논문에서는 이러한 문제를 해결하기 위한 최적 특징 선택 알고리즘을 제시한다. 제안한 알고리즘은 최적화 문제 해결을 위한 대표적인 메타 휴리스틱 알고리즘인 지역탐색 알고리즘에 기반 한다. 또한 특징 조합을 평가를 위해 선택된 특징 요소와 k-means 군집화 알고리즘을 이용해 구해진 군집화의 정확성을 비용함수로 사용한다. 제안한 특징 선택 알고리즘의 평가를 위해 NSL-KDD 데이터와 인공 신경망을 사용해 특징 모두를 사용한 경우와 비교한다.

  • PDF

HI gas kinematics of paired galaxies in the cluster environment from ASKAP pilot observations

  • Kim, Shin-Jeong;Oh, Se-Heon;Kim, Minsu;Park, Hye-Jin;Kim, Shinna
    • 천문학회보
    • /
    • 제46권2호
    • /
    • pp.70.1-70.1
    • /
    • 2021
  • We examine the HI gas kinematics and distributions of galaxy pairs in group or cluster environments from high-resolution Australian Square Kilometer Array Pathfinder (ASKAP) WALLABY pilot observations. We use 32 well-resolved close pair galaxies from the Hydra, Norma, and NGC 4636, two clusters and a group of which are identified by their spectroscopy information and additional visual inspection. We perform profile decomposition of HI velocity profiles of the galaxies using a new tool, BAYGAUD which allows us to separate a line-of-sight velocity profile into an optimal number of Gaussian components based on Bayesian MCMC techniques. Then, we construct super profiles via stacking of individual HI velocity profiles after aligning their central velocities. We fit a model which consists of double Gaussian components to the super profiles, and classify them as kinematically cold and warm HI gas components with respect to their velocity dispersions, narrower or wider 𝜎, respectively. The kinematically cold HI gas reservoir (M_cold/M_HI) of the paired galaxies is found to be relatively higher than that of unpaired control samples in the clusters and the group, showing a positive correlation with the HI mass in general. Additionally, we quantify the gravitational instability of the HI gas disk of the sample galaxies using their Toomre Q parameters and HI morphological disturbances. While no significant difference is found for the Q parameter values between the paired and unpaired galaxies, the paired galaxies tend to have larger HI asymmetry values which are derived using their moment0 map compared to those of the non-paired control sample galaxies in the distribution.

  • PDF

선형배열 기지국을 위한 위치정보 서버의 최적할당 방식 (An Optimal Allocation Mechanism of Location Servers in A Linear Arrangement of Base Stations)

  • 임경식
    • 한국정보처리학회논문지
    • /
    • 제7권2호
    • /
    • pp.426-436
    • /
    • 2000
  • 이동 통신환경에서 이동노드들은 기지국(base station)을 통하여 통신하므로, 기지국은 트래픽의 발신지 및 착신지로서 데이터 트래픽, 위치정보 트래픽 등과 같이 처리비용이 다른 이종의 트래픽을 발생한다. 그러데, 하나의 위치 정보 서버는 물리적으로 제한된 용량으르 다지므로 여러 대의 위치정보 서버를 분산시켜 구축할 필요가 있는데, 이때 기지국을 최적으로 클러스터링하고 각 클러스터마다 하나의 위치정보서버를 할당해야 한다. 본 논문에서는 기지국이 선형으로 배열된 이동 통신망에서, 서로간에 다양한 형태의 트래픽을 발생하는 n개의 기지국이 주어졌을 때, 전체 네트워크에 대한 통신비용을 최소화하기 위하여 이들을 m($1{\le}m{\le}n$) 개의 인접한 클러스터(disjoint cluster)로 분리하는 문제를 고려한다. 이를 위하여, 본 논문에서는 주어진 트래픽이 클러스터 내부에서 발생할 때와 클러스트간에 발생할 때의 통신비용 차이를 반영한 상대비용(relative cost) 개념을 도입하여 O($mm^2$)의 동적 프로그래밍(dynamic programming) 알고리즘을 제시한다. 또한 이 알고리즘은 하나의 클러스터에 대한 크기제한과 전체 네트워크에 허락된 총 통신비용이 제악조건으로 주어질 경우, 같은 계산시간 내에 모든 유효한 클러스터를 찾아 낼 수 있음을 보인다.

  • PDF

교통카드자료를 이용한 환승정류장의 유형별 입지특성에 관한 연구 - 대구시를 중심으로 - (A Study on Type of Location Characteristics of Transfer Stations Using Data on Traffic Cards - Focused on Daegu City -)

  • 김기혁;이승철
    • 대한토목학회논문집
    • /
    • 제31권4D호
    • /
    • pp.519-526
    • /
    • 2011
  • 본 연구는 대구시의 교통카드자료를 이용하여, 환승정류장의 특성을 분석하였다. 대구시의 교통카드자료는 서울시와 달리 승차 정류장의 내용을 포함하고 있지 않고, 하차 단말기도 설치되어 있지 않기 때문에 환승정류장을 파악하기가 어렵다. 따라서 교통카드자료와 대구시 BMS자료와의 Matching으로 환승통행에 대한 데이터를 구축하여 본 연구를 진행하였다. 환승량 모형은 도심으로부터의 거리와 노선수는 양의 계수를 나타낸 반면, 대기시간은 음의 계수가 나타나는 것으로 분석되었다. 본 분석에서는 Oneway ANOVA 분석을 통하여, 최적의 군집수를 정하였다. 군집1은 군집중심이 2.99로써, 대구시 중심에 위치한 형태이며 군집2는 군집중심이 6.73으로 군집3은 군집중심이 12.78로써, 대구시와 경산시의 경계를 포함하고 있는 형태를 나타내며 있는 것으로 나타났다.

다변량기법을 활용한 용담호 수질측정지점 유사성 연구 (A Study on Measuring the Similarity Among Sampling Sites in Lake Yongdam with Water Quality Data Using Multivariate Techniques)

  • 이요상;권세혁
    • 환경영향평가
    • /
    • 제18권6호
    • /
    • pp.401-409
    • /
    • 2009
  • Multivariate statistical approaches to classify sampling sites with measuring their similarity by water quality data and understand the characteristics of classified clusters have been discussed for the optimal water quality monitering network. For empirical study, data of two years (2005, 2006) at the 9 sampling sites with the combination of 2 depth levels and 7 important variables related to water quality is collected in Yongdam reservoir. The similarity among sampling sites is measured with Euclidean distances of water quality related variables and they are classified by hierarchical clustering method. The clustered sites are discussed with principal component variables in the view of the geographical characteristics of them and reducing the number of measuring sites. Nine sampling sites are clustered as follows; One cluster of 5, 6, and 7 sampling sites shows the characteristic of low water depth and main stream of water. The sites of 2 and 4 are clustered into the same group by characteristics of hydraulics which come from that of main stream. But their changing pattern of water quality looks like different since the site of 2 is near to dam. The sampling sites of 3, 8, and 9 are individually positioned due to the different tributary.

Optimizing the maximum reported cluster size for normal-based spatial scan statistics

  • Yoo, Haerin;Jung, Inkyung
    • Communications for Statistical Applications and Methods
    • /
    • 제25권4호
    • /
    • pp.373-383
    • /
    • 2018
  • The spatial scan statistic is a widely used method to detect spatial clusters. The method imposes a large number of scanning windows with pre-defined shapes and varying sizes on the entire study region. The likelihood ratio test statistic comparing inside versus outside each window is then calculated and the window with the maximum value of test statistic becomes the most likely cluster. The results of cluster detection respond sensitively to the shape and the maximum size of scanning windows. The shape of scanning window has been extensively studied; however, there has been relatively little attention on the maximum scanning window size (MSWS) or maximum reported cluster size (MRCS). The Gini coefficient has recently been proposed by Han et al. (International Journal of Health Geographics, 15, 27, 2016) as a powerful tool to determine the optimal value of MRCS for the Poisson-based spatial scan statistic. In this paper, we apply the Gini coefficient to normal-based spatial scan statistics. Through a simulation study, we evaluate the performance of the proposed method. We illustrate the method using a real data example of female colorectal cancer incidence rates in South Korea for the year 2009.

Spatial Focalization of Zen-Meditation Brain Based on EEG

  • Liu, Chuan-Yi;Lo, Pei-Chen
    • 대한의용생체공학회:의공학회지
    • /
    • 제29권1호
    • /
    • pp.17-24
    • /
    • 2008
  • The aim of this paper is to report our preliminary results of investigating the spatial focalization of Zen-meditation EEG (electroencephalograph) in alpha band (8-13 Hz). For comparison, the study involved two groups of subjects, practitioners (experimental group) and non-practitioners (control group). To extract EEG alpha rhythm, wavelet analysis was applied to multi-channel EEG signals. Normalized alpha-power vectors were then constructed from spatial distribution of alpha powers, that were classified by Fuzzy C-means based algorithm to explore various brain spatial characteristics during meditation (or, at rest). Optimal number of clusters was determined by correlation coefficients of the membership-value vectors of each cluster center. Our results show that, in the experimental group, the incidence of frontal alpha activity varied in accordance with the meditation stage. The results demonstrated three different spatiotemporal modules consisting with three distinctive meditation stages normally recognized by meditation practitioners. The frontal alpha activity in two groups decreased in different ways. Particularly, monotonic decline was observed in the control group, and the experimental group showed increasing results. The phenomenon might imply various mechanisms employed by meditation and relaxation in modulating parietal alpha.