• 제목/요약/키워드: Cluster Tree

검색결과 339건 처리시간 0.029초

배경자료를 이용한 나무구조의 군집분석 (Tree Based Cluster Analysis Using Reference Data)

  • 최대우;구자용;최용석
    • 응용통계연구
    • /
    • 제17권3호
    • /
    • pp.535-545
    • /
    • 2004
  • 이 논문에서 제안하는 군집분석방법은 분석자료와 동일한 구조의 배경자료를 생성하고 이를 나무모형의 분류기법을 이용하여 분리해 냄으로써 변수들의 규칙으로 정의되는 군집을 형성한다. 배경자료는 reverse-arcing 알고리즘을 통하여 분석자료와 공간상에서 대비되도록 생성되며 군집이 효과적으로 식별되도록 돕는다. 이 방법은 분석자료에 이산형 변수가 혼합된 경우에도 적용할 수 있으며 모의실험자료와 실제 자료를 이용하여 제안된 알고리즘의 성능을 규명하였다.

XML 트리의 노드와 레벨을 사용한 군집화 방법 (Clustering Technique Using a Node and Level of XML tree)

  • 김우생
    • 한국정보통신학회논문지
    • /
    • 제17권3호
    • /
    • pp.649-655
    • /
    • 2013
  • 최근 들어 인터넷에서 많이 사용되는 XML 문서들을 효율적으로 접근, 질의, 관리하는 방법들이 연구되고 있다. 본 논문은 XML 문서들을 효율적으로 군집화 하는 새로운 기법을 제안한다. XML 문서의 원소는 대응하는 트리의 노드에 대응하며, 문서에서의 내포 관계는 대응하는 트리의 레벨 관계에 대응한다. 따라서 유사한 XML 문서들은 대응하는 트리들에서 노드의 이름과 레벨이 유사하다. 본 논문에서는 XML 문서의 특징으로 대응하는 트리의 노드 이름과 레벨을 사용하여 군집화를 수행하였다. 제안하는 기법이 좋은 결과를 얻을 수 있음을 실험을 통하여 보였다.

ATM망에서 다중 멀티캐스팅 서버를 이용한 IP 멀티캐스팅 방안 (IP Multicasting Scheme in ATM Networks)

  • 변태영;장성식;한기준
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제26권9호
    • /
    • pp.1145-1157
    • /
    • 1999
  • 본 논문에서는 RFC 2022에서 제안한 MARS 모델을 기반으로 하여 단일 대규모 클러스터를 가지는 ATM 망에서 다중의 멀티캐스팅 서버(MCS)를 이용한 멀티캐스팅 방안을 제안하고 그 성능을 평가하였다. 클러스터 내의 한 ATM 호스트가 특정 IP 멀티캐스트 그룹에 가입할 경우 ATM 호스트의 위치와 이미 존재하는 멀티캐스팅 서버들 사이의 전송 지연을 고려하여 가능한 한 종단간 전송 지연을 최소화하는 멀티캐스팅 서버를 선택하는 방안을 기술하였다. 이 방안은 최단거리 경로 알고리즘(shortest path algorithm)에 기반하여 최적의 MCS를 선정하고 송수신자 사이의 최소 지연을 가지는 멀티캐스트 트리를 구성한다. 다양한 망 위상에서 MCS의 분포 패턴을 다르게 할 경우에도 이 방안은 멀티캐스트 트리의 평균 전달 지연을 줄이는 것을 시뮬레이션을 통하여 확인하였다.Abstract In this paper, we proposed a scheme to support multiple MCSs over a single and large cluster in ATM networks, evaluated its performance by simulation. When an ATM host requests joining into a specific multicast group, the MARS designate a proper MCS among the multiple MCSs for the group member to minimize the average path delay between the sender and the group members. This scheme constructs a multicast tree through 2-phase partial multicast tree construction based upon the shortest path algorithm.We reduced the average path delay in multicast tree using our scheme under various cluster topologies and MCS distribution scenarios.

근거리 힘 계산의 새로운 고속화 방법 (A New Fast Algorithm for Short Range Force Calculation)

  • 안상환;안철오
    • 유체기계공업학회:학술대회논문집
    • /
    • 유체기계공업학회 2006년 제4회 한국유체공학학술대회 논문집
    • /
    • pp.383-386
    • /
    • 2006
  • In this study, we propose a new fast algorithm for calculating short range forces in molecular dynamics, This algorithm uses a new hierarchical tree data structure which has a high adaptiveness to the particle distribution. It can divide a parent cell into k daughter cells and the tree structure is independent of the coordinate system and particle distribution. We investigated the characteristics and the performance of the tree structure according to k. For parallel computation, we used orthogonal recursive bisection method for domain decomposition to distribute particles to each processor, and the numerical experiments were performed on a 32-node Linux cluster. We compared the performance of the oct-tree and developed new algorithm according to the particle distributions, problem sizes and the number of processors. The comparison was performed sing tree-independent method and the results are independent of computing platform, parallelization, or programming language. It was found that the new algorithm can reduce computing cost for a large problem which has a short search range compared to the computational domain. But there are only small differences in wall-clock time because the proposed algorithm requires much time to construct tree structure than the oct-tree and he performance gain is small compared to the time for single time step calculation.

  • PDF

소상공인 집적지에서의 인공지능 Fulfillment 서비스 Platform 연구 (Artificial Intelligence Fulfillment Service Platform in Small Business Areas)

  • 김효영;박대우
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.219-221
    • /
    • 2022
  • 세계 10대 도시이며 Metro City인 서울특별시는 인쇄, 봉제, 기계금속 등 전통적인 도심제조업이 분포되어있다. 이들 제조업은 세부 업종 및 공정에 따라 소상공인 집적지를 형성해 서로 상부상조 하는 형태로 발전해왔다. 집적지의 특성상 집적지 내 각 공정별 업체 간 물류는 신속히 이루어지고 있으나 상대적으로 영세한 소상공인이 최종 단계의 완제품 수요자에 대한 주문처리 서비스를 준비하기에는 어려운 현실이다. 따라서 원활한 수주, 배송처리를 위해 집적지 상공인을 위한 통합수주 Fulfillment Service Platform 도입이 시급하다. 본 논문에서는 전통 도심산업 중 인쇄업 소상공인의 기존 Fulfillment Service data를 수집, 분석하고 CRNN, k-NN, ID3 Decision Tree algorithm을 적용한 인공지능 Fulfillment Service Platform 시스템을 설계한다. 본 연구를 통하여 집적지 소상공인 누구나 활용할 수 있는 개별 수주, 배송 맞춤서비스 사용이 가능하게 함으로써 소상공인 매출 증대 및 역량 향상에 크게 기여할 것으로 기대한다.

  • PDF

Density-based Outlier Detection in Multi-dimensional Datasets

  • Wang, Xite;Cao, Zhixin;Zhan, Rongjuan;Bai, Mei;Ma, Qian;Li, Guanyu
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권12호
    • /
    • pp.3815-3835
    • /
    • 2022
  • Density-based outlier detection is one of the hot issues in data mining. A point is determined as outlier on basis of the density of points near them. The existing density-based detection algorithms have high time complexity, in order to reduce the time complexity, a new outlier detection algorithm DODMD (Density-based Outlier Detection in Multidimensional Datasets) is proposed. Firstly, on the basis of ZH-tree, the concept of micro-cluster is introduced. Each leaf node is regarded as a micro-cluster, and the micro-cluster is calculated to achieve the purpose of batch filtering. In order to obtain n sets of approximate outliers quickly, a greedy method is used to calculate the boundary of LOF and mark the minimum value as LOFmin. Secondly, the outliers can filtered out by LOFmin, the real outliers are calculated, and then the result set is updated to make the boundary closer. Finally, the accuracy and efficiency of DODMD algorithm are verified on real dataset and synthetic dataset respectively.

피복구성학적 인체계측과 집낙구조분석 ( I ) (Anthropometry for clothing construction and cluster analysis ( I ))

  • 김구자
    • 한국의류학회지
    • /
    • 제10권3호
    • /
    • pp.37-48
    • /
    • 1986
  • The purpose of this study was to analyze 'the natural groupings' of subjects in order to classify highly similar somatotype for clothing construction. The sample for the study was drawn randomly out of senior high school boys in Seoul urban area. The sample size was 425 boys between age 16 and 18. Cluster analysis was more concerned with finding the hierarchical structure of subjects by three dimensional distance of stature. bust girth and sleeve length. The groups forming a partition can be subdivided into 5 and 6 sets by the hierarchical tree of the given subjects. Ward's Minimum Variance Method was applied after extraction of distance matrix by the Standardized Euclidean Distance. All of the above data was analyzed by the computer installed at Korea Advanced Institute of Science and Technology. The major findings, take for instance, of 16 age group can be summarized as follows. The results of cluster analysis of this study: 1. Cluster 1 (32 persons means $18.29\%$ of the total) is characterized with smaller bust girth than that of cluster 5, but stature and sleeve length of the cluster 1 are the largest group. 2. Cluster 2 (18 Persons means $10.29\%$ of the total) is characterized with the group of the smallest stature and sleeve length, but bust girth larger than that of cluster 3. 3. Cluster 3(35persons means $20\%$ of the total) is classified with the smallest group of all the stature, bust girth and sleeve length. 4. Cluster 4(60 persons means $34.29\%$ of the total) is grouped with the same value of sleeve length with the mean value of 16 age group, but the stature and bust girth is smaller than the mean value of this age group. 5. Cluster 5(30 persons means $17.14\%$ of the total) is characterized with smaller stature than that of cluster 1, and with larger bust girth than that of cluster 1, but with the same value of the sleeve length with the mean value of the 16 age group.

  • PDF

백두대간 덕유산국립공원 송계사-못봉-월하탄지역 계곡부의 사면방향과 해발고에 따른 산림구조 (Forest Structure in Relation to Slope Aspect and Altitude in the Valley Forests at Songgyesa-Motbong-Wolhatan Area, Deogyusan National Park)

  • 박인협;최윤호
    • 한국환경생태학회지
    • /
    • 제18권2호
    • /
    • pp.124-130
    • /
    • 2004
  • 덕유산국립공원의 못봉지역을 중심으로 남향사면인 송계사-못봉지역과 북향사면인 월하탄-못봉지역의 계곡부를 대상으로 사면방향과 해발고에 따른 산림구조를 조사 분석하였다. 사면 전체로 볼 때, 북향사면이 남향사면에 비하여 교목층과 아교목층의 밀도, 평균 수고와 흉고직경, 흉고단면적 둥이 모두 높았다. 해발고가 높아짐에 따라 상대 중요치가 증가하는 수종은 들메나무, 까치박달 등이었으며, 감소하는 수종은 졸참나무, 갈참나무 등이었다. 식생층 전체의 목본식물 종다양도는 북향사면이 1.362로서 남향사면의 1.242보다 높았다. 이것은 북향사면이 남향사면에 비하여 종수와 균재도가 모두 높기 때문이었다. 해발고대별 전체 식생충의 종수, 종다양도는 2개 사면 모두 해발고가 높아짐에 따라 감소하는 경향이었다. Cluster 분석 결과 남향사면과 북향사면 중, 하부의 활엽수혼효군집, 남향사면과 북향사면 상부의 들메나무-신갈나무 군집, 능선부인 정부의 신갈나무 군집 등 3개 군집으로 구분되었다. 상대중요치에 의한 종상관 분석 결과 졸참나무, 물박달나무, 피나무는 3개 수종간 유의적인 정의 상관이 있었다. 서어나무는 층층나무, 피나무, 생강나무와 유의적인 정의 상관이 있었다. 들메나무는 소나무와 유의적인 부의 상관이 있었다.

지리산국립공원 상부운 계곡부의 해발고와 사면부위에 따른 산림구조 (Forest Stnlcture in Relation to Altitude and Part of Slope in a Valley forest at Sangbuun, lirisan National Park)

  • 박인협;최윤호
    • 한국환경생태학회지
    • /
    • 제16권4호
    • /
    • pp.457-464
    • /
    • 2003
  • 지리산국립공원 상부운 계곡부(725~1,090m)의 해발고와 사면부위에 따른 산림군집구조를 파악하기 위하여 해발고와 사면부위에 따라 48개 조사구를 설정하여 교목층과 아교목충을 대상으로 조사하였다. 계곡 하부에서 상부로 갈수록 교목층의 밀도는 감소하는 반면, 평균 수고, 흉고직경, 흉고단면적은 증가하였다. 이러한 경향은 계곡 하부에 인간의 간섭이 비교적 심하기 때문인 것으로 추정되었다. 해발고가 높아짐에 따라 상대중요치가 증가하는 경향을 보이는 수종은 물푸레나무, 굴참나무, 신갈나무 등이었으며, 감소하는 경향을 보이는 수종은 때죽나무, 서어나무, 소나무 등이었다. 사면하부에서 상부로 갈수록 상대중요치가 증가하는 경향을 보이는 수종은 굴참나무, 소나무 등이었으며, 감소하는 경향을 보이는 수종은 고로쇠나무. 개암나무 등이었다 계곡정부를 포함한 해발고대별 종다양도의 범위는 0.571~l.194이었으며, 해발고가 높아짐에 따라 종다양도는 감소하는 경향이었다. 해발고가 높아짐에 따라 종다양도가 감소하는 것은 종수와 균재도가 모두 감소하기 때문이었다. 사면부위별 종다양도는 1.172~1.285이었으며 , 사면 하부에서 중, 상부로 갈수록 종수와 종다양도가 감소하였다. 수종별 상대중요치에 의한 Cluster분석 결과 계곡하부의 사면 하부와 계곡중부의 사면 상, 중, 하부 및 계곡상부의 사면중, 상부에 위치하는 졸참나무-낙엽활엽수군집, 계곡하부의 사면 중. 상부에 위치하는 소나무-졸참나무군집, 계곡상부의 사면하부와 계곡정부에 위하는 신갈나무-낙엽활엽수군집 등 3개 유형의 군집으로 구분되었다.

계층 클러스터 트리 기반 라만 스펙트럼 식별 고속 검색 알고리즘 (A Hierarchical Cluster Tree Based Fast Searching Algorithm for Raman Spectroscopic Identification)

  • 김순금;고대영;박준규;박아론;백성준
    • 한국산학기술학회논문지
    • /
    • 제20권3호
    • /
    • pp.562-569
    • /
    • 2019
  • 최근에 원 거리에서 폭발 물질의 감지를 위해 라만 분광 기기의 관심이 점차 증가하고 있다. 더불어 측정된 화학물질에 대한 라만 스펙트럼을 대용량 데이터베이스의 알려진 라만 스펙트라와 비교하여 식별할 수 있는 고속 검색 방법에 대한 요구도 커지고 있다. 지금까지 가장 간단하고 널리 사용되는 방법은 주어진 스펙트럼과 데이터베이스 스펙트라 사이의 유클리드 거리를 계산하고 비교하는 방법이다. 하지만 고차원 데이터의 속성으로 검색의 문제는 그리 간단하지 않다. 가장 큰 문제점중의 하나는 검색 방법에 있어서 연산량이 많아 계산 시간이 너무 오래 걸린다는 것이다. 이러한 문제점을 극복하기 위해, 우리는 정렬된 분산에 따른 MPS Sort+PDS 방법을 제안하였다. 이 방법은 벡터의 두 개의 주요한 특징으로 평균과 분산을 사용하여 후보가 될 수 없는 많은 코드워드를 계산하지 않으므로 연산량을 줄이고 계산 시간을 줄여준다. 본 논문에서 우리는 기존의 방법보다 더욱 더 향상된 2가지 새로운 방법의 고속 검색 알고리즘을 제안한다. PCA+PDS 방법은 전체 데이터를 사용하는 거리 계산과 똑같은 결과를 가지면서 PCA 변환을 통해 데이터의 차수를 감소시켜 계산량을 줄여준다. Hierarchical Cluster Tree 알고리즘은 PCA 변환된 스펙트라 데이터를 사용하여 이진 계층 클러스터 트리를 만든다. 그런 후 입력 스펙트럼과 가장 가까운 클러스터부터 검색을 시작하여 후보가 될 수 없는 많은 스펙트라를 계산하지 않으므로 연산량을 줄이고 계산 시간을 줄여준다. 실험은 정렬된 분산에 따른 MPS Sort+PDS와 비교하여 PCA+PDS는 60.06%의 성능 향상을 보였다. Hierarchical Cluster Tree는 PCA+PDS와 비교하여 17.74%의 성능향상을 보였다. 실험결과는 제안된 알고리즘이 고속 검색에 적합함을 확인시켜 준다.