• 제목/요약/키워드: 최적의 클러스터 수

검색결과 155건 처리시간 0.02초

PC Network Cluster를 사용한 대규모 재료 시뮬레이션에 관한 연구 (A Study on a large-scale materials simulation using a PC networked cluster)

  • 최덕기;류한규
    • 한국항공우주학회지
    • /
    • 제30권5호
    • /
    • pp.15-23
    • /
    • 2002
  • 분자 동역학 기법을 사용한 재료 파괴 시뮬레이션은 계산량의 방대함으로 인하여 극히 최근까지 활발한 연구가 진행되지 못하였으나 최근 컴퓨터의 성능향상으로 인하여 새로운 연구분야로 떠오르고 있다. 분자 동역학은 그 특성상 계산 집약적인 환경을 요구함으로 대규모의 연산을 위해서는 슈퍼컴퓨터나 클러스터(cluster)의 사용이 필수적이나 고가의 장비와 사용료로 인하여 많은 제한을 받아왔다. 본 연구에서는 PC를 사용하여 클러스터를 제작하고, 균열이 있는 시편을 사용하여 파괴현상에 대한 분자 수준의 거동을 시뮬레이션 하였으며, 클러스터의 노드(node) 수, 효율, 분자 수, 노드간의 통신시간 등의 상호관계를 파악하여 최적의 성능을 가진 클러스터를 구성하는 데 필요한 요소들을 분석하였다. 제작된 PC 클러스터를 사용하여 약 50,000개의 분자를 사용한 재료 파괴 시뮬레이션을 수행하였다.

효율적인 영상 검색을 위한 클러스터링 기반 고속 다 해상도 전역 탐색 기법 (Fast Multi-Resolution Exhaustive Search Algorithm Based on Clustering for Efficient Image Retrieval)

  • 송병철;김명준;라종범
    • 대한전자공학회논문지SP
    • /
    • 제38권2호
    • /
    • pp.117-128
    • /
    • 2001
  • 유사도 측정자 (similarity measure)에 따라 문의자 (query)의 최적 정합자 (the best match)를 찾는 최적 검색 (optimal retrieval)을 위해서는 데이터베이스의 모든 영상들에 대해 전역 탐색 (exhaustive search)을 수행해야 한다. 그러나, 일반적인 전역 탐색은 방대한 계산량을 요구한다. 그 계산량을 줄이기 위해, 본 논문은 영상 데이터베이스의 클러스터링 (clustering)에 기반한 고속 다 해상도 전역 탐색 기법을 제안한다. 먼저 데이터베이스 내의 모든 영상들을 일정 수의 클러스터 (cluster)들로 나눈다. 각 클러스터는 유사한 특징 (feature)을 갖는 영상들로 구성된다. 그리고, 각 클러스터와 문의자 간 거리 (distance)의 하계(lower bound)를 구하고, 가능성이 전혀 없다고 판단될 경우 그 클러스터를 제거한다. 가능성이 있다고 판단된 클러스터들에 속한 후보 영상들 중에서 최적 정합자를 찾는다. 또한, 불필요한 특징 정합 연산을 줄이기 위해 다 해상도 데이터 구조에 기반한 거리 부등식 성질 (distance inequality property)을 유도하여, 탐색 과정에 적용한다. 제안한 기법은 고속 다 해상도 전역 탐색 기법으로서 단일 최적 정합자뿐만 아니라 다수의 상위 최적 정합자들도 정확하게 찾을 수 있다. 가장 보편적인 밝기 히스토그램 (luminance histogram)특징을 사용하여, 제안한 기법이 고속의 탐색 속도와 함께 최적 검색을 보장함을 증명해 보인다.

  • PDF

Bacterial Foraging Algorithm과 FCM 기반 퍼지 시스템을 이용한 비선형 시스템 모델링 (Nonlinear System Modeling Using Bacterial Foraging and FCM-based Fuzzy System)

  • 조재훈;전명근;김동화
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2006년도 춘계학술대회 학술발표 논문집 제16권 제1호
    • /
    • pp.121-124
    • /
    • 2006
  • 본 논문에서는 Bacterial Foraging Algorithm과 FCM(fuzzy c-means)클러스터링을 이용하여 TSK(Takagi-Sugeno-Kang)형태의 퍼지 규칙 생성과 퍼지 시스템(FCM-ANFIS)을 효과적으로 구축하는 방법을 제안한다. 구조동정에서는 먼저 PCA(Principal Component Analysis)을 이용하여 입력 데이터 성분간의 상관관계를 제거한 후에 FCM을 이용하여 클러스터를 생성하고 성능지표에 근거해서 타당한 클러스터의 수, 즉 퍼지 규칙의 수를 얻는다. 파라미터 동정에서는 Bacterial Foraging Algorithm을 이용하여 전제부 파라미터를 최적화 시킨다. 결론부 파라미터는 RLSE(Recursive Least Square Estimate)에 의해 추정되어진다. PCA(Principal Component Analysis)와 FCM을 적용함으로써 타당한 규칙 수를 생성하였고 Bacterial Foraging Algorithm을 이용하여 최적의 전제부 파라미터를 구하였다. 제안된 방법의 성능을 평가하기 위하여 Box-Jenkins의 가스로 데이터와 Rice taste 데이터의 모델링에 적용하였고 우수한 성능을 보임을 알 수 있었다.

  • PDF

Development of an unsupervised learning-based ESG evaluation process for Korean public institutions without label annotation

  • Do Hyeok Yoo;SuJin Bak
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권5호
    • /
    • pp.155-164
    • /
    • 2024
  • 본 연구는 ESG 등급이 제공되지 않는 국내 공공기관의 ESG 등급을 추정하는 비지도 학습 기반 군집모형을 제안한다. 이를 위해, 스펙트럼 군집과 k-means 군집에서 최적의 클러스터 수를 비교했고, 그 결과의 신뢰성을 보장하기 위해 성능지표인 Davies-Bouldin Index (DBI)를 계산했다. 결과적으로, 스펙트럼 군집과 k-means 군집에서 각각 0.734 및 1.715의 DBI 값을 산출했는데, 이는 값이 작을수록 우수한 성능을 의미하므로 스펙트럼 군집의 우수성을 확인하였다. 게다가, T-검정 및 ANOVA를 이용하여 ESG 비재무 데이터 간 통계적으로 유의미한 차이를 밝혀내고, 상관계수를 이용하여 ESG 항목 간 상관관계를 확인했다. 본 연구는 이러한 결과를 바탕으로 기존 ESG 등급 없이 공공기관별 ESG 성과 순위를 추정할 가능성을 제시한다. 이는 최적의 클러스터 수를 계산한 다음, 각 클러스터 내 ESG 데이터의 평균 총합을 결정함으로써 달성된다. 따라서, 제안된 모델은 다양한 국내 공공기관의 ESG 등급을 평가하는 근거로 활용될 수 있고, 국내 지속가능경영 실천과 성과관리에 유용할 것으로 기대된다.

해양 센서 네트워크에서 네트워크 클러스터링을 위한 유전 알고리즘 (A Genetic Algorithm for Network Clustering in Underwater Acoustic Sensor Networks)

  • 장길웅
    • 한국정보통신학회논문지
    • /
    • 제15권12호
    • /
    • pp.2687-2696
    • /
    • 2011
  • 해양 센서 네트워크에서 클러스터링 문제는 네트워크 수명 및 확장성을 향상시키기 위한 문제 중 하나이다. 본 논문은 모든 노드가 클러스터 헤더를 통하여 싱크 노드로 데이터를 전송하는데 사용되는 전송 에너지를 최소화할 수 있는 클러스터링 문제의 최적 결과를 찾는 알고리즘을 제안한다. 일반적으로 네트워크에서 노드의 수가 증가하면 적절한 클러스터 구성을 위한 계산량은 급격히 늘어나게 된다. 본 논문에서는 적정한 시간 내에 최적의 클러스터 구성을 위한 유전 알고리즘을 제안하며, 효율적인 검색을 위해 유전 알고리즘의 효과적인 이웃해 생성 동작을 제안한다. 제안된 알고리즘은 전송 에너지와 실행시간 관점에서 성능을 평가하며, 평가 결과에서 제안된 알고리즘이 해양 센서 네트워크에서 클러스터를 효과적으로 구성함을 보인다.

클러스터 생성을 이용한 자기구성 퍼지 모델링 (Self-Organizing Fuzzy Modeling Using Creation of Clusters)

  • 고택범
    • 한국지능시스템학회논문지
    • /
    • 제12권4호
    • /
    • pp.334-340
    • /
    • 2002
  • 본 논문에서는 상대적으로 큰 퍼지 엔트로피를 갖는 입력-출력 데이터 집단에 다중 회귀 분석을 적용하여 다차원 평면 클러스터를 생성하고, 이 클러스터를 새로운 퍼지 모델의 규칙으로 추가한 후 모델 파라미터의 개략 동조와 정밀 동조를 반복 수행하는 자기구성 퍼지 모델링을 제안한다 Weighted recursive least squared 알고리즘과 fuzzy C-regression model 클러스터링에 의해 퍼지 모델의 파라미터를 개략적으로 동조한 후 gradient descent 알고리즘에 의해 파라미터를 정밀 동조하면서 감수분열 유전 알고리즘을 이용하여 최적의 학습률을 탐색한다. 그리고, 자기구성 퍼지 모델링 기법을 이용하여 Box-Jenkins의 가스로 데이터, 비선형 다변수 정적 함수의 데이터, 하수처리 활성오니 공정과 Mackey-Glass 시계열 데이터의 모델링을 수행하고, 기존의 방법에 의한 모델링 결과와 비교하여 그 성능을 입증한다.

퍼지 성능 측정자를 결합한 최적 클러스터 분석방법 (An Optimal Cluster Analysis Method with Fuzzy Performance Measures)

  • 이현숙;오경환
    • 한국지능시스템학회논문지
    • /
    • 제6권3호
    • /
    • pp.81-88
    • /
    • 1996
  • 클러스터링은 주어진 데이타 집합의 패턴을 비슷한 성질을 가지는 그룹으로 나누어 패턴 상호간의 관계를 정립하기 위한 방법론이다. 이러한 클러스터링 기법을 위하여 많은 알고리즘이 개발되었고, 패턴인식과 영상처리 등의 여러 공학영역에 적용되어 왔다. 대부분의 실세계 데이타는 그 경계가 명확하지 않으므로 그 특성을 보다 정확히 반영하기 위하여 퍼지이론이 도입되었다.이와 같은 클러스터 분석 방법은 보다 적절히 으용하기 위하여 클러스터링의 적절성을 평가하기 위한 방법론과 함께 연구되어야 한다. 이를 위하여 각 데이타 패턴이 얼마나 잘 분류되었는지를 수학적으로 계산하기 위한 함수들이 제안되었다. 그러나 클로스터 타당성 문제는 주어지 클러스터링 방법론의 특성, 그 알고리즘에서 사용한 파라메터의 성질, 주어진 입력 데이타 집합의 특성 등 여러 복잡한 상황을 포함하고 있으므로 기존의 연구에서와 같이 하나의 함수를 이용하여 해결하기는 어렵다. 그러므로 본 논문에서는 기존에 연구되어온 타당성 측정 함수를 조사하고 그의 단점을 고찰하여 이를 해결하기 위한 방법으로 4가지성능 측정자를 제안하고 이의 결합에 의하여 형성된 클러스터 타당성의 정도를 구하는 방법론을 제시하고자 한다. 또한 이러한 방법은 퍼지 클러스터링을 위한 학습 알고리즘과 결함하여 클러스터의 수나 데이타의 분포에 대한 정보없이 최적 클러스터를 찾아주는 방법에 응용될 수 있음을 보인다.

  • PDF

진화 알고리즘에서 휴리스틱 연산 (Heuristic Operation in Evolutionary Algorithms)

  • 류정우;김명원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.25-27
    • /
    • 2001
  • 진화 알고리즘에서 고려할 사항 중 하나는 문제와 관련 있는 진화연산 즉, 교배 연산과 돌연변이 연산을 정의하는 것이다. 일반적으로 교배 연산은 두 개체의 정보를 교환하는 재조합 연산으로써 진화의 속도를 촉진시키는 역할을 하고 돌연변이 인산은 개체집단의 다양성 을 유지시키는 역할을 한다. 그러나 이러한 진화연산자는 확률에 근거하여 모든 개체에 적용되는 맹목적인 연산이 가질 수 있는 진화시간 지연의 문제점을 갖는다. 본 논문에서는 맹목적 진화연산에 의한 진화 시간 지연을 해결하기 위해 휴리스틱 연산을 제안한다. 휴리스픽 연산은 문제의 특성에 맞지 않는 개체에만 적용되는 연산으로 진화 시간을 단축시킬 수 있다. 따라서 이러한 휴리스틱 연산의 타당성을 확인하기 위해 본 논문에서는 진화 알고리즘을 이용하여 최적의 클러스터 위치와 개수를 자동으로 찾아주는 문제에 클러스터의 특성을 고려한 휴리스틱 연산인 합병연산과 분할연산 그리고 K-means연산을 정의하여 다차원 실험데이터로 실험한 결과를 보이고 있다.

  • PDF

하둡 클러스터의 대역폭을 고려한 압축 데이터 전송 및 저장 기법 (Data Transmitting and Storing Scheme based on Bandwidth in Hadoop Cluster)

  • 김용민;김희진;김영관;홍지만
    • 스마트미디어저널
    • /
    • 제8권4호
    • /
    • pp.46-52
    • /
    • 2019
  • 산업 현장과 공공 기관에서 생성 및 수집되는 데이터의 크기가 빠르게 증가하고 있다. 기존의 데이터 처리 서버는 스케일업 방식으로 성능을 높여 증가하는 데이터를 처리하였다. 그러나 데이터의 생성 속도가 폭증하는 빅데이터 시대에는 기존 방식의 서버로는 데이터 처리에 한계가 있다. 이러한 한계를 극복하기 위해 스케일 아웃 방식으로 데이터를 분산 처리하는 분산 클러스터 컴퓨팅 시스템이 등장하게 되었다. 그러나 분산 클러스터 컴퓨팅 시스템은 데이터를 분산 처리하기 때문에 네트워크 대역폭을 비효율적으로 사용할 경우 클러스터 전체의 성능을 하락시킬 수 있다. 본 논문에서는 네트워크 대역폭을 고려하여 하둡 클러스터에서 데이터 전송 시 데이터를 압축 전송하는 기법을 제안한다. 제안 기법은 네트워크 대역폭과 압축 알고리즘의 특징을 고려하여 최적의 압축 전송 기법을 선정 후 전송한다. 실험 결과는 제안 기법을 사용할 경우 데이터 전송 시간과 크기를 감소시킨 것을 보여준다.

무선 센서 네트워크에서 개선된 LEACH 알고리즘 (Improved LEACH Algorithm in Wireless Sensor Networks)

  • 임규근;조동옥;고진광
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.231-233
    • /
    • 2015
  • 무선 센서 네트워크는 다수의 센서 노드와 하나의 싱크노드로 구성된다. 센서 네트워크상에 분포된 센서 노드들은 데이터 전송 중에 배터리 재충전이나 변경이 곤란하다. 센서들의 제한적 특성을 때문에 일반 유선 네트워크와 달리 에너지 효율적인 네트워크 설계를 요구한다. 이러한 문제를 해결하기 위해 계층적 클러스터 라우팅 프로토콜로서 LEACH 프로토콜을 분석하고, 센서들의 에너지 소모를 줄이고, 네트워크 수명을 연장하는 개선된 LEACH 라우팅 프로토콜을 제안한다. 최적 클러스터를 결정하는 기법을 이용하여 클러스터 수를 고려한 클러스터를 형성하고, 성능 분석은 MATALAB을 이용하여 시뮬레이션 하였으며, 본 개선된 프로토콜이 LEACH 프로토콜과 비교하여 우수함을 보였다.