• 제목/요약/키워드: 소프트웨어 클러스터링

검색결과 148건 처리시간 0.029초

딥러닝 기반의 딥 클러스터링 방법에 대한 분석 (Analysis of deep learning-based deep clustering method)

  • 권현;이준
    • 융합보안논문지
    • /
    • 제23권4호
    • /
    • pp.61-70
    • /
    • 2023
  • 클러스터링은 데이터의 정답값(실제값)이 없는 데이터를 기반으로 데이터의 특징벡터의 거리 기반 등으로 군집화를 하는 비지도학습 방법이다. 이 방법은 이미지, 텍스트, 음성 등 다양한 데이터에 대해서 라벨링이 없이 적용할 수 있다는 장점이 있다. 기존 클러스터링을 하기 위해 차원축소 기법을 적용하거나 특정 특징만을 추출하여 군집화하는 방법이 적용되었다. 하지만 딥러닝 기반 모델이 발전하면서 입력 데이터를 잠재 벡터로 표현하는 오토인코더, 생성 적대적 네트워크 등을 통해서 딥 클러스터링의 기술이 연구가 되고 있다. 본 연구에서, 딥러닝 기반의 딥 클러스터링 기법을 제안하였다. 이 방법에서 오토인코더를 이용하여 입력 데이터를 잠재 벡터로 변환하고 이 잠재 벡터를 클러스터 구조에 맞게 벡터 공간을 구성 및 k-평균 클러스터링을 하였다. 실험 환경으로 pytorch 머신러닝 라이브러리를 이용하여 데이터셋으로 MNIST와 Fashion-MNIST을 적용하였다. 모델로는 컨볼루션 신경망 기반인 오토인코더 모델을 사용하였다. 실험결과로 k가 10일 때, MNIST에 대해서 89.42% 정확도를 가졌으며 Fashion-MNIST에 대해서 56.64% 정확도를 가진다.

ETRI신기술-클러스터 기반 VOD 서버 S/W 기술

  • 한국전자통신연구원
    • 전자통신동향분석
    • /
    • 제14권2호통권56호
    • /
    • pp.131-132
    • /
    • 1999
  • 여러 대의 PC를 활용하여 효율적이고 확장성이 뛰어난 고성능 서버를 구축하는 클러스터링 기술을 기반으로 저렴한 가격으로 동시에 수십 명부터 1,000명(MPEG-1, 1.544Mbps 기준)이상의 사용자에게 멀티미디어 서비스 제공이 가능한 클러스터 기반 대용량 VOD(Video on Demand) 서버 소프트웨어인 MovieRo 개발 내용이다.

  • PDF

공통성과 가변성 분석 기반의 컴포넌트 모델링 기법 (Commonality and Variability Analysis-based Component Modeling Technique)

  • 김수동;조은숙;류성열
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권9호
    • /
    • pp.920-930
    • /
    • 2000
  • 컴포넌트 기반의 소프트웨어 개발이 소프트웨어 복잡성, 비용, 그리고 품질을 해결하기 위한 새로운 대안으로 소개되고 있다. COM, Enterprise JavaBeans, CORBA 컴포넌트 모델등과 같은 다양한 컴포넌트 아키텍쳐들이 소개되고 있으며 컴포넌트 기반의 소프트웨어 개발 방법론과 여러 CASE 도구들이 이를 지원하고 있다.[1,2,3,4]. 그러나 현재 컴포넌트를 구현할 수 있는 기술은 제시되어 있지만 컴포넌트를 모델링하는 기법들에 대한 연구는 미약한 상태이다. 본 논문에서는 도메인 분석에서 공통성과 가변성 추출 및 클러스터링 기법을 이용한 컴포넌트를 분석하는 기법을 제시한다. 즉 컴포넌트 추출 기법, 컴포넌트의 핫스팟(또는 가변성)표현 기법, 컴포넌트 요구사항 정의 기법 등을 제시한다. 컴포넌트 개발에 있어서 이러한 모델링 기법을 적용함으로써 컴포넌트를 효율적으로 개발할 수 있을 뿐만 아니라 재사용성이 높은 고품질의 컴포넌트 개발을 지원할 수 있다.

  • PDF

허용적 러프집합에 의한 소프트웨어 분류 (The Software Classification by the Tolerance Rough Set)

  • 김성애;최완규;이성주
    • 한국지능시스템학회논문지
    • /
    • 제11권2호
    • /
    • pp.141-147
    • /
    • 2001
  • 소프트웨어의 측정값에 근거하여 소프트웨어 품질에 관한 의사결정을 할 때, 동치관계의 요구조건인 추이적(transitive) 특성이 항상 만족되는 것은 아니다. 순환수(cyclomatic number)가 거의 비슷한 프로그램에서, 하나의 \"구조적인\" 프로그램 범주에 속하고 또 다른 하나는 \"비구조적인\" 프로그램 범주에 속한다고 명확히 분류할 수 있는가하는 점이다. 따라서, 본 연구에서는 동치관계보다는 허용적 관계를 만족하는 허용적 러프집합에 근거한 소프트웨어 분류기준을 제시하고자 한다. 분류기준을 생성하기 위한 실험 데이터 집합을 수집하고, 집합 내의 각 원소에 관한 허용적 클래스들을 생성한 후, 각 허용적 클래스들의 중심값을 클러스터링하여 분류기준을 생성한다. 생성된 분류기준을 또 다른 실험 집합에 적용하여 비교 분석한 결과 생성된 분류기준이 타당함을 보여준다.생성된 분류기준이 타당함을 보여준다.

  • PDF

허용적 러프집합에 기반한 소프트웨어 분류기준 (The Software Classification Criteria based on the Tolerant Rough Set)

  • 김상용;최완규;김영식;이성주
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2000년도 춘계학술대회 학술발표 논문집
    • /
    • pp.307-310
    • /
    • 2000
  • 소프트웨어의 측정값에 근거하여 소프트웨어 품질에 관한 의사결정을 할 때, 동치관계의 요구조건인 추이적(transitive) 특성이 항상 만족되는 것은 아니다. 순환수(cyclomatic number)가 거의 비슷한 프로그램에서, 하나는 "구조적인" 프로그램 범주에 속하고 또 다른 하나는 비구조적인 프로그램 범주에 속한다고 명확히 분류 할 수 있는가하는 점이다. 따라서, 본 연구에서는 동치관계보다는 허용적 관계를 만족하는 허용적 러프집합에 근거한 소프트웨어 분류 기준 제시하고자 한다. 분류기준을 생성하기 위한 실험 데이터 집합을 수집하고, 집합 내의 각 원소에 관한 허용적 클래스들을 생성한 후, 각 허용적 클래스들의 중심값을 클러스터링하여 분류기준을 생성한다. 생성된 분류기준을 또 다른 실험 집합에 적용하여 비교 분석하여 생성된 분류기준이 타당함을 보여준다.

  • PDF

클러스터링에 기반 도메인 분석을 통한 컴포넌트 식별 (Component Identification using Domain Analysis based on Clustering)

  • Haeng-Kon Kim;Jeon-Geun Kang
    • 한국컴퓨터산업학회논문지
    • /
    • 제4권4호
    • /
    • pp.479-490
    • /
    • 2003
  • 컴포넌트 기반 소프트웨어개발 (CBD: Component Based Development)은 재사용 부품을 기반하여 소프트웨어 개발, 수정, 유지보수를 용이하게 지원한다. 따라서 컴포넌트는 강한 응집력과 양한 결합력으로 개발되어야 한다. 본 논문에서는use case와 클래스를 간에 유사성을 통한 클러스터링 분석에 기반 하여 컴포넌트 식별에 대해 연구한다. 컴포넌트 참조 모델과 프레임워크를 제시하여 사례를 통해 검증한다. 컴포넌트 식별 방법은 추출, 명세 및 아키?쳐를 지원한다. 이들 방법론은 기존의 객체지향 방법론을 참조하며 분석에서 구현까지의 추적성을 지원하며 재사용 컴포넌트의 모듈성 지원을 위해 강한 응집력과 약한 결합력을 반영한다.

  • PDF

2H-Gel 이미지의 정렬 및 클러스터링 (Clustering of 2D-Gel images)

  • 허원
    • KSBB Journal
    • /
    • 제20권2호
    • /
    • pp.71-75
    • /
    • 2005
  • 2D-Gel 이미지간의 유사성을 기준으로 생물학적인 시료가 프로테옴 수준에서 유사성의 정도와 서로 다른 단백질 스팟을 파악해 낼 수 있다. 그러나 생물학적인 시료는 개체간 변화가 크고 2차원 전기영동장치의 재현성의 한계로 인하여 비교가 어려운 경우가 많고 의미 없는 차이점만 발견되는 경우 또한 비일비재하다. 이를 극복하기 위해서는 프로테옴 이미지간의 정렬을 통하여 정확한 비교가 가능하게 하여야한다. 본 연구에서는 이미지상의 단백질 스팟을 일일이 찾지 않고 여러 개의 원시 이미지를 동시에 정렬시키는 multiresolution-multilevel algorithm을 활용하여 소프트웨어를 개발하였다. 또 이렇게 정렬된 이미지들이 서로 얼마나 유사한지 보여주는 Phylogenetic tree를 자동으로 생성시키는 소프트웨어를 개발하였다. 이 방법을 이용하여 Fetal Alcohol Syndrome의 case와 control의 10개의 프로테옴 이미지에 대하여 클러스터링을 시도하였다. 이와 같이 2D-Gel 프로테옴 전체의 이미지를 비교하여 유사한 정도에 따라 모으는 클러스터링은 FAS 시료의 경우 case와 control 보다는 시료원의 외연적인 특징인 나이 혹은 성별에 더 의하여 의존하는 것으로 나타났다.

퍼지 클러스터링 기반의 국소평가 유전자 알고리즘 (Partially Evaluated Genetic Algorithm based on Fuzzy Clustering)

  • 유시호;조성배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권9호
    • /
    • pp.1246-1257
    • /
    • 2004
  • 유전자 알고리즘은 원하는 최적해를 찾기 위해서 개체 집단의 크기를 가능한 크게 유지하여야 한다. 하지만 실제 문제에서 개체의 적합도를 평가하는 것이 어려운 경우가 많기 때문에 큰 집단의 모든 개체에 대하여 적합도를 평가하는 것은 많은 시간과 비용을 요구한다. 이에 본 논문에서는 집단의 크기를 크게 유지하되 클러스터링에 의해 대표 개체만을 평가함으로써 효율을 높이는 퍼지 글러스터링 기반의 국소 평가 유전자 알고리즘을 제안한다. 나머지 개체들은 대표 개체로부터 간접적으로 적합도를 분배받는다. 다수의 집단에 소속되는 개체들의 경우, 하드 클러스터링 방법으로는 정확한 적합도 분배를 하기 어렵기 때문에 퍼지 c-means 알고리즘을 사용하였고, 클러스터 결과인 퍼지 소속 행렬에 의해 적합도를 배분하였다. 9개의 벤치마크 적합도 함수에 대하여 6가지 하드 클러스터링 알고리즘을 적용한 유클리디안 거리와 피어슨 상관계수에 의한 적합도 배분 방법과 본 논문에서 제안하는 방법을 비교 실천한 결과, 제안한 방법의 우수한 성능을 확인할 수 있었다.

최소좁은세상 셀룰러 유전알고리즘 (Smallest-Small-World Cellular Genetic Algorithms)

  • 강태원
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권11호
    • /
    • pp.971-983
    • /
    • 2007
  • 셀룰러 유전알고리즘(CGAs)은 모집단이 특정한 위상 구조를 갖는 유전알고리즘의 일종이다. 보통의 경우, CGAs의 모집단 공간은 네트워크 이론 측면에서 상대적으로 긴 평균경로길이와 큰 클러스터링계수를 갖는 정규 격자형 위상 구조이다. 평균경로길이가 길면 멀리 떨어진 개체들 사이의 유전적 상호작용이 느리게 일어난다. 따라서 클러스터링계수를 유지하면서 평균경로길이를 줄인다면 개체의 다양성이 유지되면서도 모집단이 보다 빠르게 수렴할 것이다. 이 논문에서는 최소좁은세상 셀룰러 유전알고리즘(SSWCGAs)을 제안한다. SSWCGAs에서 각 개체는 클러스터링이 잘되었으면서도 노드를 연결하는 평균경로길이가 짧은 모집단에 거주하여, 클러스터링에 의한 세부탐색 능력을 유지하면서도 전역탐색을 잘하게 된다. 네 가지 실변수 함수와 두 가지 GA-hard 문제에 대한 실험을 통하여 SSWCGAs가 SGAs 및 CGAs보다 효과적임을 보였다.

경계변수 값의 동적인 변경을 이용한 점층적 클러스터링 알고리즘 (Incremental Clustering Algorithm by Modulating Vigilance Parameter Dynamically)

  • 신광철;한상용
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권11호
    • /
    • pp.1072-1079
    • /
    • 2003
  • 본 논문은 점층적으로 대규모 문서 분류를 할 수 있는 새로운 클러스터링 알고리즘에 대한 것으로, 고차원의 대규모 문서 집합에 대한 클러스터링을 수행하는 spherical k-means (SKM) 알고리즘과 점층적인 방식으로 클러스터링을 수행하는 퍼지(fuzzy) ART(adaptive resonance theory) 신경망의 특징을 이용하였다. 즉, SKM의 벡터 공간 모델과 개념벡터를 토대로 퍼지 ART의 경계변수의 개념을 결합한 것이다. 제시하는 알고리즘은 점층적 클러스터링의 지원과 함께 최적의 클러스터 수를 자동으로 결정할 뿐 아니라 이상치(outlier)와 노이즈(noise)에 의한 overfitting의 문제도 해결하였다. 또한 생성된 클러스터들의 질을 평가할 수 있는 응집도를 측정하는 목적 함수의 값에 있어서도 CLASSIC3 데이타 집합으로 실험한 결과 기존의 SKM에 비해 평균 8.04%의 향상된 응집도를 나타냈다.