• 제목/요약/키워드: 군집 적합도

검색결과 339건 처리시간 0.038초

유전자 알고리즘을 이용한 군집화 기법의 적합도 함수에 관한 연구 (A Study on Fitness Function of Clustering Algorithm based on Genetic Algorithm)

  • 이수정;권혜련;김은주;이일병
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.310-312
    • /
    • 2001
  • 최근 관심의 대상이 되고 있는 CRM, eCRM에는 데이터 마이닝 기법이 핵심 기술로 이용되고 있다. 이러한 데이터 마이닝 기법가운데 가장 널리 사용되고 있는 군집화는, 데이터 집합을 유사한 데이터의 군집들로 분할하여 데이터 속에 존재하는 의미 있는 정보를 얻는 것이다. 그런데 기존의 군집화 알고리즘은 사전에 군집의 개수를 미리 결정해줘야 하고 잡음에 민감하여 지역적 최적해(local minima)에 수렴할 수 있다는 문제점을 가지고 있다. 이러한 문제점의 개선을 위해, 본 논문에서는 유사도 개념을 적합도 함수로 사용하는 유전자 알고리즘을 적용한 군집화 기법을 제안하다. 특히 적합도 하수에 사용된 군집의 대표값 개념은 요약 정보만을 이용하여 계산속도가 향상되기 때문에 대용량 데이터를 다루는 마이닝에 적합할 것을 기대된다.

  • PDF

유전자 알고리즘과 군집 분석을 이용한 확률적 시뮬레이션 최적화 기법 (Genetic Algorithm and Clustering Technique for Optimization of Stochastic Simulation)

  • 이동훈;허성필
    • 한국군사과학기술학회지
    • /
    • 제2권1호
    • /
    • pp.90-100
    • /
    • 1999
  • 유전자 알고리즘은 전통적인 등반 알고리즘을 이용하여 구하기 어려웠던 최적화 문제를 해결하기 위한 강인한(Robust) 탐색 기법이다. 특히 목적함수가 (1)여러 개의 국부 최대치를 가지는 경우, (2)수학적으로 표현이 불가능하거나 어려운 경우, (3)목적함수에 교란 항(disturbance term)이 섞여 있을 경우도 우수한 탐색 능력을 갖는 것으로 알려져 있다. 본 논문에서는 유전자 알고리즘을 이용하여 나타나는 다양한 해집합을 형성하는 개체군을 군집성 분석(cluster analysis)을 이용하여 군집화하고, 각 군집에 부여된 군집 적합도에 따라서 최적해를 구함으로써 단순 유전자 알고리즘에 의한 최적화보다 훨씬 향상된 탐색 알고리즘을 제안하였다. 반응표면의 형태가 정형화한 테스트 함수의 형태로 나타난다고 가정한 경우에 대하여 몬테 칼로 시뮬레이션을 통하여 본 알고리즘을 적용하여 평가하고 분석하였다.

  • PDF

붓스트랩 기법과 유전자 알고리즘을 이용한 최적 군집 수 결정 (Determination of Optimal Cluster Size Using Bootstrap and Genetic Algorithm)

  • 박민재;전성해;오경환
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2002년도 추계학술대회 및 정기총회
    • /
    • pp.263-266
    • /
    • 2002
  • 데이터의 군집화를 수행할 때 최적 군집수 결정은 군집 결과의 성능에 많은 영향을 미친다. 특히 K-means 방법에서는 초기 군집수 K에 따라 군집결과의 성능 차이가 많이 나타난다. 하지만 대다수의 군집분석에서 초기 군집수의 결정은 경험을 바탕으로 하여 주관적으로 결정된다. 이때 개체수와 속성수가 증가하면 이러한 결정은 더욱 어려워지며 이때 결정된 군집수가 최적이 된다는 보장도 없다. 본 논문에서는 군집의 수를 자동으로 결정하고 그 결과의 유효성을 보장하기 위해 유전자 알고리즘에 기반한 최적 군집수 결정 방안을 제안한다. 데이터의 속성에 근거한 초기 해 집단이 생성되고, 해 집단 내에서 최적화된 군집수를 찾기 위해 교차 연산이 이루어진다. 적합도 값은 전체 군집화의 비 유사성의 합의 역으로 결정되어 전체적인 군집화 성능이 향상되는 방향으로 수렴된다. 또한 지역 국소값을 해결하기 위해 돌연변이 연산이 사용된다. 그리고 유전자 알고리즘의 학습 시간의 비용을 줄이기 위해 붓스트랩 기법이 적용된다.

효율적인 군집화 시스템의 개발을 위해 유전자 알고리즘의 적용 (Application of Gene Algorithm for the development of efficient clustering system)

  • 이호현;조범준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (상)
    • /
    • pp.277-280
    • /
    • 2003
  • 현재 많은 관심의 대상이 되고 있는 데이터 마이닝은 대용량의 데이터베이스로부터 일정한 패턴을 분류하여 지식의 형태로 추출하는 작업이다. 데이터 마이닝의 대표적인 기법인 군집화는 군집내의 유사성을 최대화하고 군집들간의 유사성을 최소화시키도록 데이터 집합을 분할하는 것이다. 데이터 마이닝에서 군집화는 대용량 데이터를 다루기 때문에 원시 데이터에 대한 접근횟수를 줄이고 알고리즘이 다루어야 할 데이터 구조의 크기를 줄이는 군집화 기법이 활발하게 사용된다. 그런데 기존의 군집화 알고리즘은 잡음에 매우 민감하고, local minima에 반응한다. 또한 사전에 군집의 개수를 미리 결정해야 하고, initialization 값에 다라 군집의 성능이 좌우되는 문제점이 있다. 본 연구에서는 유전자 알고리즘을 이용하여 자동으로 군집의 개수를 결정하는 군집화 알고리즘을 제안하고, 여기서 제시하는 적합도 함수의 최적화된 군집을 찾아내어 조금더 효율적인 알고리즘을 만들어 대용량 데이터를 다루는 데이터 마이닝에 적용해 보려한다.

  • PDF

유전 알고리즘과 군집 분석을 이용한 확률적 시뮬레이션 최적화 기법

  • 이동훈
    • 한국시뮬레이션학회:학술대회논문집
    • /
    • 한국시뮬레이션학회 1998년도 추계학술대회 및 정기총회
    • /
    • pp.62-64
    • /
    • 1998
  • 유전 알고리즘은 전통적인 등반 알고리즘을 이용하여 구하기 어려웠던 최적화 문제를 해결하기 위한 강인한 (Robust) 탐색 기법이다. 특히 목적함수가 (1)여러 개의 국부 최대치를 가지거나 (2)수학적으로 표현이 불가능하거나 어렵거나 (3) 목적함수에 교란항이 섞여 있을 경우도 우수한 탐색 능력을 갖는 것으로 알려져 있다. 본 논문에서는 군집성 분석(cluster analysis)을 이용하여 군집화함으로써 유전 알고리즘을 이용하여 나타나는 다양한 해집합을 형성하는 개체군을 그룹화하고, 각 군집에 부여된 군집 적합도에 따라서 최적해를 구함으로써 최적값에 근접시킬 수 있는 탐색 알고리즘을 제안하였으며, 시뮬레이션의 출력이 특정한 테스트 함수의 형태로 나타난다고 가정한 경우에 확률적으로 나타나는 시뮬레이션 모델의 출력을 최대화하는 문제에 대하여 적용하고 분석하였다.

  • PDF

유전자 알고리즘을 이용한 효율적인 패턴 분류 시스템 구현 (The implementation of efficient pattern classification system using the gene algorithm)

  • 이호현;최용호;서원택;조범준
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 추계학술발표논문집
    • /
    • pp.792-795
    • /
    • 2002
  • 현재 많은 관심의 대상이 되고 있는 데이터 마이닝은 대용량의 데이터베이스로부터 일정한 패턴을 분류하여 지식의 형태로 추출하는 작업이다. 데이터 마이닝의 대표적인 기법인 군집화는 군집내의 유사성을 최대화하고 군집들간의 유사성을 최소화 시키도록 데이터 집합을 분할하는 것이다. 데이터 마이닝에서 군집화는 대용량 데이터를 다루기 때문에 원시 데이터에 대한 접근 횟수를 줄이고 알고리즘이 다루어야 할 데이터 구조의 크기를 줄이는 군집화 기법이 활발하게 사용된다. 그런데 기존의 군집화 알고리즘은 잡음에 매우 민감하고, local minima에 반응한다. 또한 사전에 군집의 개수를 미리 결정해야 하고, initialization 값에 따라 군집의 성능이 좌우되는 문제점이 있다. 본 연구에서는 유전자 알고리즘을 이용하여 자동으로 군집의 개수를 결정하는 LONGEPRO 알고리즘을 제안하고, 여기서 제시하는 적합도 함수의 최적화된 군집을 찾아내여 조금더 효율적인 알고리즘을 만들어 대용량 데이터를 다루는 데이터 마이닝에 적용해 보려 한다.

  • PDF

SCM 활용 패턴과 전략 유형 적합의 영향에 관한 연구 (A Study on the effect of the fit between SCM usage pattern and Strategic Typology)

  • 조남재;손지호
    • 한국정보기술응용학회:학술대회논문집
    • /
    • 한국정보기술응용학회 2006년도 춘계학술대회
    • /
    • pp.463-484
    • /
    • 2006
  • 본 연구는 많은 기업들이 SCM의 중요성을 인식하고 도입하여 활용을 하고 있는 정보시스템의 발전 단계에서 공급사슬에 참여하고 있는 기업이 어떻게 SCM을 활용하고 있는지에 초점을 둔 연구라 할 수 있다. 기존 연구에서 도출한 SCM 활용 목적에 대한 설문 항목을 중심으로 기업이 활용하고 있는 SCM 활용 패턴을 도출하였다. 군집 분석 방법을 활용하여 집단에 특성을 배정하여 동일 집단에 속한 대상의 유사성을 갖게 함으로써 집단 간의 차이를 명확하게 하였다. 군집 분석 결과 효율성을 추구 형, 군집, Business process 정확성 추구형 집단과 환경 변화 대응 추구형 군집으로 패턴을 나눌 수 있었다. 응답 기업을 Miles와 Snow의 전략유형으로 분류하여 응답 기업의 전략 유형을 판별한 결과 분석자형 40.6%, 방어자형 15.1%, 공격자형 37.2%, 반응자형 6.9%로 조사되었다. 위에서 유형화한 SCM의 활용 패턴과 전략유형을 Matrix화하여 가설인 SCM 활용 패턴과 전략유형의 적합도와 SCM 성과 만족도와의 관계를 검증하였다. 연구를 수행한 결과 기업이 SCM을 활용할 때, SCM 활용 패턴 및 전략 유형에 따라 SCM 성과 만족도가 다르게 나타난다는 것을 알 수 가 있다.

  • PDF

데이터 마이닝의 능률적인 군집화를 위한 유전자 알고리즘 적용에 관한 연구 (A Study on Gene Algorithm Application for Efficient Clustring of Data Mining)

  • 최호진;홍성표
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2008년도 제39차 동계학술발표논문집 16권2호
    • /
    • pp.41-44
    • /
    • 2009
  • 데이터 마이닝의 대표적인 기법인 군집화는 군집내의 유사성을 최대화하고, 군집들간의 유사성을 최소화 시키도록 데이터의 집합을 분할하는 것이다. 대용량의 데이터베이스에서 최적의 효율화를 내기 위해서는 원시데이터에 대한 접근 횟수를 줄이고, 이것을 알고리즘 적용 대상이 데이터 구조의 크기를 줄이는 군집화 기법에 많은 관심이 보이고 있다. 본 논문에서는 유전자 알고리즘을 이용하여 자동으로 군집의 개수를 결정하는 군집화 알고리즘을 제안하는 적합도 함수는 보다 양질의 군집을 찾아내는 것으로 평가 되었다. 또한 유전자 알고리즘 중 8가지를 세부 분석하여 평가하였다.

  • PDF

최적의 군집을 찾기 위한 상대적 군집 평가 방법 (Clustering Validity Assessment Using Relative Criteria for finding Optimal Clusters)

  • 김영옥;이수원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.334-336
    • /
    • 2002
  • 군집 분석은 데이터의 속성을 분석하여 서로 유사한 패턴을 가진 데이터를 묶는 방법이다. 군집 분석은 많은 응용 분야에서 쓰이고 있으나, 수행된 군집 분석 결과가 과연 정확한 결과이고 의미 있는 결과인지를 평가하는데 어려움이 있다. 본 논문에서는 군집이 형성된 데이터를 분석하여 군집 분석 결과를 평가하는 상대적 군집 평가 방법을 제안한다. 본 논문에서는 상대적 군집 평가 방법의 인덱스를 정의하고 형성된 군집 분석 결과에 적용해 최적의 군집, 의미 있는 군집을 찾을 수 있음을 보인다. 또한 실험을 통해 제안한 인덱스의 적합성을 보이며, 제안한 인덱스가 기존의 인덱스에 비해 최적의 군집, 의미 있는 군집을더 잘 찾을 수 있음을 보인다.

  • PDF

진화 알고리즘을 적용한 효율적 군집화 기법 (An Efficient Clustering using the Genetic Algorithm)

  • 이수정;권혜련;김은주;이일병
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (하)
    • /
    • pp.1017-1020
    • /
    • 2001
  • 최근 들어 관심의 대상이 되고 있는 CRM, eCRM은 비즈니스 분야에 중요한 역할을 담당하고 있다. 이를 위해 여러 방법들이 사용되고 있으나, 그 중 데이터 마이닝은 핵심 기술이라 할 수 있다. 다양한 데이터 마이닝 기법가운데 군집화 기법은, 데이터 집합을 유사한 데이터 개체들의 군집들로 분할하여 데이터 속에 존재하는 의미 있는 정보를 얻는 과정이다. 그런데 기존의 군집화 알고리즘들은 사전에 군집의 개수를 미리 결정해져야 하며, 지역적 최적해(local minima)에 수렴할 수 있다는 문제점을 가지고 있다. 본 논문에서는 진화 알고리즘을 사용하여 자동적으로 적절한 군집의 개수를 결정하여 군집화 될 수 있도록 하고, 병렬 탐색을 통해 지역적 최적해에 수렴되는 문제점을 개선한 알고리즘과 적합도 함수를 제안한다.

  • PDF