• 제목/요약/키워드: 데이터 클러스터링

검색결과 1,054건 처리시간 0.028초

주식시장 네트워크에서 클러스터링 기법을 이용한 포트폴리오 구성 방법 (A Method for Portfolio Construction Using a Clustering Technique on the Stock Market Networks)

  • 천봉환;김은경;정인준;우균
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.1396-1399
    • /
    • 2012
  • 본 논문은 주식 투자 포트폴리오를 구성하기 위해 클러스터링 기법을 이용하는 방법을 제안한다. 클러스터링 기법은 패턴 공간 상의 특징 벡터로 표현된 패턴 데이터를 몇 개의 부분집합으로 나누는 작업을 의미한다. 본 연구에서는 주식시장 네트워크에 클러스터링 기법을 적용하여 안정성과 수익률이 높은 포트폴리오를 구성하는 방법을 제안한다. 그리고 추천 클러스터의 투자 적합여부를 데이터를 통해 확인한다. 2007년 주식 데이터를 대상으로 실험한 결과, 추천 클러스터의 수익률이 전체 수익률을 상회함을 확인할 수 있었다.

클러스터링 센서네트워크의 방향성 전송 효과 (Effects of directional transmission on clustering WSN)

  • 김정미;장철호;김종근
    • 한국통신학회논문지
    • /
    • 제37권4B호
    • /
    • pp.258-268
    • /
    • 2012
  • 무선 센서 네트워크(WSN)에서는 저가 및 저 전력 센서로 구성되기 때문에 센서의 임무를 성공적으로 수행하면서 적은 에너지를 소모하는 것이 중요한 문제로 부각된다. 기존의 클러스터링 WSN에서는 헤드의 결정 및 헤드에 의한 데이터 수집과 전송 방안이 전체 네트워크의 성능에 큰 영향을 준다. 본 논문은 클러스터링 WSN에서 데이터 전송의 방향성을 고려한 하이브리드(Hybrid) 클러스터링 방법을 제안한다. 데이터의 효율적인 전송을 위해 모든 센서노드가 싱크로 데이터를 전송할 때 클러스터헤드를 거쳐 전송할 것인지 클러스터 헤드를 거치지 않고 싱크로 직접 전송할 것인지를 싱크, 헤드위치, 해당 센서노드의 위치에 따라 이원화 하는 하이브리드 라우팅 기법이다. 실험을 통하여 LEACH(Low Energy Adaptive Clustering Hierarchy) 방식과 비교하여 데이터를 싱크에서 역방향으로 전송 하지 않음으로써 거리와 에너지소모를 줄일 수 있음을 확인하였다.

데이터 마이닝에서 비트 트랜잭션 클러스터링을 이용한 빈발항목 생성 (Frequent Itemset Creation using Bit Transaction Clustering in Data Mining)

  • 김의찬;황병연
    • 정보처리학회논문지D
    • /
    • 제13D권3호
    • /
    • pp.293-298
    • /
    • 2006
  • 데이터베이스에는 많은 데이터들이 저장되어 있다. 무수히 많은 데이터들로부터 어떠한 정보를 얻기 위해서는 질의문을 사용하면 된다. 질의문을 통해 얻는 정보들은 기본적이고 단순한 정보들이다. 데이터 마이닝은 데이터베이스를 통해서 얻을 수 없는 정보를 얻게 해주는 기법이다. 데이터 마이닝 기법에는 여러 가지가 있지만 본 논문에서는 클러스터링과 연관규칙을 찾아내는 기법을 다룬다. 기존의 연관규칙 기법에서의 문제점을 보완하고 더 나은 규칙들을 찾아내기 위한 방법을 제시한다. 여기에 클러스터링 방법을 적용하게 되는데 기존의 거리기반이나 범주 기반 등의 클러스터링이 아닌 연관규칙에 적합한 클러스터링 기법을 제안하여 적용하게 된다. 각 클러스터의 연관규칙들을 찾게 되면 기존의 전체 데이터베이스에서 찾아진 연관규칙 뿐만 아니라 클러스터들의 특징이 될 규칙들도 찾을 수 있게 된다. 본 연구를 통해 대용량 데이터베이스의 많은 트랜잭션 접근을 줄이고 소집단의 연관성도 찾을 수 있다.

고차원 데이터를 부분차원 클러스터링하는 효과적인 알고리즘 (An Effective Algorithm for Subdimensional Clustering of High Dimensional Data)

  • 박종수;김도형
    • 정보처리학회논문지D
    • /
    • 제10D권3호
    • /
    • pp.417-426
    • /
    • 2003
  • 고차원 데이터에서 클러스터를 찾아내는 문제는 그 중요성으로 인해 데이터 마이닝 분야에서 잘 알려져 있다. 클러스터 분석은 패턴 인식, 데이터 분석, 시장 분석 등의 여러 응용 분야에 광범위하게 사용되어지고 있다. 최근에 이 문제를 풀 수 있는 투영된 클러스터링이라는 새로운 방법론이 제기되었다. 이것은 먼저 각 후보 클러스터의 부분차원들을 선택하고 이를 근거로 한 거리 함수에 따라 가장 가까운 클러스터에 점이 배정된다. 우리는 고차원 데이터를 부분차원 클러스터링하는 새로운 알고리즘을 제안한다. 알고리즘의 주요한 세 부분은, $\circled1$적절한 개수의 점들을 갖는 여러 개의 후보 클러스터로 입력 점들을 분할하고, $\circled2$다음 단계에서 유용하지 않은 클러스터들을 제외하고, 그리고 $\circled3$선택된 클러스터들은 밀접도 함수를 사용하여 미리 정해진 개수의 클러스터들로 병합한다. 다른 클러스터링 알고리즘과 비교하여 제안된 알고리즘의 좋은 성능을 보여주기 위하여 많은 실험을 수행하였다.

계층적 분류구조의 퍼지시스템 설계 및 시계열 예측 응용 (Design of Fuzzy System with Hierarchical Classifying Structures and its Application to Time Series Prediction)

  • 방영근;이철희
    • 한국지능시스템학회논문지
    • /
    • 제19권5호
    • /
    • pp.595-602
    • /
    • 2009
  • 시스템의 동작특성을 표현하는 퍼지 규칙들은 퍼지 클러스터링 기법에 매우 의존적이다. 만약, 클러스터링 기법의 분류 능력이 개선된다면, 그들에 의해 생성되는 퍼지 규칙과 식별되는 파라미터들이 보다 정밀해 질 수 있으므로 시스템의 성능이 개선될 수 있다. 따라서 본 논문에서는 분류능력이 강화된 새로운 계층 구조 클러스터링 알고리즘을 제안한다. 제안된 클러스터링 기법은 데이터 사이의 통계적 특성과 상관성을 고려하여 보다 정확하게 데이터들을 분류할 수 있도록 2개의 클러스터의 구조를 갖는다. 또한, 본 논문은 차분 데이터를 이용하여 원형 데이터의 패턴이나 규칙들이 명확하게 반영될 수 있도록 하며, 각각의 차분 데이터들의 다양한 특성을 고려할 수 있도록 다중 퍼지 시스템을 구현한다. 마지막으로, 제안된 기법들의 유효성을 다양한 비선형 시계열 데이터들의 예측을 통해 검증한다.

빈발 패턴 네트워크에서 연관 규칙 발견을 위한 아이템 클러스터링

  • 오경진;정진국;조근식
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2007년도 한국지능정보시스템학회
    • /
    • pp.321-328
    • /
    • 2007
  • 데이터마이닝은 대용량의 데이터에 숨겨진 의미있고 유용한 패턴과 상관관계를 추출하여 의사결정에 활용하는 작업이다. 그 중에서도 고객 트랜잭션의 데이터베이스에서 아이템 사이에 존재하는 연관규칙을 찾는 것은 중요한 일이 되었다. Apriori 알고리즘 이후 연관규칙을 찾기 위해 대용량 데이터베이스로부터 압축된 의미있는 정보를 저장하기 위한 데이터 구조와 알고리즘들이 제안되어 왔다. 본 논문에서는 정점으로 아이템을 표현하고, 간선으로 두 아이템집합을 표현하는 빈발 패턴 네트워크(FPN)이라 불리는 새 자료 구조를 제안한다. 빈발 패턴 네트워크에서 아이템 사이의 연관 관계를 발견하기 위해 이 구조를 어떻게 효율적으로 사용 하느냐에 초점을 두고 있다. 구조의 효율적인 사용을 위하여 한 아이템이 클러스터 내의 아이템과는 유사도가 높고, 다른 클러스터의 아이템과는 유사도가 낮도록 네트워크의 정점을 클러스터링하는 방법을 사용한다. 실험은 신뢰도, 상관관계 그리고 간선 가중치 유사도를 이용하여 네트워크에서 아이템 클러스터링의 정확도를 보여준다. 본 논문의 실험 결과를 통해 신뢰도 유사도가 네트워크의 정점을 클러스터링할 때 클러스터의 정확성에 가장 많은 영향을 미친다는 것을 알 수 있었다.

  • PDF

자기-구성 클러스터링에 의한 퍼지 모델링 (Fuzzy Modeling using Self-Organizing Clustering)

  • 김승석;전병석;김주식;유정웅;김성수
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2004년도 하계학술대회 논문집 D
    • /
    • pp.2513-2515
    • /
    • 2004
  • 본 논문에서는 주어진 데이터를 나누어 부분공간으로 구성하여 특성을 구분하거나 또다른 모델의 입력 파라미터로 제공하는 방법 중 하나의 클러스터링의 성능 개선과 이를 이용하여 퍼지 모델링을 실시하였다. 일반적인 클러스터링에서 볼 수 있는 초기 파라미터 결정 문제와 알고리즘의 수렴 문제에 대하여 문제점을 개선하였으며 클러스터링에 의하여 추정된 파라미터를 퍼지 모델에 적용하였다. 또한 일반적인 퍼지 모델의 경우 각 입력의 차원이 서로 독립적으로 구성되어 있어 데이터에서 존재하는 입력간의 상관관계를 고려하지 않았다. 제안된 퍼지 모델에서는 클러스터링에서 추정된 입력간의 상관관계(공분산)까지 고려하여 모델의 성능을 개선하였다. 제안된 논문의 유용성을 시뮬레이션을 통하여 보이고자 한다.

  • PDF

다양한 공간객체의 데이터 마이닝을 위한 공간 클러스터링 기법의 설계 (Design of Spatial Clustering Method for Data Mining of Various Spatial Objects)

  • 문상호;최진오;김진덕
    • 한국정보통신학회논문지
    • /
    • 제8권4호
    • /
    • pp.955-959
    • /
    • 2004
  • 공간 데이터 마이닝을 위한 기존의 클러스터링 기법들은 점 객체만을 대상으로 한다. 즉, 선이나 면 같은 다양한 공간 객체들을 지원하지 못한다. 이것은 클러스터링 과정에서 객체들 간의 거리 계산에 있어서, 점 객체는 용이하지만 선과 면인 경우에는 어렵기 때문이다. 본 논문에서는 이러한 문제점을 해결하기 위하여 균등 격자를 이용한 클러스터링 기법을 설계한다. 세부적으로 이 기법에서는 다각형 객체들 간의 거리 계산을 균등 격자를 이용하여 단순화시킴으로서 거리 계산에 따른 시간과 비용을 줄일 수 있다.

근사적 클러스터링에 의한 다중 전극 활동 전위 분류 (Multi-electrode Spike Sorting by Approximate Clustering)

  • 안종훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.346-351
    • /
    • 2007
  • 다중 전극으로 측정한 활동 전위의 분류(Multi-electrode spike sorting)는 단일 전극(single-electrode)보다 더 정확한 결과를 보여준다. 그러나 다중 전극에서 주어지는 활동 전위 크기들의 클러스터는 일반적으로 분류하기 쉴지 않은 문제이다. 이 논문에서는 고전적인 클러스터링 알고리듬 중의 하나인 Mountain method를 수정하여 다중 전극 활동전위의 분류에 적합한 알고리듬을 제안한다. 통상적인 데이터 클러스터링이 아닌 공간 분할을 통해 신경 데이터의 다양한 클러스터에 대해서 적응도가 높아지고 빠른 분류를 하게 된다.

  • PDF

노이즈에 강한 밀도를 이용한 Fuzzy C-means 클러스터링 알고리즘 (Noise resistant density based Fuzzy C-means Clustering Algorithm)

  • 고정원;최병인;이정훈
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2006년도 추계학술대회 학술발표 논문집 제16권 제2호
    • /
    • pp.211-214
    • /
    • 2006
  • Fuzzy C-Means(FCM) 알고리즘은 probabilitic 멤버쉽을 사용하는 클러스터링 방법으로서 널리 쓰이고 있다. 하지만 이 방법은 노이즈에 대하여 민감한 성질을 가진다는 단점이 있다. 따라서 본 논문에서는 이러한 노이즈에 민감한 성질을 보완하기 위해서 데이터의 밀도추정을 이용하여 새로운 FCM 알고리즘을 제안한다. 본 논문에서 제안된 알고리즘은 FCM과 비슷한 성능의 클러스터링 수행이 가능하며, 노이즈가 포함된 데이터에서는 FCM보다 더 나은 성능을 보여준다.

  • PDF