• 제목/요약/키워드: Log Clustering

검색결과 73건 처리시간 0.129초

시간단위 전력수요자료의 함수적 군집분석: 사례연구 (Functional clustering for electricity demand data: A case study)

  • 윤상후;최영진
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권4호
    • /
    • pp.885-894
    • /
    • 2015
  • 전력시스템의 안정적이고 효과적인 운영을 위해선 전력수요예측이 필요하다. 본 연구에서는 일별전력수요패턴의 시간에 따른 커브를 군집분석 하려고 한다. 2009년 1월 1일부터 2011년 12월 31일까지의 일별 시간단위 전력수요 자료는 추세성분 제거와 로그변환을 통해 계절성분과 오차성분으로 구성된 시계열자료로 변환되었다. 변환된 자료는 Ma 등 (2006)이 제안한 함수적 군집모형을 사용하여 분석되었고, 모수는 EM알고리즘과 일반화교차검정을 통해 추정되었다. 군집의 수는 휴일과 평일을 잘 분류하는 10개로 결정하였다. 분석결과 월요일, 평일 (화요일~금요일), 토요일, 일요일 또는 공휴일과 계절요인으로 전력수요 평균곡선이 설명된다. 함수적 군집분석을 통한 전력수요패턴의 과학적인 분류는 향후 단기전력수요예측에 활용된다.

Energy-Aware Self-Stabilizing Distributed Clustering Protocol for Ad Hoc Networks: the case of WSNs

  • Ba, Mandicou;Flauzac, Olivier;Haggar, Bachar Salim;Makhloufi, Rafik;Nolot, Florent;Niang, Ibrahima
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제7권11호
    • /
    • pp.2577-2596
    • /
    • 2013
  • In this paper, we present an Energy-Aware Self-Stabilizing Distributed Clustering protocol based on message-passing model for Ad Hoc networks. The latter does not require any initialization. Starting from an arbitrary configuration, the network converges to a stable state in a finite time. Our contribution is twofold. We firstly give the formal proof that the stabilization is reached after at most n+2 transitions and requires at most $n{\times}log(2n+{\kappa}+3)$ memory space, where n is the number of network nodes and ${\kappa}$ represents the maximum hops number in the clusters. Furthermore, using the OMNeT++ simulator, we perform an evaluation of our approach. Secondly, we propose an adaptation of our solution in the context of Wireless Sensor Networks (WSNs) with energy constraint. We notably show that our protocol can be easily used for constructing clusters according to multiple criteria in the election of cluster-heads, such as nodes' identity, residual energy or degree. We give a comparison under the different election metrics by evaluating their communication cost and energy consumption. Simulation results show that in terms of number of exchanged messages and energy consumption, it is better to use the Highest-ID metric for electing CHs.

k-means 클러스터링과 순차 패턴 기법을 이용한 VLDB 기반의 상품 추천시스템 (Product Recommendation System on VLDB using k-means Clustering and Sequential Pattern Technique)

  • 심장섭;우선미;이동하;김용성;정순기
    • 정보처리학회논문지D
    • /
    • 제13D권7호
    • /
    • pp.1027-1038
    • /
    • 2006
  • 대용량 데이터베이스에서의 추천시스템은 많은 문제점들을 지니고 있으므로, 대규모 인터넷 쇼핑몰에 적합한 추천 시스템 구조와 데이터 마이닝 기법의 필요성이 요구되고 있다. 따라서 본 논문에서는 k-mean 클러스터링과 순차 패턴 기법을 이용한 VLDB(very large database) 기반의 상품 추천 시스템을 설계 및 구현한다. 본 논문에서는 사용자의 정보를 일괄처리하고 다양한 카테고리를 계층적으로 정의하며, 탐색엔진에 순차 패턴 마이닝 기법을 이용한다. 예측 모델을 만들기 위하여 사용자의 로그 데이터 중에서 카테고리에 대한 사용자의 선호도를 추출하여 이용한다. 본 논문에서는 실험과 성능 평가를 위하여 국내 인터넷 쇼핑몰에서 30일 동안 수집한 실제 데이터를 이용한다. 또한 성능평가를 위하여 추천 예측 정확율(PRP: Predictive Recommend Precision), 추천 예측 재현율(PRR: Predictive Recommend Recall), 정확도 인수(PF1 : Predictive Factor One-measure)를 제안하여 사용한다. 성능평가 결과 가장 빠른 추천시간 및 학습시간은 O(N)이었고, 다양한 실험에서의 측도들의 값이 상당히 우수하였다.

제곱수익률 그래프와 TGARCH 모형을 이용한 비대칭 변동성 분석 (Squared Log-return and TGARCH Model : Asymmetric Volatility in Domestic Time Series)

  • 박진아;송유진;백지선;황선영;최문선
    • 응용통계연구
    • /
    • 제20권3호
    • /
    • pp.487-497
    • /
    • 2007
  • 일반적인 ARCH 형태의 모형들은 자산수익률의 급첨 (leptokurtic; heavy-tail) 성질과 변동성 집중 (volatility clustering) 현상 등의 특징을 잘 포착해내는 반면, 수익률의 부호에 따른 비대칭 레버리지 효과 (leverage effect)는 반영 할 수 없다는 단점을 가진다. 따라서 최근 금융 시계열 분야에서는 비대칭-조건부-이분산 시계열 모형에 대한 관심이 높아지고 있다. 본 연구에서는 국내 금융 시계열자료 (KOSPI, KOSDAQ, 환율, 채권, 주요종목의 주가)의 수익률 제곱을 그래프화 하여 비대칭 이분산성을 시각적으로 탐지하고 이를 바탕으로 비대 칭 TGARCH(1,1) 모형을 적합한 후 기존의 대칭 GARCH(1,1) 모형과 비교분석하고자 한다.

이단계 군집분석에 의한 농촌관광 편의시설 유형별 소비자 선호 결정요인 (Determinants of Consumer Preference by type of Accommodation: Two Step Cluster Analysis)

  • 박덕병;윤유식;이민수
    • 마케팅과학연구
    • /
    • 제17권3호
    • /
    • pp.1-19
    • /
    • 2007
  • 본 연구에서는 농촌관광 방문객에게 제공되는 편의시설을 유형화하고 어떤 특징을 가진 방문객이 어떤 편의시설을 선호하는지를 규명하기 위한 방법과 그 분석결과를 제시하였다. 이를 위하여 우선 2단계 군집분석법을 사용하여 농촌관광 편의시설을 유형화하였다. 그 다음으로 군집분석에 사용되는 변인이 범주형 변인이 있을 경우 전통적인 군집분석 방법을 적용할 수 없기 때문에 2단계 군집분석을 하였다. 본 연구는 2단계 군집분석법이 범주형 변인으로 측정된 농촌관광의 편의시설을 유형화하는 데 매우 유용하다는 것을 보여 주고 있다. 다중로짓 모형을 사용하여 특정 편의시설 유형을 선호할 확률에 영향을 미치는 농촌관광 방문자의 사회인구학적 특성과 여행특성을 규명하였다. 즉, 다중로짓 모형을 통해 참조항(일반농가형)으로 설정된 편의시설 유형에 비해 특정 편의시설을 선호할 확률에 영향을 미치는 소비자의 특성을 규명할 수 있다는 것이 본 연구의 특징이다.

  • PDF

미디어 레퍼토리를 이용한 스마트폰 애플리케이션 이용 패턴 유형 분석 (Mobile App Analytics using Media Repertoire Approach)

  • 권성은;장서인;황보현우
    • 한국전자거래학회지
    • /
    • 제26권4호
    • /
    • pp.133-154
    • /
    • 2021
  • 현대인에게 가장 보편적이고 융합적인 미디어인 스마트 폰은 애플리케이션이라는 비히클을 갖는 뉴미디어이다. 이 연구는 미디어 사용자들은 어떻게 레퍼토리를 구성하여 미디어를 이용하고 있는지를 파악하고자 2019년 11월, 4주 동안의 개인별 모바일 이용행동 로그 데이터를 이용하여 모바일 애플리케이션 카테고리별 미디어 이용량을 중심으로 군집 분석을 실시하고, 최종적으로 8개의 모바일 미디어 레퍼토리 유형별 집단을 분류하였다. 8개의 각 미디어 레퍼토리 그룹은 애플리케이션 카테고리별 절대적 이용량과 타 그룹 대비 상대적 이용량에서 차이를 보였으며, 데모그라픽적 분포에서도 집단간 차이를 보였다. 이 연구는 모바일 미디어 레퍼토리를 규명해 냈다는 학문적 기여뿐만 아니라 기존의 k-means clustering에 의존적이었던 군집 분석을 SOM(Sefl-Organized Map)을 이용하여 프로토벡터를 추출하고 이 프로토벡터를 이용하여 k-means clustering을 실시하는 이단계 접근법(two-step approach)을 시도함으로써, 기존 k-means clustering이 갖고 있는 '이상치(outlier)'나 '결측치'에 민감했던 한계점을 극복하고 더 나은 성능의 분석 결과를 도출하고 있음을 보여준다는 점에서 방법론적으로도 의미를 갖는다. 또한 모바일 미디어 이용 행동의 유형 분류 연구는 전자거래 서비스를 이용하는 고객을 유형분류하고, 각 고객 유형에 맞는 고객 관리 서비스를 집행해야 하는 실무진이 고객 행동 로그 데이터를 기반으로 고객의 구조를 파악하고 각 고객 집단에 적합한 서비스 또는 마케팅 의사결정을 차별적으로 집행해야 하는 전자거래 커뮤니티에 실무적 가이드를 제공한다는 점에서도 의미를 갖고 있다.

다양한 기기로부터의 데이터 단일 표현을 통한 개인 미멕스 시스템 (A Personal Memex System Using Uniform Representation of the Data from Various Devices)

  • 민영근;이복주
    • 정보처리학회논문지B
    • /
    • 제16B권4호
    • /
    • pp.309-318
    • /
    • 2009
  • 한 개인이 일상 생활을 하면서 겪는 사건을 자동으로 기록하고 탐색하는 시스템은 비교적 최근에 활발히 연구되고 있는 분야이다. 개인 미멕스(personal memex) 또는 라이프로그(life log)라 불리는 이러한 시스템은 MyLifeBits 프로젝트의 센스캠(SenseCam)처럼 보통 이를 위한 전용 디지털 기기를 수반한다. 본 연구에서는 개인의 일상 생활을 담는 매체로서 이러한 현대인이 일상적으로 사용하는 휴대폰, 신용카드, 디지털 카메라 등의 매체를 주목하였다. 이러한 매체에 직접 기록되는 일상 생활 또는 이러한 매체를 통해 상용 서비스를 제공하는 업체의 사이트 (예를 들면 휴대폰 회사 통화 기록)에 기록되는 일상 생활을 전송받아 체계적으로 저장하고 추후 빠르게 참조할 수 있도록 하였다. MyMemex라 불리는 본 시스템의 데이터 수집 에이전트는 이러한 싸이트에서 제공하는 웹 서비스를 이용하여 개인의 라이프로그 '웹 데이터'를 수집하여 서버에 저장한다. 또한 디지털 기기에 저장되는 '파일 데이터'를 로드하여 서버에 저장한다. 본 연구에서는 이러한 웹 데이터 또는 파일 데이터를 4W1H로 기술되는 하나의 미멕스 사건으로 보아 각 서비스마다 다른 형태를 가지는 데이터를 4 W1H 미멕스 사건 데이터로 변환한다. 이러한 변환에는 미멕스 사건 온톨로지를 사용한다. 웹 기반으로 제공되는 본 시스템에서 사용자는 자신의 일상 기록을 시간 순으로 볼 수 있고 특정 키워드를 이용하여 검색할 수 있다. 또한 미멕스 사건들이 문장으로 변환되어 일기 또는 이야기 형식으로 전개될 수 있다. 관련된 일련의 미멕스 사건들은 '에피소드'로 자동으로 군집화되어 보여진다. 저자 중 한명의 실제 라이프로그 데이터를 사용하여 에피소드 군집화를 실험한 결과 높은 정확도를 보였다.

PCA와 SOM을 이용한 자동 군집화 에이전트 (Automatic Clustering Agent using PCA and SOM)

  • 박정은;김병진;오경환
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 추계 학술대회 학술발표 논문집
    • /
    • pp.67-70
    • /
    • 2003
  • 인터넷의 정보 홍수 속에서 원하는 정보를 정확하게 제시간에 얻기란 쉬운 일이 아니며, 따라서 이러한 작업을 대신해주는 에이전트의 역할이 점점 커지고 있다. 대부분의 이벤트들이 실시간에 발생되고 처리되어야 하는 인터넷 환경에서는 분석가가 군집화의 방법과 결과 해석에 지속적으로 관여하기 어렵기 때문에 이러한 분석가의 업무를 대신하는 지능화된 에이전트가 필요하게 된다. 본 논문에서는 특히 자율학습 군집화에 대한 자동화된 시스템으로서 자동 군집화 에이전트를 제안하며 이 시스템은 군집화 수행 에이전트와 군집화 성능 평가 에이전트로 이루어져 있다. 두 개의 에이전트가 서로 정보를 교환하면서 자동적으로 최적의 군집화를 수행한다. 군집화 과정에서는 데이터를 분석하는 분석가가 군집화의 방법과 결과 해석에 실시간으로 관여하기 어렵기 때문에 이러한 작업을 담당하는 지능화된 에이전트가 자동화된 군집화를 담당하면 효과적인 군집화 전략이 될 수 있다. 또한 UCI Machine Repository의 IRIS 데이터와 Microsoft Web Log Data를 이용한 실험을 통해 제안 시스템의 성능 평가를 수행하였다.

  • PDF

철도 사상사고 위험도 평가를 위한 정량화 분석 기초모델 개발 (Development of Qualification Analysis Preliminary Frame for Railway Personal Injury Accident)

  • 박찬우;왕종배;박주남;곽상록
    • 한국철도학회:학술대회논문집
    • /
    • 한국철도학회 2007년도 춘계학술대회 논문집
    • /
    • pp.1227-1232
    • /
    • 2007
  • The objective of this study is to develop qualification analysis preliminary frame for railway personal injury accident. In this research, we develop accident scenarios to analyze systematically and evaluate quantitatively fatality accident scenarios for railway personal. The accident scenario analysis first identifies the hazardous events and explains the hazardous conditions that surround the accident and cause railway accidents. This method includes a feasibility test, a clustering process and a pattering process for a clearer understanding of the accident situation. Since this method enables an accident scenario analysis to be performed systematically as well as objectively, this method is useful in building better accident prevention strategies. Therefore, this study could serve to reduce railway accidents and could be an effective tool for a hazard analysis.

  • PDF

Fuzzy C-Means클러스터링을 이용한 웹 로그 분석기법 (Web Log Analysis Technique using Fuzzy C-Means Clustering)

  • 김미라;곽미라;조동섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.550-552
    • /
    • 2002
  • 플러스터링이란 주어진 데이터 집합의 패턴들을 비슷한 성실을 가지는 그룹으로 나누어 패턴 상호간의 관계를 정립하기 위한 방법론으로, 지금가지 이를 위한 많은 알고리즘들이 개발되어 왔으며, 패턴인식, 영상 처리 등의 여러 공학 분야에 널리 적용되고 있다. FCM(Fuzzy C-Means) 알고리즘은 최소자승 기준함수(least square criterion function)에 퍼지이론을 적용만 목적함수의 반복최적화(iterative optimization)에 기반을 둔 방식으로, 하드 분할에 의한 기존의 클러스터링 방법이 승자(winner take all) 형태의 방법론을 취하는데 비하여, 각 패턴이 특정 클러스터에 속하는 소속정도를 줌으로써 보다 정확한 정보를 형성하도록 도와준다. 본 논문에서는 FCM 기법을 이용한 웹로그 분석을 하고자 한다.

  • PDF