• 제목/요약/키워드: Demand Clustering

검색결과 129건 처리시간 0.03초

AMR 데이터에서의 전력 부하 패턴 분류 (Power Load Pattern Classification from AMR Data)

  • ;박진형;이헌규;신진호;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 춘계학술발표대회
    • /
    • pp.231-234
    • /
    • 2008
  • Currently an automated methodology based on data mining techniques is presented for the prediction of customer load patterns in load demand data. The main aim of our work is to forecast customers' contract information from capacity of daily power consumption patterns. According to the result, we try to evaluate the contract information's suitability. The proposed our approach consists of three stages: (i) data preprocessing: noise or outlier is detected and removed (ii) cluster analysis: SOMs clustering is used to create load patterns and the representative load profiles and (iii) classification: we applied the K-NNs classifier in order to predict the customers' contract information base on power consumption patterns. According to the our proposed methodology, power load measured from AMR(automatic meter reading) system, as well as customer indexes, were used as inputs. The output was the classification of representative load profiles (or classes). Lastly, in order to evaluate KNN classification technique, the proposed methodology was applied on a set of high voltage customers of the Korea power system and the results of our experiments was presented.

중기예보를 이용한 태양광 일사량 예측 연구 (A study on solar radiation prediction using medium-range weather forecasts)

  • 박수진;김효정;김삼용
    • 응용통계연구
    • /
    • 제36권1호
    • /
    • pp.49-62
    • /
    • 2023
  • 급속적으로 비중이 증가하고 있는 태양광 에너지는 지속적인 개발 및 투자가 이루어지고 있다. 신재생에너지 정책인 그린뉴딜과 가정용 태양광 패널의 설치가 증가함에 따라 국내 태양광 에너지 보급이 점차 확대되어 그에 맞추어 발전량의 정확한 수요 예측 연구가 활발하게 진행되고 있는 시점이다. 또한, 일사량 예측이 발전량 수요 예측에 가장 영향을 미치는 요소로 작용하고 있다는 점에서 일사량 예측의 중요성을 파악하였다. 덧붙여, 본 연구는 선행 연구들에서 사용되지 않은 중기예보 기상 데이터를 활용하여 일사량 예측을 하고자 하였다는 점에서 가장 큰 차이점을 확인할 수 있다. 본 논문에서는 서울, 인천, 수원, 춘천, 대구, 대전의 총 여섯 지역의 태양광 일사량 예측을 위하여 다중선형회귀모형, KNN, Random Forest 그리고 SVR 모형과 클러스터링 기법인 K-means 기법을 결합한 후, 클러스터별 확률밀도함수를 계산하여 시간별 일사량 예측을 진행하고자 하였다. 중기예보 데이터를 사용하기 전, 모형 예측 결과를 비교하기 위한 지표로서 MAE (mean absolute error)와 RMSE (root mean squared error)를 사용하였다. 데이터는 2017년 3월 1일부터 2022년 2월 28일까지의 시간별 원 관측 데이터를 중기예보 데이터 양식에 맞추어 일별 데이터로 변환하였다. 모형의 예측 성능 비교 결과, Random Forest로 일별 일사량을 예측한 후, K-means 클러스터링으로 기후요인이 유사한 날짜들을 분류한 뒤 클러스터별 일사량의 확률밀도함수를 계산하여 시간별 일사량 예측값을 나타낸 방법이 가장 우수한 성능을 보였다. 또한 이 방법론을 이용하여 중기예보 데이터에 모형 적합 후, 예측 결과를 확인하였을 때, 일자별로 예측 오류가 상승하는 것을 확인할 수 있었다. 이는 중기예보 기상데이터의 예측 오류로 인한 것으로 보인다. 향후 연구에서는 중기예보 데이터에서 활용할 수 있는 기상요인 중, 강수 여부와 같은 외생 변수를 추가하거나 시계열 클러스터링 기법을 적용한 연구가 이루어져야할 것으로 보인다.

통계분석을 이용한 낙동강유역의 수질변화 특성 조사 (Evaluation of Water Quality Characteristics in the Nakdong River using Statistical Analysis)

  • 최길용;임태효;이재운;천세억
    • 한국수자원학회논문집
    • /
    • 제45권11호
    • /
    • pp.1157-1168
    • /
    • 2012
  • 본 연구에서는 시간에 따른 수질 변화를 파악하고 원인에 따른 경향을 분석함으로써 적절한 관리대책을 수립하는 것이 필요하다고 생각되어 이 같은 연구를 하게 되었다. 현재 수질오염이 심각한 낙동강 수계를 대상으로 2006~2010년까지 수질변화를 분석하였다. 수계의 803개, 국가하천 13개소, 지방1급 하천은 10개소, 하천에 합류하는 하천은 31개 지점에서 측정한 수은, BOD(Biological Oxygen Demand), TN(Total Nitrogen)과 TP(Total Phosphorus) 등의 월평균 자료결과를 바탕으로 하여 통계적 분석(상관분석, 회귀분석, 분산분석, 시계열분석)을 통한 낙동강 유역의 인근 지역의 계절별로 수질항목을 확인하였으며, 평가지표에 따른 변화를 측정하고자 하였다. 유역의 지질 및 지형의 영향이 주로 작용하는데 지역의 기후조건, 식생, 지형, 토양, 비포화대 매질의 영향을 받기 때문에 여러가지의 변수를 가지고 유출했으며, 이는 방류량의 결정문제, 호소의 부영양화 문제 등이 제기될 수 있겠으며, 좋은 개선방안을 만들어보려고 한다. 따라서 낙동강의 강우기 유량을 증대하는 대책이 병행되는 것이 바람직하며, 물 관리 대책에는 하천유지용수 확보를 구성을 해야하며, 수로 건설사업 완료를 지속적인 관찰이 필요하다. 그러나 지류에는 물이 흐르지 않는 시기가 발생하는 이유는 자연 상태에서 흘러야 하는 하천수 및 공업용수와 농업용수로 취수했기 때문이다. 따라서 이모든 것을 관찰 및 구성을 하기 위해서는 지속적인 연구가 필요로 하며, 다음과 같은 연구의 목적을 두고 연구조사 하였다.

계층적 군집화 기반 Re-ID를 활용한 객체별 행동 및 표정 검출용 영상 분석 시스템 (Video Analysis System for Action and Emotion Detection by Object with Hierarchical Clustering based Re-ID)

  • 이상현;양성훈;오승진;강진범
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.89-106
    • /
    • 2022
  • 최근 영상 데이터의 급증으로 이를 효과적으로 처리하기 위해 객체 탐지 및 추적, 행동 인식, 표정 인식, 재식별(Re-ID)과 같은 다양한 컴퓨터비전 기술에 대한 수요도 급증했다. 그러나 객체 탐지 및 추적 기술은 객체의 영상 촬영 장소 이탈과 재등장, 오클루전(Occlusion) 등과 같이 성능을 저하시키는 많은 어려움을 안고 있다. 이에 따라 객체 탐지 및 추적 모델을 근간으로 하는 행동 및 표정 인식 모델 또한 객체별 데이터 추출에 난항을 겪는다. 또한 다양한 모델을 활용한 딥러닝 아키텍처는 병목과 최적화 부족으로 성능 저하를 겪는다. 본 연구에서는 YOLOv5기반 DeepSORT 객체추적 모델, SlowFast 기반 행동 인식 모델, Torchreid 기반 재식별 모델, 그리고 AWS Rekognition의 표정 인식 모델을 활용한 영상 분석 시스템에 단일 연결 계층적 군집화(Single-linkage Hierarchical Clustering)를 활용한 재식별(Re-ID) 기법과 GPU의 메모리 스루풋(Throughput)을 극대화하는 처리 기법을 적용한 행동 및 표정 검출용 영상 분석 시스템을 제안한다. 본 연구에서 제안한 시스템은 간단한 메트릭을 사용하는 재식별 모델의 성능보다 높은 정확도와 실시간에 가까운 처리 성능을 가지며, 객체의 영상 촬영 장소 이탈과 재등장, 오클루전 등에 의한 추적 실패를 방지하고 영상 내 객체별 행동 및 표정 인식 결과를 동일 객체에 지속적으로 연동하여 영상을 효율적으로 분석할 수 있다.

제주지역 감귤가격의 시계열적 특성 및 가격변동성에 관한 연구 (A Study on Price Volatility and Properties of Time-series for the Tangerine Price in Jeju)

  • 고봉현
    • 한국산학기술학회논문지
    • /
    • 제21권6호
    • /
    • pp.212-217
    • /
    • 2020
  • 본 연구의 목적은 Bollerslev(1986)의 GARCH 모형을 이용하여 제주지역 감귤가격의 시계열적 특성과 가격변동성(price volatility)에 대한 실증분석을 수행하는 것이다. 본 연구의 주요결과는 다음과 같이 요약된다. 첫째, 감귤 가격 변화율의 시계열이 정규분포가 아닌 꼬리가 두터운 분포를 지니고 있는 것으로 나타났다. 이는 Jarque-Bera 통계량이 1%의 유의수준에서 감귤 가격변화율의 시계열의 분포가 정규분포라는 귀무가설을 기각함으로써 검증되었다. 둘째, Ljung-Box Q 통계량을 통해 감귤 가격변화율 시계열 간 상관관계가 높은 것으로 분석되었으며, 이는 ARCH-LM 검정을 통해 통계적으로 검증되었다. 셋째 GARCH(1,1) 모형 추정결과, 평균방정식의 상수항을 제외하고는 모든 계수의 추정 값이 1%의 유의수준에서 통계적으로 유의한 결과를 보였다. 그리고 분산방정식의 지속성 모수(λ=α11) 값이 1에 근접한 것으로 추정되었다. 이는 현재와 유사한 변동성 수준이 장래에도 지속될 가능성이 매우 높은 것으로 해석된다. 그리고 이러한 결과는 제주감귤 가격변화율 시계열에서도 기존의 선행연구에서처럼 '변동성 군집(volatility clustering)' 현상이 나타나고 있음을 밝혀낸 것이다. 끝으로, 본 연구의 결과는 정부의 감귤 수급조절정책을 수립하는데 유용한 기초 자료로 활용될 수 있을 것으로 기대된다.

Genetic Traceability of Black Pig Meats Using Microsatellite Markers

  • Oh, Jae-Don;Song, Ki-Duk;Seo, Joo-Hee;Kim, Duk-Kyung;Kim, Sung-Hoon;Seo, Kang-Seok;Lim, Hyun-Tae;Lee, Jae-Bong;Park, Hwa-Chun;Ryu, Youn-Chul;Kang, Min-Soo;Cho, Seoae;Kim, Eui-Soo;Choe, Ho-Sung;Kong, Hong-Sik;Lee, Hak-Kyo
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제27권7호
    • /
    • pp.926-931
    • /
    • 2014
  • Pork from Jeju black pig (population J) and Berkshire (population B) has a unique market share in Korea because of their high meat quality. Due to the high demand of this pork, traceability of the pork to its origin is becoming an important part of the consumer demand. To examine the feasibility of such a system, we aim to provide basic genetic information of the two black pig populations and assess the possibility of genetically distinguishing between the two breeds. Muscle samples were collected from slaughter houses in Jeju Island and Namwon, Chonbuk province, Korea, for populations J and B, respectively. In total 800 Jeju black pigs and 351 Berkshires were genotyped at thirteen microsatellite (MS) markers. Analyses on the genetic diversity of the two populations were carried out in the programs MS toolkit and FSTAT. The population structure of the two breeds was determined by a Bayesian clustering method implemented in structure and by a phylogenetic analysis in Phylip. Population J exhibited higher mean number of alleles, expected heterozygosity and observed heterozygosity value, and polymorphism information content, compared to population B. The $F_{IS}$ values of population J and population B were 0.03 and -0.005, respectively, indicating that little or no inbreeding has occurred. In addition, genetic structure analysis revealed the possibility of gene flow from population B to population J. The expected probability of identify value of the 13 MS markers was $9.87{\times}10^{-14}$ in population J, $3.17{\times}10^{-9}$ in population B, and $1.03{\times}10^{-12}$ in the two populations. The results of this study are useful in distinguishing between the two black pig breeds and can be used as a foundation for further development of DNA markers.

데이터마이닝 기법을 이용한 서울시 지하철역 승차인원 예측 (A study on the number of passengers using the subway stations in Seoul)

  • 조수진;김보경;김나현;송종우
    • 응용통계연구
    • /
    • 제32권1호
    • /
    • pp.111-128
    • /
    • 2019
  • 지하철은 많은 승객들을 원거리까지 안전하고, 신속 정확하게 원하는 지점으로 대량 수송할 수 있는 친환경적인 교통수단이다. 지하철의 공익성을 증대시키기 위해서는 정확한 승객 수요 예측이 이루어져야 한다. 본 연구는 정확한 지하철 수요예측을 위하여, 군집분석을 통해 서울시 1-9호선 지하철역들을 군집화 하였다. 그 후, 전체 역과 각 군집 별 최종 예측 모형을 제시하였다. 군집화 결과, 294개의 역이 3개로 군집화 되었으며 그룹 1은 상공업지구, 그룹 2는 주상복합지구, 그룹 3은 주거지구가 중심이 되는 역들로 나타났다. 그 후 각 군집 별로 다양한 데이터 마이닝 기법을 이용해 지하철 승차인원 예측 모형을 제시하고, 수요 예측에 중요한 영향을 미치는 요인들을 도출하였다. 그리고 최종 모형을 바탕으로 2018년 10월에 개통될 서울시 9호선 3단계 연장역인 8개 신설역의 3개월 수요를 예측하였다. 8개 신설역의 월평균 시간당 평균 승차인원은 약 241에서 452명, 월평균 시간당 최대 승차인원은 약 969에서 1,515명으로 추정되었다. 본 분석의 최종 모형을 활용한 신설역의 지하철 수요 예측은 대중교통 정책 결정을 위한 기초자료로 활용되어 효율적인 지하철 운영 방안 수립에 기여할 수 있을 것이다.

클러스터 웹서버 제어시스템의 Time-delay 및 전달 특성 분석 (Analysis of Transfer Characteristics and Time-delay of Control System based on Clustering Web Server)

  • 남의석
    • 디지털융복합연구
    • /
    • 제12권8호
    • /
    • pp.219-227
    • /
    • 2014
  • 인터넷을 통한 정보 전달 방법은 Ethernet과 ATM, CAN과 같은 다양한 통신 전달 프로토콜 및 방법을 통해 이루어지고 있다. 현재 연구된 네트워크상의 시간 지연 현상에 대한 연구는 일부 네트워크 모델을 바탕으로 연구되고 있으나 다양한 통신 환경 하에서 발생하는 시간 지연 현상에 대해 최적의 모델링 방법을 제시해 주고 있지 못하고 있다. 따라서 다양한 네트워크 환경에 적합하도록 인터넷 기반 비동기 샘플치 시스템 모델에 대한 연구가 필요하다. 아울러 인터넷을 통해 구성된 폐루프 시스템은 기존 제어 시스템과 다른 동작 특성과 외란 특성을 가지므로 인터넷 환경에 적합하게 설계된 견실 제어 방법이 필요하다. 따라서 안정성이 극히 요구되는 각종 산업 기기 등에 대한 웹기반 정밀 원격 제어를 원활히 수행하기 위해서는 웹 환경에 최적화된 강인 제어 이론 개발이 필요하다. 따라서, 본 논문에서는 원격지 플랜트에 대한 실시간 원격 제어를 안정적 및 효율적으로 수행하도록 인터넷상의 데이터 전송시 시간 지연 현상 분석 및 인터넷 기반 제어시스템의 전달 특성 분석하였다.

PC 클러스터를 이용한 래스터 GIS 연산의 병렬화 (Parallelization of Raster GIS Operations Using PC Clusters)

  • 신윤호;박수홍
    • Spatial Information Research
    • /
    • 제11권3호
    • /
    • pp.213-226
    • /
    • 2003
  • GIS를 이용한 대용량의 지리정보 처리가 요구되고 있으나 단일 프로세서만으로 복잡한 GIS 연산을 처리하는 데는 능력의 한계성이 대두되고 있다. 특히, GIS 데이터의 증가속도에 프로세서 발전 속도가 미치지 못하고, 증가되는 광범위한 데이터를 처리하는 작업 또한 많은 시간이 걸리는 문제점이 나타나고 있다. 이에 대한 대안으로 계산의 양이 많고 또한, 대용량의 입·출력이 빈번히 일어나는 GIS 연산 작업을 여러 프로세서에 분산시켜 동시에 수행하도록 하는 GIS 작업의 병렬화에 대한 연구가 최근 활발히 진행되고 있다. 본 연구에서는 고가의 병렬 컴퓨터로만 수행되던 병렬 처리를 일반적인 GIS 사용자들이 사용하는 PC 기반으로 MPI(Message Passing Interface)를 사용하여 기존의 단일 프로세서로만 진행되던 래스터 GIS 연산에 대해서 병렬화 과정을 적용하여 연산의 처리 능력을 향상시키고자 한다. 이를 위해, GIS 연산들에 대한 체계적인 분석과 분류를 제시한 Tomlin(1990)의 래스터 GIS 연산을 기준으로 각 연산에 대해 적합한 데이터 분할 기법을 통한 병렬화 과정을 연구하였다.

  • PDF

Assessment through Statistical Methods of Water Quality Parameters(WQPs) in the Han River in Korea

  • Kim, Jae Hyoun
    • 한국환경보건학회지
    • /
    • 제41권2호
    • /
    • pp.90-101
    • /
    • 2015
  • Objective: This study was conducted to develop a chemical oxygen demand (COD) regression model using water quality monitoring data (January, 2014) obtained from the Han River auto-monitoring stations. Methods: Surface water quality data at 198 sampling stations along the six major areas were assembled and analyzed to determine the spatial distribution and clustering of monitoring stations based on 18 WQPs and regression modeling using selected parameters. Statistical techniques, including combined genetic algorithm-multiple linear regression (GA-MLR), cluster analysis (CA) and principal component analysis (PCA) were used to build a COD model using water quality data. Results: A best GA-MLR model facilitated computing the WQPs for a 5-descriptor COD model with satisfactory statistical results ($r^2=92.64$,$Q{^2}_{LOO}=91.45$,$Q{^2}_{Ext}=88.17$). This approach includes variable selection of the WQPs in order to find the most important factors affecting water quality. Additionally, ordination techniques like PCA and CA were used to classify monitoring stations. The biplot based on the first two principal components (PCs) of the PCA model identified three distinct groups of stations, but also differs with respect to the correlation with WQPs, which enables better interpretation of the water quality characteristics at particular stations as of January 2014. Conclusion: This data analysis procedure appears to provide an efficient means of modelling water quality by interpreting and defining its most essential variables, such as TOC and BOD. The water parameters selected in a COD model as most important in contributing to environmental health and water pollution can be utilized for the application of water quality management strategies. At present, the river is under threat of anthropogenic disturbances during festival periods, especially at upstream areas.