• 제목/요약/키워드: time series clustering

검색결과 187건 처리시간 0.028초

DETECTION OF FRUITS ON NATURAL BACKGROUND

  • Limsiroratana, Somchai;Ikeda, Yoshio;Morio, Yoshinari
    • 한국농업기계학회:학술대회논문집
    • /
    • 한국농업기계학회 2000년도 THE THIRD INTERNATIONAL CONFERENCE ON AGRICULTURAL MACHINERY ENGINEERING. V.II
    • /
    • pp.279-286
    • /
    • 2000
  • The objective of this research is to detect the papaya fruits on tree in an orchard. The detection of papaya on natural background is difficult because colors of fruits and background such as leaves are similarly green. We cannot separate it from leaves by color information. Therefore, this research will use shape information instead. First, we detect an interested object by detecting its boundary using edge detection technique. However, the edge detection will detect every objects boundary in the image. Therefore, shape description technique will be used to describe which one is the interested object boundary. The good shape description should be invariant in scaling, rotating, and translating. The successful concept is to use Fourier series, which is called "Fourier Descriptors". Elliptic Fourier Descriptors can completely represent any shape, which is selected to describe the shape of papaya. From the edge detection image, it takes a long time to match every boundary directly. The pre-processing task will reduce non-papaya edge to speed up matching time. The deformable template is used to optimize the matching. Then, clustering the similar shapes by the distance between each centroid, papaya can be completely detected from the background.

  • PDF

키워드 매핑 기반 2차원 물질 연구 영역 탐지와 발전 과정 분석 (Identification of Research Areas and Evolution of 2D Materials by the Keyword Mapping Methodology)

  • 안세정;이준영
    • 한국전기전자재료학회논문지
    • /
    • 제31권1호
    • /
    • pp.11-18
    • /
    • 2018
  • Two-dimensional (2D) materials such as transition metal dichalcogenides have attracted tremendous scientific interests owing to their potential of solving the zero band-gap issue of graphene. In this work, the research areas and technology evolutionary dynamics of the 2D materials were identified using the scientometric method focusing on keyword mapping and clustering. The time-series analysis showed that the technological progress of 2D material is in the early growth period. The overlay mapping analysis were carried out to investigate the technology evolution of 2D materials with time. The strategic diagram of co-word analysis classifying the topological positions of keyword was derived to support the analysis results. It is conjectured that extensive research will be conducted widely on the application of 2D materials not only in electronic and optoelectronic devices, but also in various other fields such as biomedical applications, and that their development will be more rapid based on accumulated results of extant graphene research.

위치기반 빅데이터를 활용한 서울시 활동인구 유형 및 유형별 지역 특성 분석 (Types and Characteristics Analysis of Human Dynamics in Seoul Using Location-Based Big Data)

  • 정재훈;남진
    • 국토계획
    • /
    • 제54권3호
    • /
    • pp.75-90
    • /
    • 2019
  • As the 24-hour society arrives, human activities in daytime and nighttime urban spaces are changing drastically, and the need for new urban management policies is steadily increasing. This study analyzes the types and characteristics of Seoul's human dynamics using location-based big data and the results are summarized as follows. First, the pattern of human dynamics in Seoul repeats itself every 7 days. Second, the types of human dynamics in Seoul can be classified into five types, and each of type has its own unique time-series and local characteristics. Third, the degree of match between human dynamics and zoning system in urban planning legislation was highest in 'Type 1' residence pattern and low in other types. The following implications can be drawn from these results. First, This paper examined the methodology of analyzing the regional characteristics of Seoul through the human dynamics and obtained meaningful results. Second, This paper can derive reliable and objective pattern analysis results using Big data that reflect the overall population characteristics. Third, the scale of night-time activity in the urban space of Seoul was understood, and its distribution, patterns and characteristics identified.

HCM 클러스터링에 의한 다중 퍼지-뉴럴 네트워크 동정과 유전자 알고리즘을 이용한 이의 최적화 (Multi-FNN Identification by Means of HCM Clustering and ITs Optimization Using Genetic Algorithms)

  • 오성권;박호성
    • 한국지능시스템학회논문지
    • /
    • 제10권5호
    • /
    • pp.487-496
    • /
    • 2000
  • 본 논문에서는, HCM 클러스러팅 방법과 유전자 알고리즘을 이용하여 다중 FNN 모델을 동정하고 최적화 한다. 제안된 다중 FNN은 Yamakawa의 FNN을 기본으로 하며, 퍼지 추론 방법으로 간략 추론을, 학습으로는 오류 역전파 알고리즘을 사용한다. 다중 FNN 모델의 구조와 파라미터를 동정하기 위해 HCM 클러스터링과 유전자 알고리즘을 사용한다. 여기서, 시스템 모델링을 위해 데이터 전처리 기능을 수행하는 HCM클러스터링 방법은 I/O 프로세서 공정 데이터를 이용하여 입출력 공간분할에 의한 다중 FNN 구조를 결정하기 위해 사용된다. 또한 유전자 알고리즘을 사용하여 멤버쉽함수의 정점, 학습율, 모멘텀 계수와 같은 다중 FNN 모델의 파라미터들을 동조한다. 모델의 근사화와 일반화 능력 사이에 합히적 균형을 얻기 위해 하중계수를 가진 합성 성능지수를 사용한다. 이 합성 성능지수는 근사화 및 예측 능력사이의 상호 균형과 의존성을 고려한 하중계수를 가진 합성 목적함수를 의미한다. 데이터 개수, 비선형성의 정도에 의존하는 이 합성 목적함수의 하중계수의 선택, 조절을 통하여 최적의 다중 FNN 모델을 설계하는 것이 유용하고 효과적임을 보인다. 제안된 모델의 성능 평가를 위하여 가스로 공정의 시계열 데이터와 비선형 함수의 수치 데이터를 사용한다.

  • PDF

데이터 중심 다항식 확장형 RBF 신경회로망의 설계 및 최적화 (Design of Data-centroid Radial Basis Function Neural Network with Extended Polynomial Type and Its Optimization)

  • 오성권;김영훈;박호성;김정태
    • 전기학회논문지
    • /
    • 제60권3호
    • /
    • pp.639-647
    • /
    • 2011
  • In this paper, we introduce a design methodology of data-centroid Radial Basis Function neural networks with extended polynomial function. The two underlying design mechanisms of such networks involve K-means clustering method and Particle Swarm Optimization(PSO). The proposed algorithm is based on K-means clustering method for efficient processing of data and the optimization of model was carried out using PSO. In this paper, as the connection weight of RBF neural networks, we are able to use four types of polynomials such as simplified, linear, quadratic, and modified quadratic. Using K-means clustering, the center values of Gaussian function as activation function are selected. And the PSO-based RBF neural networks results in a structurally optimized structure and comes with a higher level of flexibility than the one encountered in the conventional RBF neural networks. The PSO-based design procedure being applied at each node of RBF neural networks leads to the selection of preferred parameters with specific local characteristics (such as the number of input variables, a specific set of input variables, and the distribution constant value in activation function) available within the RBF neural networks. To evaluate the performance of the proposed data-centroid RBF neural network with extended polynomial function, the model is experimented with using the nonlinear process data(2-Dimensional synthetic data and Mackey-Glass time series process data) and the Machine Learning dataset(NOx emission process data in gas turbine plant, Automobile Miles per Gallon(MPG) data, and Boston housing data). For the characteristic analysis of the given entire dataset with non-linearity as well as the efficient construction and evaluation of the dynamic network model, the partition of the given entire dataset distinguishes between two cases of Division I(training dataset and testing dataset) and Division II(training dataset, validation dataset, and testing dataset). A comparative analysis shows that the proposed RBF neural networks produces model with higher accuracy as well as more superb predictive capability than other intelligent models presented previously.

호텔 수요 예측을 위한 전역/지역 모델을 선택적으로 활용하는 시계열 예측 모델 (A Time Series Forecasting Model with the Option to Choose between Global and Clustered Local Models for Hotel Demand Forecasting)

  • 박기현;정경호;안현철
    • 한국빅데이터학회지
    • /
    • 제9권1호
    • /
    • pp.31-47
    • /
    • 2024
  • 인공지능 기술의 발전으로 인해 여행 및 호텔 산업에서도 다양한 목적의 인공지능과 기계학습 기법이 활용되고 있다. 특히 관광 산업에서는 수요 예측이 매우 중요한 요소로 인식되는데, 이는 서비스 효율성과 수익 극대화에 직접적인 영향을 미치기 때문이다. 수요 예측 시 시간에 따라 변화하는 데이터 흐름을 고려해야 하며, 이를 위해 통계적 기법과 기계학습 모델이 사용된다. 최근에는 수요 예측 데이터의 다양성과 현실의 복잡성을 반영하고자 기존 모델의 변형과 통합 연구가 진행되고 있으며, 그 결과 불확실성과 변동성에 대한 예측 성능이 향상되었음이 보고되고 있다. 본 연구에서는 기존 호텔수요 예측 연구에서 시도되지 않았던 다양한 기계학습 접근법을 통합하여 호텔 판매 수요 예측 정확도를 높이는 새로운 모델을 제안한다. 구체적으로 DTW K-means 클러스터링을 통해 지역모델을 구축하고, 전체 데이터를 활용한 전역모델과 선택적으로 결합하는 XGBoost 기반 시계열 예측 모델을 제시한다. 제안 모델은 지역과 전역 모델의 장점을 살려 호텔 수요 예측 성능을 제고할 것으로 기대된다. 이는 호텔 및 여행 산업 성장에 기여할 뿐만 아니라, 향후 다른 경영 분야 예측에도 확장 적용될 수 있을 것이다.

유사한 인기도 추세를 갖는 웹 객체들의 클러스터링 (Clustering of Web Objects with Similar Popularity Trends)

  • 노웅기
    • 정보처리학회논문지D
    • /
    • 제15D권4호
    • /
    • pp.485-494
    • /
    • 2008
  • 인터넷이 광범위하게 활용됨에 따라 검색 키워드, 멀티미디어 객체, 웹 페이지, 블로그 등의 다양한 웹 객체들이 크게 증가하고 있다. 이러한 웹 객체들의 인기도는 시간에 따라 변화하며, 그러한 웹 객체 인기도의 시간적 패턴에 대한 마이닝이 여러 가지 웹 응용에 필요한 중요한 연구 과제가 되고 있다. 예를 들어, 검색 키워드에 대한 인기도 패턴의 분석은 앞으로 인기가 높아질 키워드를 미리 예측할 수 있게 하여 광고주들에게 키워드를 판매하기 위한 가격을 결정하는 데에 중요한 자료가 될 수 있다. 하지만, 웹 객체 인기도가 시간에 따라 변화하고 웹 객체의 개수가 매우 방대하다는 특성으로 인하여 웹 객체 인기도에 대한 분석은 매우 어려운 문제이다. 본 논문에서는 웹 객체 인기도의 시간적 패턴을 마이닝하기 위한 효율적인 알고리즘을 제안한다. 본 논문은 웹 객체 인기도를 시계열로 표현하고, 두 웹 객체 인기도 간의 유사성을 측정하기 위하여 gap 척도를 제안한다. gap 척도의 효율적인 계산을 위하여 FFT를 활용한 알고리즘을 제안하고, 밀도기반 클러스터링 알고리즘을 이용하여 유사한 인기도 추세를 갖는 웹 객체들의 클러스터를 생성한다. 본 논문에서는 웹 객체 인기도가 특정 분포를 따르거나 주기적이라고 가정하지 않는다. Google Trends 웹 사이트로부터 구한 검색 키워드 인기도를 이용한 실험을 통하여, 제안된 알고리즘이 실세계 응용에서 유용함을 보인다.

코로나-19에 따른 서울시 생활인구 변화와 동별 반응 차이 분석 (Analysis of the differences in living population changes and regional responses by COVID-19 outbreak in Seoul)

  • 진주혜;성병찬
    • 응용통계연구
    • /
    • 제33권6호
    • /
    • pp.697-712
    • /
    • 2020
  • 최근 20년간 세계적으로 새로운 전염병이 반복해서 등장해왔으며 코로나-19에 들어서는 일상에까지 큰 변화와 피해를 주고 있다. 이에 더해 앞으로도 새로운 전염병의 등장을 간과할 수 없게 되면서 경제 타격에 대응하기 위한 정책 발굴이 지속적으로 요구되고 있다. 이러한 상황에서 생활인구는 시민들의 생활 패턴 변화를 드러내는 중요한 지표이다. 본 논문에서는 코로나-19에 의한 일상의 변화를 유동인구 관점에서 감지 및 분류하여 시간적 및 사회환경적 특징을 분석한다. 시간 단위로 측정된 서울시 424개 행정동별 생활인구 데이터를 분류하기 위해 k-shape clustering을 사용하였고, 이후에는 각 군집에 개입분석, One-way ANOVA 등을 적용하여 코로나-19 진행 여파에 따른 군집별 특성 및 생활인구 변화 양상을 자세히 살펴보았다. 결론적으로 국내 코로나 환자 발생 전후의 인구 유출입 변동에 있어 각 군집별로 뚜렷한 특징을 확인하였으며, 코로나-19 관련 사건을 바탕으로 지정한 개입 시점에 대해서도 민감하게 반응하는 군집과 그렇지 않은 군집을 구분할 수 있었다.

군집분류를 이용한 흙막이 벽체 배면 지반의 상대적 침하거동 분석 (Analysis of Relative Settlement Behavior of Retaining Wall Backside Ground Using Clustering)

  • 곽영준;한희수
    • 지질공학
    • /
    • 제33권1호
    • /
    • pp.189-200
    • /
    • 2023
  • 도시화와 산업화에 따라 도심지에 개발이 늘어나면서 지반침하로 인한 피해가 지속적으로 발생되고 있으며, 도심지에서의 건물붕괴는 대규모 인명 및 재산 피해로 이어질 위험이 크다. 굴착지반에 균등하지 않은 하중이 작용하고, 대상지반의 사전지식이 없는 경우의 지반거동에 대해서는 연구가 거의 이루어지지 않았다. 이에 따라 지반 조사 정보가 없는 흙막이 공사의 굴착 과정에서 발생되는 배면 지반의 침하거동을 분석하는 방법이 기존에는 없었고, 본 연구에서는 시계열 데이터를 가공하여 상대적 침하거동과 상호관련성을 분석하여 흙막이 벽체 배면 지반의 침하거동을 분석하고자 하였다. 본 논문에서는 평균침하량차지수와 평균상대침하량차를 정의 및 계산하였으며, 이를 좌표계에 도시하여 시간경과에 따라 측점간의 상대적 침하거동을 분석하였다. 또한 관측점들의 군집을 분류할 수 있는 기준이 필요하여 k-평균군집분석과 Dunn Index를 이용하여 분류하였다. 분석결과 계측지점의 침하량이 일정한 값으로 수렴하면서 모든 군집들이 안정영역으로 이동한 것을 확인할 수 있었으며, 군집은 세분화되었다. 이러한 분석결과를 바탕으로 연구대상의 각 측점 간 상관관계를 분석하여 연구대상 지반의 독자거동영역과 동일거동영역을 구분할 수 있었다. 이처럼 측점들 간의 상대적 침하거동을 분석을 통해 거동영역을 구분할 수 있다면, 주변지역의 융기, 지반파괴영역 예측, 터파기 공사 시 활동파괴의 방지 등 침하관리와 안정관리에 도움을 줄 수 있다고 판단된다.

시계열 군집분석을 통한 디지털 음원의 순위 변화 패턴 분류 (Derivation of Digital Music's Ranking Change Through Time Series Clustering)

  • 유인진;박도형
    • 지능정보연구
    • /
    • 제26권3호
    • /
    • pp.171-191
    • /
    • 2020
  • 본 연구는 현대 사회에서 가장 가치 있는 문화자산이자 한류의 흐름에서 특히 중요한 위치를 차지하는 디지털 음악에 초점을 두었다. 디지털 음악에 대하여 공신력 있는 음원 차트인 '가온 차트'에 진입한 음원들의 73주간 순위 변화를 수집하였으며 유사한 특징을 가지는 패턴들로 분류하였다. 이후 각 순위 변화 패턴으로부터 주목할 만한 특징에 대한 설명적 분석을 수행하였다. 구체적으로 음원에 대한 신뢰도 이슈가 발생하기 이전 기간의 국내 발매된 디지털 음원들로 한정하여 시점을 일치시킨 후 시계열 군집분석을 통해 패턴을 도출하고자 하였다. 데이터 수집과 전처리를 통하여 742건의 중복되지 않는 음원들을 확보하였고, 시계열 순위 변화에 대한 시계열 군집분석 결과 16개의 패턴들이 도출되었다. 이후 도출된 패턴들을 기반으로 '스테디셀러'와 '원 히트 원더'의 두 가지 유형의 대표적인 패턴을 확인하였다. 나아가 두 패턴에 대하여 차트 내에서 음원의 생존 기간과 음원 순위에 관점에서 다섯 가지의 세분화된 패턴으로 분류하였다. 각 패턴들이 가지는 중요한 특징들은 다음과 같다. 원 히트 원더형 패턴에서 아티스트의 슈퍼스타 효과와 편승효과가 강하게 나타났으며, 소비자들의 디지털 음원 선택에 강한 영향을 미친다는 것을 확인하였다. 나아가 스테디셀러형 패턴을 통해서 매우 오랜시간 소비자들의 선택을 받는 음원들을 확인하였고, 소비자의 니즈를 관통하며 가장 많은 선택을 받는 음원들이 오히려 원 히트 원더형 패턴이 아니라 스테디셀러: 중기 패턴에 포진하고 있음을 확인하였다. 특히 주목할 만한 점은 스테디셀러형 패턴을 통해 기존의 패턴과는 상반되는 '차트 역주행' 현상을 확인했다는 것이다. 본 연구는 디지털 음원을 중심으로 상대적으로 소외되었던 분야인 시간의 흐름에 따른 음원의 순위 변화에 초점을 두었고, 음원의 흥행과 순위를 예측하는 것이 아니라 순위 변화의 패턴을 세분화함으로써 음원 연구에 대한 새로운 접근을 시도하였다는 점에서 의의가 있다.