• 제목/요약/키워드: Multi-level Clustering

검색결과 57건 처리시간 0.029초

A Computational Intelligence Based Online Data Imputation Method: An Application For Banking

  • Nishanth, Kancherla Jonah;Ravi, Vadlamani
    • Journal of Information Processing Systems
    • /
    • 제9권4호
    • /
    • pp.633-650
    • /
    • 2013
  • All the imputation techniques proposed so far in literature for data imputation are offline techniques as they require a number of iterations to learn the characteristics of data during training and they also consume a lot of computational time. Hence, these techniques are not suitable for applications that require the imputation to be performed on demand and near real-time. The paper proposes a computational intelligence based architecture for online data imputation and extended versions of an existing offline data imputation method as well. The proposed online imputation technique has 2 stages. In stage 1, Evolving Clustering Method (ECM) is used to replace the missing values with cluster centers, as part of the local learning strategy. Stage 2 refines the resultant approximate values using a General Regression Neural Network (GRNN) as part of the global approximation strategy. We also propose extended versions of an existing offline imputation technique. The offline imputation techniques employ K-Means or K-Medoids and Multi Layer Perceptron (MLP)or GRNN in Stage-1and Stage-2respectively. Several experiments were conducted on 8benchmark datasets and 4 bank related datasets to assess the effectiveness of the proposed online and offline imputation techniques. In terms of Mean Absolute Percentage Error (MAPE), the results indicate that the difference between the proposed best offline imputation method viz., K-Medoids+GRNN and the proposed online imputation method viz., ECM+GRNN is statistically insignificant at a 1% level of significance. Consequently, the proposed online technique, being less expensive and faster, can be employed for imputation instead of the existing and proposed offline imputation techniques. This is the significant outcome of the study. Furthermore, GRNN in stage-2 uniformly reduced MAPE values in both offline and online imputation methods on all datasets.

Examining the Residential Patterns of Urban Immigrants in Seoul Metropolitan Area

  • Kim, Hyejin;Lee, Jawon
    • International Journal of Advanced Culture Technology
    • /
    • 제6권3호
    • /
    • pp.37-43
    • /
    • 2018
  • This paper measures and maps multi-dimensional residential segregation of immigrants in Seoul metropolitan area at city/county/district level as well as town level, thereby adding to our understanding of the urban structure and its spatial distribution impacted by immigration. The perspective offered here focuses on the segregation spurred by transnational migrants and their urban settlement. By drawing population data for 79 city/county/district administrative units from the Korea Immigration Service, residential segregation of immigrants in Seoul metropolitan area is measured based on Massey & Denton's four segregation indices: evenness, exposure, concentration and clustering. The empirical findings suggest that Seoul metropolitan area is highly segregated and the areas showing hyper-segregation appear in Seoul city and Gyeonggi province. As immigrants are foreseen to continue to increase in the future, this research contributes both empirically and theoretically to preliminary research on spatial segregation of immigrants by showing how ethnic places are segregated spatially through ethnic networks that support the geographic concentration of minority groups.

Toward Successful Management of Vocational Rehabilitation Services for People with Disabilities: A Data Mining Approach

  • Kim, Yong Seog
    • Industrial Engineering and Management Systems
    • /
    • 제11권4호
    • /
    • pp.371-384
    • /
    • 2012
  • This study proposes a multi-level data analysis approach to identify both superficial and latent relationships among variables in the data set obtained from a vocational rehabilitation (VR) services program of people with significant disabilities. At the first layer, data mining and statistical predictive models are used to extract the superficial relationships between dependent and independent variables. To supplement the findings and relationships from the analysis at the first layer, association rule mining algorithms at the second layer are employed to extract additional sets of interesting associative relationships among variables. Finally, nonlinear nonparametric canonical correlation analysis (NLCCA) along with clustering algorithm is employed to identify latent nonlinear relationships. Experimental outputs validate the usefulness of the proposed approach. In particular, the identified latent relationship indicates that disability types (i.e., physical and mental) and severity (i.e., severe, most severe, not severe) have a significant impact on the levels of self-esteem and self-confidence of people with disabilities. The identified superficial and latent relationships can be used to train education program designers and policy developers to maximize the outcomes of VR training programs.

무선 센서네트워크에서 동적 예비 클러스터 헤드를 이용한 효율적인 토폴로지 관리 방안에 관한 연구 (A Dynamic Pre-Cluster Head Algorithm for Topology Management in Wireless Sensor Networks)

  • 김재현;이재용;김석규;도윤미;박노성
    • 한국통신학회논문지
    • /
    • 제31권6B호
    • /
    • pp.534-543
    • /
    • 2006
  • 무선 애드 혹/센서 네트워크에서 제안된 일반적인 클러스터링 기반의 계층적 토폴로지 관리 기법들은 빈번한 토폴로지 변화에 따라 자주 클러스터링을 재구성하게 되고 네트워크 관리에 필요한 오버헤드가 증가하게 된다. 본 논문에서는 이러한 재클러스터링 문제와 부하 분산을 위하여 동적 예비 클러스터 헤드 기법을 사용하는 멀티 흡클러스터링 알고리즘을 제안한다. 제안하는 기법은 이동성과 전원 레벨로 구성된 가중치 맵을 사용하여 예비 클러스터 헤드를 선출하고 멀티 홉 클러스터를 구성한다. 클러스터 헤드는 이러한 가중치 맵과 임계값을 사용하여 헤드의 역할을 예비 클러스터 헤드에게 넘겨주게 된다. 실험결과, 제안하는 알고리즘이 네트워크의 오버헤드를 줄이고 부하 분산을 제공하며, 토폴로지 변화에 무관하게 적절한 클러스터와 멤버를 관리할 수 있음을 확인하였다.

계층적 특징 결합 및 검증을 이용한 자연이미지에서의 장면 텍스트 추출 (Scene Text Extraction in Natural Images using Hierarchical Feature Combination and Verification)

  • 최영우;김길천;송영자;배경숙;조연희;노명철;이성환;변혜란
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권4호
    • /
    • pp.420-438
    • /
    • 2004
  • 이미지에 인위적 또는 자연적으로 포함된 텍스트는 이미지의 내용을 함축적이고 구체적으로 표현하는 중요한 정의이다. 이러한 정보를 실시간에 추출하여 정확히 인식할 수 있다면 다양한 분야에서 활용될 수 있다. 본 논문에서는 자연이미지에 포함된 장면 텍스트를 추출하는 방법으로서 텍스트의 색 연속성, 자기 변화 및 색 변화와 같은 낮은 수준의 이미지 특징으로 텍스트 후보 영역을 찾고, 다해상도 (Multi-resolution) 웨이블릿(Wavelet) 변환을 이용하여 높은 수준의 텍스트 특징인 획의 구성 여부로 검증하는 계층적인 구조를 제안한다. 색 연속성 특징은 대부분의 텍스트는 동일한 색으로 구성된다는 특징을 이용하는 것이고, 밝기 변화 특징은 텍스트 영역은 주변과의 밝기 변화가 존재하며 에지 밀도가 높은 특징을 이용한다. 또한, 색 변화 특징은 텍스트 영역은 주변 배경과의 색 변화가 존재하며, 밝기 변화보다 민감한 색 분산 값으로 표현할 수 있다는 장점을 이용한다. 높은 수준의 텍스트 특징으로서 다해상도 웨이블릿 변환을 이용하여 텍스트 획의 방향성 정보를 추출하고, 추출된 정보를 SVM(Support Vector Machine) 분류기로 검증하여 최종 영역을 확정한다. 제안한 방법을 다양한 종류의 이미지에 적용한 결과 배경이 복잡해도 비교적 안정적으로 텍스트 영역을 추출하는 것을 확인할 수 있었다.

Assessing the Impact of Advanced Technologies on Utilization Improvement of Substations

  • Han, Dong;Yan, Zheng;Zhang, Dao-Tian;Song, Yi-Qun
    • Journal of Electrical Engineering and Technology
    • /
    • 제10권5호
    • /
    • pp.1921-1929
    • /
    • 2015
  • The smart substation is the heart of a transmission system, which is particularly emphasized as the most significant composition of smart grids in China. In order to assess the functionality performance of substation technologies, this paper presents methods used to identify the most promising solutions for smart substation design and to evaluate the technical levels of available technologies. The multi-index optimization model is presented to address the issue of smart substation planning. A mathematical model of the planning decision problem is established with multiple objectives consisting of economic, reliability, and green key indices, and many kinds of concerns including physical and environmentally friendly operations are formulated as a set of constraints. With respect to the assessment of the technical level regarding integration of advanced technologies into a substation, a modified grey whitenization weight function is adopted to structure a novel grey clustering method. The proposed grey clustering approach is used to overcome the difficulty of insufficient quantitative assessment capacity for traditional methods. The evaluation of technical effects provides the classification definition for the development phase and the maturity level of the smart substation. The effectiveness of the proposed approaches in planning decision-making and evaluation of construction efforts is demonstrated with case studies involving the actual smart substation projects of Wenchongkou substation in China Southern Power Grid (CSG) and Mengzi substation in State Grid Corporation of China (SGCC).

Research on a handwritten character recognition algorithm based on an extended nonlinear kernel residual network

  • Rao, Zheheng;Zeng, Chunyan;Wu, Minghu;Wang, Zhifeng;Zhao, Nan;Liu, Min;Wan, Xiangkui
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권1호
    • /
    • pp.413-435
    • /
    • 2018
  • Although the accuracy of handwritten character recognition based on deep networks has been shown to be superior to that of the traditional method, the use of an overly deep network significantly increases time consumption during parameter training. For this reason, this paper took the training time and recognition accuracy into consideration and proposed a novel handwritten character recognition algorithm with newly designed network structure, which is based on an extended nonlinear kernel residual network. This network is a non-extremely deep network, and its main design is as follows:(1) Design of an unsupervised apriori algorithm for intra-class clustering, making the subsequent network training more pertinent; (2) presentation of an intermediate convolution model with a pre-processed width level of 2;(3) presentation of a composite residual structure that designs a multi-level quick link; and (4) addition of a Dropout layer after the parameter optimization. The algorithm shows superior results on MNIST and SVHN dataset, which are two character benchmark recognition datasets, and achieves better recognition accuracy and higher recognition efficiency than other deep structures with the same number of layers.

은닉 물체 검출을 위한 실시간 수동형 밀리미터파 영상 분할 (Real-time passive millimeter wave image segmentation for concealed object detection)

  • 이동수;염석원;이문교;정상원;장유신
    • 한국통신학회논문지
    • /
    • 제37권2C호
    • /
    • pp.181-187
    • /
    • 2012
  • 밀리미터파 영상시스템은 의복을 투과하는 성질이 뛰어나서 의복 속에 숨겨둔 은닉 물체를 탐지하는 분야에 활용된다. 더불어 수동형 밀리미터파 영상 시스템은 능동형 시스템과 달리 실내외의 개방된 공간에서 움직이는 대상자들의 탐지가 가능하다. 그러나 수동형 밀리미터파 영상은 일반적으로 회절의 제한과 낮은 신호 레벨로 해상도가 낮으며 잡음의 영향이 크다. 그러므로 영상을 효과적으로 처리하기 위한 신호의 모델링과 통계적 분석이 요구된다. 본 논문에서 은닉 물체 검출을 수행하는 밀리미터파 영상 분할 알고리즘을 C++로 구현하여 실시간으로 처리한다. 영상의 분석을 위하여 밀리미터파 영상의 히스토그램을 혼합 가우시안 모델로 추정하고 은닉 물체를 다단계 영상 분할 방법으로 추출한다. 다단계 분할은 배경에서 몸체를 분리하는 전역분할과 은닉물체를 몸체에서 분리하는 국소분할로 이루어진다. 각 분할단계는 $k$-means, EM 추정, 판정단계로 구성되어 있다. 실험에서 실외에서 획득한 수동형 밀리미터파 영상을 분석하여 은닉 물체를 실시간으로 검출할 수 있음을 확인한다.

협동적 필터링을 위한 속성기반 다단계 클러스터링 (Attribute-based Multi-level Clustering for Collaborative Filtering)

  • 김택헌;양성봉
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.525-528
    • /
    • 2007
  • 추천시스템은 일반적으로 협동적 필터링이라는 정보 필터링 기술을 사용한다. 협동적 필터링은 유사한 성향을 갖는 다른 고객들이 상품에 대해서 매긴 평가에 기반하기 때문에 고객에게 가장 적합한 유사 이웃들을 적절히 선정해 내는 것이 추천시스템의 예측의 질 향상을 위해서 필요하다. 본 논문에서는 속성 정보를 기반으로 한 다단계 클러스터링을 통한 이웃선정 방법을 제안한다. 이 방법은 대규모 데이터 셋에서 탐색 공간을 줄이기 위해 클러스터링을 수행하여 적절한 이웃 고객들의 집합을 추출한다. 이 때, 속성 정보에 따라 단계적으로 클러스터링을 수행함으로써 보다 정제된 고객집합을 구성할 수 있도록 한다. 본 논문에서는 고객 선호도와 위치 정보를 대표적인 속성 정보로 사용함으로써 모바일 환경에서 보다 정확한 추천이 이루어질 수 있도록 한다.

WSN 기반 화재 상황 모니터링을 통한 대피 경로 도출 알고리즘 (Customized Evacuation Pathfinding through WSN-Based Monitoring in Fire Scenarios)

  • 윤진이;진연진;박소연;이형준
    • 한국통신학회논문지
    • /
    • 제41권11호
    • /
    • pp.1661-1670
    • /
    • 2016
  • 본 논문에서는 화재 상황에서의 위험도 예측 시스템과 화재 대피 경로 도출 알고리즘을 제안한다. 온도 예측 시스템에서는 무선 센서 네트워크를 통해 수집한 온도 정보를 기반으로 멀티레벨 클러스터링 기법을 통해 사용자가 대피할 시점의 온도를 예측한다. 예측된 온도와 이의 신뢰도를 바탕으로 사용자의 현재 위치부터 가장 안전한 출구까지의 대피 경로를 도출하는 화재 대피 경로 알고리즘을 제안한다. NIST의 FDS(Fire Dynamics Simulator) 시뮬레이터를 이용하여 47개의 정적 노드로 구성된 무선 센서 네트워크에 대해 1436.41초 동안 성능 평가를 한 결과, 제안하는 온도 예측 시스템을 사용하였을 때, 예측 정확도가 1.48배 증가하였으며, 예측 정확도가 높은 군에 속하는 노드에 대해서는 4.21배로 크게 증가한 것으로 나타났다. 또한, 화재 대피 경로 알고리즘을 통해 도출한 대피 경로가 실제 ground-truth 온도를 사용하여 대피했을 때에 비하여 안전한 노드를 경유하는 비율이 큰 차이를 보이지 않았으며, 최단 대피 경로에 비해서는 약 12% 이상 더 안전한 경로를 도출하였음을 확인할 수 있었다.