• 제목/요약/키워드: Code Clustering

검색결과 61건 처리시간 0.027초

Comparison of graph clustering methods for analyzing the mathematical subject classification codes

  • Choi, Kwangju;Lee, June-Yub;Kim, Younjin;Lee, Donghwan
    • Communications for Statistical Applications and Methods
    • /
    • 제27권5호
    • /
    • pp.569-578
    • /
    • 2020
  • Various graph clustering methods have been introduced to identify communities in social or biological networks. This paper studies the entropy-based and the Markov chain-based methods in clustering the undirected graph. We examine the performance of two clustering methods with conventional methods based on quality measures of clustering. For the real applications, we collect the mathematical subject classification (MSC) codes of research papers from published mathematical databases and construct the weighted code-to-document matrix for applying graph clustering methods. We pursue to group MSC codes into the same cluster if the corresponding MSC codes appear in many papers simultaneously. We compare the MSC clustering results based on the several assessment measures and conclude that the Markov chain-based method is suitable for clustering the MSC codes.

자동검침 고객의 부하패턴을 이용한 일일 대표 부하패턴 생성 (Typical Daily Load Profile Generation using Load Profile of Automatic Meter Reading Customer)

  • 김영일;신진호;이봉재;양일권
    • 전기학회논문지
    • /
    • 제57권9호
    • /
    • pp.1516-1521
    • /
    • 2008
  • Recently, distribution load analysis using AMR (Automatic Meter Reading) data is researched in electric utilities. Load analysis method based on AMR system generates the typical load profile using load data of AMR customers, estimates the load profile of non-AMR customers, and analyzes the peak load and load profile of the distribution circuits and sectors per every 15 minutes/hour/day/week/month. Typical load profile is generated by the algorithm calculating the average amount of power consumption of each groups having similar load patterns. Traditional customer clustering mechanism uses only contract type code as a key. This mechanism has low accuracy because many customers having same contract code have different load patterns. In this research, We propose a customer clustring mechanism using k-means algorithm with contract type code and AMR data.

제품군의 재사용 가능한 클론 코드의 메소드 경로 통일을 위한 코드 클러스터링 방법 (A Code Clustering Technique for Unifying Method Full Path of Reusable Cloned Code Sets of a Product Family)

  • 김태영;이지현;김은미
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권1호
    • /
    • pp.1-18
    • /
    • 2023
  • 유사한 소프트웨어는 기존 산출물을 복제하고 수정하는 클론-앤-오운(clone-and-own, CAO) 방법으로 개발되곤 한다. 그러나 클론-앤-오운 방법은 복제된 제품의 수가 늘면서 유지보수를 어렵게 만들기 때문에 나쁜 프랙티스로 간주된다. 소프트웨어 제품라인 공학은 체계적인 재사용을 통해 소프트웨어 제품군을 개발하는 방법으로 클론-앤-오운 방법의 문제를 해결할 수 있다. CAO 방식으로 개발되어 온 제품패밀리를 제품라인 공학으로 마이그레이션하는 작업은 여러 소프트웨어 제품에서 클로닝된 부분들을 찾아 통합하고 재사용 가능한 자산으로 구축하는 것으로부터 시작된다. 그러나 클로닝이 디렉토리부터 코드 라인까지 다양한 수준에서 발생하고 그 과정에서 이들의 구조에 변경이 일어날 수 있어 단순하게 클로닝을 찾아내는 것만으로는 고품질의 제품라인 코드베이스를 구축하기 어렵다. 성공적인 마이그레이션을 위해서는 소스 코드들 사이의 클로닝 관계를 찾는 것 이외에도 소스 코드들의 파일 경로와 클래스 이름, 메소드 시그니처 등의 동일성을 확보는 작업이 선행되어야 한다. 이에 본 연구는 CAO 기반으로 개발된 제품들로부터 마이그레이션 대상 제품들을 선정한 후 제품들에 흩어져 있는 유사 코드 집합을 검출하여 메소드 경로의 통일이 필요한 대상을 식별하는 클러스터링 방법을 제안한다. 제안 방법의 효과를 보이기 위해 CAO 방식으로 진화해온 ApoGames 제품군에 제안 방법을 적용하여 실험을 진행하였다. 그 결과, 전처리 없이 수행된 파일의 상대 경로 기반 클러스터링 방법의 평균 정밀도는 0.91이며 식별된 공통 클러스터의 개수는 0개인 반면에 이 논문에서 제안하는 전처리와 함께 수행된 메소드 시그니처 기반 클러스터링 방법의 평균 정밀도는 0.98로 개선되었으며 식별된 공통 클러스터는 최대 15개까지 증가하였다.

Clustering을 통한 Binary CDMA 전송거리 확보 (Increase of Binary CDMA transmission range by using Clustering technique)

  • 최현석;지충원;김정선
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.679-682
    • /
    • 2008
  • 무선 통신에 대한 높은 관심은 관련 기술을 이용하여 실생활에 적용하기 위한 연구로 이어지고 있다. 이러한 무선 통신 기술들 중 근거리 무선 통신 기술인 Binary CDMA(Code Division Multiple Access)기술은 2.4Ghz의 RF영역을 사용하여 데이터를 전송하는 기술이다. 이 기술은 기존의 근거리 무선 통신인 Bluetooth보다 뛰어난 전송거리를 보장하고 있으나, 무선 통신 기술의 공통적인 문제점인 장애물에 의한 신호 감소로 인해, 실제 보장되는 거리보다 짧은 거리의 전송거리가 나타나는 구간이 생기게 된다. 이러한 문제점을 해결하기 위해 본 논문에서는 Clustering을 이용하여 보다 넓은 전송거리를 확보하기 위한 아이디어를 제시한다.

  • PDF

DVCR 시스템의 연집 오류 정정을 위한 클러스터 순환 프러덕트 부호 (A clustered cyclic product code for the burst error correction in the DVCR systems)

  • 이종화;유철우;강창언;홍대식
    • 전자공학회논문지S
    • /
    • 제34S권2호
    • /
    • pp.1-10
    • /
    • 1997
  • In this paper, an improved lower bound on the burst-error correcting capability of th ecyclic product code is presented and through the analysis of this new bound clustered cyclic product (CCP abbr.)code is proposed. The CCP code, to improve the burst-error correcting capability, combines the idea of clustering and the transmission method of cyclic product code. That is, a cluster which is defined in this paper as a group of consecutive code symbols is employed as a new transmission unit to the code array transmission of cyclic product code. the burst-error correcting capability of the CCP code is improved without a loss in the random-error correcting capability and performance comparison in the digital video camera records (DVCR) system shows the superiority of the proposed CCP code over conventional product codes.

  • PDF

대용량 위성영상의 무감독 분류를 위한 k-Means Clustering 알고리즘의 병렬처리: 다중코어와 PC-Cluster를 이용한 Hybrid 방식 (Parallel Processing of k-Means Clustering Algorithm for Unsupervised Classification of Large Satellite Images: A Hybrid Method Using Multicores and a PC-Cluster)

  • 한수희;송정헌
    • 한국측량학회지
    • /
    • 제37권6호
    • /
    • pp.445-452
    • /
    • 2019
  • 본 연구에서는 대용량 위성영상의 무감독분류를 위해 k-means clustering 알고리즘의 병렬처리 코드를 개발하여 PC-cluster에서 구현하였다. 이를 위해 OpenMP (Open Multi-Processing)를 기반으로 CPU (Central Processing Unit)의 다중코어를 이용하는 intra-node 코드와 message passing interface를 기반으로 PC-cluster를 이용하는 inter-nodes 코드, 그리고 이 둘을 병용하는 hybrid 코드를 구현하였다. 본 연구에 사용한 PC-cluster는 한 대의 마스터 노드와 여덟 대의 슬래이브 노드로 구성되어 있고 각 노드에는 여덟 개의 다중코어가 장착되어 있다. PC-cluster에는 Microsoft Windows와 Canonical Ubuntu의 두 가지 운영체제를 설치하여 병렬처리 성능을 비교하였다. 실험에 사용한 자료는 두 가지 다중분광 위성영상으로서 중용량인 LANDSAT 8 OLI (Operational Land Imager) 영상과 대용량인 Sentinel 2A 영상이다. 병렬처리의 성능을 평가하기 위하여 speedup과 efficiency를 측정한 결과 전반적으로 speedup은 N/2 이상, efficiency는 0.5 이상으로 나타났다. Microsoft Windows와 Canonical Ubuntu를 비교한 결과 Ubuntu가 2-3배의 빠른 결과를 나타내었다. 순차처리와 병렬처리 결과가 일치하는지 확인하기 위해 각 클래스의 밴드별 중심값과 분류된 화소의 수를 비교하고 결과 영상간 화소대 화소 비교도 수행하였다. Intra-node 코드를 구현할 때에는 OpenMP에 의한 false sharing이 발생하지 않도록 주의해야 하고, PC-cluster에서 대용량 위성영상을 처리하기 위해서는 파일 I/O에 의한 성능저하를 줄일 수 있도록 코드 및 하드웨어를 설계해야 함을 알 수 있었다. 또한 PC-cluster에 설치된 운영체제에 따라서도 성능 차이가 발생함을 알 수 있었다.

Fuzzy 밀집기법을 이용한 맞춤형 부픔 분류법의 개발 (Development of a Company-Tailored Part Classification & Coding System Using fuzzy clustering Techniques)

  • 박진우
    • 한국경영과학회지
    • /
    • 제13권1호
    • /
    • pp.31-38
    • /
    • 1988
  • This paper presents a methodology for the development of a part classification and coding system suited to each individual company. When coding a group of parts for a specific company by a general purpose part classification & coding system like OPITZ system, it is frequently observed that we use only a small subset of total available code numbers. Such sparsity in the actual occurrences of code numbers implies that we can design a better system which uses digits of the system more parsimoniously. A 2-dimensional fuzzy ISODATA algorithm is developed to extract the important characteristics for the classification from the set of given parts. Based on the extracted characteristics nd the distances between fuzzy clustering cenetroids, a company-unique classification and coding system can be developed. An example case study for a medium sized machine shop is presented.

  • PDF

최적화설계시스템을 이용한 터빈블레이드 냉각통로의 형상설계 (Shape Design of Passages for Turbine Blade Using Design Optimization System)

  • 정민중;이준성
    • 대한기계학회논문집A
    • /
    • 제29권7호
    • /
    • pp.1013-1021
    • /
    • 2005
  • In this paper, we developed an automatic design optimization system for parametric shape optimization of cooling passages inside axial turbine blades. A parallel three-dimensional thermoelasticity finite element analysis code from an open source system was used to perform automatic thermal and stress analysis of different blade configuration. The developed code was connected to an evolutionary optimizer and built in a design optimization system. Using the optimization system, 279 feasible and optimal solutions were searched. It is provided not only one best solution of the searched solutions, but also information of variation structure and correlation of the 279 solutions in function, variable, and real design spaces. To explore design information, it is proposed a new interpretation approach based on evolutionary clustering and principal component analysis. The interpretation approach might be applicable to the increasing demands in the general area of design optimization.

절차적 프로그램으로부터의 객체 추출 방법론 (A Method of Object Identification from Procedural Programs)

  • 진윤숙;마평수;신규상
    • 한국정보처리학회논문지
    • /
    • 제6권10호
    • /
    • pp.2693-2706
    • /
    • 1999
  • Reengineering to object-oriented system is needed to maintain the system and satisfy requirements of structure change. Target systems which should be reengineered to object-oriented system are difficult to change because these systems have no design document or their design document is inconsistent of source code. Using design document to identifying objects for these systems is improper. There are several researches which identify objects through procedural source code analysis. In this paper, we propose automatic object identification method based on clustering of VTFG(Variable-Type-Function Graph) which represents relations among variables, types, and functions. VTFG includes relations among variables, types, and functions that may be basis of objects, and weights of these relations. By clustering related variables, types, and functions using their weights, our method overcomes limit of existing researches which identify too big objects or objects excluding many functions. The method proposed in this paper minimizes user's interaction through automatic object identification and make it easy to reenginner procedural system to object-oriented system.

  • PDF

스킵연결이 적용된 오토인코더 모델의 클러스터링 성능 분석 (Clustering Performance Analysis of Autoencoder with Skip Connection)

  • 조인수;강윤희;최동빈;박용범
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권12호
    • /
    • pp.403-410
    • /
    • 2020
  • 오토인코더의 데이터 복원(Output result) 기능을 이용한 노이즈 제거 및 초해상도와 같은 연구가 진행되는 가운데 오토인코더의 차원 축소 기능을 이용한 클러스터링의 성능 향상에 대한 연구도 활발히 진행되고 있다. 오토인코더를 이용한 클러스터링 기능과 데이터 복원 기능은 모두 동일한 학습을 통해 성능을 향상시킨다는 공통점이 있다. 본 논문은 이런 특징을 토대로, 데이터 복원 성능이 뛰어나도록 설계된 오토인코더 모델이 클러스터링 성능 또한 뛰어난지 알아보기 위한 실험을 진행했다. 데이터 복원 성능이 뛰어난 오토인코더를 설계하기 위해서 스킵연결(Skip connection) 기법을 사용했다. 스킵연결 기법은 기울기 소실(Vanishing gradient)현상을 해소해주고 모델의 학습 효율을 높인다는 장점을 가지고 있을 뿐만 아니라, 데이터 복원 시 손실된 정보를 보완해 줌으로써 데이터 복원 성능을 높이는 효과도 가지고 있다. 스킵연결이 적용된 오토인코더 모델과 적용되지 않은 모델의 데이터 복원 성능과 클러스터링 성능을 그래프와 시각적 추출물을 통해 결과를 비교해 보니, 데이터 복원 성능은 올랐지만 클러스터링 성능은 떨어지는 결과를 확인했다. 이 결과는 오토인코더와 같은 신경망 모델이 출력된 결과 성능이 좋다고 해서 각 레이어들이 데이터의 특징을 모두 잘 학습했다고 확신할 수 없음을 알려준다. 마지막으로 클러스터링의 성능을 좌우하는 잠재변수(latent code)와 스킵연결의 관계를 분석하여 실험 결과의 원인에 대해 파악하였고, 파악한 결과를 통해 잠재변수와 스킵연결의 특징정보를 이용해 클러스터링의 성능저하 현상을 보완할 수 있다는 사실을 보였다. 이 연구는 한자 유니코드 문제를 클러스터링 기법을 이용해 해결하고자 클러스터링 성능 향상을 위한 선행연구이다.