• 제목/요약/키워드: modularity-based clustering

검색결과 7건 처리시간 0.02초

Community Detection using Closeness Similarity based on Common Neighbor Node Clustering Entropy

  • Jiang, Wanchang;Zhang, Xiaoxi;Zhu, Weihua
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권8호
    • /
    • pp.2587-2605
    • /
    • 2022
  • In order to efficiently detect community structure in complex networks, community detection algorithms can be designed from the perspective of node similarity. However, the appropriate parameters should be chosen to achieve community division, furthermore, these existing algorithms based on the similarity of common neighbors have low discrimination between node pairs. To solve the above problems, a noval community detection algorithm using closeness similarity based on common neighbor node clustering entropy is proposed, shorted as CSCDA. Firstly, to improve detection accuracy, common neighbors and clustering coefficient are combined in the form of entropy, then a new closeness similarity measure is proposed. Through the designed similarity measure, the closeness similar node set of each node can be further accurately identified. Secondly, to reduce the randomness of the community detection result, based on the closeness similar node set, the node leadership is used to determine the most closeness similar first-order neighbor node for merging to create the initial communities. Thirdly, for the difficult problem of parameter selection in existing algorithms, the merging of two levels is used to iteratively detect the final communities with the idea of modularity optimization. Finally, experiments show that the normalized mutual information values are increased by an average of 8.06% and 5.94% on two scales of synthetic networks and real-world networks with real communities, and modularity is increased by an average of 0.80% on the real-world networks without real communities.

정보이론 관점에서 본 서울시 지역구간의 미세먼지 영향력 재조명 (A Reexamination on the Influence of Fine-particle between Districts in Seoul from the Perspective of Information Theory)

  • 이재구;이태훈;윤성로
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권2호
    • /
    • pp.109-114
    • /
    • 2015
  • 본 논문에서는 서울시에 속하는 25개의 지역구로부터 측정된 미세먼지 시계열(time series) 정보의 상관도를 정보이론(information theory)의 엔트로피(entropy)로 정량화하고, 이를 그래프로 표현하는 서울시 지역구 미세먼지 전이 모델을 만들어 지역별 유사성과 영향력을 분석하는 방법을 제안한다. 먼저, 각각의 미세먼지 농도 시계열을 가지는 지역구의 모든 쌍마다 전이 엔트로피(transfer entropy)를 계산하여 그래프의 노드간 연결 강도를 구한다. 이 그래프에 전통적인 커뮤니티 검출(community detection) 기법인 모듈성 기반 군집화(on modularity-based clustering) 알고리즘을 적용하여 전체 지역구들에 생성되는 커뮤니티를 검출하였다. 이를 통해 지역적인 근접 정도가 높은 지역과 차량 이동이 많은 지역 간의 미세 먼지 전이성이 높은 것을 확인하였으며, 더불어 제안된 방법은 기존 미세먼지의 기상모델 분석과 다른 정보이론 관점에서의 새로운 미세먼지 분석 방법의 고찰 및 향상된 미세먼지 분석 자료 생성에 활용될 것으로 기대된다.

DCCA 방법으로 연결된 한반도의 기온 네트워크 분석 (Temperature network analysis of the Korean peninsula linking by DCCA methodology)

  • 민승식
    • 응용통계연구
    • /
    • 제29권7호
    • /
    • pp.1445-1458
    • /
    • 2016
  • 본 논문에서는 1976년부터 2015년까지 40년 간, 59개 지역 기온 시계열을 대상으로 degrended cross-correlation analysis(DCCA) 방법을 이용한 상관 계수를 도출하였다. 4년 단위의 평균기온, 최고기온, 최저기온 시계열을 분석하여 상관계수 값이 0.9 이상이면 단위 기간 동안 두 지역의 온도 상관성이 존재하는 것으로 판단하고, 두 지역 간의 연결선을 만드는 방식으로 네트워크를 구축하였다. 이후 네트워크 이론을 바탕으로 평균 경로 길이, 결집 계수, 유사성, 모듈성 등의 값들을 도출하였다. 그 결과, 기온 네트워크는 좁은 세상 성질을 만족하고, 유사성과 모듈성이 높은 네트워크임을 알 수 있었다.

Community Discovery in Weighted Networks Based on the Similarity of Common Neighbors

  • Liu, Miaomiao;Guo, Jingfeng;Chen, Jing
    • Journal of Information Processing Systems
    • /
    • 제15권5호
    • /
    • pp.1055-1067
    • /
    • 2019
  • In view of the deficiencies of existing weighted similarity indexes, a hierarchical clustering method initialize-expand-merge (IEM) is proposed based on the similarity of common neighbors for community discovery in weighted networks. Firstly, the similarity of the node pair is defined based on the attributes of their common neighbors. Secondly, the most closely related nodes are fast clustered according to their similarity to form initial communities and expand the communities. Finally, communities are merged through maximizing the modularity so as to optimize division results. Experiments are carried out on many weighted networks, which have verified the effectiveness of the proposed algorithm. And results show that IEM is superior to weighted common neighbor (CN), weighted Adamic-Adar (AA) and weighted resources allocation (RA) when using the weighted modularity as evaluation index. Moreover, the proposed algorithm can achieve more reasonable community division for weighted networks compared with cluster-recluster-merge-algorithm (CRMA) algorithm.

클라우드네이티브 애플리케이션 구축을 위한 마이크로서비스 식별 방법 (Identification of Microservices to Develop Cloud-Native Applications)

  • 최옥주;김유경
    • 한국소프트웨어감정평가학회 논문지
    • /
    • 제17권1호
    • /
    • pp.51-58
    • /
    • 2021
  • 최근 주목받고 있는 마이크로서비스는 독립적으로 개발될 뿐만 아니라 독립적으로 실행 및 배포가 가능하다는 장점 때문에, 클라우드 컴퓨팅 환경에서 보다 유연한 확장과 효율적인 협력을 보장할 수 있다. 이러한 영향으로 최근 마이크로서비스지향 애플리케이션 환경으로의 전환이 급격히 증가하고 있다. 마이크로서비스의 도입을 위해서는 무엇보다 모노리식 아키텍처로 구축된 단일 애플리케이션의 구성요소를 마이크로서비스 단위로 식별하는 문제가 선결되어야 한다. 본 논문에서는 레거시 시스템으로부터 마이크로서비스 식별의 문제를 알고리즘 기반으로 해결하기 이한 접근방법을 제안한다. 코드의 메타정보를 이용하여 그래프를 생성하고 클러스터링 알고리즘을 적용하여 마이크로서비스 후보를 추출한다. 추출된 마이크로서비스 후보에 대해 메트릭을 이용하여, 모듈화 품질을 평가한다. 또한 제안된 식별 방법의 효과를 검증하기 위해 벤치마크를 위해 많이 사용되는 공개 소프트웨어의 코드를 이용하여 후보 서비스를 도출하고, 메트릭을 이용하여 모듈화 수준을 평가한다. 결과적으로 좀더 작은 단위의 마이크로서비스로 식별해 내면서 모듈품질을 향상시키는 결과를 확인할 수 있다.

네트워크 분석을 이용한 애플리케이션 서비스 하위 카테고리 분류: 헬스케어 어플리케이션 중심으로 (Categorizing Sub-Categories of Mobile Application Services using Network Analysis: A Case of Healthcare Applications)

  • 하소희;금영정
    • 한국전자거래학회지
    • /
    • 제25권3호
    • /
    • pp.15-40
    • /
    • 2020
  • 모바일 애플리케이션 서비스 시장의 폭발적으로 성장함에 따라 애플리케이션 서비스를 고객과 개발자 관점에서 분류하는 것이 필요한 실정이다. 그러나 모바일 애플리케이션 서비스의 체계적 분류에 관한 연구는 제한적이다. 이에 본 연구에서는 네트워크 모듈성 분석을 통하여 모바일 애플리케이션 서비스의 분류하고 하위 카테고리를 제안하고자 한다. 구글플레이(GooglePlay)를 통해 총 1,607개의 헬스케어 관련 애플리케이션 서비스를 수집한 후 각 애플리케이션 서비스의 설명(description) 텍스트를 활용하여 유사도를 측정하고 이를 바탕으로 네트워크 분석을 수행하였다. 모듈성 분석을 수행하여 전체 네트워크의 커뮤니티를 탐지한 후, 각 클러스터를 기반으로 서비스 분류법을 도출한다. 이번 연구는 모바일 애플리케이션 서비스를 체계적으로 탐색하고자 하는 고객과 모바일 애플리케이션 서비스의 트렌드를 분석하고자 하는 개발자 모두에게 도움이 되는 서비스 분류에 대한 체계적인 접근방식이 될 것으로 기대된다.

소셜 네트워크 분석을 통한 무형문화유산 공동체 지식연결망 연구 - 정선아리랑을 중심으로 - (A Study of Intangible Cultural Heritage Communities through a Social Network Analysis - Focused on the Item of Jeongseon Arirang -)

  • 오정심
    • 헤리티지:역사와 과학
    • /
    • 제52권3호
    • /
    • pp.172-187
    • /
    • 2019
  • 본 논문의 목적은 무형문화유산 일반전승자의 역할을 주목하면서, 소셜 네트워크 분석을 활용해 무형문화유산 전승공동체의 연결망과 전승활동에서 발생하는 지식 흐름의 구조적 특징을 분석하는 데 있다. 이러한 연구 목적을 이루기 위해 본 논문에서는 연구 대상을 국가무형문화재 종목들 중에서 일반인의 전승활동이 활발한 '아리랑'으로 선정하였다. 아리랑은 오랜 기간 제도권 밖에서 일반대중 활동을 중심으로 자생적으로 전승되었으며, 2015년에 전문전승자 지정 없이 국가무형문화재로 지정된 최초의 사례이다. 현재 아리랑은 약 60여 종, 3,600여 곡에 이르는 것으로 추정된다. 본 논문에서는 이 중에서 전문전승자와 일반전승자의 상호교류가 활발한 향토민요 '정선아리랑'을 중심으로 연구하였다. 소셜 네트워크 분석은 사람과 사람 사이의 관계를 노드(Node)와 링크(Link)로 모델링하여 수치화 통계화 시각화하여 해석하는 방법을 말한다. 이 방법은 전통적으로 사회학에서 사회조직 및 취약계층을 연구하는 데 꾸준히 활용되었다. 최근에는 문헌정보학, 문화콘텐츠학, 경영학 등과 같은 분야에서 연구경향, 시장동향, 조직관리 등을 연구하는 데 이 방법이 활용되고 있다. 이처럼 여러 학문 분야에서 소셜 네트워크 분석을 이용한 연구가 증가하는 추세지만 문화재 분야에서는 관련 연구를 찾아보기가 어렵다. 소셜 네트워크 분석은 크게 3단계, '연결망 모델링', '데이터 수집', '데이터 분석 및 시각화'로 진행된다. 본 논문에서는 첫 번째, 2017년 기준으로 정선아리랑보존회 회원 전체를 조사 대상으로 선정하여 완전한 연결망으로 모델링하였다. 두 번째, 데이터 수집은 보존회 회원 명부를 확보해 2017년 10월 17일 면대면 조사와 2017년 12월 15일 전화 설문조사를 통해 하였다. 세 번째, 데이터 분석은 Netminer 4.0 프로그램을 이용해 중심성 분석, 구조적 등위성 분석, 커뮤니티 분석 등을 주요 지표로 하였다. 본 논문은 기존에 무형문화유산 계보조사에서 소수 사람들의 구술자료에 의존해 파악하던 방식에서 벗어나 객관적이고 계량적인 방법으로 조사할 수 있는 기반을 제공하였다는 점에서 연구 의의가 있다. 그리고 무형문화유산 전승공동체 구성원들의 관계 및 지식 흐름의 구조를 지식지도(2D Spring Map) 형태로 시각화함으로써 추상적인 내용을 직관적으로 파악할 수 있게 했다는 점에서 의미가 있다.