• 제목/요약/키워드: link similarity

검색결과 57건 처리시간 0.023초

Bypass-Based Star Aggregation Using Link Attributes for Improving the Information Accuracy

  • Kwon, Sora;Jeon, Changho
    • Journal of Communications and Networks
    • /
    • 제17권4호
    • /
    • pp.428-439
    • /
    • 2015
  • In this study, we present an approach for reducing the information inaccuracy of existing star aggregation based on bypass links when there are multi-constraint QoS parameters in asymmetric networks. In our approach, bypass links with low similarity are selected. Links that are not chosen as bypass links are included in each group depending on the star's link characteristics. Moreover, each link group is aggregated differently according to the similarity of the links that make up the group. The selection of a bypass link by using link similarity reduces the existing time complexity of O($N^3$) to O(N) by virtue of the simplification of the selection process. In addition, the adaptive integration according to the characteristics of the links in each group is designed to reduce the information inaccuracy caused by static aggregation. Simulation results show that the proposed method maintains low information distortion; specifically, it is 3.8 times lower than that of the existing method, even when the number of nodes in a network increases.

A Study on the Performance of Similarity Indices and its Relationship with Link Prediction: a Two-State Random Network Case

  • Ahn, Min-Woo;Jung, Woo-Sung
    • Journal of the Korean Physical Society
    • /
    • 제73권10호
    • /
    • pp.1589-1595
    • /
    • 2018
  • Similarity index measures the topological proximity of node pairs in a complex network. Numerous similarity indices have been defined and investigated, but the dependency of structure on the performance of similarity indices has not been sufficiently investigated. In this study, we investigated the relationship between the performance of similarity indices and structural properties of a network by employing a two-state random network. A node in a two-state network has binary types that are initially given, and a connection probability is determined from the state of the node pair. The performances of similarity indices are affected by the number of links and the ratio of intra-connections to inter-connections. Similarity indices have different characteristics depending on their type. Local indices perform well in small-size networks and do not depend on whether the structure is intra-dominant or inter-dominant. In contrast, global indices perform better in large-size networks, and some such indices do not perform well in an inter-dominant structure. We also found that link prediction performance and the performance of similarity are correlated in both model networks and empirical networks. This relationship implies that link prediction performance can be used as an approximation for the performance of the similarity index when information about node type is unavailable. This relationship may help to find the appropriate index for given networks.

Link Prediction Algorithm for Signed Social Networks Based on Local and Global Tightness

  • Liu, Miao-Miao;Hu, Qing-Cui;Guo, Jing-Feng;Chen, Jing
    • Journal of Information Processing Systems
    • /
    • 제17권2호
    • /
    • pp.213-226
    • /
    • 2021
  • Given that most of the link prediction algorithms for signed social networks can only complete sign prediction, a novel algorithm is proposed aiming to achieve both link prediction and sign prediction in signed networks. Based on the structural balance theory, the local link tightness and global link tightness are defined respectively by using the structural information of paths with the step size of 2 and 3 between the two nodes. Then the total similarity of the node pair can be obtained by combining them. Its absolute value measures the possibility of the two nodes to establish a link, and its sign is the sign prediction result of the predicted link. The effectiveness and correctness of the proposed algorithm are verified on six typical datasets. Comparison and analysis are also carried out with the classical prediction algorithms in signed networks such as CN-Predict, ICN-Predict, and PSNBS (prediction in signed networks based on balance and similarity) using the evaluation indexes like area under the curve (AUC), Precision, improved AUC', improved Accuracy', and so on. Results show that the proposed algorithm achieves good performance in both link prediction and sign prediction, and its accuracy is higher than other algorithms. Moreover, it can achieve a good balance between prediction accuracy and computational complexity.

커밋 히스토리에 기반한 버그 및 커밋 연결 기법 (A Technique to Link Bug and Commit Report based on Commit History)

  • 채영재;이은주
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권5호
    • /
    • pp.235-239
    • /
    • 2016
  • 커밋-버그 링크는 커밋히스토리(commit history)와 버그 리포트(bug report) 간의 연결(Link)을 뜻한다. 커밋-버그 링크는 소프트웨어 유지보수와 결함 예측, 버그 추적 시스템(Bug Tracking System)에 이용이 되며, 특히 결함 예측 측면에서는 성능면에서의 기반이 된다. 일반적으로 링크를 자동으로 연결하는 방식은 텍스트 유사도(text similarity)나 시간 간격(time interval), 키워드(keyword) 등을 통해서 추출하였다. 하지만 기존 방식은 커밋히스토리(commit history)의 질적인 부분에 의존적이기 때문에 다수의 링크를 놓치게 된다는 단점이 존재한다. 본 논문에서는 커밋히스토리의 메시지(message)부분에만 의존하지 않고, 버그리포트에서 연결된 커밋히스토리의 파일간의 유사도를 이용하여 링크를 연결할 수 있는 방식을 제안하고 실험을 통하여 본 기법의 적용성을 보인다.

논문의 참조 정보를 이용한 새로운 논문 유사도 (A New Similarity Measure Using Reference Information for Scientific Literature)

  • 윤석호;김상욱;박선주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.860-861
    • /
    • 2010
  • 본 논문에서는 논문들 간의 참조 정보를 이용한 새로운 논문 유사도 계산 방안을 제안한다. 본 논문에서 제안하는 방안은 in-link와 out-link를 undirected-link로 간주함으로써 in-link와 out-link를 동시에 이용하여 논문들 간의 유사도를 적절하게 계산한다. 사례 분석을 통해서 제안하는 방안의 우수성을 검증한다.

소셜 네트워크 기반 사용자 유사성 발견을 통한 개인화 및 소셜 검색 (Personalized and Social Search by Finding User Similarity based on Social Networks)

  • 박건우;오정운;이상훈
    • 정보처리학회논문지D
    • /
    • 제16D권5호
    • /
    • pp.683-690
    • /
    • 2009
  • 소셜 네트워크(Social Network)는 웹 환경에서 개인 중심의 네트워크로 구성되어 웹 사용자별 프로파일을 탐색하고 새로운 연결을 형성함으로써 정보의 소통을 지원한다. 따라서 유사한 내재적 정보를 가진 웹 사용자들로 구성 된 소셜 네트워크를 찾아서 검색에 적용한다면 검색의 효율성과 검색 결과에 대한 웹 사용자의 만족도를 향상 시킬 수 있다. 본 논문에서는 첫째, 웹 사용자간 직접 또는 간접적인 연결로 구성된 소셜 네트워크를 구성 한다. 둘째, 사용자들의 속성(Feature)에 내재된 정보를 이용하여 주제(topic)별 웹 사용자 간 유사성(Similarity)을 산정한 후, 주제(Topic)별 변화되는 유사성에 따라 소셜 네트워크를 재구성한다. 마지막으로 산정된 유사성과 웹 사용자들의 검색결과에 대한 만족도, 즉 검색 패턴(Search Pattern)을 비교 실험 한다. 실험 결과 주제별 유사성이 높은 웹 사용자 간에는 검색 패턴 또한 유사함을 확인 하였다. 이와 같은 사실을 검색에 적용한다면 개인화 검색(Personalized Search) 및 소셜 검색(Social Search)의 효율성 및 신뢰성 향상에 기여 할 수 있다.

An Incremental Similarity Computation Method in Agglomerative Hierarchical Clustering

  • Jung, Sung-young;Kim, Taek-soo
    • 한국지능시스템학회논문지
    • /
    • 제11권7호
    • /
    • pp.579-583
    • /
    • 2001
  • In the area of data clustering in high dimensional space, one of the difficulties is the time-consuming process for computing vector similarities. It becomes worse in the case of the agglomerative algorithm with the group-average link and mean centroid method, because the cluster similarity must be recomputed whenever the cluster center moves after the merging step. As a solution of this problem, we present an incremental method of similarity computation, which substitutes the scalar calculation for the time-consuming calculation of vector similarity with several measures such as the squared distance, inner product, cosine, and minimum variance. Experimental results show that it makes clustering speed significantly fast for very high dimensional data.

  • PDF

연결정책을 이용한 개방형 연결 데이터 클라우드에서의 연결성 확충 (Linkage Expansion in Linked Open Data Cloud using Link Policy)

  • 김광민;손용락
    • 정보과학회 논문지
    • /
    • 제44권10호
    • /
    • pp.1045-1061
    • /
    • 2017
  • 본 논문은 시멘틱 웹의 실제적인 구현 결과인 개방형 연결 데이터(Linked Open Data(LOD)) 클라우드에서의 연결성을 확충하는 방안을 제시하였다. 현재의 LOD 클라우드는 최초 기대와는 달리 LOD들간의 연결성 부족으로 인하여 활발한 활용을 이끌어 내지 못하고 있다. 를 적용한 명시적연결들을 LOD에 직접 첨부하여 공개하는 현재의 연결방식은 연결대상 LOD들의 변경상황을 실시간으로 검색결과에 반영하지 못하며 별도의 작업을 통하여 이러한 명시적연결들을 생성하고 주기적으로 갱신하여야 한다는 제약을 가진다. 이에 본 논문은 명시적연결들을 첨부하는 대신 LOD마다 연결정책을 마련하고 이를 LOD와 함께 공개하는 방안을 제안하였다. 연결정책에는 타겟LOD들을 선정하고 연결판단에 필요한 술어 쌍들과 유사도를 명세하도록 하였다. 이러한 연결정책에 기반하여 여러 LOD들에 거쳐 진행하는 심층검색 기능을 API로 구현하고 이를 Github를 통하여 공개하였다. 구현한 심층검색을 유사도 1.0~0.8, 깊이 4까지에서 실험한 결과 신뢰적인 연결들을 91%~98% 수준으로 포함하고 170% 정도 규모의 적정한 확장성을 제공하는 것으로 평가되었다.

링크내역을 이용한 페이지점수법 알고리즘 (PageRank Algorithm Using Link Context)

  • 이우기;신광섭;강석호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권7호
    • /
    • pp.708-714
    • /
    • 2006
  • 웹은 정보의 저장 및 검색에 있어서 보편적인 매체가 되고 있다. 웹에서 정보 검색은 검색엔진을 출발점으로 이용하는 것이 대부분이지만, 그 결과는 사용자의 요구와 늘 일치하는 것은 아니며 때로는 의도적으로 조작된 검색 결과가 제시되기도 한다. 검색엔진의 데이타를 의도적으로 조작하는 것을 스패밍(spamming)이라고 부르며, 다양한 스패밍과 방지기술이 있지만, 최근에 각광을 받고있는 링크기반 검색 방식에는 스패밍이 쉽지 않은 것으로 알려져 있다. 그러나 이러한 방식에서도 구글폭탄(Google Bombing)과 같이 페이지점수법(PageRank)을 조작할 수 있는 약점이 있다. 본 논문에서는 이러한 약점을 방지할 수 있는 알고리즘을 제시한다. 기본적으로 링크 기반 검색 방식을 기초로 하여 웹을 하나의 유향 레이블 그래프로 인식하여 각 웹 페이지들은 하나의 노드로, 하이퍼링크는 에지로 표현함에 있어서 본 연구에서는 링크구조를 기반으로 링크내역(link context)을 부여하고 이를 에지의 레이블로 사용한다. 링크내역과 대상 페이지 사이의 유사도를 구하고, 이것을 이용하여 페이지점수법의 인접행렬을 재구성하는 방법을 취했다. 결과로써 기존의 방법 및 특이값 추출기법(SVD)에 기반한 새로운 기준을 도입해 그 효과를 입증했다.

하이퍼텍스트 정보 관점에서 의도적으로 왜곡된 웹 페이지의 검출에 관한 연구 (Detecting Intentionally Biased Web Pages In terms of Hypertext Information)

  • 이우기
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권1호
    • /
    • pp.59-66
    • /
    • 2005
  • 웹(World Wide Web)은 정보의 저장 및 검색에 있어서 보편적인 매체가 되고 있다 웹에서는 일반적으로 검색엔진(Web search engine)을 통해 정보 검색을 수행하지만, 그 결과가 사용자의 요구와 늘 일치하는 것은 아니며 때로는 의도적으로 조작된 검색 결과가 제시되기도 한다. 웹 페이지에 대한 평가를 조작하는 것을 의도적 조작이라고 부른다. 최근에 가장 각광을 받는 링크 기반 검색 방식에는 의도적 조작이 상대적으로 어렵지만, 링크 기반 검색 방식의 대표격인 구글의 페이지 점수법(PageRank algorithm)도 구글밤처럼 조작할 수 있는 방법이 있다 본 논문에서는 기본적으로 링크 기반 검색 방식을 기초로 웹을 하나의 유향그래프(directed graph)로 인식하여 각 웹 페이지들은 하나의 노드로, 하이퍼텍스트 링크를 에지(edge)로 표현하며. 하이퍼텍스트 정보관점에서 링크 내역과 대상 페이지(target page) 사이의 유사도(similarity)를 구하고. 이것을 이용하여 페이지 점수화 (PageRank) 접근법의 전이 행렬(transition matrix)을 재구성하는 방법을 취했다 결과적으로 기존의 점수화 방법과 비교하여 효과가 $60\%$ 이상 될 수 있음을 입증했다.

  • PDF