• 제목/요약/키워드: 그래프 유사도

검색결과 292건 처리시간 0.026초

GPU에서 CUDA를 이용한 그래프 유사도 측정을 위한 병렬 알고리즘 (A Parallel Algorithm for Measuring Graph Similarity Using CUDA on GPU)

  • 손민영;김영학;최성자
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권3호
    • /
    • pp.156-164
    • /
    • 2017
  • 두 그래프의 유사도를 측정하는 문제는 다양한 응용분야에서 그래프 문제를 해결하기 위한 기본적인 도구 중 하나이다. 대부분 그래프 알고리즘들은 정점과 간선의 개수를 기반으로 한 시간 복잡도를 가진다. 최근 GPU는 낮은 가격 대비 높은 계산 능력을 제공하기 때문에 그래프 응용에서 수행 시간을 개선하기 위해 널리 활용되고 있다. 본 논문에서는 GPU 환경에서 CUDA를 사용하여 그래프의 유사도를 측정하기 위한 효율적인 병렬 알고리즘을 제안한다. 제안된 알고리즘의 평가를 위해 CPU 기반 알고리즘과 비교하였으며 실험적 결과를 통하여 제안된 방법이 성능과 효율성에서 상당한 개선이 있음을 보인다. 또한 그래프의 크기가 클수록 제안된 알고리즘의 성능이 더 개선됨을 보인다.

대용량 그래프 환경에서 스카이라인을 이용한 서브 그래프 유사도 측정 기법 (A Similarity Measurement Scheme using Skyline Queryin Large-scale Graph Environments)

  • 임종태;복경수;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2017년도 춘계 종합학술대회 논문집
    • /
    • pp.47-48
    • /
    • 2017
  • 최근 각종 실험 장비의 발전에 따라 유사 서브 그래프 매칭에 대한 연구가 활발하게 진행되고 있다. 하지만 유사 서브 그래프 매칭은 다수의 최종 결과들이 반환되었을 경우, 사용자는 어떤 결과가 자신에게 가장 유의미한 결과인지를 판별하기 힘든 문제점이 존재한다. 본 논문에서는 대용량 그래프 환경에서 스카이라인을 이용한 서브 그래프 유사도 측정 기법을 제안한다. 제안하는 기법은 스카이라인 기법과 피드백에 기반한 랭킹을 수행하여 유사 서브 그래프 매칭에서 사용자에게 유의미한 결과를 반환한다.

  • PDF

Min-Hash를 이용한 효율적인 대용량 그래프 클러스터링 기법 (An Efficient Large Graph Clustering Technique based on Min-Hash)

  • 이석주;민준기
    • 정보과학회 논문지
    • /
    • 제43권3호
    • /
    • pp.380-388
    • /
    • 2016
  • 그래프 클러스터링은 서로 유사한 특성을 갖는 정점들을 동일한 클러스터로 묶는 기법으로 그래프 데이터를 분석하고 그 특성을 파악하는데 폭넓게 사용된다. 최근 소셜 네트워크 서비스와 월드 와이드 웹, 텔레폰 네트워크 등의 다양한 응용분야에서 크기가 큰 대용량 그래프 데이터가 생성되고 있다. 이에 따라서 대용량 그래프 데이터를 효율적으로 처리하는 클러스터링 기법의 중요성이 증가하고 있다. 본 논문에서는 대용량 그래프 데이터의 클러스터들을 효율적으로 생성하는 클러스터링 알고리즘을 제안한다. 우리의 제안 기법은 그래프 내의 클러스터들 간의 유사도를 Min-Hash를 이용하여 효과적으로 추정하고 계산된 유사도에 따라서 클러스터들을 생성한다. 실세계 데이터를 이용한 실험에서 우리는 본 논문에서 제안하는 기법과 기존 그래프 클러스터링 기법들과 비교하여 제안기법의 효율성을 보였다.

워드 임베딩 기반 근사 Top-k 레이블 서브그래프 매칭 기법 (Approximate Top-k Labeled Subgraph Matching Scheme Based on Word Embedding)

  • 최도진;오영호;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제22권8호
    • /
    • pp.33-43
    • /
    • 2022
  • 지식 그래프 및 단백질 상호 작용과 같은 실제 데이터에서 개체들과 개체들의 관계 및 구조를 나타내기 위해 레이블 그래프를 사용한다. IT의 급속한 발전과 데이터의 폭발적인 증가로 사용자에게 관심 있는 정보를 제공하기 위한 서브 그래프 매칭 기술이 필요하다. 본 논문은 레이블의 의미적 유사성과 그래프 구조 차이를 고려한 근사 Top-k 서브 그래프 매칭 기법을 제안한다. 제안하는 기법은 레이블 의미적 유사도를 고려하기 위하여 FastText을 활용한 학습 모델을 이용한다. 레이블 간 의미적 유사도를 미리 계산한 LSG(Label Similarity Graph)를 통해 처리 속도의 효율을 높인다. LSG를 통해 레이블이 정확하게 일치해야 확장이 가능한 기존 연구의 한계를 해결한다. 2-hop까지 탐색을 수행함으로써 질의 그래프에 대한 구조적 유사성을 지원한다. 매칭된 서브 그래프는 유사도 값 기반으로 Top-k 결과를 제공한다. 제안하는 기법의 우수성을 보이기 위하여 다양한 성능평가를 수행한다.

그래프간 유사도 측정에 의한 음악 기호 인식 (A Musical Symbol recognition By Using Graphical Distance Measures)

  • 전정우;장경식;허경용;김재희
    • 한국음향학회지
    • /
    • 제15권1호
    • /
    • pp.54-60
    • /
    • 1996
  • 패턴인식이나 영상이해의 영역에서는 같은 물체라도 잡음이나 왜곡에 의하여 모양이 훼손되어 다른 물체로 인식될 수 있다. 따라서 물체 인식에서는 두 물체가 완전히 동일한지 여부를 판정하는 것보다는 두 물체가 서로 어느 정도 유사한가를 판정하는 것이 중요한 경우가 많다. 이 논문에서는 훼손된 기호의 인식을 위하여 기호를 표현하는 두 그래프 표현간의 유사도 측정을 이용한 기호 인식 방법을 제안하였다. 제안한 기호 인식 방법은 런 그래프(run graph)를 이용하여 인식 대상 기호를 노드(node)와 에지(edge)로 구성되는 그래프 형태로 표현하고 임베딩 변환(embedding transform)을 포함한 생성 규칙을 사용하여 입력 그래프를 참조 모델 그래프와 유사한 형태로 변형시킨다. 이러한 과정에서 변형된 최종 그래프와 모델 그래프간의 구조적 유사성과 변형시 사용된 생성 규칙의 수를 이용하여 그래프간 유사도를 측정함으로써 기호를 인식하였으며 이의 응용 분야로서 악보에서 비음표 기호 인식에 사용하였다. 이 결과 96%의 인식률을 얻었으며 기호가 심하게 훼손되지 않은 경우에는 거의 인식에 성공하였다.

  • PDF

Normalized Cuts을 이용한 그래프 기반의 모션 분할 (Graph-based Motion Segmentation using Normalized Cuts)

  • 윤성주;박안진;정기철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.522-526
    • /
    • 2008
  • 모션 캡쳐 장비는 사람의 자연스러운 행동이나 동작 정보를 정밀하게 얻기 위해 널리 사용되며, 영화나 게임과 같은 콘텐츠에서 자주 활용되고 있다. 하지만 모션 캡쳐 장비가 고가이기 때문에 한번 입력받은 데이터를 모션별로 분할하고 상황에 맞게 재결합하여 사용할 필요가 있으며, 입력 데이터를 모션별로 분할하는 것은 대부분 수동으로 이루어진다. 이 때문에 캡쳐된 데이터를 자동으로 분할하기 위한 연구들이 다양하게 시도되고 있다. 기존의 연구들은 크게 전역적 특성에 대한 고려없이 이웃하는 프레임만을 고려하는 온라인 방식과 데이터를 전역적으로 고려하나 이웃하는 프레임 사이의 관계를 고려하지 않는 오프라인 방식으로 나누어진다. 본 논문에서는 온라인과 오프라인 방식을 병합한 그래프 기반의 모션 분할 방법을 제안한다. 분할을 위해 먼저 모션데이터를 기반으로 그래프를 생성하며, 그래프는 이웃하는 각 프레임사이의 유사도뿐만 아니라 시간축을 기반으로 일정시간내의 프레임들의 유사도를 모두 고려하였다. 이렇게 생성된 그래프를 분할하기 위해 분할된 모션내의 유사도 합을 최소화하고 각 모션간의 유사도는 최대화할 수 있는 normalized cuts을 이용하였다. 실험에서 제안된 방법은 기존의 오프라인 방식 중 하나인 GMM과 온라인 방식 중 하나인 국부최소값 분할 방법보다 좋은 결과를 보였으며, 이는 각 프레임 사이의 유사도뿐만 아니라 일정시간내의 유사도를 전역적으로 고려하기 때문이다.

  • PDF

대용량 그래프에서의 유사 매칭을 위한 그래픽 사용자 인터페이스 기반 서브 그래프 생성 도구에 대한 연구 (A Study on GUI based Subgraph Generation Tool for Similar Matching in Large Capacity Graphs)

  • 송재오;홍승민;이상문
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제58차 하계학술대회논문집 26권2호
    • /
    • pp.349-350
    • /
    • 2018
  • 최근 빅데이터를 비롯한 각종 실험 장비의 발전에 따라 첨단 분야에서의 과학데이터가 급격히 증가하고 있는 가운데, 그래프 매칭은 컴퓨터 네트워크 모니터링, 소셜 네트워크의 진화 분석, 생물학 네트워크에서 모티프(motif) 탐지 등 네트워크 분석 및 데이터 마이닝 분야에서 널리 활용되고 있다. 이와 같이, 폭발적으로 증가하는 데이터에 대한 네트워크 모델링 및 유사 그래프 매칭 분석을 수행하기 위한 연구 및 기반 기술 개발은 필수적인 실정이다. 본 논문에서는 이미 확보된 대용량 그래프에서 유사한 형태의 서브 그래프를 매칭할 수 있는 GUI(Graphic User Interface)기반의 생성 도구를 제안한다.

  • PDF

단백질 구조 비교에서 유사성 그래프의 효율적인 생성 (Efficient Generation of Docking Graph in Protein Structure Comparison)

  • 최경호;김진홍;이명준;이수현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.893-895
    • /
    • 2003
  • 단백질간 구조 비교는 기능적 또는 구조적으로 연관된 단백질을 분류하거나 모티프(motif)를 찾는데 유용하게 사용되고 있다. 여러 가지 단백질간 구조 비교 방법 중에서 단백질 2차구조를 이용하는 방법은 실행속도의 측면에서 장점이 있다. 본 논문에서는 단백질 2차 구조와 그들 사이의 관계를 기반으로 한 단백질 구조 비교에서 사용될 유사성 그래프를 생성하는 방법을 기술하였다. 유사성 그래프는 단백질의 2차구조 사이의 관계를 노드로 하여 생성되는데, 그 시간복잡도가 O(n$^4$)이다. 이에 본 논문에서는 유사성 그래프의 생성을 효율적으로 할 수 있는 알고리즘을 개발하였다.

  • PDF

공통 Phrase의 관계 그래프와 Suffix Tree 문서 모델을 이용한 문서 군집화 기법 (Document Clustering with Relational Graph Of Common Phrase and Suffix Tree Document Model)

  • 조윤호;이상근
    • 한국콘텐츠학회논문지
    • /
    • 제9권2호
    • /
    • pp.142-151
    • /
    • 2009
  • 기존의 문서 군집화 기법 NSTC은 문서 군집화 과정 내에서 TF-IDF를 이용하여 문서간 유사도를 측정한다. 본 논문에서는 TF-IDF가 아닌, 공통 Phrase의 관계 그래프를 이용한 새로운 문서간 유사도 측정을 제안한다. 이 방법은 문서 집합 내의 공통 Phrase들의 관계를 나타낸 관계 그래프를 통해 공통 Phrase의 가중치를 부여하는 방법을 제시한다. 또한 실험을 통해 NSTC와 비교하여 본 논문에서 제안한 문서간 유사도 측정 기법이 문서 군집화에 더욱 효과적임을 보였다.

에지 확장을 통한 제어 흐름 그래프의 효과적인 비교 방법 (An Effective Method for Comparing Control Flow Graphs through Edge Extension)

  • 임현일
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제2권8호
    • /
    • pp.317-326
    • /
    • 2013
  • 본 논문에서는 바이너리 프로그램의 정적인 구조를 표현하는 제어 흐름 그래프를 비교하는 방법을 제안한다. 제어 흐름 그래프를 비교하기 위해서 기본 블록에 포함된 프로그램의 명령어 및 구문 정보를 비교한 후 기본 블록 사이의 유사한 정도를 측정한다. 또한, 에지 확장을 통해 기본 블록들 간의 제어 흐름을 표현하는 그래프 에지의 유사성을 함께 반영한다. 각 기본 블록 사이의 유사도 결과를 기반으로 기본 블록을 서로 매칭하고, 기본 블록 사이의 매칭 정보를 이용해서 전체 제어 흐름 그래프의 유사도를 측정한다. 본 논문에서 제안한 방법은 자바 프로그램으로부터 추출한 제어 흐름 그래프를 대상으로 제어 흐름 구조의 유사성에 따라 두 가지 기준으로 실험을 수행하였다. 그리고, 성능을 평가하기 위해서 기존의 구조적 비교 방법을 함께 실험하였다. 실험 결과로부터 에지 확장 방법은 서로 다른 프로그램에 대해 충분한 변별력을 가지고 있음을 확인할 수 있다. 프로그램 비교에 좀 더 많은 시간이 소요되지만, 구조가 유사한 프로그램에 대한 매칭 능력에서 기존의 구조적 비교 방법에 비해 우수한 결과를 보였다. 제어 흐름 그래프는 프로그램의 분석에 다양하게 활용될 수 있으며, 제어 흐름 그래프의 비교 방법은 프로그램의 유사성 비교를 통한 코드의 최적화, 유사 코드 검출, 코드의 도용 탐지 등 다양한 분야에서 응용될 수 있을 것이라 기대된다.