• 제목/요약/키워드: 그래프 기법

검색결과 731건 처리시간 0.027초

하둡 맵리듀스와 페이지 랭크를 이용한 서울시 대중 교통 인구 이동 분석 (Analysis of the population flow of public transportation in Seoul using Hadoop MapReduce and PageRank algorithm)

  • 백민석;오상윤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.354-356
    • /
    • 2022
  • 소셜 네트워크 및 웹 데이터와 같은 대규모 그래프 데이터를 처리하기 위해 병렬 처리 기반의 기법들이 많이 사용되어 왔다. 본 연구에서는 그래프 형식의 대규모 교통 데이터를 하둡 맵리듀스를 이용하여 처리하는 효과적인 기법을 제안한다. 제안하는 방식에서는 도시의 유동 인구 흐름을 가중치로 고려할 수 있도록 Weighted PageRank 알고리즘을 기반으로 하는 병렬 그래프 알고리즘을 사용하며, 해당 알고리즘을 하둡 맵리듀스에 적용하여 주거 및 근무지 등의 지역을 분류하도록 결과를 분석하였다. 제안 기법을 통한 분석 결과를 기반으로 지역 간 유동 인구 그래프 데이터에서 각 도시의 영향력을 측정하는 페이지랭크, 하둡 맵리듀스 기반의 기법을 제시한다.

동적 그래프에서 GPU 기반의 점진적 연결 요소 처리 (GPU Based Incremental Connected Component Processing in Dynamic Graphs)

  • 김남영;최도진;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제22권6호
    • /
    • pp.56-68
    • /
    • 2022
  • 최근 실시간 처리의 요구가 증가하면서 시간에 따라서 변화하는 동적 그래프에 관한 연구가 활발하게 진행되고 있다. 동적 그래프를 분석하기 위한 알고리즘의 하나로 연결 요소가 있다. GPU는 높은 메모리 대역폭, 연산 성능으로 대규모의 그래프 계산에 적합하다. 그러나 동적 그래프의 연결 요소를 GPU를 이용하여 처리할 때, GPU의 제한된 메모리로 인해 실제 그래프 처리 시 CPU와 GPU 간에 잦은 데이터 교환이 발생한다. 본 논문에서는 동적 그래프에서 GPU 기반의 효율적인 점진적 연결 요소 처리 기법을 제안한다. 제안하는 기법은 Weighted-Quick-Union 알고리즘을 기반으로 연결 요소 레이블에 구성 요소의 개수를 이용하여 연결 요소를 빠르게 계산한다. 또한, 재계산할 부분을 판별하여 GPU로 전송할 데이터를 최소화하여 대규모 그래프에 대하여 CPU와 GPU 간의 데이터 교환 횟수를 감소시킨다. 뿐만 아니라 GPU와 CPU 간에 데이터 전송 시간 낭비를 줄이기 위해 GPU와 CPU가 비동기로 실행하는 처리 구조를 제안한다. 실제 데이터 집합을 사용한 성능 평가를 통해 제안하는 기법의 우수성을 입증한다.

서브 그래프의 사용 패턴을 고려한 다중 계층 캐싱 기법 (Multi-layer Caching Scheme Considering Sub-graph Usage Patterns)

  • 유승훈;정재윤;최도진;박재열;임종태;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제18권3호
    • /
    • pp.70-80
    • /
    • 2018
  • 최근 소셜 미디어와 모바일 장비들의 발달로 인해 그래프 데이터들이 다양한 분야에서 활용되고 있다. 이와 함께 대용량 그래프 데이터 처리 과정에서 입출력 비용을 감소시키기 위한 캐싱 기법에 대한 연구들이 진행되고 있다. 본 논문에서는 그래프 토폴로지의 특징인 그래프의 연결성과 과거의 서브 그래프 사용 이력을 고려하여 다중 계층 캐싱 기법을 제안한다. 제안하는 기법은 캐시를 Used Data Cache와 Prefetched Cache로 구분한다. Used Data Cache는 자주 사용되는 서브 그래프 패턴에 따라 가중치를 부여하여 데이터를 캐싱하고 Prefetched Cache는 사용되지는 않았지만 최근 사용된 데이터의 주변 데이터들이 사용될 가능성이 높은 데이터를 캐싱한다. 그래프 패턴을 추출하기 위해 과거의 이력 정보를 활용하여 패턴을 추출하였다. 자주 사용되는 서브 그래프들이 다시 사용될 것을 예측하여 가중치를 부여하여 캐싱한다. 최근 사용된 데이터의 주변 데이터들이 사용 될 것을 예측하여 캐싱한다. 각각의 캐시에 캐싱된 데이터들을 관리하고 메모리가 가득 찰 경우 사용될 가능성이 낮은 데이터와 새로운 데이터를 교체하는 전략을 제안한다. 성능 평가를 통해 제안하는 캐싱 기법이 기존의 캐시 관리 기법에 비해 우수함을 증명한다.

레지스터 쌍의 융합 (Coalescing Register Pairs)

  • 황성욱;문수묵
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.410-412
    • /
    • 1998
  • 그래프 채색 기법(Graph Coloring)에 기반한 레지스터 할당기들은 간섭 그래프의 서로 다른 노드(node)에 같은 레지스터를 할당함으로써 복사 명령어를 없앤다. 본 논문은 이러한 기법 가운데 보수적 융합(Conservative Coalescing)이 레지스터 쌍을 융합하는데 단점이 있음을 지적하고 이러한 문제가 낙관적 레지스터 융합 기법(Optmistic Register Coalescing)에 의해 해결될 수 있음을 보인다.

병렬처리를 위한 효율적인 사상 기법 (Efficient Mapping Scheme for Parallel Processing)

  • 김석수;전문석
    • 한국정보처리학회논문지
    • /
    • 제3권4호
    • /
    • pp.766-780
    • /
    • 1996
  • 본 논문은 통신 오버헤드의 정확한 특성을 사용하여 병렬처리를 위한 사상 기법을 표현했다. 목적 함수의 집합은 시스템 그래프에 문제 그래프를 사상하는 것의 최적화 를 평가하기 위해서 정형화했다. 이것 중에 하나는 병렬처리의 실시간 응용에 특히 적절하다. 목적함수는 문제 그래프에서 연결선이 가중치를 갖고 있고, 시스템 그래프 에서 연결선을 위해 명목거리보다 실제거리를 고용했다는 점에서 기존의 것과 차이가 있다. 이것은 통신오버헤드를 더 정확하게 측량할 수 있다. 효율적인 사상 기법이 목적함수를 위해서 개발되었고, 초기할당과 쌍교환의 두 단계에서 최적화 과정이 이루 어진다. 이 사상 기법은 시스템 그래프로서 하이퍼큐브를 사용하여 테스트했다.

  • PDF

소셜 네트워크에서 사용자 관심도를 고려한 그래프 기반 이벤트 검출 기법 (Graph-based Event Detection Scheme Considering User Interest in Social Networks)

  • 김이나;김민영;임종태;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제18권7호
    • /
    • pp.449-458
    • /
    • 2018
  • 소셜 네트워크 서비스의 사용량이 증가함에 따라 오프라인에서 발생한 이벤트 정보가 더욱 빠르게 확산되고 있다. 이에 따라 소셜 데이터를 분석하여 이벤트를 검출하기 위한 연구들이 진행되고 있다. 본 논문에서는 소셜 네트워크 환경에서 사용자 관심도를 고려한 그래프 기반 이벤트 검출 기법을 제안한다. 제안하는 기법은 사용자들이 게시한 글을 분석하여 키워드 그래프를 구축한다. 사용자의 소셜 행위로부터 관심도를 계산하고 관심도의 변화를 고려하여 이벤트 판별에 이용한다. 따라서 의미 없이 반복 게시되어 이벤트로 검출된 결과를 제거하고 결과의 신뢰성을 향상시킬 수 있다. 제안하는 이벤트 검출 기법의 우수성을 입증하기 위해 다양한 성능평가를 수행한다.

완전그래프를 이용한 문서요약 연구 (Document Summarization Method using Complete Graph)

  • 유준현;박순철
    • 한국산업정보학회논문지
    • /
    • 제10권2호
    • /
    • pp.26-31
    • /
    • 2005
  • 본 논문에서는 웹 검색엔진에서 일반적으로 사용하는 문서요약에 대한 연구로써 문서 내에 있는 문장들의 꼭짓점을 연결하는 완전그래프기법을 도입하여 요약내용을 좀 더 간결하고 함축하게 하는 통계요약기법을 제안했다. 이 요약기술을 지금까지 통계 문서요약기술에서 우수하다고 판단된 클러스터링 기법과 MMR 기법 등과 비교하였다. 특히, 요약 성능을 평가하기 위하여 인위적으로 요약된 요약문을 기준으로 한 각 요약기법들의 FScore값들과 비교하였다. 이 기술들 중에서 완전그래프기법이 약 $30\%$정도 성능향상을 보였다.

  • PDF

대용량 그래프에서 k-차수 인덱스 테이블을 이용한 RDBMS 기반의 효율적인 최단 경로 탐색 기법 (RDBMS based Efficient Method for Shortest Path Searching over Large Graphs using K-degree Index Table)

  • 홍지혜;한용구;이영구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1186-1188
    • /
    • 2013
  • 최근 소셜 네트워크의 등장과 기술의 발달로 인해 빅 데이터가 등장하였다. 특히, 소셜 네트워크나 웹 데이터 등과 같은 빅 데이터를 이용하는 애플리케이션이 많아지고 있다. 이러한 그래프 데이터는 크기가 매우 방대하여 인-메모리 기법을 통해 연산하기 어렵다. 최근 대용량 그래프 상에서 효율적인 최단 경로 탐색을 위해 부분 최단 경로를 저장하는 인덱스 테이블을 활용한 기법이 제안되었으나, 인덱스 참조율을 고려하지 않아 비효율적이다. 본 논문에서는 인덱스 참조율이 높은 노드의 차수를 이용한 k-차수 인덱스 테이블을 이용한 효율적인 최단 경로 탐색 기법을 제안한다. 실험을 통하여 제안하는 기법이 거리 기반 인덱스를 이용한 기존의 기법에 비해 약 12% 정도 성능이 향상됨을 보였다.

디스크 기반 그래프 엔진의 입출력 성능 향상을 위한 그래프 오더링 (Improving the I/O Performance of Disk-Based Graph Engine by Graph Ordering)

  • 임근학;김정현;이은재;서지원
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제24권1호
    • /
    • pp.40-45
    • /
    • 2018
  • 빅데이터와 소셜 네트워크의 발전과 더불어 거대한 그래프를 처리하는 연구도 활발하게 진행되고 있다. 최근 그래프 처리의 성능 향상을 위해 Gorder 라는 그래프 오더링 기법이 제안되었다. 이 기법은 메모리 상의 그래프 레이아웃을 변형하여 데이터 접근 패턴을 CPU 캐시에 적합하게 바꿈으로써 성능을 향상시킨다. 하지만 그래프 알고리즘의 캐시 지역성에만 초점을 두고 설계되었기 때문에 디스크 기반 그래프 엔진에서는 적합하지 않고 전처리 비용도 크다는 문제점이 있다. 제시한 문제점을 해결하기 위해, 본 논문에서는 새로운 그래프 오더링인 I/O Order를 제안하였다. I/O Order는 디스크 기반의 그래프 엔진에서 지역성 외에 입출력 부하를 고려하여 설계되었다. 또한, 오더링 비용을 줄이기 위해 간단한 scheme을 사용한다. 본 논문에서 제시된 I/O Order는 Gorder와 비교해 전처리 비용이 최대 9.6배 감소하였고 성능은 지역성이 낮은 그래프 알고리즘에서 Random 대비 최대 2배 이상 향상되었다.

하이퍼-스타 연결망의 위상적 성질과 방송 알고리즘 (Topological Properties and Broadcasting Algorithm of Hyper-Star Interconnection Network)

  • 김종석;오은숙;이형옥
    • 정보처리학회논문지A
    • /
    • 제11A권5호
    • /
    • pp.341-346
    • /
    • 2004
  • 최근에 병렬처리를 위한 새로운 위상으로 하이퍼-스타 그래프 HS(m, k)가 제안되었다. 하이퍼-스타 그래프는 하이퍼큐브와 스타 그래프의 성질을 가지고 있으면서, 같은 노드수를 갖는 하이퍼큐브 보다 망비용이 우수한 그래프이다 본 논문에서는 하이퍼-스타 그래프 HS(m, k)가 하이퍼큐브의 서브그래프임을 증명한다. 그리고 정규형 그래프인 하이퍼-스타 HS(2n, n)가 제안된 매핑 기법에 의해 노드 대칭임을 보이며, 최소 높이를 갖는 스패닝 트리를 이용한 일-대-다 방송 기법을 제안하고, 방송 수행 시간이 2n-1임을 보인다.