• 제목/요약/키워드: 재귀적 질의 알고리즘

검색결과 4건 처리시간 0.021초

대용량 데이터 처리를 위한 고속 분산 인메모리 플랫폼 기반 재귀적 질의 알고리즘들의 구현 및 비교분석 (A Comparative Analysis of Recursive Query Algorithm Implementations based on High Performance Distributed In-Memory Big Data Processing Platforms)

  • 강민서;김재성;이재길
    • 정보과학회 논문지
    • /
    • 제43권6호
    • /
    • pp.621-626
    • /
    • 2016
  • 재귀적 질의 알고리즘은 소셜네트워크 서비스의 도달가능 질의와 같은 많은 응용프로그램에 사용된다. 하지만 최근에 소셜네트워크 서비스의 규모가 커짐에 따라 그래프 데이터의 크기 또한 커지고 있다. 따라서 재귀적 질의 알고리즘을 싱글 머신에서 가동하는 것이 거의 불가능해졌다. 본 논문에서는 이러한 문제점을 해결하기 위해서 고속 분산 인메모리 플랫폼인 스파크와 트위스터에서 재귀적 질의 알고리즘을 구현하였다. 구현된 알고리즘은 아마존 EC2 머신 50대에서 Real-world 데이터 셋인 LiveJournal과 ClueWeb으로 실험하였다. 실험결과 상대적으로 노드 수는 적고 평균 차수(degree)는 높은 LiveJournal 데이터 셋에서는 스파크에서 구현된 재귀적 알고리즘의 성능이 트위스터의 것보다 좋았다. 그리고 상대적으로 노드 수는 많고 평균 차수는 낮은 ClueWeb 데이터 셋에서는 트위스터에서 구현된 재귀적 알고리즘의 성능이 스파크의 것보다 좋았다.

데이터로그 시스템들의 재귀 질의 처리 성능 평가 (Experimental Evaluation of Recursive Query Processing in Datalog Systems)

  • 이유경;김현지;홍기재;강혁규;한욱신
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.729-732
    • /
    • 2019
  • 데이터로그는 논리형 선언형 프로그래밍 언어로, 특히 재귀적인(recursion) 알고리즘을 표현하기 편리한 언어이다. 대표적인 데이터로그 시스템으로는 CORAL, LogicBlox, XSB, Soufflé가 있다. 본논문에서는 이 네 가지 시스템의 특징을 설명하고, 세 가지 벤치마크, 이행적 폐쇄(Transitive closure), 동세대(same generation), 포인터 분석(pointer analysis)으로 데이터로그 시스템들의 재귀 질의(recursive query) 처리 성능을 비교하였다.

XML 구조 문맥을 사용한 효율적인 경로 표현식 조인 알고리즘 (An Efficient Path Expression Join Algorithm Using XML Structure Context)

  • 김학수;신영재;황진호;이승미;손진현
    • 정보처리학회논문지D
    • /
    • 제14D권6호
    • /
    • pp.605-614
    • /
    • 2007
  • XML 데이터 검객을 위한 표준 질의 언어로서 XQuery와 XPath가 W3C에 의해 표준으로 제정되었다. XQuery와 XPath를 보편적으로 사용함에 따라, 최근 연구는 방대한 XML 데이터베이스에서 XPath 경고 표현식에 대한 효율적인 질의 처리를 위한 데이터 구조 및 알고리즘 개발에 초점을 두고 있다. 최근에, XPath 경로 표현식을 처리할 때 XML 엘리먼트 사이의 구조적 관계(조상-자손, 부모-자식)를 결정하는 구조적 조인의 개념은 중요한 XPath 프로세싱 기법중의 하나가 되었다. 그러나 XPath 질의 처리에서 자주 발생하는 구조적 조인들은 높은 비용을 요구한다. 본 논문에서, 우리는 XPath 질의들을 효율적으로 처리하기 위해 제안한 구조적 인덱스(SI) 기반의 새로운 구조적 조인 알고리즘(SISJ)을 제안한다. 실험 결과에서는 이전의 알고리즘보다 근소하게 더 효율적인 성능을 보여 준다. 그러나 재귀성이 높은 문서에 대해서는 제안기법의 가지치기 특성으로 인해 약 30% 이상의 성능향상을 보였다.

온톨로지에서의 그래프 레이블링을 이용한 효율적인 트랜지티브 클로저 질의 처리 (Efficient Processing of Transitive Closure Queries in Ontology using Graph Labeling)

  • 김종남;정준원;민경섭;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권5호
    • /
    • pp.526-535
    • /
    • 2005
  • 온톨로지는 특정 개념에 대한 부가정보 및 개념간의 관계를 기술하는 방법으로서 고차원의 웹과 서비스를 실현하기 위한 시멘틱 웹, 그리고 지식관리 시스템을 비롯한 다양한 응용분야의 요구와 관심이 증가하면서 그 중요성이 대두되고 있다. 온톨로지에서 정보에 대한 접근은 특정 개념과 특정 관계를 가지는 데이타를 찾는 것이 주를 이루는데, 이러한 관계가 주로 트랜지티브 관계이기 때문에 트랜지티브 질의를 처리하는 것이 많은 비중을 차지한다. 또한 이와 같은 트랜지티브 클로저 질의 처리는 재귀호출의 형태로서 그 처리 비용 또한 매우 크다. 본 논문에서는 이와 같은 트랜지티브 클로저 질의의 효율적 처리를 지원하기 위한 방법으로써 그래프 레이블링을 이용한 전처리 기법을 제안한다 이 기법은 저장 공간을 효율적으로 사용하고 알고리즘도 단순한 특징을 가지기 때문에 트랜지티브 클로저 질의에 대한 응답 시간을 줄이는 장점을 가지게 된다. 그리고 이와 같이 제안한 기법에 대해 기존 시스템들과 비교해 봄으로써 그래프 레이블링을 이용한 기법이 대용량 온톨로지에서의 트랜지티브 클로저 질의 처리에 효율적임을 보이고자 한다.