• 제목/요약/키워드: 외부합병정렬

검색결과 2건 처리시간 0.019초

대용량 주기억장치를 이용한 외부 합병정렬 방법에 관한 연구 (On The External Merge Sorting With Large Main Memory)

  • 최황규
    • 산업기술연구
    • /
    • 제10권
    • /
    • pp.73-76
    • /
    • 1990
  • 본 논문은 대용량 주기억장치를 갖는 컴퓨터 상에서 효율적으로 수행 될 수 있는 외부 합병정렬 방법에 대하여 기술한다. 제시된 정렬 방법은 주기억 장치의 용량이 정렬될 화일 크기의 제곱근보다 크다는 조건하에서, 주기억 장치를 최대로 이용하여 외부 합병정렬에 소요되는 외부 합병의 횟수를 최소화 함으로써 외부 합병정렬의 성능에 가장 큰 영향을 미치는 입출력 시간을 크게 줄일수 있음을 보였다.

  • PDF

매개변수 환경설정에 따른 타조의 외부합병정렬 성능 연구 (External Merge Sorting in Tajo with Variable Server Configuration)

  • 이종백;강운학;이상원
    • 정보과학회 논문지
    • /
    • 제43권7호
    • /
    • pp.820-826
    • /
    • 2016
  • 거대한 데이터로부터 가치 있는 정보를 추출해 내는 빅데이터 기술의 필요성은 나날이 커지고 있다. 빅데이터 분석을 위해 사용되는 하둡 시스템은 맵리듀스를 통해 데이터를 처리하였으나, 맵리듀스 프레임워크는 코드 재사용성의 한계, 질의 최적화 기술의 부재 등의 단점을 보인다. 이를 극복하기 위해 SQL-on-Hadoop이라 불리는 하둡 기반의 SQL 질의 처리 기술이 주목받고 있다. SQL-on-Hadoop 기술 중 타조(Tajo)는 국내 개발진이 주축이 되어 개발되었다. 타조는 데이터 분석을 위해 외부합병정렬 알고리즘을 사용하며, 정렬 연산에 영향을 주는 매개변수로 정렬 버퍼 사이즈와 팬-아웃을 가진다. 본 논문은 타조의 정렬 연산에 영향을 미치는 매개변수인 정렬 버퍼 사이즈와 팬-아웃 값에 따른 정렬의 성능 차이를 보인다. 또한 측정한 성능에 대하여 정렬 버퍼 사이즈가 증가함에 따른 CPU 캐시 미스의 비율 증가, 팬-아웃에 따른 합병 단계 수의 변화가 성능 차이의 원인임을 보인다.