• Title/Summary/Keyword: Sort

검색결과 1,457건 처리시간 0.028초

맵리듀스를 이용한 정렬 기반의 데이터 큐브 분산 병렬 계산 알고리즘 (Sort-Based Distributed Parallel Data Cube Computation Algorithm using MapReduce)

  • 이수안;김진호
    • 전자공학회논문지
    • /
    • 제49권9호
    • /
    • pp.196-204
    • /
    • 2012
  • 최근 많은 응용 분야에서 대규모 데이터에 대해 온라인 다차원 분석(OLAP)을 사용하고 있다. 다차원 데이터 큐브는 OLAP 분석에서 핵심 도구로 여긴다. 본 논문에서는 맵리듀스 분산 병렬 처리를 이용하여 효율적으로 데이터 큐브를 계산하는 방법을 연구하고자 한다. 이를 위해, 맵리듀스 프레임워크에서 데이터 큐브 계산 방법으로 잘 알려진 PipeSort 알고리즘을 구현하는 효율적인 방법에 대해서 살펴본다. PipeSort는 데이터 큐브의 한 큐보이드에서 동일한 정렬 순서를 갖는 여러 큐보이드를 한 파이프라인으로 한꺼번에 계산하는 효율적인 방식이다. 이 논문에서는 맵리듀스 프레임워크에서 PipeSort의 파이프라인을 구현한 네 가지 방법을 20대의 서버에서 수행하였다. 실험 결과를 보면, 고차원 데이터에 대해서는 PipeMap-NoReduce 알고리즘이 우수한 성능을 보였으며, 저차원 데이터에 대해서는 Post-Pipe 알고리즘이 더 우수함을 보였다.

빠른 계수 정렬법의 제안 (Proposal of Fast Counting Sort)

  • 이상운
    • 한국인터넷방송통신학회논문지
    • /
    • 제15권5호
    • /
    • pp.61-68
    • /
    • 2015
  • 데이터를 비교 정렬하는 방법들 중 O(nlogn)보다 빠른 방법은 알려져 있지 않고 있으며, 가장 빠른 퀵 정렬법은 최적과 평균의 경우 O(nlogn), 최악의 경우 $O(n^2)$ 수행 복잡도를 갖고 있다. 본 논문은 비교 정렬법이 아닌 O(n+k),(k=최대치)의 계수 정렬법을 보다 빠르게 수행하는 O(n+k)의 단순 계수정렬법과 데이터의 자리 수 l의 숫자별 빈도수를 계수하여 해당 가상 버킷에 저장하는 O(ln)의 기수 계수 정렬법을 제안하였다. 6개의 실험 데이터에 제안된 알고리즘을 적용한 결과, 퀵 정렬의 O(nlogn) 또는 $O(n^2)$을 O(n+k) 또는 O(ln)으로 단순화 시킬 수 있었다. 결론적으로 제안된 방법은 계수정렬법과 퀵 정렬법에 비해 보다 빠른 방법이다.

저속 네트웍 PC 클러스터상에서 NOW-Sort의 성능향상 (Enhanced NOW-Sort on a PC Cluster with a Low-Speed Network)

  • 김지형;김동승
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제29권10호
    • /
    • pp.550-560
    • /
    • 2002
  • 병렬 외부정렬을 클러스터형 분산 컴퓨터에서 실행하는 경우에는 순수하게 주메모리에서 부분적인 정렬과 머지를 위해 실행되는 과정(순수 계산)뿐만 아니라 디스크로부터의 입출력 과정 및 각 노드들간의 데이타 교환에 따르는 통신과정을 적절히 배치, 설계함이 필요하다. 그 주된 이유는 전체 수행시간이 순수 계산시판보다는 디스크 입출력에 소요되는 시간 및 통신의 소요시간의 비중이 크기 때문이다. 본 연구에서는 저속 네트웍 PC 클러스터를 계산도구로 하여 단위시간당 정렬 자료규모를 최대화함을 목표로 하여, 알고리즘적인 최적화를 통해서, 즉, 정렬 도중 통신과정에서 발생하는 지체시간을 최소화하여 전체적인 통신 성능을 높이고, 디스크 입출력 작업은 전송 규모와 횟수를 조절하여 계산과 통신작업등과의 중첩정도를 극대화시켜 외부정렬의 성능을 개선하였다. 실험 결과 새 알고리즘이 기존의 NOW-sort 알고리즘[1]에 비해서 동일한 PC 클러스터 경에서 최대 45% 정도까지 실행시간을 단축시킬 수 있고, 확장성 면에 있어서도 더 우수한 것을 확인하였다.

확장형 VLSI 리바운드 정렬기의 설계 (Design of an Expandable VLSI Rebound Sorter)

  • 윤지헌;안병철
    • 한국정보처리학회논문지
    • /
    • 제2권3호
    • /
    • pp.433-442
    • /
    • 1995
  • 시간 복잡도가 O(Ν)인 고집적 회로(VLSI)의 병렬 정렬기 설계에 관한 논문이다. 발표된 빠른 VLSI 정렬 알고리즘은 Ν개의 데이타를 정렬하기 위해 O(log Ν)시간 복 잡도를 가지고 있다. 그러나 이러한 알고리즘은 입출력 시간을 고려하지 않고, 복잡 한 네트워크 구조를 가지므로 확장이나 실용화하기 힘들다. 입출력 시간이 포함된 병 렬 정렬 알고리즘들의 칩면적과 시간 복잡도를 분석한 후 가장 효과적인 rebound sort 이론을 확장하여 VLSI로 구현한다. 이 리바운드 정렬기는 파이프라인으로 구성하여 O(Ν)의 시간 복잡도를 가지며 한 개의 칩에 8개의 16비트 레코드를 정렬할 수 있다. 그리고 이 정렬 칩은 확장성을 가지고 있어 수직으로 연결할 경우 8개 이상의 레코드 를 정렬할 수 있다.

  • PDF

Development of YOLOv5s and DeepSORT Mixed Neural Network to Improve Fire Detection Performance

  • Jong-Hyun Lee;Sang-Hyun Lee
    • International Journal of Advanced Culture Technology
    • /
    • 제11권1호
    • /
    • pp.320-324
    • /
    • 2023
  • As urbanization accelerates and facilities that use energy increase, human life and property damage due to fire is increasing. Therefore, a fire monitoring system capable of quickly detecting a fire is required to reduce economic loss and human damage caused by a fire. In this study, we aim to develop an improved artificial intelligence model that can increase the accuracy of low fire alarms by mixing DeepSORT, which has strengths in object tracking, with the YOLOv5s model. In order to develop a fire detection model that is faster and more accurate than the existing artificial intelligence model, DeepSORT, a technology that complements and extends SORT as one of the most widely used frameworks for object tracking and YOLOv5s model, was selected and a mixed model was used and compared with the YOLOv5s model. As the final research result of this paper, the accuracy of YOLOv5s model was 96.3% and the number of frames per second was 30, and the YOLOv5s_DeepSORT mixed model was 0.9% higher in accuracy than YOLOv5s with an accuracy of 97.2% and number of frames per second: 30.

가상의 기수계수버킷 정렬 (Virtual Radix Counting Bucket sort)

  • 이상운
    • 한국인터넷방송통신학회논문지
    • /
    • 제15권6호
    • /
    • pp.95-102
    • /
    • 2015
  • 데이터를 정렬하는 방법들 중 O(nlogn)보다 빠른 방법은 알려져 있지 않고 있으며, 가장 빠른 방법으로 퀵정렬이 있으며, 이 정렬법은 n개의 데이터에 대해 최적과 평균의 경우 O(nlogn), 최악의 경우$O(n^2)$ 수행 복잡도를 갖고 있다. 본 논문에서는 리스트를 기수 숫자별로 빈도수를 계수하여 해당 가상 버킷에 저장하는 가상분할방법을 적용하였다. 또한 추가적인 메모리를 최소화시키기 위해 리스트 상에서 해당 버킷에 데이터들을 이동시키는 방법을 적용하였다. 제안된 알고리즘은 주어진 숫자의 자리수 k만큼 분할되며, 각 자리수에 대해 수행복잡도가 O(n)으로 O(kn) 알고리즘이다.

연령, 범주전형성 및 회상조건에 따른 아동의 상위기억과 범주적 조직화 책략 사용 (Metamemory and Categorical Organization Strategy for Age, Category Typicality, and Recall Tasks)

  • 이혜련;이경님
    • 아동학회지
    • /
    • 제16권2호
    • /
    • pp.125-138
    • /
    • 1995
  • The purpose of the present research was to study developmental trends in categorical organization strategy. The subjects were 160 children - 40 nine - year - old boys, 40 nine - year - old girls, 40 seven - year - old boys, 40 seven - year - old girls. All subjects received one of three lists of items differing in category representativeness in either a free -recall or a sort -recall task. The selection of list materials permitted separation of the effects of age differences in category knowledge from those of knowledge per se on children's recall behavior. The tasks were administered to children individually with the memory task followed by the metamemory task. The data was analyzed with three - way ANOVA arid Pearson's correlation coefficient. The results were that (1) Children's recall, clustering, and metamemory increased with age, while age effects for clustering were restricted to the sort - recall/high typicality condition. At each age level, children showed higher level of recall, clustering and metamemory for category typical rather than atypical list, and sort - recall than free-recall. Level of clustering and metamemory were superior in the sort - recall task and for items of high category typicality. (2) 9 - year - old children were capable of deliberately and efficiently using category organization as a memory strategy at least when appropriate contextual support was present (as determined by task requirements and list materials: sort - recall/high typicality).

  • PDF

데이터베이스에서의 시간 시스템에 관한 연구 (A study of Time Management System in Data Base)

  • 최진탁
    • 산업경영시스템학회지
    • /
    • 제21권48호
    • /
    • pp.185-192
    • /
    • 1998
  • A new algorithm is proposed in this paper which efficiently performs join in the temporal database. The main idea is to sort the smaller relation and to partition the larger relation, and the proposed algorithm reduces the cost of sorting the larger relation. To show the usefulness of the algorithm, the cost is analyzed with respect to the number of accesses to secondary storage and compared with that of Sort-Merge algorithm. Through the comparisons, we present and verify the conditions under which the proposed algorithm always outperforms the Sort-Merge algorithm. The comparisons show that the proposed algorithm achieves 10∼30% gain under those conditions.

  • PDF

새로운 정렬 알고리즘 : 정보 블록 정렬 알고리즘 (A New Sort Algorithm : Information Block Sort Algorithm(IBSA))

  • 송태옥;김태영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.560-562
    • /
    • 2000
  • 본 논문에서는 정보블록알고리즘(IBPA;Information Block Preprocessing Algorithm)을 이용한 정보블록 정렬알고리즘 (IBSA; Information Block Sort Algotithm)을 제안하고 그 성능을 평가하였다. IBSA의 시간복잡도는 O(N)이며, 데이터의 분포상태에 영향을 받지 않는다. IBPA의 성능을 측정해본 결과, 2백만개의 랜덤데이터를 정렬한 경우, 중복값 허용의 경우 (a)는 퀵 정렬의 32.42%, 기수정렬의 9%정도의 비교회수만으로도 정렬할 수 있음을 보여주었으며, 중복값이 없는 경우 (b)는 퀵 정렬의 53.12%, 기수정렬의 12.79%정도의 비교회수만으로도 정렬할 수 있음을 보여주었다.

  • PDF

위상 정렬과 여유 시간 기반 주기 및 실시간 비주기 태스크 스케줄링 알고리즘 (Periodic and Real-Time Aperiodic Task Scheduling Algorithm based on Topological Sort and Residual Time)

  • 김시완;박홍성
    • 제어로봇시스템학회논문지
    • /
    • 제18권4호
    • /
    • pp.302-307
    • /
    • 2012
  • Real-time systems perform periodic tasks and real-time aperiodic tasks such as alarm processing. Especially the periodic tasks included in control systems such as robots have precedence relationships among them. This paper proposes a new scheduling algorithm based on topological sort and residual time. The precedence relationships among periodic tasks are translated to the priorities of the tasks using topological sort algorithm. During the execution of the system the proposed scheduling algorithm decides on whether or not a newly arrived real-time aperiodic task is accepted based on residual time whenever the aperiodic task such as alarm is arrived. The proposed algorithm is validated using examples.