• Title/Summary/Keyword: 파티션함수

Search Result 7, Processing Time 0.023 seconds

A Development Study of The VPT for the improvement of Hadoop performance (하둡 성능 향상을 위한 VPT 개발 연구)

  • Yang, Ill Deung;Kim, Seong Ryeol
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.19 no.9
    • /
    • pp.2029-2036
    • /
    • 2015
  • Hadoop MR(MapReduce) uses a partition function for passing the outputs of mappers to reducers. The partition function determines target reducers after calculating the hash-value from the key and performing mod-operation by reducer number. The legacy partition function doesn't divide the job effectively because it is so sensitive to key distribution. If the job isn't divided effectively then it can effect the total processing time of the job because some reducers need more time to process. This paper proposes the VPT(Virtual Partition Table) and has tested appling the VPT with a preponderance of data. The applied VPT improved three seconds on average and we figure it will improve more when data is increased.

Estimation of scheduling algorithm's performance for the synthesis of pipelined data path (파이프라인 데이터패스 합성을 위한 스케쥴링 알고리즘의 성능평가)

  • 오주영;박도순
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10c
    • /
    • pp.30-32
    • /
    • 1999
  • 본 논문에서는 자원제약을 목적함수로 하여 파이프라인 실행이 가능하게 하는 데이터패스 합성을 위해 개발되어진 스케쥴링 알고리즘들의 실행시간과 실행결과를 도표를 기준으로 정렬한다. 평가의 대상이 되는 알고리즘들은 스케쥴을 위해 제안되는 함수의 계산시점, 함수의 역할과 적용방법에 의해 구분되어지는 논문 [1],[2],[3]에 대하여 수행되어지며, 충돌을 발생시키는 파티션 내에 위치하는 모빌리티를 가지는 각각의 연산에 대해 다음 파티션으로의 지연시 충돌수 변이와 각 연산의 모빌리티를 요소로 계산되는 우선 순위 함수를 정의하여 스케쥴 순열을 정렬하는 결정하는 논문[1]과 자원 할당 가능성 판단함수를 제안하고 이를 기준으로 배정가능 범위를 축소해 나가며 연산을 스케쥴하는 논문[2]와, 논문[2]의 자원할당 가능성 판단시 부과되는 시간감소를 위해 현재의 스케쥴 상황 값들을 정량화 하여 연산이 선택되도록하여 결과적 실행 시간을 감소시키는 논문[3]에 대하여 벤치마크 성능평가와 알고리즘 실행시간 결과 비교를 수행하고 향후 연구 진행 방향을 제시한다.

  • PDF

ILP implementation for hardware software partitioning (하드웨어 소프트웨어 분할을 위한 ILP 구현)

  • 오주영;한갑수;박도순
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10c
    • /
    • pp.21-23
    • /
    • 2000
  • 본 논문에서는 통합설계에서 시간제약하의 최소비용 시스템 구현을 위한 분할의 최적해 탐색을 위한 ILP형식을 정의하고 실험에 의해 결과를 평가한다. 분할 문제는 각 노드의 하드웨어 소프트웨어 파티션 선택과 소프트웨어 실행을 위한 대상 노드의 스케쥴링 문제가 함께 고려되어야 한다. 본 논문에서는 분할 단계에서 스케쥴링을 함께 고려하는 ILP형 정의를 위해 ASAP과 ALAP 스케쥴에 의해 유도되는 모빌리티와 시간 제약 조건, 종속성 제약 조건을 형식화하고, 목적함수인 최소 시스템 설계 비용 탐색을 위한 형을 정의한다. 정의된 형에 의한 ILP 구현은 다양한 벤치마크 검증에 의해 최적의 해를 결과로 보인다.

  • PDF

A method of operation selection in scheduling with decreasing mobilities (배정 가능 범위 축소에 의한 스케쥴링을 위한 연산 선택 방법)

  • 서영진;유희진;박도순
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.665-667
    • /
    • 1998
  • 자동화 설계의 합성 과정 중에서 스케쥴링은 설계되는 하드웨어의 면적과 실행 시간을 결정하는 중요한 단계이다. 본 논문에서는 논문[8]의 방법으로 모든 연산의 배정 가능 범위를 축소하였으나 스케쥴링이 종료되지 않을 때 현재의 스케쥴링 상황을 매개변수로 표현하여 임의의 연산 배정 범위를 축소하기 위한 선택 함수를 제안한다. 제안한 방법에서는 배정 가능 범위가 가장 큰 연산의 ASAP 또는 ALAP중의 하나를 항상 선택하는데, 그러한 연산이 2개 이상인 경우에는 임의의 연산의 ASAP 또는 ALAP을 선택하여 축소하는 경우에 모든 연산의 배정 가능 범위의 변화량, 임의의 연산을 ASAP 또는 ALAP에 고정하였을 때 자원 제약과 그 연산의 종속성에 의한 다른 연산들의 이동 변화량, 그리고 각 파티션에 연산들의 배정을 균등하게 하는 정보를 사용하여 연산의 ASAP 또는 ALAP중에 하나를 선택한다. 이 알고리즘의 성능 평가는 5차 엘립틱 웨이브 필터를 벤치마크로 사용하였으며, 실험 결과는 모든 엘립틱 웨이브 필터에 대해 최적이었다.

  • PDF

Selection Method of Multiple Threshold Based on Probability Distribution function Using Fuzzy Clustering (퍼지 클러스터링을 이용한 확률분포함수 기반의 다중문턱값 선정법)

  • Kim, Gyung-Bum;Chung, Sung-Chong
    • Journal of the Korean Society for Precision Engineering
    • /
    • v.16 no.5 s.98
    • /
    • pp.48-57
    • /
    • 1999
  • Applications of thresholding technique are based on the assumption that object and background pixels in a digital image can be distinguished by their gray level values. For the segmentation of more complex images, it is necessary to resort to multiple threshold selection techniques. This paper describes a new method for multiple threshold selection of gray level images which are not clearly distinguishable from the background. The proposed method consists of three main stages. In the first stage, a probability distribution function for a gray level histogram of an image is derived. Cluster points are defined according to the probability distribution function. In the second stage, fuzzy partition matrix of the probability distribution function is generated through the fuzzy clustering process. Finally, elements of the fuzzy partition matrix are classified as clusters according to gray level values by using max-membership method. Boundary values of classified clusters are selected as multiple threshold. In order to verify the performance of the developed algorithm, automatic inspection process of ball grid array is presented.

  • PDF

A Study on Simplification of Machine Learning Model (기계학습 모델의 간략화 방법에 대한 연구)

  • Lee, Gye-Sung;Kim, In-Kook
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.16 no.4
    • /
    • pp.147-152
    • /
    • 2016
  • One of major issues in machine learning that extracts and acquires knowledge implicit in data is to find an appropriate way of representing it. Knowledge can be represented by a number of structures such as networks, trees, lists, and rules. The differences among these exist not only in their structures but also in effectiveness of the models for their problem solving capability. In this paper, we propose partition utility as a criterion function for clustering that can lead to simplification of the model and thus avoid overfitting problem. In addition, a heuristic is proposed as a way to construct balanced hierarchical models.

Improved Method for Learning Context-Free Grammar using Tabular representation

  • Jung, Soon-Ho
    • Journal of the Korea Society of Computer and Information
    • /
    • v.27 no.2
    • /
    • pp.43-51
    • /
    • 2022
  • In this paper, we suggest the method to improve the existing method leaning context-free grammar(CFG) using tabular representation(TBL) as a chromosome of genetic algorithm in grammatical inference and show the more efficient experimental result. We have two improvements. The first is to improve the formula to reflect the learning evaluation of positive and negative examples at the same time for the fitness function. The second is to classify partitions corresponding to TBLs generated from positive learning examples according to the size of the learning string, proceed with the evolution process by class, and adjust the composition ratio according to the success rate to apply the learning method linked to survival in the next generation. These improvements provide better efficiency than the existing method by solving the complexity and difficulty in the crossover and generalization steps between several individuals according to the size of the learning examples. We experiment with the languages proposed in the existing method, and the results show a rather fast generation rate that takes fewer generations to complete learning with the same success rate than the existing method. In the future, this method can be tried for extended CYK, and furthermore, it suggests the possibility of being applied to more complex parsing tables.