• 제목/요약/키워드: map-reduce

검색결과 849건 처리시간 0.025초

Radix-4 방식의 터보 MAP 복호 알고리즘 (Turbo MAP Decoding Algorithm based on Radix-4 Method)

  • 정지원;성진숙;김명섭;오덕길;고성찬
    • 한국통신학회논문지
    • /
    • 제25권4A호
    • /
    • pp.546-552
    • /
    • 2000
  • 터보부호의 복호기는 두 개이상의 연판정 입출력이 가능한 복호기로 구성되며, 이러한 복호기는 일정길이의 비트열에서 최적의 사후확률(a posteriori robability)을 이용한 MAP(maximum-a-posteriori) symbol estimator를 이용한다. 기존의 radix-2 MAP복호기는 아주 큰 인터리버 블록 크기로 인해 고속 통신시스템의 적용에는 문제점이 있다. 따라서 본 논문에서는 인터리버 블록크기를 줄일 수 있는 radix-2 MAP복호기를 기바으로 하는 새로운 radix-4 MAP복호기를 제안하였다. Radix-4 MAP 복호기 구조에 적용하기 위해 순방향, 역방향 state metric과 채널 metric을 제안하였으며, 가우시안 채널에서 기존의 radix-2 기반의 MAP 복호기와 성능을 비교하였다.

  • PDF

수치지도 수시갱신을 위한 알고리즘 적용 연구 (An Algorithm Application Study on the Updating Digital Maps)

  • 박청;이호남;박기석;오세정
    • 한국측량학회:학술대회논문집
    • /
    • 한국측량학회 2009년도 춘계학술발표회 논문집
    • /
    • pp.135-143
    • /
    • 2009
  • The purpose of this research is to reduce editors' workload and automation to update(v) Digital Map(n) regarding changed topography. In Digital Map case, it usually uses the way of various survey to update(v). In this case, it costs a great deal and doesn't be efficient backup management. Accordingly, it can reduce editors' the period of the process and be efficiently managed the backup data due to well organized backup data management. We present update plan that used clipping and join for this result by analyzing Boundary of input data.

  • PDF

Key개수가 MapReduce 성능에 미치는 영향에 관한 연구 (A Study on the effect of the number of Key to MapRedue performance)

  • 정석준;김진홍;신동렬
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2016년도 제53차 동계학술대회논문집 24권1호
    • /
    • pp.207-209
    • /
    • 2016
  • 정보통신기술의 급속한 발전으로 인해 인터넷은 사회 전 분야를 변화시키고 있고 이를 통해 데이터의 양이 증가하면서 의료, 교육, 경영 등 사회 전 분야에서 빅데이터에 관심이 증가하고 있다. 이에 따라 다양한 빅데이터 오픈소스가 생기고 데이터의 크기에 따라 성능을 비교하는 실험이 진행되었다. 본 논문에서는 데이터의 크기가 아니라 데이터를 분류하는 key의 개수에 따라 성능을 비교하고자 한다.

  • PDF

MapReduce에서 Reuse JVM을 이용한 대규모 스몰파일 처리성능 향상 방법에 관한 연구 (A Study on the Improving Performance of Massively Small File Using the Reuse JVM in MapReduce)

  • 최철웅;김정인;김판구
    • 한국멀티미디어학회논문지
    • /
    • 제18권9호
    • /
    • pp.1098-1104
    • /
    • 2015
  • With the widespread use of smartphones and IoT (Internet of Things), data are being generated on a large scale, and there is increased for the analysis of such data. Hence, distributed processing systems have gained much attention. Hadoop, which is a distributed processing system, saves the metadata of stored files in name nodes; in this case, the main problems are as follows: the memory becomes insufficient; load occurs because of massive small files; scheduling and file processing time increases because of the increased number of small files. In this paper, we propose a solution to address the increase in processing time because of massive small files, and thus improve the processing performance, using the Reuse JVM method provided by Hadoop. Through environment setting, the Reuse JVM method modifies the JVM produced conventionally for every task, so that multiple tasks are reused sequentially in one JVM. As a final outcome, the Reuse JVM method showed the best processing performance when used together with CombineFileInputFormat.

감성분석을 위한 병렬적 HDFS와 맵리듀스 함수 (A Parallel HDFS and MapReduce Functions for Emotion Analysis)

  • 백봉현;류윤규
    • 한국정보컨버전스학회논문지
    • /
    • 제7권2호
    • /
    • pp.49-57
    • /
    • 2014
  • 최근 대량의 SNS(Social Network Service) 데이터로부터 유용한 정보를 추출하고 사용자의 진의 정보를 평가하기 위한 오피니언 마이닝(opinion mning)이 소개되고 있다. 오피니언 마이닝은 대량의 SNS 데이터로부터 빠른 기간 내에 데이터를 수집하고 분석하여 목적에 적합한 정보를 추출하는 효율적인 기법이 필요하다. SNS에서 발생되는 다양한 비정형 데이터로부터 감성정보를 추출하기 위해, 본 논문에서는 하둡(Hadoop) 시스템 기반의 병렬적 HDFS(Hadoop Distributed File System)와 맵리듀스(MapReduce) 기반 감성분석 함수를 제안한다. 실험결과로 제안한 시스템과 함수는 데이터 수집과 적재시간에 대해 O(n)보다 빠르게 처리하며, 메모리와 CPU 자원에 대해 안정적인 부하분산이 이루어지는 것을 확인하였다.

  • PDF

공간 소셜 분석을 위한 마이크로블로그 데이터의 맵리듀스 기반 공간 집계 알고리즘 (A MapReduce based Algorithm for Spatial Aggregation of Microblog Data in Spatial Social Analytics)

  • 조현구;양평우;유기현;남광우
    • 정보과학회 논문지
    • /
    • 제42권6호
    • /
    • pp.781-790
    • /
    • 2015
  • 인터넷과 모바일 환경의 발전에 따라 최근에는 마이크로블로그가 성행하고 있다. 마이크로블로그에는 부가적인 데이터가 담겨있다. 그 중 위치 정보에 대한 데이터를 포함하는 마이크로블로그 데이터를 공간 소셜 웹 객체라고 지칭한다. 이러한 마이크로블로그 데이터에 대한 일반 집계는 사용자별 데이터 집계 등이 있으나, 단일 정보에 대한 집계만 가능하다. 본 연구는 공간 소셜 웹 객체의 특성을 갖는 마이크로블로그 데이터의 공간 소셜 분석을 위해, 일반 집계와 공간 데이터를 결합하고 지오해시와 맵리듀스를 이용한 공간 집계에 대한 알고리즘을 제시한다. 이를 통해 의미있는 공간 소셜에 대한 분석의 기반을 마련하였다.

Optimization Driven MapReduce Framework for Indexing and Retrieval of Big Data

  • Abdalla, Hemn Barzan;Ahmed, Awder Mohammed;Al Sibahee, Mustafa A.
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권5호
    • /
    • pp.1886-1908
    • /
    • 2020
  • With the technical advances, the amount of big data is increasing day-by-day such that the traditional software tools face a burden in handling them. Additionally, the presence of the imbalance data in big data is a massive concern to the research industry. In order to assure the effective management of big data and to deal with the imbalanced data, this paper proposes a new indexing algorithm for retrieving big data in the MapReduce framework. In mappers, the data clustering is done based on the Sparse Fuzzy-c-means (Sparse FCM) algorithm. The reducer combines the clusters generated by the mapper and again performs data clustering with the Sparse FCM algorithm. The two-level query matching is performed for determining the requested data. The first level query matching is performed for determining the cluster, and the second level query matching is done for accessing the requested data. The ranking of data is performed using the proposed Monarch chaotic whale optimization algorithm (M-CWOA), which is designed by combining Monarch butterfly optimization (MBO) [22] and chaotic whale optimization algorithm (CWOA) [21]. Here, the Parametric Enabled-Similarity Measure (PESM) is adapted for matching the similarities between two datasets. The proposed M-CWOA outperformed other methods with maximal precision of 0.9237, recall of 0.9371, F1-score of 0.9223, respectively.

학교폭력과 자살사고를 예방하기 위한 감성분석 시스템의 설계 (Design of a Sentiment Analysis System to Prevent School Violence and Student's Suicide)

  • 김영택
    • 컴퓨터교육학회논문지
    • /
    • 제17권6호
    • /
    • pp.115-122
    • /
    • 2014
  • 현 청소년들의 학교내 생활환경에서 문제점으로 대두되는 폭력 및 자살사고 발생률 증가에 대한 예방차원의 빅 데이터 처리 분석 시스템을 목표로 연구하였고 설계의 경제성과 용이성, 적용의 신속성 등을 고려해서 많은 이용률을 가지고 있는 오픈 소스인, 하둡 시스템(Hadoop system)의 맵리듀스(MapReduce) 알고리즘과 분산 병렬 환경을 위한 HDFS(Hadoop Distibuted File System) 구성을 사용하여 실험하였다. 연구에서 사용된 분석기법은 기존의 통계적인 분석기법들이 가지는 난이도를 피하기 위해 상업적인 사회 망의 비정형 대화 자료를 이용해서 폭력성 어휘에 대한 단어 수(word count) 분석을 적용하여 폭행, 자살사고를 사전에 감지하여 예방하는 감성분석(sentiment analysis) 시스템을 텍스트 마이닝 관점에서 제안하여 실험하였다.

  • PDF

가상화 클러스터 환경에서 빅 데이터 분산 처리 성능에 하이퍼바이저가 미치는 영향 (Effects of Hypervisor on Distributed Big Data Processing in Virtualizated Cluster Environment)

  • 정혜진;나연묵
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권2호
    • /
    • pp.89-94
    • /
    • 2016
  • 최근 클라우드 컴퓨팅 시장의 클러스터 환경이 일반 클러스터 환경에서 가상화 클러스터 환경으로 변화하고 있다. 이러한 클러스터 환경의 변화는 대용량 분산처리 성능에 영향을 끼치고 있으며, 국내외의 많은 IT관련 기업에서 경쟁적으로 연구와 서비스에 집중 투자하고 있다. 본 논문에서는 대용량 데이터 분산 처리 성능에 하이퍼바이저가 미치는 영향을 비교하기 위한 목적으로 하이퍼바이저를 사용하는 Xen과 컨테이너 기반의 Docker를 사용하여 가상 클러스터 환경을 만들고, MapReduce의 성능을 측정하는 실험을 하였다. 이 결과 하이퍼바이저를 사용하지 않은 Docker 성능이 약 1.44배 - 2.92배 더 좋은 것을 검증하였다.

맵리듀스와 대응분석을 활용한 비정형 빅 데이터의 정형화와 시각적 해석 (Standardizing Unstructured Big Data and Visual Interpretation using MapReduce and Correspondence Analysis)

  • 최요셉;최용석
    • 응용통계연구
    • /
    • 제27권2호
    • /
    • pp.169-183
    • /
    • 2014
  • 오늘날, 다양한 분야에서 다양한 형태의 빅 데이터들이 축적되고 있다. 이에, 빅 데이터를 분석하고 그 속에서 가치 있는 정보를 찾아내는 것은 매우 중요해지고 있다. 또한, 비정형 빅 데이터를 정형화하여 통계적 기법을 적용할 수 있게 하는 것은 매우 중요해지고 있다. 본 연구에서는 분산처리 시스템인 맵리듀스를 활용하여 비정형 빅 데이터를 정형화하고, 통계적 분석 기법인 단순 대응분석과 다중 대응분석을 적용하여, 한국 경제 신문의 지면에 실린 기사를 이용해 삼성전자와 애플을 언급하고 있는 단어들의 관계와 특성을 각각 파악하였다.