• Title/Summary/Keyword: 데이터 분석성능

Search Result 5,842, Processing Time 0.037 seconds

Performance analysis of UNIX buffer cache on user data and metadata (사용자 데이터와 메타데이터에 대한 유닉스 버퍼 캐쉬의 성능 분석)

  • 최진모;김준형;성영락;오하령
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10a
    • /
    • pp.74-76
    • /
    • 1998
  • 본 논문에서는 유닉스 파일 시스템에서의 버퍼캐쉬 크기에 따라 사용자 데이터와 메타데이터의 버퍼 캐쉬 히트율을 분석하였다. 그리고 메타 데이터가 유닉스 운영체제 파일 시스템의 성능에 미치는 영향을 분석하고 이를 기반으로 버퍼 캐쉬의 동적 특성과 성능의 장애 요인들을 분석하였다. 유닉스 운영체제에서 사용되는 사용자 데이터와 메타데이터에 대한 버퍼 캐쉬의 동적인 동작을 분석하기 위하여 trace-driven방법을 이용하였으며 이를 위하여 시뮬레이터를 작성.사용하였다. 파일 시스템은 특정 유닉스 버전에 영향을 받지 않기 위해 USF[1]에 기초하였고, 작업부하(workload)로는 Sprite- trace 데이터 중 allspice 서버에서 추출한 데이터를 사용하였다.

  • PDF

A Design of Generalized View for the Visualization Layer of Performance Monitoring Tool (성능 감시기의 가시화충을 위한 일반화된 뷰의 설계)

  • 마대성;유진호;김병기
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10a
    • /
    • pp.756-758
    • /
    • 1998
  • 본 논문은 병렬 프로그램의 성능 분석을 위한 성능 감시기에 가시화층에 일반화된 뷰를 설계하고 구현하였다. 대부분의 성능 감시기는 하드웨어에 의존적인 특성화에 뷰를 제공함으로서 이식성이나 확장성이 부족하다. 일반화된 뷰를 제공하는 성능 감시기는 데이터 필터층에서 필터링된 성능 분석 데이터를 이용하여 프로그래머가 정의한 데이터의 범위에 따라 뷰를 스스로 확장할 수 있다. 또한 CallBack기능을 제공하여 관심 있는 데이터를 쉽게 볼 수 있다. 프로그래머는 성능 감시기의 일반화된 뷰를 이용하여 다양한 형태의 성능 분석 결과를 볼 수 있다.

  • PDF

Performance Improvement of Regression Neural Networks by Using PCA (PCA 기법에 의한 회귀분석 신경망의 성능개선)

  • 조용현;박용수
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2001.06a
    • /
    • pp.116-119
    • /
    • 2001
  • 본 논문에서는 주요성분분석 기법을 도입하여 회귀분석을 위한 신경망의 성능 개선방안을 제안하였다. 이는 대용량의 입력 데이터를 통계적으로 독립인 특징들의 집합으로 변환시키는 주요성분분석 기법의 속성을 살려 학습데이터의 타원을 감소시킴으로서 고차원의 학습데이터에 따른 신경망의 학습성능 의존성을 줄이기 위함이다. 제안된 기법의 신경망을 10개의 독립변수 패턴을 가진 자동차 연비문제에 적용하여 시뮬레이션한 결과, 기존의 학습데이터를 그대로 이용하는 신경 망보다 우수한 학습성능과 회귀성능이 있음을 확인할 수 있었다.

  • PDF

Performance Analysis of Data Consistency Model Using Bluetooth (블루투스를 이용한 데이터 일치성 모델의 성능 분석)

  • 한국희;김찬우;김재훈;고영배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04d
    • /
    • pp.292-294
    • /
    • 2003
  • 인터넷의 보급과 활용이 증대되고 있고, 이동 통신에 대한 관심과 함께 분산 환경을 통한 컴퓨팅의 성능 향상이 중요시되고 있다. 분산 환경에서 데이터 사용의 성능을 향상시키기 위하여 데이터 중복 기법을 사용하는데, 서로 다른 복사본 사이의 데이터 일치성 유지가 필요하다. 본 논문에서는 데이터 일치성의 대표적인 모델을 Eager, Lazy, Periodic 세 가지로 구분하고. 각 모델의 특징을 알아보고 비용을 분석하여 사용자가 적절한 모델을 사용할 수 있도록 하였다. 또한 무선 컴퓨팅 환경에서의 데이터 일치성에 대한 테스트 베드를 블루투스를 이용하여 구축한 후 실제 성능을 측정하여 비용분석 모델의 유용성을 검증하였다.

  • PDF

Analysis on the reception performance of using dual stream for terrestrial DTV (이중 스트림 기술이 지상파 DTV 수신 성능 개선에 미치는 영향 분석)

  • 지금란;김대진;김성훈;심용훈;김승원
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2002.11a
    • /
    • pp.37-42
    • /
    • 2002
  • 본 논문은 ATSC T3/S9에 수신 성능 개선을 위해 제안된 방식 중 이중 스트림 기술을 알아보고 Robust 8-VSB와 Pseudo 2-VSB의 등화기에서 강인 데이터가 일반 데이터의 성능에 미치는 영향을 비교 분석하기 위해 전산 모의 실험을 실시하였다. 그 결과 Robust 8-VSB 방식은 이용된 모든 채널 환경에서 강인 데이터가 일반데이터의 성능 개선에 도움을 주지만, Pseudo 2-VSB방식의 경우는 채널 환경이 나쁜 경우에 강인 데이터가 일반 데이터의 성능 개선에 도움을 주는 것을 보여주었다.

  • PDF

Analysis of the Influence Factors of Data Loading Performance Using Apache Sqoop (아파치 스쿱을 사용한 하둡의 데이터 적재 성능 영향 요인 분석)

  • Chen, Liu;Ko, Junghyun;Yeo, Jeongmo
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.4 no.2
    • /
    • pp.77-82
    • /
    • 2015
  • Big Data technology has been attracted much attention in aspect of fast data processing. Research of practicing Big Data technology is also ongoing to process large-scale structured data much faster in Relatioinal Database(RDB). Although there are lots of studies about measuring analyzing performance, studies about structured data loading performance, prior step of analyzing, is very rare. Thus, in this study, structured data in RDB is tested the performance that loads distributed processing platform Hadoop using Apache sqoop. Also in order to analyze the influence factors of data loading, it is tested repeatedly with different options of data loading and compared with data loading performance among RDB based servers. Although data loading performance of Apache Sqoop in test environment was low, but in large-scale Hadoop cluster environment we can expect much better performance because of getting more hardware resources. It is expected to be based on study improving data loading performance and whole steps of performance analyzing structured data in Hadoop Platform.

Analysis of GPGPU Performance by dedicating L2 Cache for Texture Data (텍스쳐 데이터를 위한 2차 캐쉬 구조를 가지는 그래픽 처리 장치의 성능 분석)

  • Kim, Gwang Bok;Kim, Cheol Hong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2017.01a
    • /
    • pp.143-144
    • /
    • 2017
  • 최근 그래픽 처리 장치는 DRAM에 대한 접근을 줄이고자 여러 메모리 계층을 사용하고 있다. GPGPU의 L2 캐쉬는 요청 데이터의 타입에 따라 별도로 접근하는 L1 메모리와 다르게 레이턴시가 긴 DRAM에 접근하기 전에 모든 데이터 타입이 접근 가능한 캐쉬이다. 본 논문에서는 애플리케이션에서 명시하는 다양한 데이터 타입에 대하여 접근 및 적재를 허용하는 L2 캐쉬를 오직 텍스쳐 데이터만을 허용하도록 하여 변화하는 성능을 분석하고자 한다. 본 실험을 위해 텍스쳐 데이터 이외의 데이터 타입은 L2 캐쉬를 바이패스하여 바로 DRAM에 접근하도록 구조를 변경한다. 실험을 통한 분석 결과 텍스쳐 데이터만을 허용하는 경우 대부분의 벤치마크에서 성능 감소가 발생하여 기존 구조대비 평균 5.58% 감소율을 확인하였다. 반대로, 본 논문의 실험 환경에서의 L2 캐쉬의 적중률이 낮은 애플리케이션인 needle은 불필요한 L2 접근을 바이패스 함으로써 전체적인 성능 증가를 이끌어낸 것으로 분석된다.

  • PDF

Analytical Modeling of a Buffered $\times$a switch (Buffered a$\times$a Switch의 성능분석)

  • 박경화;양명국
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10a
    • /
    • pp.630-632
    • /
    • 1998
  • 본 논문에서는, Multi[le-Buffered a$\times$a Crossbar 수위치의 성능 분석 모형을 제안하고 스위치에 장착된 buffer 의 개수의 중가에 다른 성능 향상 추이를 분석하였다. buffered스위치 기법은 다수 데이터 패킷을 동시에 전송할 때 네트웍에서 발생되는 충돌문제를 효과적으로 해결할 수 있는 방법으로 널리 알려져있다. 제안된 성능 예측 모형은 스위치 입력 단에 유입되는 데이터 패킷이 buffered 스위치 내부에서 전송되는 유형을 확률적으로 분석하여 수립되었다. 모형의 수학적 복잡도 해결을 위하여 확률 식 유도 과정 등에 steady state 개념을 도입하였다. 제안한 모형은 스위치 크기 및 스위치에 장착된 buffer의 개수와 무관하게 buffered a$\times$a 크로스바 스위치의 성능 예측을 가능케 하고, 나아가서 이들로 구성된 다층 연결 망의 성능 분석에 확대 적용이 가능하다. 제안한 수학적 성능 분석 연구는 실효성 검증을 위하여 병행된 시뮬레이션 결과는 미세한 오차 범위 내에서 모형의 예측 데이터와 일치하는 결과를 보여 분석 모형의 타당성을 입증하였다. 또한, 분석 결과 스위치에 소수의 버퍼를 장착했을 때, throughput이 크게 증가하지만, 네 개 이상의 버퍼를 장착되는 버퍼의 개수가 네 개 정도일 경우 가격 대 성능비가 우수한 것으로 추론되었다.

  • PDF

An Extension of DBMax, Oracle Performance Monitoring Tool, for Data Warehouses (데이터웨어하우스 성능 모니터링을 위한 DBMax의 확장)

  • 김은주;용환승;이상원
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.262-264
    • /
    • 2002
  • 데이터웨어하우스는 대용량의 데이터를 대상으로 복잡한 분석을 수행하거나 전략적 의사 결정을 위해 사용되기 때문에 신속한 질의 응답을 위한 성능 관리가 무엇보다 중요하다. 데이터웨어하우스는 일반 운영계 시스템과는 다른 목적과 특성을 가지기 때문에 그에 적합한 성능 모니터링 방법이 필요하다. 본 연구에서는 오라클 데이터베이스를 위한 OLTP(On-Line Transaction Processing)용 국산 성능 모니터링 도구인 DBMax를 데이터웨어하우스 환경에 적용할 수 있도록 기능을 확장한다. 우선 기존의 운영계 시스템과는 구분되는 데이터웨어하우스의 특성을 토대로 오라클9i에서 제공하고 있는 성능 항상 기법인 실체화된 뷰(MV: Materialized View)와 EH(Data Extraction, Transformation and Loading) 화장 기능을 모니터링하기 위한 요구사항을 분석하고 이를 지원하기 위한 DBMax 확장 방안을 설계 및 구현한다. 실체화된 뷰와 ETL 확장 기능을 위해 제공되는 오라클9i의 다양한 스키마 객체에 대한 정보 및 성능 관련 지표를 제시하여 SQL 튜닝 기능을 지원하며 사후 분석을 위한 DBMax의 로그 파일에서 의미 있는 SQL문을 추출하여 잠재적으로 유용한 실체화된 뷰를 권고할 수 있도록 기능을 확장한다.

  • PDF

A Study on Performance Evaluation of Container-based Virtualization for Real-Time Data Analysis (실시간 데이터 분석을 위한 컨테이너 기반 가상화 성능에 관한 연구)

  • Choi, BoAh;Han, JaeDeok;Oh, DaSom;Park, HyunKook;Kim, HyeonA;Seo, MinKwan;Lee, JongHyuk
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.05a
    • /
    • pp.32-35
    • /
    • 2020
  • 본 논문은 실시간 데이터 분석을 위한 컨테이너 가상화 기술 사용에 대한 효용성을 알아보기 위해 HDP 와 MapR 배포판에 포함된 Spark 를 도커라이징 전과 후 환경에 설치 후 HiBench 벤치마크 프로그램을 이용해 성능을 측정하였다. 그리고 성능 측정치에 대해 대응표본 t 검정을 이용하여 도커라이징 전과 후의 성능 차이가 있는지를 통계적으로 분석하였다. 분석 결과, HDP 는 도커라이징 전과 후에 대한 성능 차이가 있었지만 MapR 은 성능 차이가 없었다.