• 제목/요약/키워드: 데이터 분석성능

검색결과 5,910건 처리시간 0.03초

데이터웨어하우스에서 효율적인 분석데이터 추출시 PL/SQL을 이용한 질의 최적화 (Query optimizing Efficient Extracting Warehouse use PL/SQL for Analysis Data in data)

  • 정승경
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.313-316
    • /
    • 2006
  • 기존에 기업의 의사결정을 위해 사용되는 데이터 웨어하우스나 데이터 마트에서 성능향상을 위한 많은 연구들이 있었다. 하지만 복잡한 업무요건이 추가되고 기업의 요구가 다양해짐에 따라 RDBMS의 성능은 점점 낮아지고 이를 해결하기 위한 필요성이 요구되었다. 따라서 본 논문에서는 이를 해결하기 위해 버퍼기능을 하는 PL/SQL Package를 구현하여 효율적인 질의 최적화 방법을 제안하고자 한다. 그리고 본 논문에서 제안한 방법이 기존의 방법보다 성능이 좋다는 것을 실험을 통해 증명해 보였다.

  • PDF

이동 컴퓨팅 환경에서 무선링크상태와 데이터 특성을 고려한 TCP 성능향상 (Improving the performance of TCP over Mobile Computing Environments based on Wireless Link States and Data Characteristics)

  • 유병인;홍영식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (3)
    • /
    • pp.276-278
    • /
    • 1998
  • 본 연구에서는 이동 컴퓨팅 환경에서 TCP프로토콜의 전송성능 저하요인을 분석하고 이에 따른 적응적인 정책을 수입해 효율적인 프로토콜을 제시한다. 이동 컴퓨팅환경에서 TCP 패킷을 크기에 따라 벌크데이터와 인터액티브데이터로 나누고, 무선링크의 상태에 따라 안전 상태와 위험 상태로 나누어 각각의 특성을 고려한 TCP의 전송성능 향상방법을 제시하였다. 본 연구에서 제안된 정책은 모의 실험 환경을 통해 성능향상을 검증했으며, 실제 이동 컴퓨터환경에서 무선 네트워크와 유선 네트워크사이의 중간 호스트인 기지국에 적용시킬수 있다.

  • PDF

얼굴 표정 인식을 위한 유전자 알고리즘 기반 심층학습 모델 최적화 (Optimization of Deep Learning Model Based on Genetic Algorithm for Facial Expression Recognition)

  • 박장식
    • 한국전자통신학회논문지
    • /
    • 제15권1호
    • /
    • pp.85-92
    • /
    • 2020
  • 심층학습은 많은 양의 데이터셋을 학습에 활용하여 객체 분류, 검출, 분할 등의 영상 분석에 탁월한 성능을 나타내고 있다. 본 논문에서는 데이터셋의 종류가 다양한 얼굴 표정인식 데이터셋들을 활용하여 학습 데이터셋의 특성이 심층학습 성능에 영향을 줄 수 있음을 확인하고, 각 학습 데이터셋에 적합한 심층학습 모델의 구성 요소를 설정하는 방법을 제안한다. 제안하는 방법은 심층학습 모델의 성능에 영향을 주는 구성 요소인 활성함수, 그리고 최적화 알고리즘을 유전 알고리즘을 이용하여 선정한다. CK+, MMI, KDEF 데이터셋에 대해서 널리 활용되고 있는 심층학습 모델의 각 구성 요소별 다양한 알고리즘을 적용하여 성능을 비교 분석하고, 유전 알고리즘을 적용하여 최적의 구성 요소를 선정할 수 있음을 시뮬레이션을 통하여 확인한다.

레이블 노이즈가 존재하는 자료의 판별분석 방법 비교연구 (A Comparative Study of Classification Methods Using Data with Label Noise)

  • 권소영;김경희
    • Journal of the Korean Data Analysis Society
    • /
    • 제20권6호
    • /
    • pp.2853-2864
    • /
    • 2018
  • 판별분석(discriminant analysis)은 새로운 개체가 입력되었을 때, 그 개체가 어느 그룹에 속하는지 예측하는데 사용되는 분석방법이다. 판별분석에서는 레이블(label)을 통해 새로운 개체를 예측하기 때문에 판별분석에서 레이블은 중요하다. 레이블 노이즈(label noise)는 관측된 레이블에 오류가 포함된 것을 의미하며, 실데이터에 발생하기 쉽고 판별성능에 영향을 미칠 수 있는 중요한 요인이다. 이를 개선하기 위해 레이블 노이즈와 레이블 노이즈에 강건한 모형들이 연구되고 있지만, 레이블 노이즈가 존재할 때 판별성능에 영향을 줄 수 있는 요인을 고려하고 이 요인들이 판별성능에 미치는 영향을 비교한 연구는 찾기 힘들다. 따라서 이 논문에서는 분류문제에서 많이 사용되는 LDA, QDA, KNN, SVM 방법을 이용하여 레이블 노이즈가 판별성능에 미치는 영향을 알아보고자 한다. 특히 판별분석의 성능과 연관이 있을 것으로 예상되는 레이블 노이즈의 발생 비율, 발생형태, 데이터의 개수에 따른 판별성능을 모의실험을 통해 살펴보았다. 그 결과, 데이터의 형태와 분석기법에 따라 레이블 노이즈가 판별성능에 영향을 미치는 정도가 다름을 확인하였다.

지열 히트펌프 시스템의 데이터 마이닝 기반 성능 예측 기술 (Data Mining-Based Performance Prediction Technology of Geothermal Heat Pump System)

  • 황민혜;박명규;전인기;손병후
    • 대한기계학회논문집 C: 기술과 교육
    • /
    • 제4권1호
    • /
    • pp.27-34
    • /
    • 2016
  • 지열 시스템을 대상으로 데이터 마이닝 기반 성능 예측 모델을 구축하였다. 지열 시스템의 실시간 성능 분석과 예측에 필요한 데이터의 기본 조건을 검토한 후, 데이터베이스의 구조를 설계하였다. 먼저 시스템 성능계수(COP)와 전력 소비량을 분석 대상으로 설정한 후, 이들 물리량의 추출 주기(1분 5분 10분 30분 60분 간격)가 예측 결과에 미치는 영향을 분석하였다. 이어서 범주형과 수치형 의사결정나무 모델을 적용하여 시스템의 성능을 예측하였다. 범주형 의사결정나무 모델을 적용했을 때, 10분 주기의 예측 결과의 정확도는 97.7%로 가장 높았다. 또한 수치형 의사결정나무 분석 결과를 통해 COP가 변하는 순간의 임계값을 찾을 수 있었다. 본 논문에서 제안한 방법은 지열 시스템의 실시간 성능 분석과 운전 상태 등에 적용할 수 있을 것으로 판단된다.

CDMA망에서 실시간 무선망 운용 및 최적화시스템 구축 방안 (Deployment Method for Real-time Radio Access Network Optimizer in CDMA Network)

  • 박상진;이용희;이지영
    • 한국정보통신설비학회:학술대회논문집
    • /
    • 한국정보통신설비학회 2003년도 하계학술대회
    • /
    • pp.253-257
    • /
    • 2003
  • CDMA 방식의 디지털 이동통신 망은 기존의 2G 방식에서 IX, IxEV-DO을 거쳐 WCDMA로 비약적으로 발전하고 있으며, 이에 따라 무선망 운용 및 최적화 방법도 진화해가고 있다. 운용자들이 Field Tool을 사용하여 직접 Field 데이터를 측정, 분석하고 조치하는 방식이 가장 기본적인 방법이라면, Field 데이터와 Network 데이터를 함께 수집하여 분석하는, 보다. 발전된 방법도 사용되고 있다. 그러나, 이러한 방법도 여러 Tool에서 데이터를 off-line으로 수집한 후 분석 작업을 수동으로 반복 수행해야하는 번거로움이 있어, 실시간 on-line 무선망 최적화 시스템을 통한 체계적이고 과학적인 운용 방법을 생각해 볼 수 있다. 우선, 타 운용 Tool 들과의 on-line 연동으로 중앙 집중적 데이터베이스를 구축하여, 무선망에 관련된 모든 데이터에 대한 통합적인 관리가 필요하다. 이 데이터베이스를 이용하여, 실시간으로 무선망 성능 및 효율 저하 원인 분석을 실시하며, 분석된 결과는 기지국의 상태 및 문제점 도출에서부터 최종 처방까지 제시해준다. 본 논문에서는 이러한 솔루션을 구축하기 위한 다양한 네트웍 데이터 연동(성능, 장애, 구성, RF, 실측 데이터 등), 주요 KPI (Key Performance Indicator) 모니터링, 통계적 분석, 무선망 분석 등에 대해 고찰해본다.

  • PDF

데이터센터 장애 예방을 위한 인프라 이상징후 분석: RRCF와 Prophet Ensemble 분석 기반 (Infrastructure Anomaly Analysis for Data-center Failure Prevention: Based on RRCF and Prophet Ensemble Analysis)

  • 신현종;김성근;천병환;진경복;양승정
    • 한국빅데이터학회지
    • /
    • 제7권1호
    • /
    • pp.113-124
    • /
    • 2022
  • 데이터센터의 장애 예방을 위해 머신러닝과 빅데이터를 활용한 다양한 방법들이 적용되어 왔다. 그러나 개별 장비 기반의 성능지표를 참조하거나, 인프라 운영환경을 고려하지 않은 접근방법으로 실제 활용되는 데에는 많은 한계가 있었다. 이에 본 연구에서는 개별 인프라 장비들의 성능지표를 통합 모니터링하며, 다양한 장비들의 성능지표를 구간화, 등급화 하여 단일수치화를 진행한다. 인프라 운영에 대한 경험치 기반으로 데이터 전처리를 수행하며, RRCF(Robust Random Cut Forest)분석과 Prophet 분석 모델을 앙상블하여 이상징후 검출에 신뢰도 있는 분석결과를 도출하였다. 데이터센터 내 운영담당자들의 접근을 용이하게 하기 위해 장애분석시스템을 구현하여 데이터센터 장애의 선제 대응과 적정한 튜닝시점을 제시할 수 있다.

데이터 웨어하우스 성능 관리를 위한 DBMax의 확장 (An Extension of the DBMax for Data Warehouse Performance Administration)

  • 김은주;용환승;이상원
    • 정보처리학회논문지D
    • /
    • 제10D권3호
    • /
    • pp.407-416
    • /
    • 2003
  • 데이터베이스의 사용이 증가하고 다루어야 하는 데이터의 양이 방대해지면서 데이터베이스 시스템을 효율적으로 사용하기 위한 성능 관리 기술이 중요해지고 있다. 특히 데이터 웨어하우스는 대용량의 데이터를 대상으로 복잡한 분석을 수행하거나 전략적 의사 결정을 위해 사용하기 때문에 신속한 질의 응답을 위한 성능 관리가 무엇보다 중요하다. 데이터 웨어하우스는 일반 운영계 시스템과는 다른 목적과 특성을 가지기 때문에 그에 적합한 성능 모니터링 방법 및 튜닝 기술이 필요하다. 본 연구에서는 OLTP(On-Line Transaction Processing)용 오라클 데이터베이스를 위한 국산 성능 관리 도구인 DBMax를 데이터 웨어하우스 환경에 적합하도록 기능을 확장한다. 우선 데이터 웨어하우스 응용 분야를 지원하기 위한 오라클 9i의 요약 관리(summary management) 기능과 ETL(Data Extraction, Transformation and Loading) 기능을 중심으로 데이터 웨어하우스 시스템의 성능 관리시 고려해야 할 요구 사항을 분석하고 이를 지원하는 DBMax의 확장 아키텍처를 설계 및 구현한다. 구체적으로 요약 관리와 ETL 작업을 지원하기 위한 오라클 9i의 다양한 스키마 객체에 대한 정보와 성능 관련 지표를 제시하여 데이터 웨어하우스 환경에서 수행되는 질의에 대한 SQL 튜닝 기능을 강화한다. 또한 사후 분석을 위한 BBMax의 로그 파일에서 의미 있는 SQL 문을 추출하여 잠재적으로 유용한 실체화된 뷰를 추천하는 요약 권고 기능을 추가한다.

원격운용 시스템의 네트워크 성능분석을 위한 시간동기화 방안에 관한 연구 (A Study on Time Synchronization Method for Analyzing the Network Performance of Remote Control System)

  • 양동원;김남곤;김도종
    • 전기전자학회논문지
    • /
    • 제26권2호
    • /
    • pp.141-149
    • /
    • 2022
  • 인공지능 및 무인 감시, 자율화 기술의 발전으로 인해 무인으로 운용되는 원격 감시/자율 주행 시스템의 개발이 활발히 연구되고 있다. 개발되는 원격운용 및 제어 시스템의 효과적인 성능분석을 위해서는 원격운용 시스템의 데이터를 실시간으로 기록하고 그 데이터를 분석하는 일이 중요하다. 또한, 통제 시스템과 원격 시스템 간의 성능분석을 위해서는 각 시스템의 기록데이터 간 시간동기화가 필수적으로 요구된다. 본 논문에서는 원격운용 시스템의 기록데이터 분석을 위한 GPS 기반 시간동기화 설계 방안을 제시한다. 제안 방법은 기록데이터에 GPS 신호를 활용한 정밀한 시간정보를 기록함으로써 원격 시스템이 기록데이터 시간 오차를 1ms 이내로 만족할 수 있도록 하였으며, OS 내 설정을 통해 이더넷 통신을 특정 CPU가 전담하도록 하는 CPU shielding 및 affinity 설정 기법을 통해 시간동기화 성능을 개선하였다. 제안 방법은 단계별 실험 및 네트워크 데이터 저장 실험을 통해서 그 성능을 입증하였으며, 무인수색차량의 무인차량과 통제차량 기록장치에 적용할 수 있음을 확인하였다. 제안 방법은 향후 무인수색차량의 네트워크 데이터 분석 방법으로 활용할 예정이며, 활용 중에 발생하는 다양한 분석을 통해 성능 개선을 해 나갈 예정이다.

데이터 스트림 환경에서의 조인 연속 질의의 그리디 질의 최적화 성능 분석 (Greedy Query Optimization Performance Analysis for Join Continuous Query over Data Streams)

  • 박홍규;이원석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.361-364
    • /
    • 2006
  • 최근에 제한된 데이터 셋보다 센서 데이터 처리, 웹 서버 로그나 전화 기록과 같은 다양한 트랜잭션 로그 분석 등과 관련된 데이터 스트림 처리에 더 많은 관심이 집중되고 있으며, 특히 데이터 스트림의 질의 처리에 대한 관심이 증가하고 있다. 본 논문에서는 질의 중에서 2 개 이상의 스트림을 조인하는 조인 연속 질의를 처리하는 방법과 성능에 대해서 연구한다. 각 조인의 비용을 스트림의 입력 속도와 조인 선택도를 이용한 조인 비용 모델로 정의하고 그리디 알고리즘을 이용하여 최적화하는 기법을 제안하고 실험을 통해 다양한 스트림 환경에서 최적화 알고리즘이 어떤 성능을 보이는 지를 알아본다.

  • PDF