• Title/Summary/Keyword: 데이터 분석성능

Search Result 5,934, Processing Time 0.028 seconds

Intelligent Data Mining Agent for Automatic Clustering (자동 군집화를 위한 지능화된 데이터 마이닝 에이전트)

  • 박정은;전성해;오경환
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2002.11a
    • /
    • pp.370-376
    • /
    • 2002
  • 인터넷 환경에서 발생되는 수많은 데이터를 지능적으로 처리할 수 있는 자동화된 분석 시스템의 필요성이 제기된다. 이러한 시스템의 데이터 분석은 크게 지도 학습과 자율 학습으로 나된다. 본 논문에서는 특히 자율학습 군집화에 대한 자동화된 시스템으로서 지능화된 데이터 마이닝 에이전트를 제안한다. 군집화 과정에서는 데이터를 분석하는 분석가가 군집화의 방법과 결과 해석에 실시간으로 관여하기 어렵기 때문에 이러한 작업을 담당하는 지능화된 에이전트가 자동화된 군집화를 담당하면 효과적인 군집화 전략이 될 수 있다. 본 논문의 자동 군집화를 위한 지능화된 데이터 마이닝 에이전트 시스템은 군집화 수행 에이전트와 군집화 성능 평가 에이전트로 구성된 다중 에이전트로서 두 개의 에이전트가 서로 정보를 교환하면서 최적의 군집화를 수행한다. UCI Machine Repository 데이터를 이용한 실험을 통해 제안 시스템의 성능 평가를 수행하였다.

  • PDF

Analysis of Waiting Time in a Data Broadcast System using User Cache (사용자 캐쉬를 사용한 데이터 방송 시스템에서의 사용자 대기시간 분석)

  • Kim, Jong-Deok;Kim, Jong-Gwon
    • Journal of KIISE:Information Networking
    • /
    • v.28 no.1
    • /
    • pp.82-92
    • /
    • 2001
  • 데이터 방송은 무선 통신 환경에서 많은 사용자들에게 정보를 전달하는데 있어 효과적인 방안으로 주목받고 있다. 데이터 방송 시스템에서의 중요문제 중 하나는 사용자 기다림을 최소화하는 것이다. 사용자 대기시간을 줄이는 데는 두 가지 접근법이 있다. 하나는 대기시간을 최소화하는 방송 스케쥴의설계이고 다른 하나는 사용자 시스템이 지역 메모리를 캐쉬로 이용하여 사용자 요구에 즉각 응답하는 것이다. 이두 가지 접근법은 동시에 적용되어 전체 성능을 보다 좋게 할 수 있다. 효율적인 방송시스템의 설계 및 구현을 위해서는 방송 스케쥴, 캐쉬 크기, 캐슁 정책등 여러 가지 요인을 종합적으로 고려하는 것이 필요하다. 본 놈누에서는 WWW과 같이 정보 항목들간에 구조적 연관 관계가 존재하는 시스템에서 앞서 기술한 여러 가지 요인을 함께 고려하여 방송 시스템의 성능을 분석하였다. 분석적 기법을 이용하여 채택한 방송 스케쥴 캐슁 정책의 조합으로 얻을수 있는 시스템 성능의 하한을 구하였다. 이 결과를 이용하면 여러 가지 시스템 구현 방안간의 성능 비교가 가능하며 이를 통해 효과적인 방송 시스템의 설계 및 구현이 가능할 것이다. 우리는 분석의 타당성 검증을 위해 시뮬레이션을 수행하였다.

  • PDF

A study on time series data analysis for performance monitoring of cloud applications (클라우드 애플리케이션의 성능 모니터링을 위한 시계열 데이터 분석 연구)

  • Dupyo Hong;Dongwan Kim;Yongtae Shin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.05a
    • /
    • pp.58-59
    • /
    • 2023
  • 클라우드 애플리케이션의 성능 모니터링 방법에는 클라우드 소프트웨어 스택의 인프라, 플랫폼 및 애플리케이션 계층에서 수집한 시계열 데이터 분석이라는 방법이 존재한다. 클라우드 컴퓨팅 환경에서 운영되는 서비스 간의 런타임 종속성을 분석하는 것은 클라우드 리소스 관리를 수행하기 위해 필요한 단계이다. 본 논문에서는 Bi-LSTM 기법을 활용해 클라우드 애플리케이션의 관계를 분석하고 종속성을 찾아 모니터링 성능을 향상시키는 시스템을 제안한다. 제안하는 시스템은 클라우드 스택의 모든 계층으로부터 시계열 데이터를 수집하여 인공지능 모델을 훈련, 재훈련 및 업데이트 과정을 진행한다. 본 논문에서는 Bi-LSTM 모델을 활용하여 훈련 중에 학습된 성능 메트릭 간의 종속성을 발견한다.

Regression Model With High Reliability by Using Neural Networks (신경망을 이용한 고신뢰성의 회귀분석 모델)

  • Jo, Yong-Hyeon
    • The KIPS Transactions:PartB
    • /
    • v.8B no.4
    • /
    • pp.327-334
    • /
    • 2001
  • 본 논문에서는 기울기하강과 동적터널링이 조합된 학습알고리즘의 다층신경망을 이용한 고신회성의 회귀분석 모델을 제안하였다. 기울기하강은 빠른 수렴속도의 최적화가 가능하도록 하기 위함이고, 동적터널링은 국소최적해를 만났을 때 이를 벗어난 새로운 연결가중치를 설정하여 전역최적해로 수렴되도록 하기 위함이다. 또한 대용량의 입력 데이터를 통계적으로 독립인 특징들의 집합으로 변환시키는 주요성분분석 기법의 속성을 살려 학습데이터의 차원을 감소시킴으로서 고차원의 학습데이터에 따른 회귀분석 모델의 제약도 동시에 해결하였다. 제안된 기법의 신경망을 3개의 독립변수 패턴을 가진 암모니아 제조공정문제와 10개의 독립변수 패턴을 가진 자동차 연비문제에 각각 적용하여 시뮬레이션한 결과, 기존의 역전과 알고리즘의 신경망이나 주요성분분석에 의한 차원을 감소시키지 않은 학습패턴을 이용한 신경망보다 각각 더욱 우수한 학습성능과 회귀성능이 있음을 확인할 수 있었다. 또한 학습패턴의 영평균 정규화로 회귀용 신경망의 성능을 더욱 더 개선하였다.

  • PDF

Optimization of Sensor Data Window Size for Deep Learning Regression Model (딥러닝 회귀 모델 개발을 위한 센서 데이터 윈도우 사이즈 최적화 기법)

  • Choi, Min-Seo;Yoo, Dong-Yeon;Lee, Jung-Won
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.05a
    • /
    • pp.610-613
    • /
    • 2022
  • 센서 데이터의 중요성이 커지면서 센서 데이터 처리 연구의 수요가 증가하고 있다. 센서 데이터 기반의 딥러닝 모델 개발 시, 센서 데이터 단일 값에 의한 출력이 아닌 시계열적인 특성을 반영하여 연속적인 데이터 간의 연관성을 파악할 수 있는 슬라이딩 윈도우 기법을 통해 효율적으로 데이터를 분석하고 처리할 수 있다. 하지만, 기존의 방법들은 학습 성능(학습 시간 및 모델 성능)에 미치는 영향을 평가하는 기준 없이 입력 데이터의 윈도우 사이즈를 임의로 설정하여 데이터를 처리해 왔다. 따라서, 본 논문은 학습 시간과 모델 성능을 기준으로 센서 데이터의 윈도우 사이즈 최적화 기법을 제안한다. 제안한 방법은 전류를 이용하여 스위치와 다이오드 온도를 추정하는 가상 센서(virtual sensor) 실험 테스트베드에 적용하여, 학습 시간 중심으로는 5%의 윈도우 사이즈를, 모델 성능 중심으로는 R2 SCORE 의 값을 0.9295 로 갖는 8%의 윈도우 사이즈가 최적으로 도출되었다.

MQTT-based physical activity edutech for infants Platform Implementation (MQTT 기반 유아 신체활동 에듀테크 플랫폼 구현)

  • Huh, Ji-Hye;Kim, Kyurin;Park, Woo-Jung;Shin, Dae-hyeon;Kim, Beom-Jung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.11a
    • /
    • pp.937-939
    • /
    • 2022
  • 최근 에듀테크 산업은 코로나 19와 4차 산업사회의 발달로 교육의 디지털 트랜스포메이션이 진행되고 있다. 그러나 기존 에듀테크 기술들은 코로나 19로 인해 예기치 못한 환경에서의 교육 불균형과 영유아들의 언어적, 신체적 발달에 대한 방향을 제시하고 있지 못하다. 이에 본 논문에서는 MQTT 기반 유아 신체활동 에듀테크 플랫폼을 제안한다. 제안하는 플랫폼의 적용된 기술은 MQTT와 아두이노 센서를 활용하여 학습 동기를 유발하고 자발적인 참여를 유도한다. 성능평가는 제안하는 플랫폼의 주요 기능인 센서 데이터 처리 정확도를 분석하기 위해 QoS(Quality of Service)레벨별 데이터 처리율과 초당 처리량을 분석한다. 부하 테스트 성능평가를 통해 QoS2 레벨이 요청된 데이터 처리를 모두 정상적으로 완료하여 제안하는 플랫폼의 데이터의 신뢰성을 보장하기 위해 QoS 레벨 2를 적용하고자 한다.

Performance Evaluation of Fusion Algorithms Using PCA and LDA for Face Verification (얼굴인증을 위한 PCA와 LDA 융합 알고리즘 구현 잊 성능 비교 분석)

  • 정장현;구은경;강행봉
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.718-720
    • /
    • 2004
  • 얼굴 인증에서 가장 보편적으로 사용되고 있는 주성분 분석(PCA . Principal Component Analysis)은 정면 얼굴과 같은 특징 패턴에 대해서 비교적 높은 성능을 보인다. 인식률을 떨어뜨리지 않으면서 데이터량을 줄일 수 있는 효과가 있어 클래스를 잘 축약하여 표현하기에 유용하다. 하지만 조명이나 표정의 변화에 대해서는 성능을 보장할 수 없다 이를 보완하기 위해 성분이 다른 클래스간의 분리가 수월하도록 선형판별분석(LDA Linear Discriminant Analysis)을 사용한다 LDA는 데이터의 양이 적을 때는 성능이 떨어지는 단점이 있다 그래서 PCA와 LDA를 융합한 기술을 사용하면 더 나은 성능을 얻을 수 있는데 Min, Max, Mean, Append, Majority voting방법 등이 이에 해당된다. 하지만 기존 연구에서는 제한적 데이터베이스에 대한 실험에 그쳐 실험 결과의 객관성이 부족했다. 본 논문에서는 정형화된 환경에서 여러 가지 데이터베이스를 사용해 실험함으로써 Min, Max, Mean 융합 알고리즘의 성능을 비교 분석한다. 융합 알고리즘이 언제나 좋은 성능을 내는 것은 아니지만 얼굴영상에서 조명이나 표정 등이 변화함에 상관없이 일정 수준의 인증율을 보장하고 있다.

  • PDF

Performance Analysis of Distributed Parallel Processing Schemes for Large Data in Cloud Computing (클라우드 컴퓨팅에서의 대규모 데이터를 위한 분산 병렬 처리 기법의 성능분석)

  • Hong, Seung-Tae;Chang, Jae-Woo
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2010.09a
    • /
    • pp.111-118
    • /
    • 2010
  • 최근 IT 분야에서 인터넷을 기반으로 IT 자원들을 서비스 형태로 제공하는 클라우드 컴퓨팅에 대한 연구가 활발히 진행되고 있다. 한편, 효율적인 클라우드 컴퓨팅을 제공하기 위해서는, 막대한 양의 데이터를 수많은 서버들에 분산 처장하고 관리하기 위한 분산 데이터 처장 기법 빛 분산 병렬 처리 기법에 대한 연구가 필수적이다. 이를 위해 본 논문에서는 대표적인 분산 병렬 처리 기법에 대해 살펴보고, 이를 비교 분석한다. 마지막으로 Hadoop 기반 클러스터를 구축하고 이를 통해서 대규모 데이터를 위한 분산 병렬 처리 기법에 대한 성능평가를 수행한다.

  • PDF

Survey for Objective Performance Evaluation of Skyline Query Methods (스카이라인 질의 기법의 객관적 성능 평가를 위한 연구 조사)

  • Choi, Jong-Hyeok;Nasridinov, Aziz
    • Proceedings of The KACE
    • /
    • 2018.01a
    • /
    • pp.49-52
    • /
    • 2018
  • 스카이라인 질의는 데이터들 사이의 비교 연산을 통해 지배되지 않은 데이터들의 최소 집합을 스카이라인으로 탐색하며 이때 지배되지 않고 스카이라인으로 선택된 데이터들은 지배된 데이터들을 대표하게 된다. 이러한 특징은 금융, 네트워크, 웹서비스 등 다양한 분야에서 스카이라인의 활용을 이끌어냈다. 하지만 스카이라인 질의는 데이터의 양이나 차원의 수가 증가하는 경우 전체적인 성능이 크게 감소하는 문제를 야기하기 때문에 이를 해결하기 위한 다양한 기법들이 연구 및 제안되고 있다. 하지만 실제 스카이라인 질의를 활용하기 위해서는 객관적 성능 평가를 통해 주어진 상황에서 최적의 성능을 보일 수 있는 기법을 선택해야할 필요가 있지만 기존의 연구들은 성능 평가에 있어 각 기법이 목표한 문제들에 대한 단편적인 실험을 진행하고 있기 때문에 이들을 객관적으로 평가하기 위해서는 새로운 스카이라인 성능 평가 방법이 필요한 실정이다. 본 논문에서는 이러한 문제를 해결하기에 앞서 스카이라인 질의 기법의 객관적 성능 평가를 위한 품질 요소 선택 기준을 선택하기 위해 기존 연구들에 대한 조사와 분석을 진행한다.

  • PDF

A Study on the Data Traffic Generation Model by Simulation (시뮬레이션에 의한 데이터 트래픽 발생모델에 관한 연구)

  • Koo Hye-Ryun;Lim Seog-Ku
    • Proceedings of the KAIS Fall Conference
    • /
    • 2004.06a
    • /
    • pp.107-111
    • /
    • 2004
  • 자기 유사적인 트래픽 성질이 차세대 고속 통신망의 성능에 미치는 영향을 예측 분석하기 위해서는 자기유사 트래픽을 정확하고 효율적으로 모델링하기 위한 연구 및 분석 결과는 인터넷 망이나 새롭게 구현될 시스템에서 반드시 고려하여야 할 사항이라고 판단된다. 이러한 관점에서 본 논문에서는 인터넷 데이터 트래픽이 갖는 통계적 특성인 자기유사 트래픽을 발생할 수 있는 시뮬레이션 모델을 제시하고 각 방식의 성능을 분석한 후 이를 기초로 데이터 트래픽이 입력되는 모듈들을 실험할 수 있는 트래픽 발생 방식을 제안하고 마지막으로 결론을 맺는다.

  • PDF