• Title/Summary/Keyword: 다중 데이터

Search Result 3,521, Processing Time 0.032 seconds

Learning Multiple Instance Support Vector Machine through Positive Data Distribution (긍정 데이터 분포를 반영한 다중 인스턴스 지지 벡터 기계 학습)

  • Hwang, Joong-Won;Park, Seong-Bae;Lee, Sang-Jo
    • Journal of KIISE
    • /
    • v.42 no.2
    • /
    • pp.227-234
    • /
    • 2015
  • This paper proposes a modified MI-SVM algorithm by considering data distribution. The previous MI-SVM algorithm seeks the margin by considering the "most positive" instance in a positive bag. Positive instances included in positive bags are located in a similar area in a feature space. In order to reflect this characteristic of positive instances, the proposed method selects the "most positive" instance by calculating the distance between each instance in the bag and a pivot point that is the intersection point of all positive instances. This paper suggests two ways to select the "most positive" pivot point in the training data. First, the algorithm seeks the "most positive" pivot point along the current predicted parameter, and then selects the nearest instance in the bag as a representative from the pivot point. Second, the algorithm finds the "most positive" pivot point by using a Diverse Density framework. Our experiments on 12 benchmark multi-instance data sets show that the proposed method results in higher performance than the previous MI-SVM algorithm.

Supercompact Multiwavelets for Three Dimensional Flow Field Simulation (3차원 유동 시뮬레이션을 위한 Supercompact 다중 웨이블릿)

  • Yang, Seung-Cheol;Lee, Do-Hyung
    • Journal of the Korean Society for Aeronautical & Space Sciences
    • /
    • v.33 no.12
    • /
    • pp.18-25
    • /
    • 2005
  • This paper presents a supercompact multi-wavelet scheme and its application to fluid simulation data. The supercompact wavelet method is an appropriate wavelet for fluid simulation data in the sense that it can provide compact support and avoid unnecessary interaction with remotely located data (e.g. across a shock discontinuity or vortices). thresholding for data compression is applied based on a covariance vector structure of multi-wavelets. The extension of this scheme to three dimensions is analyzed. The numerical tests demonstrate that it can allow various analytic advantages as well as large data compression ratios in actual practice.

Implementation and Performance Analysis of Real-time Multi-source Sensor Data Management System Based on Wireless Sensor Network (무선 센서네트워크 기반 실시간 다중소스 센서데이터 관리시스템 구현 및 성능분석)

  • Kang, Moon-Sik
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.36 no.8B
    • /
    • pp.1003-1011
    • /
    • 2011
  • In this paper, a real-time multi-source sensor data management system based on wireless sensor network is proposed and implemented. The proposed management system is designed to transmit the wireless data to the server in order to monitor and control the multi-source target's status efficiently by analyzing them. The proposed system is implemented to make it possible to control and transmit the wireless sensor data by classifying them, of which data are issued from the clustered sources composed of a number of the remote multiple sensors. In order to evaluate the performance of the proposed system, we measure and analyze both the transmission delay time according to the distance and the data loss rate issued from multiple data sources. From these results, it is verified that the proposed system has a good performance.

Performance Evaluation of Multilinear Regression Empirical Formula and Machine Learning Model for Prediction of Two-dimensional Transverse Dispersion Coefficient (다중선형회귀경험식과 머신러닝모델의 2차원 횡 분산계수 예측성능 평가)

  • Lee, Sun Mi;Park, Inhwan
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.172-172
    • /
    • 2022
  • 분산계수는 하천에서 오염물질의 혼합능을 파악할 수 있는 대표적인 인자이다. 특히 하수처리장 방류수 혼합예측과 같이 횡 방향 혼합에 대한 예측이 중요한 경우, 하천의 지형적, 수리학적 특성을 고려한 2차원 횡 분산계수의 결정이 필요하다. 2차원 횡 분산계수의 결정을 위해 기존 연구에서는 추적자실험결과로부터 경험식을 만들어 횡 분산계수 산정에 사용해왔다. 회귀분석을 통한 경험식 산정을 위해서는 충분한 데이터가 필요하지만, 2차원 추적자 실험 건수가 충분치 않아 신뢰성 높은 경험식 산정이 어려운 상황이다. 따라서 본 연구에서는 SMOTE기법을 이용하여 횡분산계수 실험데이터를 증폭시켜 이로부터 횡 분산계수 경험식을 산정하고자 한다. 또한 다중선형회귀분석을 통해 도출된 경험식의 한계를 보완하기 위해 다양한 머신러닝 기법을 적용하고, 횡 분산계수 산정에 적합한 머신러닝 기법을 제안하고자 한다. 기존 추적자실험 데이터로부터 하폭 대 수심비, 유속 대 마찰유속비, 횡 분산계수 데이터 셋을 수집하였으며, SMOTE 알고리즘의 적용을 통해 회귀분석과 머신러닝 기법 적용에 필요한 데이터그룹을 생성했다. 새롭게 생성된 데이터 셋을 포함하여 다중선형회귀분석을 통해 횡 분산계수 경험식을 결정하였으며, 새로 제안한 경험식과 기존 경험식에 대한 정확도를 비교했다. 또한 다중선형회귀분석을 통해 결정된 경험식은 횡 분산계수 예측범위에 한계를 보였기 때문에 머신러닝기법을 적용하여 다중선형회귀분석에 대한 예측성능을 평가했다. 이를 위해 머신러닝 기법으로서 서포트 벡터 머신 회귀(SVR), K근접이웃 회귀(KNN-R), 랜덤 포레스트 회귀(RFR)를 활용했다. 세 가지 머신러닝 기법을 통해 도출된 횡 분산계수와 경험식으로부터 결정된 횡 분산계수를 비교하여 예측 성능을 비교했다. 이를 통해 제한된 실험데이터 셋으로부터 2차원 횡 분산계수 산정을 위한 데이터 전처리 기법 및 횡 분산계수 산정에 적합한 머신러닝 절차와 최적 학습기법을 도출했다.

  • PDF

An Analysis of the Overhead of Multiple Buffer Pool Scheme on InnoDB-based Database Management Systems (InnoDB 기반 DBMS에서 다중 버퍼 풀 오버헤드 분석)

  • Song, Yongju;Lee, Minho;Eom, Young Ik
    • Journal of KIISE
    • /
    • v.43 no.11
    • /
    • pp.1216-1222
    • /
    • 2016
  • The advent of large-scale web services has resulted in gradual increase in the amount of data used in those services. These big data are managed efficiently by DBMS such as MySQL and MariaDB, which use InnoDB engine as their storage engine, since InnoDB guarantees ACID and is suitable for handling large-scale data. To improve I/O performance, InnoDB caches data and index of its database through a buffer pool. It also supports multiple buffer pools to mitigate lock contentions. However, the multiple buffer pool scheme leads to the additional data consistency overhead. In this paper, we analyze the overhead of the multiple buffer pool scheme. In our experimental results, although multiple buffer pool scheme mitigates the lock contention by up to 46.3%, throughput of DMBS is significantly degraded by up to 50.6% due to increased disk I/O and fsync calls.

Transmission and Rendering of Massive Terrain Data in Network Environment (네트웍 환경에서의 대규모 지형 데이터 전송 및 렌더링)

  • 김대성;한정현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.184-186
    • /
    • 2003
  • 본 논문에서는 대규모 지형 데이터를 이용한 네트웍 환경에서의 지형 탐색을 위한 다중 해상도 기법과 prefetching 기법을 제안한다. 지형 렌더링에 널리 사용되는 직각이등변 삼각형 메쉬 형태의 DEM 데이터를 정삼각형 메친 데이터로 재구성한 뒤, 이를 다중 해상도로 구조화하여. 네트웍 환경에서의 주요 문제점인 대역폭과 지연 문제를 보완하였다. 본 기법은 3차원 지형 데이터를 이용한 온라인 게임 등에 응용될 수 있다.

  • PDF

An efficient video multiplexer for the transmission of the DMB multimedia data (DMB 멀티미디어 데이터의 전송을 위한 효율적인 비디오 다중화기)

  • Na Nam-Woong;Baek Sun-Hye;Hong Sung-Hoon
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2003.11a
    • /
    • pp.183-186
    • /
    • 2003
  • DMB(Digital Multimedia Broadcasting)는 유럽의 디지털 오디오 방송규격인 Eureka-147 DAB(Digital Audio Broadcasting) 전송시스템을 기반으로 하여 동영상 및 음성, 문자데이터 등을 포함한 멀티미디어 서비스를 제공하기 위한 새로운 방송표준이다 따라서 DMB 시스템은 Eureka-147 DAB 전송부 이외에 영상 및 음성을 압축하는 미디어압축 (복)부호화부, 압축된 미디어 스트림을 다중화 하는 비디오 (역)다중화부가 추가된 구조를 갖는다. 본 논문은 DMB 표준의 비디오 다중화부의 분석을 통하여 확장된 전송기능 및 높은 전송효율을 제공할 수 있는 새로운 비디오 다중화 구조를 제시한다. 또한 표준 비디오 다중화기와 제안된 비디오 다중화기의 성능평가를 위해 기능적으로 분석하고 시뮬레이션을 통해 전송효율을 측정하였다.

  • PDF

A Fault Detection Scheme in Acoustic Sensor Systems Using Multiple Acoustic Sensors (다중 센서를 이용한 음향 센서 시스템의 고장 진단)

  • Oh, Won-Geun
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.11 no.2
    • /
    • pp.203-208
    • /
    • 2016
  • This paper presents a fault detection and data processing algorithm for acoustic sensor systems using the multiple sensor algorithm that has originally developed for the wireless sensor nodes. The multiple sensor algorithm can increase the reliability of the sensor systems by utilizing and comparing the measurements of the multiple sensors. In the acoustic sensor system, the equivalent sound level($L_{eq}$) is used to detect the faulty sensor. The experiment was conducted to demonstrate the feasibility of the multiple acoustic sensor algorithm, and the results show that the algorithm can detect the faulty sensor and validate the data.

A Web-Based High Performance Multiple Sequence Alignment System Design and Implementation (웹 기반 고성능 다중서열정렬시스템 설계 및 구현)

  • Kim, Tae-Kyung;Kim, Hun-Gi;Choi, Chi-Hwan;Jung, Seung-Hyun;Hou, Bo-Kyeng;Cho, Wan-Sup
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2010.07a
    • /
    • pp.79-82
    • /
    • 2010
  • 다중서열정렬 알고리즘은 생명정보학 분야에서 서열기반의 계통분류 분석에 가장 많이 사용되며, 가장 대표적인 공개 프로그램은 ClustalW로 사용자가 로컬시스템에 설치하여 이용할 수 있다. 그러나 실제로 사용자들이 ClustalW을 설치한 후, 서열데이터의 준비, 가공, 처리 및 타 시스템과 연동 등과 같은 작업을 하는데 여러 가지 어려움이 있다. 따라서 본 논문에서는 다중서열정렬 작업을 편리하고 빠르게 수행할 수 있는 웹기반의 고성능 다중서열정렬시스템을 제안한다. 제안된 시스템의 특징은, (1) Inter-Query 라우팅 알고리즘을 통해 다수의 PC 자원을 효율적으로 활용하여 계산 성능을 극대화하였으며, (2) 사용자 편의성을 고려한 웹인터페이스의 제공을 통해 개인화된 데이터관리, 실시간 모니터링, 데이터 편집 등을 지원하여 사용자가 손쉽게 서열데이터의 수집, 관리 및 처리할 수 있도록 지원한다.

  • PDF

A Study on the Cooling Energy Saving System for Data Centers Using Multi-Machine Learning (다중 기계 학습을 활용한 데이터 센터의 냉방 에너지 절감 시스템에 관한 연구)

  • Jang, Hyun-Cheol
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.458-460
    • /
    • 2019
  • 최근 클라우드 시스템 환경이 점차 늘어남에 따라 데이터 센터(IDC) 구축이 점차 늘어나가고 있다. 데이터 센터는 최근 부각하고 있는 4 차 산업 영역에서 사물 인터넷(IoT), 자율주행차 등 에서 처리될 대용량 데이터로 인한 이를 처리하는 중요한 역할을 담당하고 있다. 데이터센터 운영에는 대량의 에너지가 필요하다. 수 많은 컴퓨터에서 발생하는 열에너지를 처리하기 위하여 대량의 전력 냉방 에너지를 소비하고 있다. 냉방 공조 운영은 데이터 센터 운영에 중요한 역할을 한다. 이유는 많은 컴퓨터를 가동하는 비용보다 부대 시설로 운영되는 냉방 에너지를 보다 많이 소비하는 현상까지 발생하고 있다. 이에 최근 데이터 센터 냉방 공조 운영을 효율화하는 것에 연구를 맞추고 있다. 본 논문에서는 냉방 공조 운영 효율화 하도록 하기 위해서 다중 기계 학습을 활용한 데이터 센터의 냉방 에너지 절감 시스템을 제안하고자 한다. 기존의 단수 알고리즘을 활용하여 머신 러닝의 모델구현 방식이 아닌 다중의 기계 학습을 통하여 최적화된 모델을 일일 배치로 생성하여 예측을 하는 시스템이다. 본 시스템을 통하여 사전에 최적화된 냉방 운영을 하여 기존 데이터 센터의 운영되는 과다 냉방을 감축 시켜 에너지를 절감해주는 기능을 제공한다. 본 논문 시스템 연구 결과는 폭발적으로 늘어가고 있는 데이터 센터의 에너지 효율화에 기여할 수 있고, 클라우드 사업에서 경쟁력을 줄 수 있는 운영 시스템 방안을 제시한다.