• Title/Summary/Keyword: 입력데이터

Search Result 4,335, Processing Time 0.043 seconds

Virtual Samples Generation Based on the Distriburion of Input Data (입력 데이터의 분포를 고려한 가상 샘플 생성)

  • 이봉기;임용업;조성준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.302-304
    • /
    • 2000
  • 본 논문에서는 잡음 추가와 네트웍 앙상블을 이용하는 기법으로 최근에 제안된 가상 샘플 생성 방법(VSG:Virtual Sample Generation)을 개선하는 방법을 제안하고, 이를 대표적인 앙상블학습 알고리즘인 Bagging, Boosting과 비교한다. 기존의 가상 샘플 생성 방법에 기초하여 입력 데이터의 분포를 고려하여 가상 샘플을 생성하는 방법을 제안한다. 이 방법은 입력 분포의 밀도가 높은 곳에서 가장 샘플로 인한 과소 적합을 방지하고 밀도가 낮은 곳에서 가상 샘플로 인한 과도 적합을 방지하기 위한 것이다. 본 논문은 입력 데이터의 밀도를 추정하는 새로운 과정을 정리하고 입력 분포에 따라 적합한 가상 샘플을 생성하는 방법을 고안했다. 그리고 제안하는 방법의 일반화 성능 향상을 보이기 위해 여러 가지의 합성 데이터를 사용하여 실험을 하였고 이를 Bagging, Boosting, VSG의 성능과 비교하였다.

  • PDF

Development of Artificial Neural Network Model for Prediction of Water Quality Parameters in Large Rivers with Tributary Inflow (지천유입이 있는 대하천에서 수질예측을 위한 인공신경망모델의 개발)

  • Seo, Il Won;Yun, Se Hun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.141-141
    • /
    • 2017
  • 본 연구에서는 대하천의 8개의 수질인자(수온, 용존산소, 수소이온농도, 전기전도도, 총질소, 총인, 탁도, 클로로필-a)를 예측할 수 있는 인공신경망모델을 개발하였다. 인공신경망모델(ANN)은 수질데이터가 가지는 불확실성 및 비정상성, 복잡한 상호관련성에 효과적으로 대응할 수 있는 데이터기반 모델이다. 데이터기반 모델의 특성상 예측정확도를 높이기 위해서 양질의 입력데이터를 구성하는 것이 가장 중요하다. 때문에 각각의 수질인자뿐만 아니라 기상학적 인자 또한 예측을 위한 입력자료로 사용하였으며, 요인분석 및 층화표층추출법을 적용하여 입력데이터를 구성하였고 앙상블기법을 이용하여 추가적으로 예측의 정확도를 향상시켰다. 개발된 모델을 이용하여 지천유입이 있는 북한강의 수질자료를 예측한 결과 탁도를 제외한 7개의 수질인자 모두 0.85 이상의 설명력을 보였으며, 실측값과 예보값을 비교해본 결과 평균적으로 10% 미만의 에러값을 나타냈다. 요인분석을 통하여 연관성있는 인자를 입력인자로 추가한 경우 향상된 결과값을 보였주었으며, 앙상블기법을 적용한 결과 정확도 면에서 큰 향상을 보여주었다.

  • PDF

Development of data conversion system between MOS & EMS (이기종 컴퓨터(MOS/EMS)간 데이터 자동변환시스템 개발)

  • Lee, Kang-Jae;Choi, Bong-Soo;Kim, Tae-Eon
    • Proceedings of the KIEE Conference
    • /
    • 2008.07a
    • /
    • pp.1863-1864
    • /
    • 2008
  • 한국전력거래소에서 운영중인 EMS(Energy Management System)와 MOS(Market Operation System) 설비는 각각 Alstom사와 ABB사에 의해 우리나라의 전력계통 특성에 맞게 제작되어 공급된 전력계통과 전력시장의 운영을 자동화한 시스템이다. EMS는 전력계통 감시와 효율적인 운영을 위해 전력계통을 모델링한 데이터를 활용하며, MOS는 실시간 급전계획 수립을 위한 기반자료로 전력계통을 모델링한 데이터를 사용하게 된다. 그러나, 대한민국 전력산업의 핵심인 두 시스템은 시스템 설계 방식 및 DB 구조가 상이하여 전력계통의 신.증설 및 변경 시 동일한 데이터를 양 시스템에 각각 따로 구축, 운영해야하는 실정이다. 이에 따라 DB작업을 위한 자료 준비부터 입력, 수정, 검증 등 모든 과정에 중복된 관리가 이루어지고 있다. 중복 관리는 양 시스템 간 DB의 주요 데이터 특성 및 명칭이 상이하여 일률적인 관리가 어렵고, 시스템별 특성 및 운영노하우가 없이는 인적실수에 의한 입력오류 개연성이 폭넓게 존재하는 등 현 상황에서 피할 수 없는 현실이었다. EMS와 MOS 시스템 중 최소한 개의 시스템을 전면 재구축하지 않으면 해결되지 않을 본 문제를 해소하기 위하여 전력거래소는 특정 시스템에 구축된 데이터를 변환알고리즘을 통해 나머지 하나의 시스템에 자동 구축할 수 있는 시스템을 개발하여 활용하고자 한다. 이것이 바로 EMS에 입력되어 정확성이 검증된 계통데이터를 추출하여 MOS의 데이터 형식으로 변환하고, 변환된 데이터를 MOS시스템에 자동으로 입력할 수 있는 MOS/EMS 데이터 자동변환시스템이다.

  • PDF

Simple Kinematic Model Generation by Learning Control Inputs and Velocity Outputs of a Ship (선박의 제어 입력과 속도 출력 학습에 의한 단순 운동학 모델 생성)

  • Kim, Dong Jin;Yun, Kunhang
    • Journal of Navigation and Port Research
    • /
    • v.45 no.6
    • /
    • pp.284-297
    • /
    • 2021
  • A simple kinematic model for the prediction of ship manoeuvres based on trial data is proposed in this study. The model consists of first order differential equations in surge, sway, and yaw directions which simulate the time series of each velocity component. Actually instead of sea trial data, dynamic model simulations are conducted with randomly varied control inputs such as propeller revolution rates and rudder angles. Based on learning of control inputs and velocity outputs of dynamic model simulations in sufficient time, kinematic model coefficients are optimized so that the kinematic model can be approximately reproduce the velocity outputs of dynamic model simulations with arbitrary control inputs. The resultant kinematic model is verified with new dynamic simulation sets.

A High-Speed Data Processing Algorithm for RFID Input Data Stream Using Multi-Buffer (RFID 입력 테이터 스트림에 대한 다중 버퍼 기반의 고속 데이터 처리 알고리즘)

  • Han, Soo;Shin, Seung-Ho
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.10b
    • /
    • pp.302-307
    • /
    • 2007
  • RFID를 기반으로 유비쿼터스 환경의 응용 서비스를 지원하는 미들웨어는 지속적으로 끊임없이 입력되는 데이터를 정확하게 실시간으로 처리하고 응용 서비스에서 질의하는 결과를 획득해서 전달하여야 한다. 이와 같은 지속적으로 입력되는 대량의 데이터 스트림을 처리하기 위해서 데이터 스트림 관리 시스템(Data Stream Management System: DSMS)을 개발하기 위한 연구가 진행되고 있다. 기존에 연구되는 데이터 스트림에 대한 알고리즘은 대부분 연속 질의 결과들 사이의 평균 오차를 줄이고, 부하 발생 시 데이터의 우선순위에 따라 버리는 것에 초점이 맞추어져 있다. 본 논문에서는 RFID EPC 라는 데이터 특성에 맞추어 다중버퍼를 이용함으로써 고속의 데이터 처리 능력을 얻고, 각 버퍼마다 일정한 규칙을 통해 질의에 있어서도 빠른 대응을 할 수 있는 알고리즘을 제안한다. 본 논문은 현재 DSMS의 관련 연구와 고속 데이터 처리의 필요성을 말하고, 제안하는 알고리즘 설명과 시뮬레이션을 통해 단일버퍼와 다중버퍼일 경우 데이터 처리 속도 성능 평가와 제안한 알고리즘에 맞도록 버퍼가 생성 되는지 테스트하는 것으로 구성된다.

  • PDF

Characteristics of Gas Furnace Process by Means of Partition of Input Spaces in Trapezoid-type Function (사다리꼴형 함수의 입력 공간분할에 의한 가스로공정의 특성분석)

  • Lee, Dong-Yoon
    • Journal of Digital Convergence
    • /
    • v.12 no.4
    • /
    • pp.277-283
    • /
    • 2014
  • Fuzzy modeling is generally using the given data and the fuzzy rules are established by the input variables and the space division by selecting the input variable and dividing the input space for each input variables. The premise part of the fuzzy rule is presented by selection of the input variables, the number of space division and membership functions and in this paper the consequent part of the fuzzy rule is identified by polynomial functions in the form of linear inference and modified quadratic. Parameter identification in the premise part devides input space Min-Max method using the minimum and maximum values of input data set and C-Means clustering algorithm forming input data into the hard clusters. The identification of the consequence parameters, namely polynomial coefficients, of each rule are carried out by the standard least square method. In this paper, membership function of the premise part is dividing input space by using trapezoid-type membership function and by using gas furnace process which is widely used in nonlinear process we evaluate the performance.

Reduction of Input Pins in VLSI Array for High Speed Fractal Image Compression (고속 프랙탈 영상압축을 위한 VLSI 어레이의 입력핀의 감소)

  • 성길영;전상현;이수진;우종호
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.26 no.12A
    • /
    • pp.2059-2066
    • /
    • 2001
  • In this paper, we proposed a method to reduce the number of input pins in one-dimensional VLSI array for fractal image compression. We use quad-tree partition scheme and can reduce the number of the input pins up to 50% by sharing the domain\`s and the range\`s data input pins in the proposed VLSI array architecture. Also, we can reduce the input pins and simplify the internal operation circuit of the processing elements by eliminating a few number of bits of the least significant bits of the input data. We simulated using the 256$\times$256 and 512$\times$512 Lena images to verify performance of the proposed method. As the result of simulation, we can decompress the original image with about 32dB(PSNR) in spite of elimination of the least significant 2-bit in the original input data, and additionally reduce the number of input pins up to 25% compared to VLSI array sharing input pins of range and domain.

  • PDF

The Study on Effect of sEMG Sampling Frequency on Learning Performance in CNN based Finger Number Recognition (CNN 기반 한국 숫자지화 인식 응용에서 표면근전도 샘플링 주파수가 학습 성능에 미치는 영향에 관한 연구)

  • Gerelbat BatGerel;Chun-Ki Kwon
    • Journal of the Institute of Convergence Signal Processing
    • /
    • v.24 no.1
    • /
    • pp.51-56
    • /
    • 2023
  • This study investigates the effect of sEMG sampling frequency on CNN learning performance at Korean finger number recognition application. Since the bigger sampling frequency of sEMG signals generates bigger size of input data and takes longer CNN's learning time. It makes making real-time system implementation more difficult and more costly. Thus, there might be appropriate sampling frequency when collecting sEMG signals. To this end, this work choose five different sampling frequencies which are 1,024Hz, 512Hz, 256Hz, 128Hz and 64Hz and investigates CNN learning performance with sEMG data taken at each sampling frequency. The comparative study shows that all CNN recognized Korean finger number one to five at the accuracy of 100% and CNN with sEMG signals collected at 256Hz sampling frequency takes the shortest learning time to reach the epoch at which korean finger number gestures are recognized at the accuracy of 100%.

Cluster Based Fuzzy Model Tree using Node Information (상호 노드 정보를 이용한 클러스터 기반 퍼지 모델트리)

  • Park, Jin-Il;Lee, Dae-Jong;Kim, Yong-Sam;Jeon, Myeong-Geun
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2007.11a
    • /
    • pp.235-238
    • /
    • 2007
  • 본 논문에서는 기존의 클러스터 기반 퍼지 모델트리에서 트리의 깊이에 따른 over-fitting으로 인한 훈련 및 검증데이터의 일관성 문제점을 해결하기 위해 상호 노드간의 정보를 고려하는 방법을 제안하고자 한다. 제안된 방법은 우선 입력과 출력변수의 속성을 고려한 퍼지 클러스터링에 의해 중심벡터를 계산한 후, 중심벡터들과 입력 속성간의 소속도를 이용하여 구간 분할된 영역별로 각각의 선형모델을 구축한다. 예측 단계에서는 입력된 데이터가 잎노드에 도달하는 노드간의 중심벡터와 입력 데이터간의 거리값에 따른 소속도를 계산한 후 최종적으로 무게 중심법을 이용하여 출력값을 예측하게 된다. 제안된 방법의 우수성을 보이기 위해 다양한 벤치마크 데이터를 대상을 실험한 결과, 기존의 클러스터 기반 퍼지 모델트리보다 향상된 성능을 보임을 알 수 있었다.

  • PDF

A Study on the Input Format Standards for the Contributions to Serials and Monographs (연속간행물 및 단행본 게재기사의 입력형식 표준화에 관한 연구)

  • 한종엽
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1999.08a
    • /
    • pp.229-232
    • /
    • 1999
  • 문헌 데이터베이스를 구축함에 있어서 서지데이터의 입력형식에 관해서는 국내의 표준지침이 마련되어 있지 않다. 국내외의 관련표준과 선행연구를 검토하고, CSA OCLC, 국회도서관, 연구개발 정보센터 등의 입력데이터 서지요소를 분석하여 학술지의 기사와 단행본 형태 출판물의 기고문, 특허문헌 등을 대상으로 구축하는 데이터베이스의 실용적인 입력표준안을 설계하여 제시하고자 한다.

  • PDF