• Title/Summary/Keyword: 데이터전처리

Search Result 19, Processing Time 0.025 seconds

A Prediction Model for Coating Thickness Based on PLS Model and Variable Selection (부분최소자승법과 변수선택을 이용한 코팅두께 예측모델 개발)

  • Lee, Hye-Seon;Lee, Young-Rok;Jun, Chi-Hyuck;Hong, Jae-Hwa
    • The Korean Journal of Applied Statistics
    • /
    • v.23 no.2
    • /
    • pp.295-304
    • /
    • 2010
  • Coating thickness is one of target variables in quality control process in steel industry. To predict coating thickness and to control quality of anti-fingerprint steel coils, ultraviolet-visible spectra are measured. We propose a variable-interval selection procedure based on the variable importance in projection in partial least square model. Using the proposed variable interval selection method, prediction performance gets better in the reduced model than the full model with full spectra absorbance. It is also shown that the first differencing as a data preprocessing technique does work well for the prediction of coating thickness.

Survey on Wearable Sensor Applications (착용센서 활용 조사연구)

  • Yim, Jaegeol
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2017.07a
    • /
    • pp.419-420
    • /
    • 2017
  • 착용센서가 스포츠, 복지, 건강 등 다양한 분야에서 널리 연구되고 있다. 착용센서 시스템은 일반적으로 데이터획득, 데이터전처리, 특징값 추출 그리고 분석 단계로 구성된다. 본 연구는 착용센서 시스템 각 단계별 연구 현황과 착용센서 활용 연구현황을 살펴본다.

  • PDF

Airport Punctuality Analysis Using Multi-Dimensional Visual Analysis Method (다차원 시각적 분석방법을 이용한 공항 정시운항 분석에 관한 연구)

  • Cho, Jae-Hee;Lee, Dek-Ui
    • 한국IT서비스학회:학술대회논문집
    • /
    • 2010.05a
    • /
    • pp.285-290
    • /
    • 2010
  • 인천공항 웹사이트에 공개되어 있는 여객운항 데이터를 수집하여 공항정시운항분석을 위한 데이터마트를 두 가지 구축하였다. 이를 바탕으로 항공사별, 국가별, 출항지별, 목적지별 출도착 패턴분석을 실시하였다. 각 데이터마트는 요일, 시간 등과 같은 시간차원, 운항도시, 경도좌표, 위도좌표등과 같은 공간차원, 항공사, 공항게이트, 지연여부, 경유여부, 출도착여부 등과 같은 일반차원으로 구성되며, 예정시간, 실제시간, 지연시간, 지연율 등과 같은 측정지표를 가지고 있다. 특히 데이터전처리 과정을 통해 각 운항도시의 경. 위도 좌표값을 추가하였고, 이에 따라 세계지도 위에 정보를 디스플레이하는 시각화 분석도 실현 가능하게 되었다.

  • PDF

Analysis of Important Features for Predicting House Prices (주택가격 예측을 위한 주요 특성 분석)

  • Jun-Wan Kim;Seung-June Beak;Juryon Paik
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.01a
    • /
    • pp.27-29
    • /
    • 2023
  • 불안정한 부동산 가격은 지속적인 사회 문제로 거론되고 있는데 이는 부동산 매매 가격을 예측할 수 있는 정확한 지표가 체계적이고 구체적으로 확립되지 않았기 때문이다. 본 논문은 가격변동에 주요하게 영향을 미치는 특성을 파악하여 가격 예측 지표로 활용하기 위해 머신러닝 모델을 적용하여 특성 분석을 수행한다. 이를 위해 한국부동산원에서 제공하는 2021년 10월부터 2022년 9월까지 1년간의 역 주변 500M 이내 거래 데이터 약 30만 6천 개를 어떠한 과정으로 전처리하여 머신러닝 모델에 적용하였는지 기술한다.

  • PDF

Development of Machine Learning Prediction Models for Wastewater Treatment Plant considering Data Pre-processing (데이터 전처리를 고려한 하수처리장 머신러닝 모델 개발)

  • Kyu Dae Shim;;Chan Soo Park;Dong Kyun Kim;Shin Geol Kim
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.495-495
    • /
    • 2023
  • 본 연구는 하수처리장 운영시스템 자료를 활용하여, 머신러닝 기반의 예측 모델을 개발하고, 모델 정확도 향상에 대하여 검토하였다. 하수처리장에 설치된 각종 센서를 통해 실시간으로 자료가 모니터링되고 있으며, 수집된 자료는 운영시스템에 저장된다. 하수처리장 시스템은 설정된 값과 센서의 측정값을 비교해 이상치가 발생하면 운영자가 즉각적으로 조치하여 문제를 해결하고 있으나, 비정상적인 상황 발생시 이를 대처할 시간이 부족하여 적절한 조치가 이루어지지 못하는 경우가 발생 되고 있다. 따라서, 이러한 문제점을 해결하기 위해 A 하수처리장 운영자료를 활용하여 결과 예측이 신속하고 신뢰도 높은 머신러닝 기반의 예측 모델을 개발하고자 하였다. 모델의 예측 정확도 및 신뢰성을 향상하기 위하여 결과에 영향을 미치는 주요 영향 인자를 분석하고, 이를 기반으로 모델의 추가 분석 및 개선을 수행하여 모델의 예측력을 평가하였다. 금회 연구는 데이터 전처리를 과정을 통한 인사이트를 도출하고 이를 활용하여 하수처리장 운영자료 예측 정확도를 높일 수 있었으며, 이 결과를 바탕으로 다른 하수처리장의 모델 개발시에도 유용하게 활용이 가능할 것으로 검토되었다.

  • PDF

Design of WAP Based Network Management System Using Mobile Terminal (무선 단말기를 이용한 WAP 기반 네트워크 관리시스템의 설계)

  • Lee, Young-Jun;Ahn, Seong-Jin;Chung, Jin-Wook
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04b
    • /
    • pp.1475-1478
    • /
    • 2002
  • 인터넷 발전과 더불어 네트워크 규모가 커지면서 효과적인 네트워크 관리의 필요성이 대두되었고 네트워크 관리자의 역할이 매우 중요한 부분을 차지하게 되었다. 웹 기반 네트워크 관리시스템은 관리를 위해 네트워크가 연결된 PC를 통해서만 관리행위를 할 수 있는데 무선인터넷이 발진하면서 무선 단말기 플랫폼 상에서 네트워크의 관리를 가능하게 하는 네트워크 관리 시스템의 구현이 가능하게 되었다. 본 논문에서는 국제 표준 무선 인터넷 기술인 WAP과 클라이언트의 요청 없이 데이터전송이 가능한 WAP 푸시 기술을 통해 긴급장애 발생에 대처하는 기능을 제공함으로써 네트워크 관리자에게 이동성을 부여하여 신속하고 효율적인 네트워크 관리를 가능하게 하는 WAP기반 네트워크관리 시스템의 설계에 대해 제안하고자 한다.

  • PDF

Explanation of Influence Variables and Development of Tight Oil Productivity Prediction Model by Production Period using XAI Algorithm (XAI를 활용한 생산기간에 따른 치밀오일 생산성 예측 모델 개발 및 영향변수 설명)

  • Han, Dong-kwon;An, Yu-bin;Kwon, Sun-il
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2022.05a
    • /
    • pp.484-487
    • /
    • 2022
  • This study suggests an XAI-based machine learning method to predict the productivity of tight oil reservoirs according to the production period. The XAI algorithm refers to interpretable artificial intelligence and provides the basis for the predicted result and the validity of the derivation process. In this study, we proposed a supervised learning model that predicts productivity in the early and late stages of production after performing data preprocessing based on field data. and then based on the model results, the factors affecting the productivity prediction model were analyzed using XAI.

  • PDF

A Study of Connection Data transmission to the Firereciver Network and Telecommunication Network (화재수신기 Network과 통신Network 접속시 데이터 전송에 관한 연구)

  • Baek, Dong-Hyun;Ryu, Keun-Ho;Shin, Seung-Chul
    • Proceedings of the Korea Institute of Fire Science and Engineering Conference
    • /
    • 2012.04a
    • /
    • pp.393-396
    • /
    • 2012
  • 신호처리원과 그 방식은 네트웍 구성시 매우 중요하다. 따라서 대단위단지에서 많이 적용되고 있는 자동화재탐지설비의 화재수신기 네트웍과 통신네트웍에 접속시와 수신기에서 발생하는 통신 데이터를 일반 통신네트윅에 접속하여 발생하는 데이터전송시 문제점에 대하여 고찰한 것이다. 경보설비의 구성에서 중계기와 수신기간의 통신 형태를 측정하여 보편화된 통신방식을 사용하였다는 것을 알 수 있었으며 수신기에서 통신네트윅간의 연결은 수신기의 Ethernet 통신모듈을 통한 프로토콜 형태를 확인하였다.

  • PDF

Necessity of AI Literacy Education to Enhance for the Effectiveness of AI Education (AI교육 효과성 제고를 위한 AI리터러시 교육의 필요성)

  • Yang, Seokjae;Shin, Seungki
    • 한국정보교육학회:학술대회논문집
    • /
    • 2021.08a
    • /
    • pp.295-301
    • /
    • 2021
  • This study tried to examine the necessity of AI literacy education to increase the effectiveness of artificial intelligence education ahead of the revision of the next revised curriculum. To this end, AI modeling classes were conducted for high school students and the necessity, content, and training period of AI literacy perceived by students in AI education were investigated through a questionnaire. The results showed that they generally agreed on the need for data utilization and data preprocessing in the AI class, and in the course of the AI class, there were many cases of difficulties due to lack of basic competencies for database use. In particular, it was observed that the understanding of the file structure for data analysis was insufficient and the understanding of the data storage format for data analysis was low. In order to overcome this part, the necessity of prior education for data processing was recognized, and there were many opinions that it is generally appropriate to go to high school at that time. As for the content elements of AI literacy, it was found that there were high demands on the content of data visualization along with data transformation, including data creation and deletion.

  • PDF

A Study of Automatic Deep Learning Data Generation by Considering Private Information Protection (개인정보 보호를 고려한 딥러닝 데이터 자동 생성 방안 연구)

  • Sung-Bong Jang
    • The Journal of the Convergence on Culture Technology
    • /
    • v.10 no.1
    • /
    • pp.435-441
    • /
    • 2024
  • In order for the large amount of collected data sets to be used as deep learning training data, sensitive personal information such as resident registration number and disease information must be changed or encrypted to prevent it from being exposed to hackers, and the data must be reconstructed to match the structure of the built deep learning model. Currently, these tasks are performed manually by experts, which takes a lot of time and money. To solve these problems, this paper proposes a technique that can automatically perform data processing tasks to protect personal information during the deep learning process. In the proposed technique, privacy protection tasks are performed based on data generalization and data reconstruction tasks are performed using circular queues. To verify the validity of the proposed technique, it was directly implemented using C language. As a result of the verification, it was confirmed that data generalization was performed normally and data reconstruction suitable for the deep learning model was performed properly.