• Title/Summary/Keyword: 인공지능 학습용 데이터

Search Result 97, Processing Time 0.02 seconds

Data Mining using Instance Selection in Artificial Neural Networks for Bankruptcy Prediction (기업부도예측을 위한 인공신경망 모형에서의 사례선택기법에 의한 데이터 마이닝)

  • Kim, Kyoung-jae
    • Journal of Intelligence and Information Systems
    • /
    • v.10 no.1
    • /
    • pp.109-123
    • /
    • 2004
  • Corporate financial distress and bankruptcy prediction is one of the major application areas of artificial neural networks (ANNs) in finance and management. ANNs have showed high prediction performance in this area, but sometimes are confronted with inconsistent and unpredictable performance for noisy data. In addition, it may not be possible to train ANN or the training task cannot be effectively carried out without data reduction when the amount of data is so large because training the large data set needs much processing time and additional costs of collecting data. Instance selection is one of popular methods for dimensionality reduction and is directly related to data reduction. Although some researchers have addressed the need for instance selection in instance-based learning algorithms, there is little research on instance selection for ANN. This study proposes a genetic algorithm (GA) approach to instance selection in ANN for bankruptcy prediction. In this study, we use ANN supported by the GA to optimize the connection weights between layers and select relevant instances. It is expected that the globally evolved weights mitigate the well-known limitations of gradient descent algorithm of backpropagation algorithm. In addition, genetically selected instances will shorten the learning time and enhance prediction performance. This study will compare the proposed model with other major data mining techniques. Experimental results show that the GA approach is a promising method for instance selection in ANN.

  • PDF

일상어휘를 기반으로 한 선물 가격 예측모형의 계발

  • 김광용;이승용
    • Proceedings of the Korea Database Society Conference
    • /
    • 1999.06a
    • /
    • pp.291-300
    • /
    • 1999
  • 본 논문은 인공신경망과 귀납적 학습방법 등의 인공지능 방법과 선물가격결정에 대한 기존 재무이론을 사용하여 일상어취로 표현되는 파생상품 가격예측 모형을 개발하는데 있다. 모형의 개발은 1단계로 인공신경망이나 기존의 선물가격결정이론(평균보 유비용모형이나 일반균형모형)을 이용하여 선물 가격을 예측한 후, 서로 비교 분석하여 인공신경망 모형의 우수성을 확인하였다. 귀납적 학습방법중 CART 알고리듬을 사용하여 If-Then 규칙을 생성하였다. 특히 실용적 측면에서 선물가격의 일상어휘화를 통한 모형개발을 여러 가지 방법으로 시도하였다. 이러한 선물가격 예측모형의 유용성은 일단 If-Then 규칙으로 표현되어 전문가의 판단에 확실한 이론적인 근거를 제시할 수 있는 장점이 있으며, 특히 의사결정지원시스템으로 활용화 될 경우 매우 유용한 근거자료로 활용될 수 있다. 이러한 선물가격 예측모형의 정확성은 분석표본과 검증표본으로 나누어 검증표본에서 세가지 기본모형(평균보유 비용모형, 일반균형모형, 인공신경망 모형)과 각 모형의 귀납적 학습방법 모형의 다른 3가지 어휘표현방법 3가지를 모형별로 비교 분석하였다. 분석결과 인공신경망모형은 상당한 예측력을 갖고 있는 것으로 판명되었으며, 특히 CART를 기반으로 한 일상어취 기반의 선물가격예측 모형은 예측력이 높은 것으로 나타났다.

  • PDF

Application of Knowledge Graph in a military Intelligent Image Analysis System (군사용 지능형 영상 판독 시스템에서의 지식그래프 적용 방안)

  • Na, Hyung-Sun;Kang, Hyung-Seok;Ahn, Jinhyun;Im, Dong-Hyuk
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.05a
    • /
    • pp.583-585
    • /
    • 2022
  • 기존 군사 분야 영상 판독 시스템은 영상 판독관들의 작업 부담이 크고, 판독관들의 경험과 숙련도에 의존적이다. 이전 연구에서 판독관들의 부담을 줄이고 경험 및 숙련 의존도를 낮추기 위해 문장 추천 시스템을 제안하였다. 하지만 학습에 사용된 데이터의 양이 적고, 학습에 사용되지 않은 장비 혹은 지역 등의 단어가 등장 시 제대로 동작하지 않는 한계점이 있었다. 이를 해결하기 위해 학습 데이터 단계와 디코딩 단계에 지식그래프를 적용하여 문장의 다양성과 확장성을 확보하고, 데이터 부족 문제를 완화하였다. 이 연구는 추후 판독관들의 업무 과부화를 완화하고 업무 효율을 높일 수 있을 것이다.

Class Classification and Validation of a Musculoskeletal Risk Factor Dataset for Manufacturing Workers (제조업 노동자 근골격계 부담요인 데이터셋 클래스 분류와 유효성 검증)

  • Young-Jin Kang;;;Jeong, Seok Chan
    • The Journal of Bigdata
    • /
    • v.8 no.1
    • /
    • pp.49-59
    • /
    • 2023
  • There are various items in the safety and health standards of the manufacturing industry, but they can be divided into work-related diseases and musculoskeletal diseases according to the standards for sickness and accident victims. Musculoskeletal diseases occur frequently in manufacturing and can lead to a decrease in labor productivity and a weakening of competitiveness in manufacturing. In this paper, to detect the musculoskeletal harmful factors of manufacturing workers, we defined the musculoskeletal load work factor analysis, harmful load working postures, and key points matching, and constructed data for Artificial Intelligence(AI) learning. To check the effectiveness of the suggested dataset, AI algorithms such as YOLO, Lite-HRNet, and EfficientNet were used to train and verify. Our experimental results the human detection accuracy is 99%, the key points matching accuracy of the detected person is @AP0.5 88%, and the accuracy of working postures evaluation by integrating the inferred matching positions is LEGS 72.2%, NECT 85.7%, TRUNK 81.9%, UPPERARM 79.8%, and LOWERARM 92.7%, and considered the necessity for research that can prevent deep learning-based musculoskeletal diseases.

Development of Sensor Data-based Motion Prediction Model for Home Co-Robot (가정용 협력 로봇의 센서 데이터 기반 실행동작 예측 모델 개발)

  • Yoo, Sungyeob;Yoo, Dong-Yeon;Park, Ye-Seul;Lee, Jung-Won
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.552-555
    • /
    • 2019
  • 디지털 트윈이란 현실 세계의 물리적인 사물을 컴퓨터 상에 동일하게 가상화 시키는 기술을 의미하는 것으로, 물리적 사물이나 시스템을 모델링하거나 IoT 기술에 접목되어 활용되고 있는 기술이다. 디지털 트윈 기술은 가상의 모델을 무한정 시뮬레이션을 통해 동작을 튜닝하고 환경변화에 대한 대응을 미리 실험하여 리스크를 최소화할 수 있는 장점을 지닌다. 최근 인공지능이나 기계학습에 관련된 기술들이 주목받기 시작하면서, 이와 같은 물리적인 사물의 모델링 작업을 데이터 기반으로 수행하려는 시도가 증가하고 있다. 특히, 산업현장에서 많이 활용되는 인더스트리 4.0 공장 자동화의 핵심인 협력 로봇의 디지털 트윈을 구축하기 위해서는 로봇의 동작을 인지하는 과정이 필수적으로 요구된다. 그러나 현재 협력 로봇의 동작을 인지하기 위한 시도는 미비하며, 센서 데이터를 기반으로 동작을 역으로 예측하는 기술은 더욱 그렇다. 따라서 본 논문에서는 로봇의 동작을 인지하기 위해 가정용 협력 로봇에서 전류 및 관성 데이터를 수집하기 위한 실험 환경을 구축하고, 수집한 센서 데이터를 기반으로 한 동작 예측 모델을 제안하고자 한다. 제안하는 방식은 로봇의 동작 명령어를 조인트 위치 기반으로 분류하고 전류와 위치 센서 값을 사용하여 학습을 통해 예측하는 방식이다. SVM 을 이용하여 학습한 결과, 모델의 성능은 평균적으로 정확도, 정밀도, 및 재현율이 모두 96%로 평가되었다.

Development of informatics subject education system using cloud-based social platform for maker education (메이커 교육을 위한 클라우드 기반 교육용 소셜 플랫폼을 활용한 정보교과 교육시스템 개발)

  • Yang, Hwan-Geun;Lee, Tae-Wuk
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2019.07a
    • /
    • pp.409-412
    • /
    • 2019
  • 본 논문에서는 인공지능과 빅데이터 클라우드 등 다양한 4차 산업혁명시대의 기술과 교육을 융합한 에듀테크를 기초로 하여 에듀테크에 대한 교사의 학습 방향을 제시하며 전체적인 클라우드의 개념 및 분류체계, 교육의 활용을 제시하였고 클라우드 기반 교육용 소셜 플랫폼과 R. M. Gagne(1985)의 9가지 이론을 토대로 정보교과 추상화 단원의 학습 지도안을 설계 후 성취도 평가를 제시하였다. 연구 내용 분석 결과 기술의 발전성과 교육현장에서의 개인정보 교육 및 정보보안 교육의 필요성이 강조되며 확고한 플랫폼 구축과 빅데이터 확보 및 분석하여 개인에게 맞춤형 서비스 제공이 필요하다. 또한 사용자 편의성 극대화 서비스 및 UX 간결이 요구된다. 본 논문을 토대로 에듀테크의 일부분인 클라우드 기반 소셜러닝의 다양하고 체계적인 선행연구 활성화에 시발점이 되었으면 한다.

  • PDF

Detection Fastener Defect using Semi Supervised Learning and Transfer Learning (준지도 학습과 전이 학습을 이용한 선로 체결 장치 결함 검출)

  • Sangmin Lee;Seokmin Han
    • Journal of Internet Computing and Services
    • /
    • v.24 no.6
    • /
    • pp.91-98
    • /
    • 2023
  • Recently, according to development of artificial intelligence, a wide range of industry being automatic and optimized. Also we can find out some research of using supervised learning for deteceting defect of railway in domestic rail industry. However, there are structures other than rails on the track, and the fastener is a device that binds the rail to other structures, and periodic inspections are required to prevent safety accidents. In this paper, we present a method of reducing cost for labeling using semi-supervised and transfer model trained on rail fastener data. We use Resnet50 as the backbone network pretrained on ImageNet. At first we randomly take training data from unlabeled data and then labeled that data to train model. After predict unlabeled data by trained model, we adopted a method of adding the data with the highest probability for each class to the training data by a predetermined size. Futhermore, we also conducted some experiments to investigate the influence of the number of initially labeled data. As a result of the experiment, model reaches 92% accuracy which has a performance difference of around 5% compared to supervised learning. This is expected to improve the performance of the classifier by using relatively few labels without additional labeling processes through the proposed method.

A Survey of Fashion Datasets for AI Training (인공지능 학습용 패션 데이터셋 최근 동향 조사)

  • Jin, Hailin;Piao, Zhegao;Gu, Yeong Hyeon;Yoo, Seong Joon
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.07a
    • /
    • pp.637-642
    • /
    • 2020
  • 패션산업은 매년 1 조원씩 성장(연평균 2.1%)하며 많은 연구자들의 관심을 받고 있다. 전통적인 패션산업은 점차 디지털화되어 선진적인 컴퓨터 비전 기술을 적용해 소비자들에게 더 좋은 쇼핑 서비스를 제공하고 있다. 본 논문에서는 2014 년부터 2019 년 사이에 구축된 대표적인 패션 데이터셋을 연도별로 정리하고 각 데이터셋에 포함된 주석(annotation)의 특징을 정리했다. 또한 데이터셋이 패션 상품 검출(Fashion detection), 패션 이미지 생성(Fashion image generation), 가상 피팅(Virtual try-on) 그리고 패션 의류 분할(Fashion Clothing segmentation) 등 연구에서의 활용될 수 있는 여부에 대해 분석했다.

  • PDF

Unethical Expressions in Messenger Talks for Interactive Artificial Intelligence (대화형 인공지능을 위한 메신저 대화의 비윤리적 표현 연구)

  • Yelin Go;Kilim Nam;Hyunju Song
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.22-25
    • /
    • 2022
  • 본 연구는 대화형 인공지능이 비윤리적 표현을 학습하거나 생성하는 것을 방지하기 위한 기초적 연구로, 메신저 대화에 나타나는 단어 단위, 구 단위 이상의 비윤리적 표현을 수집하고 그 특성을 분석하였다. 비윤리적 표현은 '욕설, 혐오 및 차별 표현, 공격적 표현, 성적 표현'이 해당된다. 메신저 대화에 나타난 비윤리적 표현은 욕설이 가장 많은 비중을 차지했는데, 욕설에서는 비표준형뿐만 아니라 '존-', '미치다' 등과 같이 맥락을 고려하여 판단해야 하는 경우가 있다. 가장 높은 빈도로 나타난 욕설 '존나류, 씨발류, 새끼류'의 타입-토큰 비율(TTR)을 확인한 결과 '새끼류'의 TTR이 가장 높게 나타났다. 다음으로 메신저 대화에서는 공격적 표현이나 성적인 표현에 비해 혐오 및 차별 표현의 비중이 높았는데, '국적/인종'과 '젠더' 관련된 혐오 및 차별 표현이 특히 높게 나타났다. 혐오 및 차별 표현은 단어 단위보다는 구 단위 이상의 표현의 비중이 높았고 문장 단위로 떨어지기 보다는 대화 전체에 걸쳐 나타나는 것을 확인하였다. 따라서 혐오 및 차별 표현을 탐지하기 위해서는 단어 단위보다는 구 단위 이상 표현의 탐지에 대한 필요성이 있음을 학인하였다.

  • PDF

A Study on Basalization of the Classification in Mountain Ginseng and Plain Ginseng Images in Artificial Intelligence Technology for the Detection of Illegal Mountain Ginseng (불법 산양삼 검출을 위한 인공지능 기술에서의 산양삼과 인삼 이미지의 분류 기저화 연구)

  • Park, Soo-Kyoung;Na, Hojun;Kim, Ji-Hye
    • The Journal of Bigdata
    • /
    • v.5 no.1
    • /
    • pp.209-225
    • /
    • 2020
  • This study tried to establish a base level for the form of ginseng in order to prevent fraud in which novice consumers, who have no information on ginseng and mountain ginseng, regard ginseng as mountain ginseng. To that end, researchers designed a service design in which when a consumer takes a picture of ginseng with an APP dedicated to a smartphone, the photo is sent remotely and the determined results are sent to the consumer based on machine learning data. In order to minimize the difference between the data set in the research process and the background color, location, size, illumination, and color temperature of the mountain ginseng when consumers took pictures through their smartphones, the filming box exclusively for consumers was designed. Accordingly, the collection of mountain ginseng samples was made under the same controlled environment and setting as the designed box. This resulted in a 100% predicted probability from the CNN(VGG16) model using a sample that was about one-tenth less than widley required in machine learning.