• Title/Summary/Keyword: 기계학습알고리즘

Search Result 779, Processing Time 0.031 seconds

Document Autoclustering for Web Agent (웹 에이전트를 위한 문서 자동 분류)

  • 양찬범;박영택
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.54-56
    • /
    • 1999
  • 웹 에이전트는 사용자가 웹을 브라우징하는 행위를 모니터하여 사용자의 관심정보를 학습하고 사용자가 필요로 한느 웹 상의 정보를 제공하는 시스템이다. 웹 에이전트는 사용자의 관심정보를 추출하기 위해서 귀납적 기계학습을 수행한다. 이때, 학습의 효율을 높이기 위해서는 관련이 있는 문서들을 그룹화하여 학습 시스템에 제공하여야 한다. 본 논문에서는 비감독 개념 학습 알고리즘인 COBWEB을 이용하여 사용자가 관심을 표시한 문서들의 분류트리를 생성한다. 분류트리는 귀납적 기계학습 시스템의 입력으로 사용될 수 있는 형태가 아니므로 분류 트리의 분석과 문서 분류 후처리 작업을 통해서 문서 집합을 생성해야 한다. 이를 위해서는 분류트리를 분석하여 초기 클러스터를 생성하고, 유사한 클러스터들의 병합을 수행한다. 본 논문에서 제안하는 문서 자동 분류 방식은 비감독 개념 학습 알고리즘이 생성한 문서 분류 트리의 분석을 통해서 충분한 유사도와 적절한 수의 문서를 포함하는 초기 클러스터를 생성할 수 있다. 그러므로 문서 분류의 후처리 작업인 클러스터의 병합 작업에서 불필요한 작업을 제거함으로서 보다 효과적이고 합리적인 문서 분류 작업을 수행한다.

  • PDF

A study on data collection environment and analysis using virtual server hosting of Azure cloud platform (Azure 클라우드 플랫폼의 가상서버 호스팅을 이용한 데이터 수집환경 및 분석에 관한 연구)

  • Lee, Jaekyu;Cho, Inpyo;Lee, Sangyub
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2020.07a
    • /
    • pp.329-330
    • /
    • 2020
  • 본 논문에서는 Azure 클라우드 플랫폼의 가상서버 호스팅을 이용해 데이터 수집 환경을 구축하고, Azure에서 제공하는 자동화된 기계학습(Automated Machine Learning, AutoML)을 기반으로 데이터 분석 방법에 관한 연구를 수행했다. 가상 서버 호스팅 환경에 LAMP(Linux, Apache, MySQL, PHP)를 설치하여 데이터 수집환경을 구축했으며, 수집된 데이터를 Azure AutoML에 적용하여 자동화된 기계학습을 수행했다. Azure AutoML은 소모적이고 반복적인 기계학습 모델 개발을 자동화하는 프로세스로써 기계학습 솔루션 구현하는데 시간과 자원(Resource)를 절약할 수 있다. 특히, AutoML은 수집된 데이터를 분류와 회귀 및 예측하는데 있어서 학습점수(Training Score)를 기반으로 보유한 데이터에 가장 적합한 기계학습 모델의 순위를 제공한다. 이는 데이터 분석에 필요한 기계학습 모델을 개발하는데 있어서 개발 초기 단계부터 코드를 설계하지 않아도 되며, 전체 기계학습 시스템을 개발 및 구현하기 전에 모델의 구성과 시스템을 설계해볼 수 있기 때문에 매우 효율적으로 활용될 수 있다. 본 논문에서는 NPU(Neural Processing Unit) 학습에 필요한 데이터 수집 환경에 관한 연구를 수행했으며, Azure AutoML을 기반으로 데이터 분류와 회귀 등 가장 효율적인 알고리즘 선정에 관한 연구를 수행했다.

  • PDF

A Study on Smoker Prediction Using Machine Learning Algorithm (기계학습 알고리즘을 이용한 흡연자 예측 연구)

  • Jongwoo Baek;Joonil Bang;Joowon Lee;Hwajong Kim
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.07a
    • /
    • pp.537-538
    • /
    • 2023
  • 본 논문에서는 사람에게서 나타나는 생체 특성과 흡연여부의 상관관계 분석을 위해 랜덤 포레스트와 그래디언트 부스팅 트리의 두 가지 기계학습 알고리즘을 사용하였다. 연구에 사용된 데이터는 국민건강보험공단에서 제공하고 Kaggle에서 취합하여 정리한 건강검진 정보를 사용하였다. 분류 모델의 학습에 있어 혈청 정보가 높은 관계성을 보일 것으로 예상하였으나, 실제 결과는 성별이 가장 큰 영향을 끼치는 것으로 확인되었다.

  • PDF

Sensor Data Collection & Refining System for Machine Learning-Based Cloud (기계학습 기반의 클라우드를 위한 센서 데이터 수집 및 정제 시스템)

  • Hwang, Chi-Gon;Yoon, Chang-Pyo
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.25 no.2
    • /
    • pp.165-170
    • /
    • 2021
  • Machine learning has recently been applied to research in most areas. This is because the results of machine learning are not determined, but the learning of input data creates the objective function, which enables the determination of new data. In addition, the increase in accumulated data affects the accuracy of machine learning results. The data collected here is an important factor in machine learning. The proposed system is a convergence system of cloud systems and local fog systems for service delivery. Thus, the cloud system provides machine learning and infrastructure for services, while the fog system is located in the middle of the cloud and the user to collect and refine data. The data for this application shall be based on the Sensitive data generated by smart devices. The machine learning technique applied to this system uses SVM algorithm for classification and RNN algorithm for status recognition.

연산능력을 기르기 위한 대안적 알고리즘 지도 방안 -사칙연산을 중심으로 -

  • Nam, Seung-In;Gang, Yeong-Ran;Park, In-Muk
    • Communications of Mathematical Education
    • /
    • v.13 no.1
    • /
    • pp.19-38
    • /
    • 2002
  • 알고리즘이란 ‘유한한 단계를 거쳐 일련의 문제를 해결하기 위한 명확하고 체계적인 방법’ 으로써 수량에 관련된 문제를 보다 신속 ${\cdot}$ 정확하게 처리하기 위하여 역사적으로 다양한 알고리즘이 존재 ${\cdot}$ 변천해 왔다. 계산기가 발명되기 전까지는 지필 알고리즘이 매우 강조되어 왔으나 계산기가 상용화되면서 지필알고리즘에 대한 효용성과 활용도가 점차 줄어들고 있으나 지필 알고리즘은 수학학습의 기초 ${\cdot}$ 기본인 동시에 뼈대로써 그 가치와 역할은 여전히 중요하다. 그러나 표준화된 지필 알고리즘에 대한 지나친 강조로 인해 학생들은 대수적 구조나 계산 원리를 바르게 이해하지 못한 채 반복 연습을 통해 익힌 표준 알고리즘을 기계적으로 적용하여 답을 구하는 경우가 많으며, 이로 인해 학생들은 수학학습에 대한 불안감과 기피현상이 보이고 있다. 또 인간의 창조적 사고활동의 최종적인 산물인 표준 알고리즘은 대안적인 알고리즘에 비해 효율성에서 앞서지만 학생들의 사고 수준에서는 그 원리를 이해하기 힘든 경우가 있을 것이다. 따라서 수학교육의 목적 중의 하나인 문제 해결력을 기르기 위해, 그리고 표준 알고리즘의 가치와 효율성을 인식시키고, 수학학습에 대한 불안감을 줄이기 위해 표준 알고리즘뿐만 아니라 대안적인 알고리즘을 병행하여 지도할 필요가 있다.

  • PDF

Development of Image Defect Detection Model Using Machine Learning (기계 학습을 활용한 이미지 결함 검출 모델 개발)

  • Lee, Nam-Yeong;Cho, Hyug-Hyun;Ceong, Hyi-Thaek
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.15 no.3
    • /
    • pp.513-520
    • /
    • 2020
  • Recently, the development of a vision inspection system using machine learning has become more active. This study seeks to develop a defect inspection model using machine learning. Defect detection problems for images correspond to classification problems, which are the method of supervised learning in machine learning. In this study, defect detection models are developed based on algorithms that automatically extract features and algorithms that do not extract features. One-dimensional CNN and two-dimensional CNN are used as algorithms for automatic extraction of features, and MLP and SVM are used as algorithms for non-extracting features. A defect detection model is developed based on four models and their accuracy and AUC compare based on AUC. Although image classification is common in the development of models using CNN, high accuracy and AUC is achieved when developing SVM models by converting pixels from images into RGB values in this study.

Competitive Co-Evolving Neural Network : Host and Parasites (기생체 숙주 이론 기반의 경쟁 공진화 신경망)

  • 박정은;박민재;오경환
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.142-144
    • /
    • 2003
  • 유전자 알고리즘을 사용하여 신경망의 가중치를 학습하는 방법은 역전파 알고리즘이 가지는 여러 가지 문제점을 해결하기 위해 제안되었으나, 유전자 알고리즘 역시 전역 탐색이 아니기 때문에 실세계의 데이터에 적용하기 어려운 가장 큰 장애 요소인 지역 최소점 문제를 완벽하게 해결할 수는 없다. 이러한 지역 최소점 문제를 완화하기 위해 본 논문에서는 기생체-숙주 공진화 현상을 기반으로 한 유전자 알고리즘을 사용한 경쟁 공진화 신경망 학습 방법을 제시하고 있다. 경쟁 공진화는 서로 다를 개체간의 경쟁적인 진화를 통해 궁극적으로 보다 적합도가 높은 개체가 생성되는 이론을 기반으로 하고 있다. 이러한 경쟁 공진화를 통한 신경망 가중치의 학습이 일반적인 유전자 알고리즘을 사용하여 신경망을 학습시키는 것보다 더욱 우수한 가중치 집단을 탐색할 수 있음을 두 종류의 기계 학습 데이터를 통해 입증하였다.

  • PDF

Research Trends on 5G Communications using Machine Learning (기계학습을 활용한 5G통신 동향)

  • Kim, K.Y.;Kim, Y.S.;Nam, J.Y.;Lee, W.Y.;Seo, J.H.;Hong, S.E.
    • Electronics and Telecommunications Trends
    • /
    • v.31 no.5
    • /
    • pp.1-10
    • /
    • 2016
  • 빅데이터를 통한 학습, GPU를 활용한 고속 컴퓨팅 및 다양한 알고리즘 개발과 더불어 기계학습은 다양한 분야에서 종래에 이루어내지 못한 뛰어난 성과를 달성하고 있다. 그동안 상용화된 통신 시스템에서 기계학습이 활성화되지 못했지만, 전례없는 다양한 서비스와 단말을 아우르는 5G 통신에서는 더욱 적극적으로 활용될 것으로 예상된다. 기계학습은 링크 적응 등 무선접속기술, 다양한 망이 혼재된 이종망 기술, 트래픽 분류 등을 위한 네트워크 기술, 침입 탐지를 위한 보안 기술 등 다양한 통신기술에서 연구됐다. 또한, 최근에는 유럽의 Public Private Partnership(5G PPP) 프로젝트를 비롯하여 다양한 그룹에서 활발히 연구되고 있으며, 컬컴/노키아/에릭슨 등 통신 관련 기업들도 적극적인 투자를 하고 있다. 본고에서는 기계학습 관련 통신기술, 연구그룹 및 기업 동향을 소개하고, 이를 통해 5G 통신 적용 가능성을 짚어본다.

  • PDF

Developing Reinforcement Learning based Job Allocation Model by Using FlexSim Software (FlexSim 소프트웨어를 이용한 강화학습 기반 작업 할당 모형 개발)

  • Jin-Sung Park;Jun-Woo Kim
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.01a
    • /
    • pp.311-313
    • /
    • 2023
  • 병렬 기계 작업장에서 자원을 효율적으로 활용하기 위해서는 처리할 작업을 적절한 기계에 할당해야 한다. 특정 작업을 처리할 기계를 선택할 때 휴리스틱을 사용할 수도 있으나, 특정 작업장에 맞춤화된 휴리스틱을 개발하는 것은 쉽지 않다. 반면, 본 논문에서는 이종 병렬 기계 작업장을 위한 작업 할당 모형을 개발하는데 강화학습을 응용하고자 한다. 작업 할당 모형을 학습하는데 필요한 에피소드들은 상용 시뮬레이션 소프트웨어인 FlexSim을 이용하여 생성하였다. 아울러, stable-baseline3 라이브러리를 이용하여 강화학습 알고리즘을 생성된 에피소드들에 적용하였다. 실험 결과를 통해 시뮬레이션과 강화학습이 작업장 운영관리에 유용함을 알 수 있었다.

  • PDF

Prediction of Citizens' Emotions on Home Mortgage Rates Using Machine Learning Algorithms (기계학습 알고리즘을 이용한 주택 모기지 금리에 대한 시민들의 감정예측)

  • Kim, Yun-Ki
    • Journal of Cadastre & Land InformatiX
    • /
    • v.49 no.1
    • /
    • pp.65-84
    • /
    • 2019
  • This study attempted to predict citizens' emotions regarding mortgage rates using machine learning algorithms. To accomplish the research purpose, I reviewed the related literature and then set up two research questions. To find the answers to the research questions, I classified emotions according to Akman's classification and then predicted citizens' emotions on mortgage rates using six machine learning algorithms. The results showed that AdaBoost was the best classifier in all evaluation categories. However, the performance level of Naive Bayes was found to be lower than those of other classifiers. Also, this study conducted a ROC analysis to identify which classifier predicts each emotion category well. The results demonstrated that AdaBoost was the best predictor of the residents' emotions on home mortgage rates in all emotion categories. However, in the sadness class, the performance levels of the six algorithms used in this study were much lower than those in the other emotion categories.