• 제목/요약/키워드: 자동화 머신러닝

검색결과 64건 처리시간 0.028초

트랜잭션 기반 머신러닝에서 특성 추출 자동화를 위한 딥러닝 응용 (A Deep Learning Application for Automated Feature Extraction in Transaction-based Machine Learning)

  • 우덕채;문현실;권순범;조윤호
    • 한국IT서비스학회지
    • /
    • 제18권2호
    • /
    • pp.143-159
    • /
    • 2019
  • Machine learning (ML) is a method of fitting given data to a mathematical model to derive insights or to predict. In the age of big data, where the amount of available data increases exponentially due to the development of information technology and smart devices, ML shows high prediction performance due to pattern detection without bias. The feature engineering that generates the features that can explain the problem to be solved in the ML process has a great influence on the performance and its importance is continuously emphasized. Despite this importance, however, it is still considered a difficult task as it requires a thorough understanding of the domain characteristics as well as an understanding of source data and the iterative procedure. Therefore, we propose methods to apply deep learning for solving the complexity and difficulty of feature extraction and improving the performance of ML model. Unlike other techniques, the most common reason for the superior performance of deep learning techniques in complex unstructured data processing is that it is possible to extract features from the source data itself. In order to apply these advantages to the business problems, we propose deep learning based methods that can automatically extract features from transaction data or directly predict and classify target variables. In particular, we applied techniques that show high performance in existing text processing based on the structural similarity between transaction data and text data. And we also verified the suitability of each method according to the characteristics of transaction data. Through our study, it is possible not only to search for the possibility of automated feature extraction but also to obtain a benchmark model that shows a certain level of performance before performing the feature extraction task by a human. In addition, it is expected that it will be able to provide guidelines for choosing a suitable deep learning model based on the business problem and the data characteristics.

인공지능을 활용한 정책의사결정에 관한 탐색적 연구: 문제구조화 유형으로 살펴 본 성공과 실패 사례 분석 (An Exploratory Study on Policy Decision Making with Artificial Intelligence: Applying Problem Structuring Typology on Success and Failure Cases)

  • 은종환;황성수
    • 정보화정책
    • /
    • 제27권4호
    • /
    • pp.47-66
    • /
    • 2020
  • 머신러닝과 딥러닝 등 인공지능 기술의 급속한 발전은 행정-정책 분야에도 영향을 확대하고 있다. 이 논문은 데이터분석과 알고리즘의 발전으로 자동화된 구성과 운용을 설계하는 인공지능 시대의 정책의사결정에 관한 탐색적 연구이다. 이 연구의 의의는 정책의사결정에서의 주요 연구 중 하나인 정책 문제의 문제구조화를 기반으로 하여, 문제정의가 잘 구조화된 정도에 따른 유형으로 이론적 틀을 구성하여 성공과 실패 사례를 구분하고 분석해서 시사점을 도출하였다. 즉 문제구조화가 어려운 유형일수록 인공지능을 활용한 의사결정의 실패 혹은 부작용의 우려가 크다는 것이다. 또한 알고리즘의 중립성여부에 대한 우려도 제시하였다. 정책적 제언으로는 우리나라 인공지능 추진체계구축 시 기술적 측면과 사회적 측면의 전문가들이 전문적으로 역할을 하는 소위원회를 병렬적으로 두고 이 소위원회들이 종합적, 융합적으로도 작동할 수 있는 운영의 묘를 발휘하는 거버넌스 추진체계 구축이 필요함을 제시하고 있다.

스마트 팩토리에서 머신 러닝 기반 설비 장애진단 예측 시스템 (A Predictive System for Equipment Fault Diagnosis based on Machine Learning in Smart Factory)

  • 조재형;이재오
    • KNOM Review
    • /
    • 제24권1호
    • /
    • pp.13-19
    • /
    • 2021
  • 최근 산업 분야에서는 공장 자동화 뿐만 아니라 장애 진단/예측을 통해 고장/사고를 사전에 방지하여 생산량을 극대화하기 위한 연구가 진행되고 있으며, 이를 구성하기 위해 많은 양의 데이터 축적을 위한 클라우드 기술, 데이터 처리를 위한 빅 데이터 기술, 그리고 데이터 분석을 쉽게 진행하기 위한 AI(Artificial Intelligence)기술이 도입되고 있다. 또한 최근에는 장애 진단/예측의 발전으로 인해 설비 유지보수(PM: Productive Maintenance) 방식도 정기적으로 설비를 유지보수 하는 방식인 TBM(Time Based Maintenance)에서 설비 상태에 따라 유지보수 하는 방식인 CBM(Condition Based Maintenance)을 조합하는 방식으로 발전하고 있다. CBM 기반 유지보수를 수행하기 위하여 설비의 상태(condition)의 정의와 분석이 필요하다. 따라서 본 논문에서는 머신 러닝(Machine Learning) 기반의 장애 진단을 위한 시스템 및 데이터 모델(Data Model)을 제안하며, 이를 기반으로 장애를 사전 예측한 사례를 제시하고자 한다.

흉부 X-ray 기반 의료영상 품질평가 보조 도구 개발 (Development of Medical Image Quality Assessment Tool Based on Chest X-ray)

  • 남기현;유동연;김양곤;선주성;이정원
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권6호
    • /
    • pp.243-250
    • /
    • 2023
  • 흉부 X-ray 영상은 폐와 심장을 검사하는 방사선 검사이며 특히, 폐 질환을 진단하는 데 널리 사용되고 있다. 이러한 흉부 X-ray의 품질은 의사의 진단에 영향을 줄 수 있으므로 품질을 평가하는 과정이 필수적으로 거쳐야 하는데, 이 과정은 영상의학과 전문의의 주관이 개입될 수 있고, 수작업으로 이루어지기 때문에 많은 시간과 비용이 소모된다. 또한, 이러한 품질평가는 X-ray 영상의 특징과 사용 목적에 따라 일반적인 품질평가와는 다른 평가 요소가 필요하다. 따라서 본 논문에서는 X-ray 영상에서 검출되는 장기의 해상도, ,해부학적인 구조, 균형 등을 고려하여 임상 현장에서 사용되는 흉부 X-ray 영상 화질 평가 가이드라인을 적용하여 품질요소를 5가지(인공음영, 포함범위, 환자자세, 흡기정도, 그리고 투과상태)로 나누고 이를 자동화하는 도구를 제안한다. 제안하는 도구는 수작업으로 품질평가를 진행하는 본래의 방식 대비 소요 시간과 비용을 줄여주고, 더 나아가 흉부 X-ray를 이용한 학습 모델 개발에 높은 품질의 학습데이터를 선별하는 과정에도 사용될 수 있다.

다각형 이미지의 방향 결정을 이용한 새로운 CAPTCHA 시스템의 설계 (Design of A New CAPTCHA System using Detecting Orientation of Polygonal Image)

  • 정우근;김종우;조환규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.766-769
    • /
    • 2010
  • CAPTCHA 시스템은 스팸이나 로봇에 의한 자동 가입, 계정 생성 방지도구로써 인간의 우수한 가독성을 통해 특정 언어 또는 그림을 해독할 수 있는 특성을 이용한 것으로 일반적으로 컴퓨터 프로그램이 해독하기 어려운 기호, 글자 등을 재입력하도록 하여 스팸을 위한 자동화 도구 등을 무력화 시키는 보안 기술이다. 하지만 기존에 존재하였던 텍스트 기반의 시스템은 웹봇이나 머신 러닝등을 통하여 쉽게 통과할 수 있는 단점을 나타냈다. 우리는 이러한 단점을 보완하고자 새로운 이미지 기반의 CAPTCHA 시스템을 제안하였다. 제안된 시스템은 일반적인 사진에서 부분 이미지를 출력, 무작위 회전을 가하여 사용자에게 올바른 교정을 요하는 시스템이었다. 본 논문에서는 일반적인 사진에서 출력되는 부분 이미지의 형태를 다각형으로 추출하여, 사용자에게 좀 더 인식률을 높일 수 있는 서브 이미지의 형태를 찾고, 좀 더 효과적이고 실용적일수 있는 CAPTCHA 시스템을 제안하고자 한다. 본 논문에서 제공하는 다각형의 형태는 정사각형, 정오각형, 정육각형, 정칠각형 그리고 정팔각형이다. 총 5가지 형태의 다각형 중에서 사용자에게 가장 효과적인 다각형을 실험을 통하여 찾을 것이다.

머신러닝 기반의 자동화된 소스 싱크 분류 및 하이브리드 분석을 통한 개인정보 유출 탐지 방법 (Machine Learning Based Automated Source, Sink Categorization for Hybrid Approach of Privacy Leak Detection)

  • 심현석;정수환
    • 정보보호학회논문지
    • /
    • 제30권4호
    • /
    • pp.657-667
    • /
    • 2020
  • 안드로이드 프레임워크는 단 한번의 권한 허용을 통해 앱이 사용자의 정보를 자유롭게 이용할 수 있으며, 유출되는 데이터가 개인정보임을 식별하기 어렵다는 문제가 있다. 따라서 본 논문에서는 어플리케이션을 통해 유출되는 데이터를 분석하여, 해당 데이터가 실제로 개인정보에 해당하는 것인지를 파악하는 기준을 제시한다. 이를 위해 우리는 제어 흐름 그래프를 기반으로 소스와 싱크를 추출하며, 소스에서 싱크까지의 흐름이 존재하는 경우 사용자의 개인정보를 유출하는지 확인한다. 이 과정에서 우리는 구글에서 제공하는 위험한 권한 정보를 기준으로 개인정보와 직결되는 소스와 싱크를 선별하며, 동적분석 툴을 통해 각 API에 대한 정보를 후킹한다. 후킹되는 데이터를 통해 사용자는 해당 어플리케이션이 실제로 개인정보를 유출한다면 어떤 개인정보를 유출하는지 여부를 파악할 수 있다. 우리는 툴을 최신 버전의 API에 적용하기 위해 머신러닝을 통해 최신 버전의 안드로이드의 소스와 싱크를 분류하였으며, 이를 통해 86%의 정확도로 최신 배포 버전인 9.0 안드로이드의 API를 분류하였다. 또한 툴은 2,802개의 APK를 통해 평가되었으며, 개인정보를 유출하는 850개의 APK를 탐지하였다.

심층신경망을 활용한 데이터 기반 ESG 성과 예측에 관한 연구: 기업 재무 정보를 중심으로 (Predicting Future ESG Performance using Past Corporate Financial Information: Application of Deep Neural Networks)

  • 김민승;문승환;최성원
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.85-100
    • /
    • 2023
  • 최근 기업의 지속가능경영 역량으로 대변되는 기업 ESG 성과(environmental, social, and corporate governance)가 투자의사 결정에 주요 요인 중 하나로 부각되고 있다. 전통적 ESG 성과 평가 프로세스는 평가기관마다의 고유 기준에 따라 질적 정성적 방식으로 수행되어 그 평가 소요 시간 및 비용이 큰 데 비해 투자의사 결정 시 신뢰성과 예측 가능성 및 적시성에 제약이 존재한다. 이에 본 연구에서는 정량화되고 공개된 기업 재무 정보를 활용하여 머신러닝을 통한 자동화된 기업 ESG 평가 예측을 시도하였다. 심층신경망 기법을 활용해 2019년부터 2021년까지 3년간 한국ESG기준원에서 제공한 1,780건의 ESG 평가에 대하여 총 12종(21,360건)의 시장 공개 재무 정보를 기반으로 예측 모형을 구축한 결과, 제안된 심층신경망 모형은 약 86%의 분류성능을 보여 여타 비교모형 대비 크게 높은 정확도를 나타냈다. 본 연구는 정량적이고 공개된 과거 기업 재무 정보만으로도 자동화된 프로세스를 통해 비교적 정확한 미래 ESG 평가 예측을 달성할 수 있었다는 점에 의의가 크다. 특히 기업 ESG 관련 정보 접근이 상대적으로 불리한 일반 투자자들의 입장에서 볼 때 낮은 비용과 적은 시간 투자로도 기업 ESG 성과 평가에 대한 예측 가능성과 적시성을 향상 시킬 수 있다는 점에 실용적 함의가 있다. 또한 본 연구는 향후 추가적인 국내외 데이터 수집 및 모형 고도화를 통해 기업 ESG 성과 예측 분야에서의 확장이 기대된다.

머신러닝을 활용한 수도권 약수터 수질 예측 모델 개발 (Development of a water quality prediction model for mineral springs in the metropolitan area using machine learning)

  • 임영우;엄지연;곽기영
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.307-325
    • /
    • 2023
  • 코로나19 팬데믹의 장기화로 인해 실내 생활에 지쳐가는 사람들이 우울감, 무기력증 등을 해소하기 위해 근거리의 산과 국립공원을 찾는 빈도가 폭발적으로 증가하였다. 자연으로 나온 수많은 사람들이 오가는 걸음을 멈추고 숨을 돌리며 쉬어가는 장소가 있는데 바로 약수터이다. 산이나 국립공원이 아니더라도 근린공원 또는 산책로에서도 간간이 찾아볼 수 있는 약수터는 수도권에만 약 6백여개가 위치해 있다. 하지만 불규칙적이고 수작업으로 수행되는 수질검사로 인해 사람들은 실시간으로 검사 결과를 알 수 없는 상태에서 약수를 음용하게 된다. 따라서 본 연구에서는 약수터 수질에 영향을 미치는 요인을 탐색하고 다양한 곳에 흩어져 있는 데이터를 수집하여 실시간으로 약수터 수질을 예측할 수 있는 모델을 개발하고자 한다. 데이터 수집의 한계로 인해 서울과 경기로 지역을 한정한 후 데이터 관리가 잘 이루어지고 있는 18개 시의 약 300여개 약수터를 대상으로 2015~2020년의 수질 검사 데이터를 확보하였다. 약수터 수질 적합 여부에 영향을 미칠 것으로 여겨지는 다양한 요인들 중 두 차례의 검토를 거쳐 총 10개의 요인을 최종 선별하였다. 최근 주목받고 있는 자동화 머신러닝 기술인 AutoML 기법을 활용하여 20여가지의 머신러닝 기법들 중 예측 성능 기준 상위 5개의 모델을 도출하였으며 그 중 catboost 모델이 75.26%의 예측 분류 정확도로 가장 높은 성능을 가지고 있음을 확인하였다. 추가로 SHAP 기법을 통해 분석에 사용한 변인들이 예측에 미치는 절대적인 영향력을 살펴본 결과 직전 수질 검사에서 부적합 판정을 받았는지 여부가 가장 중요한 요인이었으며 그 외 평균 기온, 과거 연속 2번 수질 부적합 판정 기록 유무, 수질 검사 당일 기온, 약수터 고도 등이 수질 부적합 여부에 영향을 미치고 있음을 확인하였다.

머신러닝 알고리즘 기반 반도체 자동화를 위한 이송로봇 고장진단에 대한 연구 (A Study on the Failure Diagnosis of Transfer Robot for Semiconductor Automation Based on Machine Learning Algorithm)

  • 김미진;고광인;구교문;심재홍;김기현
    • 반도체디스플레이기술학회지
    • /
    • 제21권4호
    • /
    • pp.65-70
    • /
    • 2022
  • In manufacturing and semiconductor industries, transfer robots increase productivity through accurate and continuous work. Due to the nature of the semiconductor process, there are environments where humans cannot intervene to maintain internal temperature and humidity in a clean room. So, transport robots take responsibility over humans. In such an environment where the manpower of the process is cutting down, the lack of maintenance and management technology of the machine may adversely affect the production, and that's why it is necessary to develop a technology for the machine failure diagnosis system. Therefore, this paper tries to identify various causes of failure of transport robots that are widely used in semiconductor automation, and the Prognostics and Health Management (PHM) method is considered for determining and predicting the process of failures. The robot mainly fails in the driving unit due to long-term repetitive motion, and the core components of the driving unit are motors and gear reducer. A simulation drive unit was manufactured and tested around this component and then applied to 6-axis vertical multi-joint robots used in actual industrial sites. Vibration data was collected for each cause of failure of the robot, and then the collected data was processed through signal processing and frequency analysis. The processed data can determine the fault of the robot by utilizing machine learning algorithms such as SVM (Support Vector Machine) and KNN (K-Nearest Neighbor). As a result, the PHM environment was built based on machine learning algorithms using SVM and KNN, confirming that failure prediction was partially possible.

머신러닝을 위한 의료영상기반 학습 데이터 지원 플랫폼 구축 및 근감소증 데이터 AI 응용 (Construction of Medical Image-Based Learning Data Support Platform for Machine Learning and Its Application of Sarcopenia Data AI)

  • 김지언;임동욱;유영주;노시형;이충섭;김태훈;정창원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.434-436
    • /
    • 2021
  • 의료산업은 진단 및 치료 위주의 기술개발이 진행되어왔다. 최근 의료 빅데이터를 기반으로 진단, 치료 및 재활뿐만 아니라 예방과 예후관리까지 지원하는 의료서비스에 대한 패러다임이 변화되고 있다. 특히, 여러 의료 중심의 플랫폼 기술 가운데 객관적인 진단지표를 가지고 있는 의료영상을 기반으로 인공지능 학습에 적용하여 진단 및 예측을 중심으로 한 플랫폼 개발이 진행되고 있다. 하지만, 인공지능 연구에는 많은 학습 데이터가 요구될 뿐만 아니라 학습에 적용하기 위해서는 데이터 특성에 따른 전처리 기술과 분류 작업에 많은 시간 소요되어 이와 같은 문제점을 해결할 수 있는 방법들이 요구되고 있다. 따라서, 본 논문은 인공지능 학습까지 적용하기 위한 의료영상 데이터에 대한 확장 모델을 개발하여 공통적인 조건에 따라 의료영상 데이터가 표준화되어 변환하며, 자동화 시스템 구조에 따라 데이터가 분류·저장되어 인공지능 학습까지 지원할 수 있는 플랫폼을 제안하고자 한다. 그리고 근감소증 학습데이터 관리 및 적용 결과를 통해 플랫폼의 수행성을 검증하였다. 향후 제안한 플랫폼을 통해 의료데이터에 대한 전처리, 분류, 관리까지 지원함으로써 CDM 확장 표준 의료데이터 플랫폼으로 활용 가능성을 보였다.