• 제목/요약/키워드: Auto Classification

검색결과 165건 처리시간 0.022초

머신러닝 기법을 이용한 로터리 킬른 공정의 질소산화물 배출예측에 관한 연구 (A Study on the Prediction of Nitrogen Oxide Emissions in Rotary Kiln Process using Machine Learning)

  • 유제형;박정열;배재권
    • 산업융합연구
    • /
    • 제21권7호
    • /
    • pp.19-27
    • /
    • 2023
  • 이차전지 시장의 확대에 따라 니켈 산화광을 로터리 킬른 및 전기로 공법을 이용하여 생산하는 공정이 전 세계적으로 확대되고 있는 상황이며 지속가능한 ESG 경영 확대에 따라 배출가스 내 질소산화물 등 대기오염물질 관리가 강화되고 있다. 건식니켈제련 공정의 주요 설비 중 하나인 로터리 킬른은 광석의 건조와 예비환원을 위한 설비이며 운전 중 질소산화물이 생성되므로 질소산화물 농도 예측 운전이 필요하다. 본 연구에서는 회귀 예측을 위한 LSTM 모델과 분류 예측을 위한 LightGBM 모델을 적용한 AutoML을 사용하여 모델을 최적화 하였다. LSTM을 적용 시 5분 후 예측 값은 상관계수 0.86, MAE 5.13ppm, 40분 후 예측 값은 상관계수 0.38, MAE 10.84ppm의 결과를 얻었다. 분류 예측을 위한 LightGBM 적용 결과 Test 정확도는 5분 후 0.75에서 40분 후 0.61로 상승하여 실제 조업에 활용할 수 있는 수준까지 상승되었고 AutoML을 통한 모델 최적화 결과 5분 후 예측 값의 정확도는 0.75에서 0.80까지, 40분 후의 예측 정확도는 0.61에서 0.70까지 향상되었다. 본 연구를 통해 로터리 킬른 질소산화물 예측 값을 실제 조업에 적용하여 대기오염물질 배출규제 준수 및 ESG 경영에 기여할 수 있다.

인보이스 서류 영상의 테이블 헤더 문자 분류를 통한 구매 정보 추출 모델 (Purchase Information Extraction Model From Scanned Invoice Document Image By Classification Of Invoice Table Header Texts)

  • 신현경
    • 디지털융복합연구
    • /
    • 제10권11호
    • /
    • pp.383-387
    • /
    • 2012
  • 스캔된 인보이스에 특화된 서류 관리 자동화 시스템 구축에있어서 추출된 금전적 데이터의 정확도에대한 엄격한 요구는 인보이스 테이블을 위한 발생적 모델 설계에서 자체 인증 절차를 포함하는 것을 필요로 한다. 가격 = 단가 ${\times}$ 구매수량과 같은 내부적 관계식을 활용한 단순한 인증 절차를 사용하는 것이 전형적 방법론이다. 본 논문에서 는 영상내 테이블 헤더 부분의 탐색과 탐색된 헤더의 컬럼 구분자를 활용하는 개선된 자동 인증 절차를 갖춘 인보이스내 정보 추출 모델을 제안한다.

Automated Link Tracing for Classification of Malicious Websites in Malware Distribution Networks

  • Choi, Sang-Yong;Lim, Chang Gyoon;Kim, Yong-Min
    • Journal of Information Processing Systems
    • /
    • 제15권1호
    • /
    • pp.100-115
    • /
    • 2019
  • Malicious code distribution on the Internet is one of the most critical Internet-based threats and distribution technology has evolved to bypass detection systems. As a new defense against the detection bypass technology of malicious attackers, this study proposes the automated tracing of malicious websites in a malware distribution network (MDN). The proposed technology extracts automated links and classifies websites into malicious and normal websites based on link structure. Even if attackers use a new distribution technology, website classification is possible as long as the connections are established through automated links. The use of a real web-browser and proxy server enables an adequate response to attackers' perception of analysis environments and evasion technology and prevents analysis environments from being infected by malicious code. The validity and accuracy of the proposed method for classification are verified using 20,000 links, 10,000 each from normal and malicious websites.

불균형 클래스에서 AutoML 기반 분류 모델의 성능 향상을 위한 데이터 처리 (Data Processing of AutoML-based Classification Models for Improving Performance in Unbalanced Classes)

  • 이동준;강지수;정경용
    • 융합정보논문지
    • /
    • 제11권6호
    • /
    • pp.49-54
    • /
    • 2021
  • 최근 스마트 헬스케어 기술의 발전에 따라 일상적인 질환에 대한 관심이 증가하고 있다. 이에 따라 헬스케어 데이터를 통해 예측 모델로 질병을 분석하거나 예측하는 연구들이 증가하고 있다. 그러나 헬스케어 데이터에는 양성 데이터와 음성 데이터의 불균형이 존재한다. 이는 특정 질환을 가진 환자에 비하여 상대적으로 환자가 아닌 사람이 많아 데이터 수집에 어려움이 있어 발생하는 현상이다. 데이터 불균형은 질병 예측 및 탐지 시 진행하는 모델의 성능에 영향을 끼치기 때문에 이를 제거할 필요가 있다. 따라서 본 연구에서는 오버샘플링과 결측값 대치를 통해서 데이터 불균형을 해소한다. AutoML을 기반으로 여러 모델의 성능을 파악하고 모델 중 상위 3개의 모델을 앙상블한다.

Fully Automatic Coronary Calcium Score Software Empowered by Artificial Intelligence Technology: Validation Study Using Three CT Cohorts

  • June-Goo Lee;HeeSoo Kim;Heejun Kang;Hyun Jung Koo;Joon-Won Kang;Young-Hak Kim;Dong Hyun Yang
    • Korean Journal of Radiology
    • /
    • 제22권11호
    • /
    • pp.1764-1776
    • /
    • 2021
  • Objective: This study aimed to validate a deep learning-based fully automatic calcium scoring (coronary artery calcium [CAC]_auto) system using previously published cardiac computed tomography (CT) cohort data with the manually segmented coronary calcium scoring (CAC_hand) system as the reference standard. Materials and Methods: We developed the CAC_auto system using 100 co-registered, non-enhanced and contrast-enhanced CT scans. For the validation of the CAC_auto system, three previously published CT cohorts (n = 2985) were chosen to represent different clinical scenarios (i.e., 2647 asymptomatic, 220 symptomatic, 118 valve disease) and four CT models. The performance of the CAC_auto system in detecting coronary calcium was determined. The reliability of the system in measuring the Agatston score as compared with CAC_hand was also evaluated per vessel and per patient using intraclass correlation coefficients (ICCs) and Bland-Altman analysis. The agreement between CAC_auto and CAC_hand based on the cardiovascular risk stratification categories (Agatston score: 0, 1-10, 11-100, 101-400, > 400) was evaluated. Results: In 2985 patients, 6218 coronary calcium lesions were identified using CAC_hand. The per-lesion sensitivity and false-positive rate of the CAC_auto system in detecting coronary calcium were 93.3% (5800 of 6218) and 0.11 false-positive lesions per patient, respectively. The CAC_auto system, in measuring the Agatston score, yielded ICCs of 0.99 for all the vessels (left main 0.91, left anterior descending 0.99, left circumflex 0.96, right coronary 0.99). The limits of agreement between CAC_auto and CAC_hand were 1.6 ± 52.2. The linearly weighted kappa value for the Agatston score categorization was 0.94. The main causes of false-positive results were image noise (29.1%, 97/333 lesions), aortic wall calcification (25.5%, 85/333 lesions), and pericardial calcification (24.3%, 81/333 lesions). Conclusion: The atlas-based CAC_auto empowered by deep learning provided accurate calcium score measurement as compared with manual method and risk category classification, which could potentially streamline CAC imaging workflows.

검출과 분류기능이 탑재된 실시간 지능형 PTZ카메라 (Real-Time PTZ Camera with Detection and Classification Functionalities)

  • 박종화;안태기;전지혜;조병목;박구만
    • 한국통신학회논문지
    • /
    • 제36권2C호
    • /
    • pp.78-85
    • /
    • 2011
  • 본 논문에서는 카메라 자체에서 움직임을 검출하고 분류된 객체를 추척할 수 있는 지능형 PTZ 카메라 시스템을 제안하였다. 추적하고자 하는 객체가 검출되면 분류하고, 객체의 움직임에 따라 PTZ 카메라가 실시간으로 추적한다. 검출을 위해 GMM을 사용하였고 검출성능을 높이기 위해 그림자 제거 기법을 적용하였다. 검출된 객체의 분류를 위해 Legendre 모멘트를 적용하였다. 본 논문에서는 카메라의 초점 조절을 사용하지않고 영상의 중심과 객체와의 방향, 거리, 속도 정보만을 이용하여 PTZ 카메라의 움직임을 제어하는 방법을 제안하였다. TI DM6446 Davinci를 이용하여 실시간으로 객체의 검출, 분류와 추적이 가능한 카메라 시스템을 구성하였다. 실험 결과 사람과 차량을 구분하고, 움직임의 속도가 빠른 차량에 대해서도 본 추적시스템은 안정적으로 동작함을 확인하였다.

표적 구분을 위한 ISAR 영상 기법에 대한 연구 (A Study on ISAR Imaging Algorithm for Radar Target Recognition)

  • 박종일;김경태
    • 한국전자파학회논문지
    • /
    • 제19권3호
    • /
    • pp.294-303
    • /
    • 2008
  • ISAR(Inverse Synthetic Aperture Radar) 영상은 표적에 대한 RCS(Radar Cross Section)를 2차원 공간에 표현하며, 표적구분에 이용될 수 있다. 2차원 IFFT(Inverse fast Fourier Transform)를 이용하여 쉽고 빠르게 ISAR 영상을 만들 수 있다. 하지만 IFFT를 이용하여 만든 ISAR 영상은 측정된 주파수 대역 폭과 각도 영역이 작아질 경우 해상도가 떨어지게 된다. 이를 해결하기 위해 AR(Auto Regressive), MUSIC(Multiple SIgnal Classification), Modified MUSIC과 같은 고해상도 스펙트럼 예측 기법을 이용하여 주파수 대역 폭과 각도 영역이 작아도 높은 해상도의 ISAR 영상을 만들 수 있다. 본 논문에서는 IFFT, AR, MUSIC, Modified MUSIC 기법을 적용하여 만든 ISAR 영상을 이용하여 표적 구분에 이용하고, 표적 구분에 적절한 ISAR 영상을 얻기 위한 고해상도 기법을 연구한다. 그리고 표적 구분 결과를 보여준다.

자기연상 다층퍼셉트론의 이상 탐지 성질 분석 (Analysis of Novelty Detection Properties of Autoassociative MLP)

  • 이형주;황병호;조성준
    • 대한산업공학회지
    • /
    • 제28권2호
    • /
    • pp.147-161
    • /
    • 2002
  • In novelty detection, one attempts to discriminate abnormal patterns from normal ones. Novelty detection is quite difficult since, unlike usual two class classification problems, only normal patterns are available for training. Auto-Associative Multi-Layer Perceptron (AAMLP) has been shown to provide a good performance based upon the property that novel patterns usually have larger auto-associative errors. In this paper, we give a mathematical analysis of 2-layer AAMLP's output characteristics and empirical results of 2-layer and 4-layer AAMLPs. Various activation functions such as linear, saturated linear and sigmoid are compared. The 2-layer AAMLPs cannot identify non-linear boundaries while the 4-layer ones can. When the data distribution is multi-modal, then an ensemble of AAMLPs, each of which is trained with pre-clustered data is required. This paper contributes to understanding of AAMLP networks and leads to practical recommendations regarding its use.

Comparative Study of Dimension Reduction Methods for Highly Imbalanced Overlapping Churn Data

  • Lee, Sujee;Koo, Bonhyo;Jung, Kyu-Hwan
    • Industrial Engineering and Management Systems
    • /
    • 제13권4호
    • /
    • pp.454-462
    • /
    • 2014
  • Retention of possible churning customer is one of the most important issues in customer relationship management, so companies try to predict churn customers using their large-scale high-dimensional data. This study focuses on dealing with large data sets by reducing the dimensionality. By using six different dimension reduction methods-Principal Component Analysis (PCA), factor analysis (FA), locally linear embedding (LLE), local tangent space alignment (LTSA), locally preserving projections (LPP), and deep auto-encoder-our experiments apply each dimension reduction method to the training data, build a classification model using the mapped data and then measure the performance using hit rate to compare the dimension reduction methods. In the result, PCA shows good performance despite its simplicity, and the deep auto-encoder gives the best overall performance. These results can be explained by the characteristics of the churn prediction data that is highly correlated and overlapped over the classes. We also proposed a simple out-of-sample extension method for the nonlinear dimension reduction methods, LLE and LTSA, utilizing the characteristic of the data.

Comparing automated and non-automated machine learning for autism spectrum disorders classification using facial images

  • Elshoky, Basma Ramdan Gamal;Younis, Eman M.G.;Ali, Abdelmgeid Amin;Ibrahim, Osman Ali Sadek
    • ETRI Journal
    • /
    • 제44권4호
    • /
    • pp.613-623
    • /
    • 2022
  • Autism spectrum disorder (ASD) is a developmental disorder associated with cognitive and neurobehavioral disorders. It affects the person's behavior and performance. Autism affects verbal and non-verbal communication in social interactions. Early screening and diagnosis of ASD are essential and helpful for early educational planning and treatment, the provision of family support, and for providing appropriate medical support for the child on time. Thus, developing automated methods for diagnosing ASD is becoming an essential need. Herein, we investigate using various machine learning methods to build predictive models for diagnosing ASD in children using facial images. To achieve this, we used an autistic children dataset containing 2936 facial images of children with autism and typical children. In application, we used classical machine learning methods, such as support vector machine and random forest. In addition to using deep-learning methods, we used a state-of-the-art method, that is, automated machine learning (AutoML). We compared the results obtained from the existing techniques. Consequently, we obtained that AutoML achieved the highest performance of approximately 96% accuracy via the Hyperpot and tree-based pipeline optimization tool optimization. Furthermore, AutoML methods enabled us to easily find the best parameter settings without any human efforts for feature engineering.