• 제목/요약/키워드: Artificial neural

검색결과 3,623건 처리시간 0.033초

머신 러닝을 이용한 밸브 사이즈 및 종류 예측 모델 개발 (Data-driven Modeling for Valve Size and Type Prediction Using Machine Learning)

  • 김찬호;최민식;주종효;이아름;윤건;조성호;김정환
    • Korean Chemical Engineering Research
    • /
    • 제62권3호
    • /
    • pp.214-224
    • /
    • 2024
  • 밸브는 유량과 압력 조절 등의 중요한 역할을 수행하며, 적절한 밸브 사이즈와 유형 선택이 필요하다. Engineering Procurement Construction (EPC) 산업에선 밸브 사이즈 계수(Cv)의 수식적 계산을 바탕으로 사이즈와 유형을 선정해왔으나 이러한 방식은 전문가의 많은 시간과 비용이 요구되어 비효율적이다. 본 연구는 이를 해결하기위해 머신 러닝기법을 이용한 밸브 사이즈 및 유형 예측 모델을 개발하였다. Artificial neural network (ANN), Random Forest, XGBoost, Catboost의알고리즘을 적용하여 모델들을 개발하였으며, 평가 지표로는 사이즈 예측에는 Normalized root mean squared error (NRMSE)와 R2를, 종류 예측에는 F1 score를 적용하였다. 또한, 유체 상에 따른 영향을 확인하고자 유체 전체, 액체, 기체, 스팀의 4개의 데이터 세트로 사례 연구를 진행하였다. 연구 결과, 사이즈의 경우 전체, 액체, 기체에선 Catboost(R2기준, 전체: 0.99216, 액체: 0.98602, 기체: 0.99300. NRMSE 기준, 전체: 0.04072, 액체: 0.04886, 기체: 0.03619)가, 스팀에선 Random Forest가(R2: 0.99028, NRMSE: 0.03493) 가장 뛰어난 모델임을 확인하였다. 종류의 경우 Catboost가 모든 데이터에서 가장 높은 성과를 제시하였다(F1 score 기준, 전체: 0.95766, 액체: 0.96264, 기체: 0.95770, 스팀: 1.0000). 본 연구에서 제안한 모델들을 적용할 경우, 주어진 조건에 따른 밸브 선택을 도와 의사결정 속도를 높여줄 것으로 기대된다.

재무예측을 위한 Support Vector Machine의 최적화 (Optimization of Support Vector Machines for Financial Forecasting)

  • 김경재;안현철
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.241-254
    • /
    • 2011
  • Support vector machines(SVM)은 비교적 최근에 등장한 데이터마이닝 기법이지만, 재무, CRM 등의 경영학 분야에서 많이 연구되고 있다. SVM은 인공신경망과 필적할 만큼의 예측 정확도를 보이는 사례가 많았지만, 암상자로 불리는 인공신경망 모형에 비해 구축된 예측모형의 구조를 이해하기 쉽고, 인공신경망에 비해 과도적합의 가능성이 적어서 적은 수의 데이터에서도 적용 가능하다는 장점을 가지고 있다. 하지만, 일반적인 SVM을 이용하려면, 인공신경망과 마찬가지로 여러 가지 설계요소들을 설계자가 선택하여야 하기 때문에 임의성이 높고, 국부 최적해에 수렴할 가능성도 크다. 또한, 많은 수의 데이터가 존재하는 경우에는 데이터를 분석하고 이용하는데 시간이 소요되고, 종종 잡음이 심한 데이터가 포함된 경우에는 기대하는 수준의 예측성과를 얻지 못할 가능성이 있다. 본 연구에서는 일반적인 SVM의 장점을 그대로 유지하면서, 전술한 두 가지 단점을 보완한 새로운 SVM 모형을 제안한다. 본 연구에서 제안하는 모형은 사례선택기법을 일반적인 SVM에 융합한 것으로 대용량의 데이터에서 예측에 불필요한 데이터를 선별적으로 제거하여 예측의 정확도와 속도를 제고할 수 있는 방법이다. 본 연구에서는 잡음이 많고 예측이 어려운 것으로 알려진 재무 데이터를 활용하여 제안 모형의 유용성을 확인하였다.

기계식 인공판막 상태 평가를 위한 컴퓨터 보조진단 시스템 (Computer Aided Diagnosis System for Evaluation of Mechanical Artificial Valve)

  • 이혁수
    • 대한의용생체공학회:의공학회지
    • /
    • 제25권5호
    • /
    • pp.421-430
    • /
    • 2004
  • 임상적으로 의사가 청진기를 이용해 초기 혈전이 생긴 기계식 판막 음향신호의 변화를 구분하기는 쉽지 않다. 기계식 판막의 이상은 환자의 죽음을 의미하기 때문에 기계식 판막의 신뢰성과 초기 혈전 현상을 비관혈적으로 조기 진단하는 방법은 매우 중요하다. 이 논문은 컴퓨터 보조진단 시스템과 음향신호의 주파수 스펙트럼의 이동을 관찰하여 기계식 판막의 혈전 현상을 비관혈적으로 평가하는 것을 목적으로 한다. 혈전 모델은 상용화된 기계식 판막에 폴리우레세인과 실리콘을 이용하여 제작하였다. 판막의 표면에는 폴리우레세인을 코팅하고, 봉합링에는 실리콘을 코팅하였다. 봉합링의 주위에서 혈전이 발생하고, 20%, 40%, 60%로 자라나는 현상은 실리콘을 이용하여 제작하였다. 실험 시스템에서 판막의 음향 신호는 마이크로폰과 증폭기를 사용하여 측정하였고, 마이크로폰에는 주위잡음을 제거하기 위해 커플러를 장착하였다. 측정된 음향신호는 A/D 컨버터를 이용하여 샘플링하고, 스펙트럼을 분석하였다. 정상적인 판막과 혈전이 형성된 판막의 주파수 구분을 위해 인공신경망을 구성하였고, 연속적으로 판막의 운동 주기성을 확인하기 위하여 return map을 사용하였다. 생체 내 실험에서는 기계식 판막을 사용하는 순환장치를 장착한 동물과 기계식 판막을 치환 받은 지 1년 이내와 1년이 넘은 환자에게서 데이터를 채집하였다. 실험에서 얻은 데이터 스펙트럼은 두 가지 형태의 첨두치를 보였고, 이중에서 두 번째 첨두치는 혈전의 모델에 따라 변화를 보였다. 생체 내, 외 실험에서 얻은 데이터를 인공신경망에 적용한 결과 정상 판막과 혈전이 생성된 판막을 구분하였고, 환자를 대상으로 한 실험에서는 10명 중 1명이 두 번째 첨두치가 이동하는 결과를 보였지만 다른 방법으로 확인하지는 못했다. 본 논문의 결과는 기계식 판막의 혈전현상을 비침습적으로 조기 진단하고, 상태를 지속적으로 감시할 수 있는 기술적 토대를 제공할 것이다.

유전자 알고리즘을 이용한 분류자 앙상블의 최적 선택 (Optimal Selection of Classifier Ensemble Using Genetic Algorithms)

  • 김명종
    • 지능정보연구
    • /
    • 제16권4호
    • /
    • pp.99-112
    • /
    • 2010
  • 앙상블 학습은 분류 및 예측 알고리즘의 성과개선을 위하여 제안된 기계학습 기법이다. 그러나 앙상블 학습은 기저 분류자의 다양성이 부족한 경우 다중공선성 문제로 인하여 성과개선 효과가 미약하고 심지어는 성과가 악화될 수 있다는 문제점이 제기되었다. 본 연구에서는 기저 분류자의 다양성을 확보하고 앙상블 학습의 성과개선 효과를 제고하기 위하여 유전자 알고리즘 기반의 범위 최적화 기법을 제안하고자 한다. 본 연구에서 제안된 최적화 기법을 기업 부실예측 인공신경망 앙상블에 적용한 결과 기저 분류자의 다양성이 확보되고 인공신경망 앙상블의 성과가 유의적으로 개선되었음을 보여주었다.

문서 요약 기법이 가짜 뉴스 탐지 모형에 미치는 영향에 관한 연구 (A Study on the Effect of the Document Summarization Technique on the Fake News Detection Model)

  • 심재승;원하람;안현철
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.201-220
    • /
    • 2019
  • 가짜뉴스가 전세계적 이슈로 부상한 최근 수년간 가짜뉴스 문제 해결을 위한 논의와 연구가 지속되고 있다. 특히 인공지능과 텍스트 분석을 이용한 자동화 가짜 뉴스 탐지에 대한 연구가 주목을 받고 있는데, 대부분 문서 분류 기법을 이용한 연구들이 주를 이루고 있는 가운데 문서 요약 기법은 지금까지 거의 활용되지 않았다. 그러나 최근 가짜뉴스 탐지 연구에 생성 요약 기법을 적용하여 성능 개선을 이끌어낸 사례가 해외에서 보고된 바 있으며, 추출 요약 기법 기반의 뉴스 자동 요약 서비스가 대중화된 현재, 요약된 뉴스 정보가 국내 가짜뉴스 탐지 모형의 성능 제고에 긍정적인 영향을 미치는지 확인해 볼 필요가 있다. 이에 본 연구에서는 국내 가짜뉴스에 요약 기법을 적용했을 때 정보 손실이 일어나는지, 혹은 정보가 그대로 보전되거나 혹은 잡음 제거를 통한 정보 획득 효과가 발생하는지 알아보기 위해 국내 뉴스 데이터에 추출 요약 기법을 적용하여 '본문 기반 가짜뉴스 탐지 모형'과 '요약문 기반 가짜뉴스 탐지 모형'을 구축하고, 다수의 기계학습 알고리즘을 적용하여 두 모형의 성능을 비교하는 실험을 수행하였다. 그 결과 BPN(Back Propagation Neural Network)과 SVM(Support Vector Machine)의 경우 큰 성능 차이가 발생하지 않았지만 DT(Decision Tree)의 경우 본문 기반 모델이, LR(Logistic Regression)의 경우 요약문 기반 모델이 다소 우세한 성능을 보였음을 확인하였다. 결과를 검증하는 과정에서 통계적으로 유의미한 수준으로는 요약문 기반 모델과 본문 기반 모델간의 차이가 확인되지는 않았지만, 요약을 적용하였을 경우 가짜뉴스 판별에 도움이 되는 핵심 정보는 최소한 보전되며 LR의 경우 성능 향상의 가능성이 있음을 확인하였다. 본 연구는 추출요약 기법을 국내 가짜뉴스 탐지 연구에 처음으로 적용해 본 도전적인 연구라는 점에서 의의가 있다. 하지만 한계점으로는 비교적 적은 데이터로 실험이 수행되었다는 점과 한 가지 문서요약기법만 사용되었다는 점을 제시할 수 있다. 향후 대규모의 데이터에서도 같은 맥락의 실험결과가 도출되는지 검증하고, 보다 다양한 문서요약기법을 적용해 봄으로써 요약 기법 간 차이를 규명하는 확장된 연구가 추후 수행되어야 할 것이다.

환경요인을 이용한 다층 퍼셉트론 기반 온실 내 기온 및 상대습도 예측 (Prediction of Air Temperature and Relative Humidity in Greenhouse via a Multilayer Perceptron Using Environmental Factors)

  • 최하영;문태원;정대호;손정익
    • 생물환경조절학회지
    • /
    • 제28권2호
    • /
    • pp.95-103
    • /
    • 2019
  • 온도와 상대습도는 작물 재배에 있어서 중요한 요소로써, 수량과 품질의 증대를 위해서는 적절히 제어 되어야 한다. 그리고 정확한 환경 제어를 위해서는 환경이 어떻게 변화할지 예측할 필요가 있다. 본 연구의 목적은 현시점의 환경 데이터를 이용한 다층 퍼셉트론(multilayer perceptrons, MLP)을 기반으로 미래 시점의 기온 및 상대습도를 예측하는 것이다. MLP 학습에 필요한 데이터는 어윈 망고(Mangifera indica cv. Irwin)을 재배하는 8연동 온실($1,032m^2$)에서 2016년 10월 1일부터 2018년 2월 28일까지 10분 간격으로 수집되었다. MLP는 온실내부 환경 데이터, 온실 외 기상 데이터, 온실 내 장치의 설정 및 작동 값을 사용하여 10~120분 후 기온 및 상대습도를 예측하기 위한 학습을 진행하였다. 사계절이 뚜렷한 우리나라의 계절에 따른 예측 정확도를 분석하기 위해서 테스트 데이터로 계절별로 3일간의 데이터를 사용했다. MLP는 기온의 경우 은닉층이 4개, 노드 수가 128개일 때($R^2=0.988$), 상대습도는 은닉층 4개, 노드 수 64개에서 가장 높은 정확도를 보였다($R^2=0.990$). MLP 특성상 예측 시점이 멀어질수록 정확도는 감소하였지만, 계절에 따른 환경 변화에 무관하게 기온과 상대습도를 적절히 예측하였다. 그러나 온실 내 환경 제어 요소 중 분무 관수처럼 특이적인 데이터의 경우, 학습 데이터 수가 적기 때문에 예측 정확도가 낮았다. 본 연구에서는 MLP의 최적화를 통해서 기온 및 상대습도를 적절히 예측하였지만 실험에 사용된 온실에만 국한되었다. 따라서 보다 일반화를 위해서 다양한 장소의 온실 데이터 이용과 이에 따른 신경망 구조의 변형이 필요하다.

입 모양 인식 시스템 전처리를 위한 관심 영역 추출과 이중 선형 보간법 적용 (Region of Interest Extraction and Bilinear Interpolation Application for Preprocessing of Lipreading Systems)

  • 한재혁;김용기;김미혜
    • 정보처리학회 논문지
    • /
    • 제13권4호
    • /
    • pp.189-198
    • /
    • 2024
  • 입 모양 인식은 음성 인식의 중요 부분 중 하나로 음성 인식을 위한 입 모양 인식 시스템에서 입 모양 인식 성능을 개선하기 위한 여러 연구가 진행됐다. 최근의 연구에서는 인식 성능을 개선하기 위해 입 모양 인식 시스템의 모델 구조를 수정하는 방법이 사용됐다. 본 연구에서는 모델 구조를 수정하는 것으로 인식 성능을 개선하는 기존의 연구와 달리 모델 구조의 변화 없이 인식 성능을 개선하는 것을 목표로 한다. 모델 구조의 수정 없이 인식 성능을 개선하기 위해, 사람이 하는 입 모양 인식에서 사용되는 단서를 참고해 입 모양 인식 시스템의 기존 관심 영역인 입술 영역과 함께 턱, 뺨과 같은 다른 영역을 관심 영역으로 설정하고 각 관심 영역의 인식률을 비교해 가장 높은 성능의 관심 영역을 제안한다. 또한, 관심 영역 크기를 정규화하는 과정에서 보간법의 차이로 인해 발생하는 정규화 결과의 차이가 인식 성능에 영향을 준다고 가정하고 최근접 이웃 보간법, 이중 선형 보간법, 이중 삼차 보간법을 사용해 동일한 관심 영역을 보간하고 각 보간법에 따른 입 모양 인식률을 비교해 가장 높은 성능의 보간법을 제안한다. 각 관심 영역은 객체 탐지 인공신경망을 학습시켜 검출하고, 각 관심 영역을 정규화하고 특징을 추출하고 결합한 뒤, 결합된 특징들을 차원 축소한 결과를 저차원 공간으로 매핑하는 것으로 동적 정합 템플릿을 생성했다. 생성된 동적 정합 템플릿들과 저차원 공간으로 매핑된 데이터의 거리를 비교하는 것으로 인식률을 평가했다. 실험 결과 관심 영역의 비교에서는 입술 영역만을 포함하는 관심 영역의 결과가 이전 연구의 93.92%의 평균 인식률보다 3.44% 높은 97.36%의 평균 인식률을 보였으며, 보간법의 비교에서는 이중 선형 보간법이 97.36%로 최근접 이웃 보간법에 비해 14.65%, 이중 삼차 보간법에 비해 5.55% 높은 성능을 나타내었다. 본 연구에 사용된 코드는 https://github.com/haraisi2/Lipreading-Systems에서 확인할 수 있다.

기업의 SNS 노출과 주식 수익률간의 관계 분석 (The Analysis on the Relationship between Firms' Exposures to SNS and Stock Prices in Korea)

  • 김태환;정우진;이상용
    • Asia pacific journal of information systems
    • /
    • 제24권2호
    • /
    • pp.233-253
    • /
    • 2014
  • Can the stock market really be predicted? Stock market prediction has attracted much attention from many fields including business, economics, statistics, and mathematics. Early research on stock market prediction was based on random walk theory (RWT) and the efficient market hypothesis (EMH). According to the EMH, stock market are largely driven by new information rather than present and past prices. Since it is unpredictable, stock market will follow a random walk. Even though these theories, Schumaker [2010] asserted that people keep trying to predict the stock market by using artificial intelligence, statistical estimates, and mathematical models. Mathematical approaches include Percolation Methods, Log-Periodic Oscillations and Wavelet Transforms to model future prices. Examples of artificial intelligence approaches that deals with optimization and machine learning are Genetic Algorithms, Support Vector Machines (SVM) and Neural Networks. Statistical approaches typically predicts the future by using past stock market data. Recently, financial engineers have started to predict the stock prices movement pattern by using the SNS data. SNS is the place where peoples opinions and ideas are freely flow and affect others' beliefs on certain things. Through word-of-mouth in SNS, people share product usage experiences, subjective feelings, and commonly accompanying sentiment or mood with others. An increasing number of empirical analyses of sentiment and mood are based on textual collections of public user generated data on the web. The Opinion mining is one domain of the data mining fields extracting public opinions exposed in SNS by utilizing data mining. There have been many studies on the issues of opinion mining from Web sources such as product reviews, forum posts and blogs. In relation to this literatures, we are trying to understand the effects of SNS exposures of firms on stock prices in Korea. Similarly to Bollen et al. [2011], we empirically analyze the impact of SNS exposures on stock return rates. We use Social Metrics by Daum Soft, an SNS big data analysis company in Korea. Social Metrics provides trends and public opinions in Twitter and blogs by using natural language process and analysis tools. It collects the sentences circulated in the Twitter in real time, and breaks down these sentences into the word units and then extracts keywords. In this study, we classify firms' exposures in SNS into two groups: positive and negative. To test the correlation and causation relationship between SNS exposures and stock price returns, we first collect 252 firms' stock prices and KRX100 index in the Korea Stock Exchange (KRX) from May 25, 2012 to September 1, 2012. We also gather the public attitudes (positive, negative) about these firms from Social Metrics over the same period of time. We conduct regression analysis between stock prices and the number of SNS exposures. Having checked the correlation between the two variables, we perform Granger causality test to see the causation direction between the two variables. The research result is that the number of total SNS exposures is positively related with stock market returns. The number of positive mentions of has also positive relationship with stock market returns. Contrarily, the number of negative mentions has negative relationship with stock market returns, but this relationship is statistically not significant. This means that the impact of positive mentions is statistically bigger than the impact of negative mentions. We also investigate whether the impacts are moderated by industry type and firm's size. We find that the SNS exposures impacts are bigger for IT firms than for non-IT firms, and bigger for small sized firms than for large sized firms. The results of Granger causality test shows change of stock price return is caused by SNS exposures, while the causation of the other way round is not significant. Therefore the correlation relationship between SNS exposures and stock prices has uni-direction causality. The more a firm is exposed in SNS, the more is the stock price likely to increase, while stock price changes may not cause more SNS mentions.

비대칭 오류비용을 고려한 분류기준값 최적화와 SVM에 기반한 지능형 침입탐지모형 (An Intelligent Intrusion Detection Model Based on Support Vector Machines and the Classification Threshold Optimization for Considering the Asymmetric Error Cost)

  • 이현욱;안현철
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.157-173
    • /
    • 2011
  • 최근 인터넷 사용의 증가에 따라 네트워크에 연결된 시스템에 대한 악의적인 해킹과 침입이 빈번하게 발생하고 있으며, 각종 시스템을 운영하는 정부기관, 관공서, 기업 등에서는 이러한 해킹 및 침입에 의해 치명적인 타격을 입을 수 있는 상황에 놓여 있다. 이에 따라 인가되지 않았거나 비정상적인 활동들을 탐지, 식별하여 적절하게 대응하는 침입탐지 시스템에 대한 관심과 수요가 높아지고 있으며, 침입탐지 시스템의 예측성능을 개선하려는 연구 또한 활발하게 이루어지고 있다. 본 연구 역시 침입탐지 시스템의 예측성능을 개선하기 위한 새로운 지능형 침입탐지모형을 제안한다. 본 연구의 제안모형은 비교적 높은 예측력을 나타내면서 동시에 일반화 능력이 우수한 것으로 알려진 Support Vector Machine(SVM)을 기반으로, 비대칭 오류비용을 고려한 분류기준값 최적화를 함께 반영하여 침입을 효과적으로 차단할 수 있도록 설계되었다. 제안모형의 우수성을 확인하기 위해, 기존 기법인 로지스틱 회귀분석, 의사결정나무, 인공신경망과의 결과를 비교하였으며 그 결과 제안하는 SVM 모형이 다른 기법에 비해 상대적으로 우수한 성과를 보임을 확인할 수 있었다.

역전파 알고리즘을 이용한 최적의 교통안전 평가 모형개발 (Development of Optimum Traffic Safety Evaluation Model Using the Back-Propagation Algorithm)

  • 김중효;권성대;홍정표;하태준
    • 대한토목학회논문집
    • /
    • 제35권3호
    • /
    • pp.679-690
    • /
    • 2015
  • 교통사고 피해를 최소화하기 위해서는 차량과 도로 체계에 대한 공학적인 개선을 통하여 교통사고 원인을 제거해야 한다. 일반적으로 안정성과 효율성이 부족한 도로는 교통사고가 지속적으로 발생할 가능성이 크고 이를 개선하는데 막대한 사회적 비용과 시간이 소요되며, 부적절한 환경 요인으로 발생한 교통사고는 국가적으로 큰 피해를 발생시키게 된다. 따라서 본 연구는 최근 인공지능 분야 중 활발히 연구 중인 역전파 알고리즘(Back-Propagation Algorithm : BPA)을 이용하여 신호교차로를 대상으로 최적의 교통안전 평가기법을 제시하고자 하였다. 본 연구는 광주광역시내 교통혼잡과 교통사고가 빈번하게 발생하고 있는 신호교차로 지점을 대상으로, BPA를 이용하여 보다 신뢰성 높은 교통안전 평가 모형을 개발하고자 다음과 같은 일련의 방법으로 연구를 수행하였다. 첫째, 신호교차로 교통사고와 교통상충간의 순위상관분석을 실시하여 교통사고 순위와 교통상충 순위가 통계적으로 유의함을 확인하였다. 이는 교통상충이 신호교차로 교통안전 평가 변수로 사용될 수 있음에 따라 설명변수로 입력되고 교통사고가 종속변수인 선형회귀모형을 개발하는데 이용하였다. 둘째, 신호교차로의 교통량과 진입 진출 차로수 차이 등을 교통사고의 설명변수로 간주하여 다중회귀분석을 통해 교통사고 예측모형을 개발하였다. 셋째, 교통량과 도로 기하구조 요소를 모형의 설명변수로 설정하고 교통상충을 종속변수로 하여 BPA를 이용한 최적의 교통안전 평가 모형을 개발하였다. 마지막으로, 교통사고 실측값, 다중회귀모형, BPA에 의한 교통사고 예측값을 평균제곱근오차 방법으로 모형의 적합도 비교 분석을 하였다. 본 연구의 결과, BPA에 의해 도출된 교통사고 예측값과 교통사고 실측값 사이의 평균제곱오차는 3.89로 계산되어 BPA가 다중회귀 모형보다 상대적으로 교통안전 평가능력이 우수한 것으로 나타나 실제 신호교차로 교통안전도를 평가하는데 효과적으로 활용될 수 있을 것으로 판단되고 추후, 교통안전정책 수립시 실질적인 도움이 될 것으로 기대된다.