• Title/Summary/Keyword: System Performance Parameter

검색결과 2,055건 처리시간 0.029초

MLOps를 위한 효율적인 AI 모델 드리프트 탐지방안 연구 (A Study on Efficient AI Model Drift Detection Methods for MLOps)

  • 이예은;이태진
    • 인터넷정보학회논문지
    • /
    • 제24권5호
    • /
    • pp.17-27
    • /
    • 2023
  • 오늘날 AI(Artificial Intelligence) 기술이 발전하면서 실용성이 증가함에 따라 실생활 속 다양한 응용 분야에서 널리 활용되고 있다. 이때 AI Model은 기본적으로 학습 데이터의 다양한 통계적 속성을 기반으로 학습된 후 시스템에 배포되지만, 급변하는 데이터의 상황 속 예상치 못한 데이터의 변화는 모델의 성능저하를 유발한다. 특히 보안 분야에서 끊임없이 생성되는 새로운 공격과 알려지지 않은 공격에 대응하기 위해서는 배포된 모델의 Drift Signal을 찾는 것이 중요해짐에 따라 모델 전체의 Lifecycle 관리 필요성이 점차 대두되고 있다. 일반적으로 모델의 정확도 및 오류율(Loss)의 성능변화를 통해 탐지할 수 있지만, 모델 예측 결과에 대한 실제 라벨이 필요한 점에서 사용 환경의 제약이 존재하며, 실제 드리프트가 발생한 지점의 탐지가 불확실한 단점이 있다. 그 이유는 모델의 오류율의 경우 다양한 외부 환경적 요인, 모델의 선택과 그에 따른 파라미터 설정, 그리고 새로운 입력데이터에 따라 크게 영향을 받기에 해당 값만을 기반으로 데이터의 실질적인 드리프트 발생 시점을 정밀하게 판단하는 것은 한계가 존재하게 된다. 따라서 본 논문에서는 XAI(eXplainable Artificial Intelligence) 기반 Anomaly 분석기법을 통해 실질적인 드리프트가 발생한 시점을 탐지하는 방안을 제안한다. DGA(Domain Generation Algorithm)를 탐지하는 분류모델을 대상으로 시험한 결과, 배포된 이후 데이터의 SHAP(Shapley Additive exPlanations) Value를 통해 Anomaly score를 추출하였고, 그 결과 효율적인 드리프트 시점탐지가 가능함을 확인하였다.

커터수명지수 예측을 위한 다중선형회귀분석과 트리 기반 머신러닝 기법 적용 (Application of Multiple Linear Regression Analysis and Tree-Based Machine Learning Techniques for Cutter Life Index(CLI) Prediction)

  • 홍주표;고태영
    • 터널과지하공간
    • /
    • 제33권6호
    • /
    • pp.594-609
    • /
    • 2023
  • TBM 공법은 굴착면 안정성 확보 및 주변환경에 비치는 영향을 최소화하기 때문에 도심지나 하·해저터널 등에서 적용 사례가 증가하는 추세이다. 디스크 커터의 수명을 예측하는 대표적인 모델 중 NTNU모델은 커터수명지수(Cutter Life Index, CLI)를 주요 매개 변수로 활용하지만 복잡한 시험절차와 시험장비의 희귀성으로 측정에 어려움이 있다. 본 연구에서는 다중선형회귀분석과 트리 기반의 머신러닝 기법으로 암석물성을 활용하여 CLI를 예측하였다. 문헌 조사를 통해 암석의 일축압축강도, 압열인장강도, 등 가석영함량과 세르샤 마모지수 등을 포함한 데이터베이스를 구축하였고 파생변수를 계산하여 추가하였다. 다중선형회귀분석은 통계적 유의성과 다중공선성을 고려하여 입력 변수를 선정하였고 머신러닝 예측 모델은 변수 중요도를 기반으로 입력 변수를 선정하였다. 학습용과 검증용 데이터를 8:2로 나누어 모델 간 예측 성능을 비교한 결과 XGBoost가 최적의 모델로 선정되었다. 본 연구에서 도출된 다중선형회귀모델과 XGBoost모델을 선행 연구와 예측 성능을 비교하여 타당성을 확인하였다.

한국어 언어모델 파인튜닝을 통한 협찬 블로그 텍스트 생성 (Generating Sponsored Blog Texts through Fine-Tuning of Korean LLMs)

  • 김보경;변재연;차경애
    • 한국산업정보학회논문지
    • /
    • 제29권3호
    • /
    • pp.1-12
    • /
    • 2024
  • 본 논문에서는 대규모 한국어 언어모델인 KoAlpaca를 파인튜닝하고 이를 이용한 블로그 텍스트 생성 시스템을 구현하였다. 소셜 미디어 플랫폼의 블로그는 기업 마케팅 수단으로 널리 활용된다. 수집된 협찬 블로그 텍스트의 감정 분석과 정제를 통한 긍정 리뷰의 학습 데이터를 구축하고 KoAlpaca 학습의 경량화를 위한 QLoRA를 적용하였다. QLoRA는 학습에 필요한 메모리 사용량을 크게 줄이는 파인튜닝 접근법으로 파라미터 크기 12.8B 경우의 실험 환경에서 LoRA 대비 최대 약 58.8%의 메모리 사용량 감소를 확인하였다. 파인튜닝 모델의 생성 성능 평가를 위해서 학습 데이터에 포함되지 않은 100개의 입력으로 생성한 텍스트는 사전학습 모델에 비해서 평균적으로 두배 이상의 단어 수를 생성하였으며 긍정 감정의 텍스트 역시 두 배 이상으로 나타났다. 정성적 생성 성능 평가를 위한 설문조사에서 파인튜닝 모델의 생성 결과가 제시된 주제에 더 잘 부합한다는 응답이 평균 77.5%로 나타났다. 이를 통해서 본 논문의 협찬물에 대한 긍정 리뷰 생성 언어모델은 콘텐츠 제작을 위한 시간 관리의 효율성을 높이고 일관된 마케팅 효과를 보장하는 콘텐츠 제작이 가능함을 보였다. 향후 사전학습 모델의 생성 요소에 의해서 긍정 리뷰의 범주에서 벗어나는 생성 결과를 감소시키기 위해서 학습 데이터의 증강을 활용한 파인튜닝을 진행할 예정이다.

부도예측을 위한 KNN 앙상블 모형의 동시 최적화 (Investigating Dynamic Mutation Process of Issues Using Unstructured Text Analysis)

  • 민성환
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.139-157
    • /
    • 2016
  • 앙상블 분류기란 개별 분류기보다 더 좋은 성과를 내기 위해 다수의 분류기를 결합하는 것을 의미한다. 이와 같은 앙상블 분류기는 단일 분류기의 일반화 성능을 향상시키는데 매우 유용한 것으로 알려져 있다. 랜덤 서브스페이스 앙상블 기법은 각각의 기저 분류기들을 위해 원 입력 변수 집합으로부터 랜덤하게 입력 변수 집합을 선택하며 이를 통해 기저 분류기들을 다양화 시키는 기법이다. k-최근접 이웃(KNN: k nearest neighbor)을 기저 분류기로 하는 랜덤 서브스페이스 앙상블 모형의 성과는 단일 모형의 성과를 개선시키는 데 효과적인 것으로 알려져 있으며, 이와 같은 랜덤 서브스페이스 앙상블의 성과는 각 기저 분류기를 위해 랜덤하게 선택된 입력 변수 집합과 KNN의 파라미터 k의 값이 중요한 영향을 미친다. 하지만, 단일 모형을 위한 k의 최적 선택이나 단일 모형을 위한 입력 변수 집합의 최적 선택에 관한 연구는 있었지만 KNN을 기저 분류기로 하는 앙상블 모형에서 이들의 최적화와 관련된 연구는 없는 것이 현실이다. 이에 본 연구에서는 KNN을 기저 분류기로 하는 앙상블 모형의 성과 개선을 위해 각 기저 분류기들의 k 파라미터 값과 입력 변수 집합을 동시에 최적화하는 새로운 형태의 앙상블 모형을 제안하였다. 본 논문에서 제안한 방법은 앙상블을 구성하게 될 각각의 KNN 기저 분류기들에 대해 최적의 앙상블 성과가 나올 수 있도록 각각의 기저 분류기가 사용할 파라미터 k의 값과 입력 변수를 유전자 알고리즘을 이용해 탐색하였다. 제안한 모형의 검증을 위해 국내 기업의 부도 예측 관련 데이터를 가지고 다양한 실험을 하였으며, 실험 결과 제안한 모형이 기존의 앙상블 모형보다 기저 분류기의 다양화와 예측 성과 개선에 효과적임을 알 수 있었다.

오염하천 정화를 위한 호기성 인공습지의 운영인자 평가 (Parameter Estimation of the Aerated Wetland for the Performance of the Polluted Stream Treatment)

  • 김둘선;이동근
    • 청정기술
    • /
    • 제25권4호
    • /
    • pp.302-310
    • /
    • 2019
  • 호기조와 혐기/무산소조를 직렬로 연결한 인공습지를 이용하여 크게 오염된 하천수를 처리하였다. 호기조는 자연 공기 배출 시스템을 통하여 공기가 연속적으로 공급되어 호기성 상태가 유지되었다. 인공습지의 성능에 영향을 미치는 최적의 영향인자를 조사하기 위하여 체류시간을 다르게 한 5개의 파일럿 플랜트를 사용하였다. 호기조에서 BOD (biochemical oxygen demand)와 COD (chemical oxygen demand)의 제거율은 1차 반응 속도식을 나타내었고, COD 제거 속도 상수는 BOD보다 약간 낮았다. 온도 의존성은 COD (θ = 1.0079)와 BOD (θ = 1.0083)제거에 대한 값이 거의 동일했으나 T-N 제거의 온도 의존성(θN)은 1.0189로 다소 높게 나타났다. SS제거율은 98%로 높았고 수력학적 부하 속도(Q/A)가 증가함에 따라 제거 효율이 증가하는 경향을 보였다. 혐기/무산소조에서 BOD와 COD 제거의 주요 메커니즘은 호기조와 완전히 다르게 나타났다. 혐기/무산소조에서 COD와 COD는 생물학적 탈질을 위한 탄소원으로 공급되었고 T-P는 혐기/무산소조 내의 orthophosphate와 자갈 사이의 양이온 교환에 의해 제거되는 것으로 조사되었다. 인공습지는 여과된 고형물에 의해 막힘 없이 성공적으로 운영되었고 고형물들은 매우 빠르게 연속적으로 분해되었다.

국내 지면온도의 시공간적 변화 분석 (Analyzing Spatial and Temporal Variation of Ground Surface Temperature in Korea)

  • 구민호;송윤호;이준학
    • 자원환경지질
    • /
    • 제39권3호
    • /
    • pp.255-268
    • /
    • 2006
  • 58개 기상관측소에서 최근 22년간(1981-2002) 측정된 기상 자료를 이용하여 국내의 기온(SAT) 및 지면온도(GST)의 시공간적 변동 경향을 분석하였다. 먼저 관측 자료로부터 각 관측소의 평균기온(MSAT)과 평균지면온도(MGST)를 계산하였으며, 다중선형회귀분석을 통해 MSAT와 MGST를 예측할 수 있는 회귀식을 산정하였다. 회귀모형의 회귀변수는 관측소의 위도 및 고도이다. 회귀모형의 추정치와 실제 관측값의 결정계수($R^2$)는 각각 0,92와 0.94로 나타나 모형의 예측 정확성이 매우 높은 것으로 분석되었다. MGST는 지열펌프 시스템 설계의 주요 입력 변수이므로 최근 지열에너지자원 활용 분야에서 매우 중요하게 다루어지는 변수이다. 따라서 제시된 회귀모형은 신뢰할만한 관측 자료가 없는 지역에서 MGST를 추정하는데 매우 유용하게 이용될 수 있을 것으로 예상된다. SAT 자료에 대한 선헝회귀분석을 통해 지구온난화 및 도시화에 기인한 기온 상승의 장기 추세 변동성을 탐색하였다. 1개 관측소를 제외한 57개 관측소에서 $0.005{\sim}0.088^{\circ}C/yr$ 범위의 기온증가율을 가지는 추세 변동이 확인되었다. 또한 GST에 영향을 미치는 기상요소로서 일사량, 지구복사, 강수량 및 적설량 자료를 분석하였다. GST는 주로 SAT 및 일사량에 의하여 결정되지만 강수 및 증발에 의한 토양의 열용량 변화, 적설에 의한 대기와 지표면 차단, 지구복사에 영향을 줄 수 있는 대기의 조건 변화 등이 복합적인 변동 요인으로 작용하는 것으로 나타났다.

Wavelet Thresholding Techniques to Support Multi-Scale Decomposition for Financial Forecasting Systems

  • Shin, Taek-Soo;Han, In-Goo
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 1999년도 춘계공동학술대회-지식경영과 지식공학
    • /
    • pp.175-186
    • /
    • 1999
  • Detecting the features of significant patterns from their own historical data is so much crucial to good performance specially in time-series forecasting. Recently, a new data filtering method (or multi-scale decomposition) such as wavelet analysis is considered more useful for handling the time-series that contain strong quasi-cyclical components than other methods. The reason is that wavelet analysis theoretically makes much better local information according to different time intervals from the filtered data. Wavelets can process information effectively at different scales. This implies inherent support for multiresolution analysis, which correlates with time series that exhibit self-similar behavior across different time scales. The specific local properties of wavelets can for example be particularly useful to describe signals with sharp spiky, discontinuous or fractal structure in financial markets based on chaos theory and also allows the removal of noise-dependent high frequencies, while conserving the signal bearing high frequency terms of the signal. To data, the existing studies related to wavelet analysis are increasingly being applied to many different fields. In this study, we focus on several wavelet thresholding criteria or techniques to support multi-signal decomposition methods for financial time series forecasting and apply to forecast Korean Won / U.S. Dollar currency market as a case study. One of the most important problems that has to be solved with the application of the filtering is the correct choice of the filter types and the filter parameters. If the threshold is too small or too large then the wavelet shrinkage estimator will tend to overfit or underfit the data. It is often selected arbitrarily or by adopting a certain theoretical or statistical criteria. Recently, new and versatile techniques have been introduced related to that problem. Our study is to analyze thresholding or filtering methods based on wavelet analysis that use multi-signal decomposition algorithms within the neural network architectures specially in complex financial markets. Secondly, through the comparison with different filtering techniques results we introduce the present different filtering criteria of wavelet analysis to support the neural network learning optimization and analyze the critical issues related to the optimal filter design problems in wavelet analysis. That is, those issues include finding the optimal filter parameter to extract significant input features for the forecasting model. Finally, from existing theory or experimental viewpoint concerning the criteria of wavelets thresholding parameters we propose the design of the optimal wavelet for representing a given signal useful in forecasting models, specially a well known neural network models.

  • PDF

깊은보-외부기둥 접합부의 반복 횡하중 실험 (Reversed Cyclic Load Tests on Deep Beam-and-Exterior Column Joints)

  • 고동우;이한선
    • 콘크리트학회논문집
    • /
    • 제19권3호
    • /
    • pp.265-273
    • /
    • 2007
  • 최근 우리나라의 공동주택 또는 주상복합 건물의 구조 시스템으로 상부 벽식 하부 골조의 복합구조 형태가 주로 사용되고 있다. 이와 같은 건물의 경우 상부층의 하중이 전이판 또는 깊은보의 형태를 띠는 깊은보를 통해 하부 골조로 전달되고, 횡력에 대해서는 하부 골조가 연층 또는 약층에 의한 파괴가 발생할 수 있기 때문에 횡력에 대한 깊은보와 기둥은 매우 중요하다. 본 연구에서는 이러한 깊은보와 하부 기둥이 만나는 부분에서 요구되는 강도, 연성 등을 파악하고자 깊은보-외부기둥 접합부에 대해 ACI의 중진지역 상세에 의한 방법과 Sheikh가 제안한 방법에 따라 기둥을 설계한 후, 1/2.5 축소 모델 실험에 대한 반복 횡하중 실험을 수행하였다. 그 결과는 다음과 같다. (1) Sheikh의 제안식에 따라 설계할 경우 요구 횡철근이 2.9배 증가하였으며, 이는 기둥의 연성이 증가하는 결과를 가져왔다. (2) 기둥 횡변 위는 대부분 소성힌지에서 휨변형, 접합부에서 휨변형, 그리고 들뜸에 의해 발생하였다. (3) 깊은보와 외부기둥이 접하는 경우 기둥의 상세 뿐만 아니라 접합부에서 과도한 변형을 방지하기 위해 접합부 내부에도 충분한 횡철근이 배근이 되어야 할 필요가 있었다.

다랑어 연승어구의 형상에 관한 시뮬레이션 (Simulation on the shape of tuna longline gear)

  • 이지훈;이춘우
    • 수산해양기술연구
    • /
    • 제39권4호
    • /
    • pp.305-317
    • /
    • 2003
  • 중층 연승어구의 수중형상과 낚시의 심도는 어획성능을 좌우하는 중요한 요소하다. 또한 매조업시마다 얻어지는 낚시별 어획어종, 크기등과 같은 조획 데이터의 체계적인 관리와 분석도 향후 조업을 위한 지표로서 고려되어야 한다. 본 연구에서는 유향$.$유속에 따른 어구의 수중 형상을 시뮬레이션하여 해석하였고, 해석의 정확성을 검증하기 위해서 모형실험을 실시하였다. 또한 시뮬레이션에서 얻어진 각 낚시별 심도 정보를 활용하여, 낚시별로 사용한 미끼와 어획된 어종의 자료를 처리할 수 있는 데이터베이스 시스템을 구축하였다. 본 연구에서 얻어진 결과를 요약하면 디음과 같다. 1. 영각과 단축률이 일정할 때, 유속이 증가함에 따라 낚시의 심도는 유속에 비례해서 감소하였다. 2. 단축률과 유속이 일정할 때, 영각이 증가함에 따라 낚시의 심도는 영각에 비례해서 감소하였다. 3. 영각과 유속이 일정할 때, 단축률이 증가함에 따라 낚시의 심도는 단축률에 비례해서 감소하였다. 4 시뮬레이션에 의한 수중 형상과 모형어구의 수중 형상을 비교한 결과, 오차는 $ {\pm}3%$ 이내로 나타나 실험결과에 대한 시뮬레이션의 결과가 잘 일치함을 나타내었다. 5 본 연구에서 시뮬레이션에서 얻어진 낚시 심도정보를 활용한 조획률 데이터베이스 시스템은 여러 파라미터들 예를 들어 미끼, 낚시 섬도 등에 따라서 어획어의 종류와 크기를 분석할 수 있어서, 현장의 조획 데이터의 관리 및 분석에 많은 도움을 줄 수 있을 것이다.

타의 스팬길이에 따른 면적 변화가 침로안정성에 미치는 영향에 관한 연구 (A Study on the Effect of Rudder Area with Reference to Changes in Span Distance on Course Stability of a Ship)

  • 손경호;이경우;김현수;김윤수;하문근
    • 대한조선학회논문집
    • /
    • 제33권4호
    • /
    • pp.1-14
    • /
    • 1996
  • IMO 조종성잠정기준 4가지 항목중, 특히 비대선형의 경우 침로안정성이 문제시될 수 있다. 본 연구의 목적은 타의 스팬길이에 따른 면적 변화가 침로안정성에 미치는 영향을 조사함으로써, 타면적 증감에 의한 침로안정성 개선 방법을 모색하고자 한다. 본 연구에서는 타직압력과 관련된 실험 정수들과 조종유체력미계수와의 관계를 정식화하였고, 타직압력과 관련된 각종 구속모형시험을 실시하여 타면적 변화에 따른 조정유체력미계수의 변화를 구하고, 이로부터 침로안정성을 비교, 분석하였다. 또한 조종성 시뮬레이션 기법을 이용하여 타면적 증감에 따른 조종성능 개선 효과를 검토하였다. 연구 결과, 타면적 증가는 침로안정성을 저해할 가능성이 있으며, 그 원인은 스팬길이 증가로 인한 타 상부와 선미 오버행 하부의 공간이 작아지기 때문이다. 이 공간은 조종운동시정류계수에 큰 영향을 미치며, 이것이 침로안정성과 관련된다는 것을 알 수 있었다.

  • PDF