• 제목/요약/키워드: input parameter

검색결과 1,639건 처리시간 0.028초

MLOps를 위한 효율적인 AI 모델 드리프트 탐지방안 연구 (A Study on Efficient AI Model Drift Detection Methods for MLOps)

  • 이예은;이태진
    • 인터넷정보학회논문지
    • /
    • 제24권5호
    • /
    • pp.17-27
    • /
    • 2023
  • 오늘날 AI(Artificial Intelligence) 기술이 발전하면서 실용성이 증가함에 따라 실생활 속 다양한 응용 분야에서 널리 활용되고 있다. 이때 AI Model은 기본적으로 학습 데이터의 다양한 통계적 속성을 기반으로 학습된 후 시스템에 배포되지만, 급변하는 데이터의 상황 속 예상치 못한 데이터의 변화는 모델의 성능저하를 유발한다. 특히 보안 분야에서 끊임없이 생성되는 새로운 공격과 알려지지 않은 공격에 대응하기 위해서는 배포된 모델의 Drift Signal을 찾는 것이 중요해짐에 따라 모델 전체의 Lifecycle 관리 필요성이 점차 대두되고 있다. 일반적으로 모델의 정확도 및 오류율(Loss)의 성능변화를 통해 탐지할 수 있지만, 모델 예측 결과에 대한 실제 라벨이 필요한 점에서 사용 환경의 제약이 존재하며, 실제 드리프트가 발생한 지점의 탐지가 불확실한 단점이 있다. 그 이유는 모델의 오류율의 경우 다양한 외부 환경적 요인, 모델의 선택과 그에 따른 파라미터 설정, 그리고 새로운 입력데이터에 따라 크게 영향을 받기에 해당 값만을 기반으로 데이터의 실질적인 드리프트 발생 시점을 정밀하게 판단하는 것은 한계가 존재하게 된다. 따라서 본 논문에서는 XAI(eXplainable Artificial Intelligence) 기반 Anomaly 분석기법을 통해 실질적인 드리프트가 발생한 시점을 탐지하는 방안을 제안한다. DGA(Domain Generation Algorithm)를 탐지하는 분류모델을 대상으로 시험한 결과, 배포된 이후 데이터의 SHAP(Shapley Additive exPlanations) Value를 통해 Anomaly score를 추출하였고, 그 결과 효율적인 드리프트 시점탐지가 가능함을 확인하였다.

커터수명지수 예측을 위한 다중선형회귀분석과 트리 기반 머신러닝 기법 적용 (Application of Multiple Linear Regression Analysis and Tree-Based Machine Learning Techniques for Cutter Life Index(CLI) Prediction)

  • 홍주표;고태영
    • 터널과지하공간
    • /
    • 제33권6호
    • /
    • pp.594-609
    • /
    • 2023
  • TBM 공법은 굴착면 안정성 확보 및 주변환경에 비치는 영향을 최소화하기 때문에 도심지나 하·해저터널 등에서 적용 사례가 증가하는 추세이다. 디스크 커터의 수명을 예측하는 대표적인 모델 중 NTNU모델은 커터수명지수(Cutter Life Index, CLI)를 주요 매개 변수로 활용하지만 복잡한 시험절차와 시험장비의 희귀성으로 측정에 어려움이 있다. 본 연구에서는 다중선형회귀분석과 트리 기반의 머신러닝 기법으로 암석물성을 활용하여 CLI를 예측하였다. 문헌 조사를 통해 암석의 일축압축강도, 압열인장강도, 등 가석영함량과 세르샤 마모지수 등을 포함한 데이터베이스를 구축하였고 파생변수를 계산하여 추가하였다. 다중선형회귀분석은 통계적 유의성과 다중공선성을 고려하여 입력 변수를 선정하였고 머신러닝 예측 모델은 변수 중요도를 기반으로 입력 변수를 선정하였다. 학습용과 검증용 데이터를 8:2로 나누어 모델 간 예측 성능을 비교한 결과 XGBoost가 최적의 모델로 선정되었다. 본 연구에서 도출된 다중선형회귀모델과 XGBoost모델을 선행 연구와 예측 성능을 비교하여 타당성을 확인하였다.

부도예측을 위한 KNN 앙상블 모형의 동시 최적화 (Investigating Dynamic Mutation Process of Issues Using Unstructured Text Analysis)

  • 민성환
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.139-157
    • /
    • 2016
  • 앙상블 분류기란 개별 분류기보다 더 좋은 성과를 내기 위해 다수의 분류기를 결합하는 것을 의미한다. 이와 같은 앙상블 분류기는 단일 분류기의 일반화 성능을 향상시키는데 매우 유용한 것으로 알려져 있다. 랜덤 서브스페이스 앙상블 기법은 각각의 기저 분류기들을 위해 원 입력 변수 집합으로부터 랜덤하게 입력 변수 집합을 선택하며 이를 통해 기저 분류기들을 다양화 시키는 기법이다. k-최근접 이웃(KNN: k nearest neighbor)을 기저 분류기로 하는 랜덤 서브스페이스 앙상블 모형의 성과는 단일 모형의 성과를 개선시키는 데 효과적인 것으로 알려져 있으며, 이와 같은 랜덤 서브스페이스 앙상블의 성과는 각 기저 분류기를 위해 랜덤하게 선택된 입력 변수 집합과 KNN의 파라미터 k의 값이 중요한 영향을 미친다. 하지만, 단일 모형을 위한 k의 최적 선택이나 단일 모형을 위한 입력 변수 집합의 최적 선택에 관한 연구는 있었지만 KNN을 기저 분류기로 하는 앙상블 모형에서 이들의 최적화와 관련된 연구는 없는 것이 현실이다. 이에 본 연구에서는 KNN을 기저 분류기로 하는 앙상블 모형의 성과 개선을 위해 각 기저 분류기들의 k 파라미터 값과 입력 변수 집합을 동시에 최적화하는 새로운 형태의 앙상블 모형을 제안하였다. 본 논문에서 제안한 방법은 앙상블을 구성하게 될 각각의 KNN 기저 분류기들에 대해 최적의 앙상블 성과가 나올 수 있도록 각각의 기저 분류기가 사용할 파라미터 k의 값과 입력 변수를 유전자 알고리즘을 이용해 탐색하였다. 제안한 모형의 검증을 위해 국내 기업의 부도 예측 관련 데이터를 가지고 다양한 실험을 하였으며, 실험 결과 제안한 모형이 기존의 앙상블 모형보다 기저 분류기의 다양화와 예측 성과 개선에 효과적임을 알 수 있었다.

자기조직화 지도를 활용한 성장모형 기반의 시장 성장패턴 지도 구축: ICT제품을 중심으로 (Development of Market Growth Pattern Map Based on Growth Model and Self-organizing Map Algorithm: Focusing on ICT products)

  • 박도형;정재권;정여진;이동원
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.1-23
    • /
    • 2014
  • 시장 예측은 일정 기간 동안 소비자에게 판매되는 동종 제품 또는 서비스의 수량 혹은 매출액의 규모를 추정하는 활동으로 정의할 수 있다. 정확한 시장 예측은 기업의 입장에서 새로운 제품의 도입시기 결정, 제품 설계, 생산계획 수립, 마케팅 전략 수립 등에 활용됨으로써 경영활동에 있어 효율적인 의사결정을 내릴 수 있게 하고, 정부의 입장에서는 발전 가능성이 있는 분야에 국가예산을 더 배분할 수 있는 효율적인 예산수립이 가능하게 한다. 본 연구는 정보통신기술(Information and Communication Technology: ICT) 분야의 제품 및 서비스에 대해서 과거의 시계열 자료를 이용하여 시장 성장곡선을 도출하고, 성장패턴이 비슷한 그룹으로 분류하여, 산업 내 시장에 대해 이해하고, 제품들의 미래 전망을 예측하는 데 목적이 있다. 다양한 아이템들을 통일되고 일관적인 방법으로 예측하기 위하여, 로지스틱 모형, 곰페르츠 모형, Bass 모형의 세 가지 전통적인 성장모형과 로지스틱 모형이나 곰페르츠 모형에서 도출되는 잠재시장 크기를 Bass 모형에 결합시킨 두 가지 하이브리드 성장모형을 개발하여 비교 분석하였다. 데이터 설명력이 우수한 로지스틱 + Bass 모형을 최적의 모형으로 선정하여 ICT 제품 및 서비스들 각각의 시장 성장곡선 모수를 확인하였다. 도출된 모수를 데이터로 하여, 자기조직화 지도 알고리즘을 통해, 5개의 의미 있는 영역으로 구분된 시장 성장패턴 지도가 구축되었는데, 각 영역별로 차별화된 특징과 성장패턴을 가지고 있었다. 본 연구에서 제안한 프로세스 및 시스템은 산업 시장 분석 시스템의 수요 예측 기능으로 활용될 수 있으며, ICT 산업뿐만 아니라 다양한 산업 및 분야에도 적용 가능할 것으로 기대된다.

작물모형의 생물계절 및 잠재수량 예측력 개선 방법 탐색: I. 유전 모수 정보 향상으로 콩의 개화시기 및 잠재수량 예측력 향상이 가능한가? (Exploring Ways to Improve the Predictability of Flowering Time and Potential Yield of Soybean in the Crop Model Simulation)

  • 정유란;신평;서명철
    • 한국농림기상학회지
    • /
    • 제19권4호
    • /
    • pp.203-214
    • /
    • 2017
  • 본 연구에서는 진주, 수원, 춘천의 정보로만 추정한 유전 모수(New1~New3)와 지역 조합으로 추정한 유전 모수(New4~New7), NICS (2010)와 Kim et al. (2004)의 유전 모수의 개화시기 및 잠재수량의 예측력을 평가하여 기존의 유전 정보와 새로운 유전 정보에 대한 불확실 정도를 알고 다음 후속 연구에 활용 가능성을 알아보고자 수행했다. 결과적으로, 개별 및 지역조합 유전 모수에서 모수 추정 지점 혹은 참여한 지점의 유전 모수의 평가 지표들은 비교적 좋은 결과를 보여 주었지만 뚜렷하게 나타나지 않았다. 대구, 밀양, 전주에서 New7 유전 모수의 개화시기의 예측력은 NICS (2010)나 Kim et al. (2004)의 유전 모수의 개화 시기 예측력보다 개선되지 않았다. 그러나 New7 유전 모수의 잠재수량의 예측력은 큰 차이는 아니지만 NICS (2010)나 Kim et al. (2004)의 유전 모수의 잠재 수량 예측력보다 개선되는 현상을 보였다. 예를 들면, 밀양에서 NICS (2010)와 Kim et al. (2004)의 유전 모수의 잠재수량 결정계수가 0.00과 0.01로 전혀 예측력이 없는 것으로 평가하였지만 New7 유전 모수의 잠재수량 결정계수는 0.31로 나타났다. 반면, 전주에서 NICS (2010)과 Kim et al. (2004)의 유전 모수의 잠재수량 결정계수는 0.66과 0.41로 평가되었는데, New7 유전 모수의 잠재수량 결정계수는 0.00으로 예측력이 없는 것으로 평가되었다. 새로운 유전 모수의 예측력(New1~New7)이 기존의 유전 모수(NICS (2010)과 Kim et al. (2004))의 예측력보다 크게 개선되지는 않았지만, 평가 결과가 좋은 지역 조합 유전 모수를 지역별 개화시기 및 잠재수량을 예측하는 데에는 활용할 수 있을 것으로 판단된다.

부품 내장 공정을 이용한 5G용 내장형 능동소자에 관한 연구 (The Study on the Embedded Active Device for Ka-Band using the Component Embedding Process)

  • 정재웅;박세훈;유종인
    • 마이크로전자및패키징학회지
    • /
    • 제28권3호
    • /
    • pp.1-7
    • /
    • 2021
  • 본 논문에서는 Bare-die Chip 형태의 Drive amplifier를 Ajinomoto Build-up Film (ABF)와 FR-4로 구성된 PCB에 내장함으로써 28 GHz 대역 모듈에서 적용될 수 있는 내장형 능동소자 모듈을 구현하였다. 내장형 모듈에 사용된 유전체 ABF는 유전율 3.2, 유전손실 0.016의 특성을 가지고 있으며, Cavity가 형성되어 Drive amplifier가 내장되는 FR4는 유전율 3.5, 유전손실 0.02의 특성을 가진다. 제안된 내장형 Drive amplifier는 총 2가지 구조로 공정하였으며 측정을 통해 각각의 S-Parameter특성을 확인하였다. 공정을 진행한 2가지 구조는 Bare-die Chip의 패드가 위를 향하는 Face-up 내장 구조와 Bare-die Chip의 패드가 아래를 향하는 Face-down내장 구조이다. 구현한 내장형 모듈은 Taconic 사의 TLY-5A(유전율 2.17, 유전손실 0.0002)를 이용한 테스트 보드에 실장 하여 측정을 진행하였다. Face-down 구조로 내장한 모듈은 Face-up 구조에 비해 Bare-die chip의 RF signal패드에서부터 형성된 패턴까지의 배선 길이가 짧아 이득 성능이 좋을 것이라 예상하였지만, Bare-die chip에 위치한 Ground가 Through via를 통해 접지되는 만큼 Drive amplifier에 Ground가 확보되지 않아 발진이 발생한다는 것을 확인하였다. 반면 Bare-die chip의 G round가 부착되는 PCB의 패턴에 직접적으로 접지되는 Face-up 구조는 25 GHz에서부터 30 GHz까지 약 10 dB 이상의 안정적인 이득 특성을 냈으며 목표주파수 대역인 28 GHz에서의 이득은 12.32 dB이다. Face-up 구조로 내장한 모듈의 출력 특성은 신호 발생기와 신호분석기를 사용하여 측정하였다. 신호 발생기의 입력전력(Pin)을 -10 dBm에서 20 dBm까지 인가하여 측정하였을 때, 구현한 내장형 모듈의 이득압축점(P1dB)는 20.38 dB으로 특성을 확인할 수 있었다. 측정을 통해 본 논문에서 사용한 Drive amplifier와 같은 Bare-die chip을 PCB에 내장할 때 Ground 접지 방식에 따라 발진이 개선된다는 것을 검증하였으며, 이를 통해 Chip Face-up 구조로 Drive amplifier를 내장한 모듈은 밀리미터파 대역의 통신 모듈에 충분히 적용될 수 있을 것이라고 판단된다.

항공 LiDAR 원자료 필터링 조건에 따른 산림지역 수치표고모형 정확도 평가 (The Accuracy Evaluation of Digital Elevation Models for Forest Areas Produced Under Different Filtering Conditions of Airborne LiDAR Raw Data)

  • 조승완;최형태;박주원
    • 농업생명과학연구
    • /
    • 제50권3호
    • /
    • pp.1-11
    • /
    • 2016
  • 3차원 지형정보를 얻기 위하여 항공 LiDAR(Light Detection and Ranging)자료 기반 수치표고모델(Digital Elevation Model, DEM) 생성에 대한 연구들에 대한 관심이 지속적으로 높아져 왔다. 항공 LiDAR 원자료로부터 정확도가 높은 DEM을 생성하기 위해서는 3차원 점군에서 비지면점을 제외시키고 지면점만을 포함시키는 필터링(filtering)과정이 중요하다. 특히, 필터링을 구성하는 알고리즘의 패러미터 값 변화에 따라 산출되는 결과물들에 차이가 발생하고 정확도에 영향을 준다. 따라서 본 연구는 화천, 양주, 경산 및 장흥 유역 대상지의 항공 LiDAR 자료로부터 Fusion 소프트웨어를 이용하여 LiDAR DEM을 생성하는 GroundFilter알고리즘의 Mean패러미터(GFmn) 수준 변화가 LiDAR DEM 결과물의 정확도에 어떤 영향을 주는지 분석하였다. GFmn 수준 변화에 따른 정확도에 대한 영향 여부를 분석하기 위해 일원배치분산분석을 실시하였고, 그 결과 GFmn의 수준 변화에 따라 정확도에 대한 영향이 유의미하게 나타났다(F-value: 4.915, p<0.01). 이 후 각각의 GFmn 수준들을 다른 수준들과 차이가 있는지 여부로 묶기 위하여 사후검정을 실시하였다. 사후분석을 통해 잔차의 평균 차이에 따라 '7, 5, 9, 3'과 '1' 두 집단으로 나뉘었다. 아울러 보다 정확한 해발고도를 표현하는 LiDAR DEM 생성하는데 적정 GFmn은 '7' 조건일 때로 나타났다. 이 연구를 통해 보다 정확한 해발고도를 표현하는 LiDAR DEM을 생성할 수 있는 패러미터 값을 제안하였다.

농업기상재해 조기경보시스템에서의 고해상도 격자형 자료의 처리 속도 향상 기법 (Speed-up Techniques for High-Resolution Grid Data Processing in the Early Warning System for Agrometeorological Disaster)

  • 박주현;신용순;김성기;강위수;한용규;김진희;김대준;김수옥;심교문;박은우
    • 한국농림기상학회지
    • /
    • 제19권3호
    • /
    • pp.153-163
    • /
    • 2017
  • 데이터 처리 속도는 예보 능력과 관련이 있다. 최신의 입력 자료를 이용한 예측 데이터의 고속 생산은 신속한 대처를 가능하게 한다. 또한 알고리즘 작성, 계산, 결과 평가, 알고리즘 개선으로 이어지는 순환 구조를 원활하게 할 뿐만 아니라 오류 발생시 빠른 시간 내에 복구할 수 있게 하는 등 매우 중요한 요소이다. 현재의 조기경보 시스템은 매 계산 주기 마다 섬진강 유역의 10개 시군에 대해 30미터 해상도의 격자형 자료를 400개 이상 생성하고 있으며(중간 데이터 포함) 최대 9일까지 예보되는 자료를 포함할 경우 600개 이상이다. 이는 전국을 30미터 해상도로 약 45개를 생성하는 계산양과 비슷하다. 또한 14,000여개의 필지에 대한 구역 통계와, 각 래스터의 평균, 최대, 최소 등의 통계자료 생성도 함께 수행 해야 한다. 이와 같은 대량의 데이터를 한정된 시간 내로 처리하기 위한 몇 가지 기법을 적용하여 적용하였으며, 아직 적용은 못하였으나 가능성의 여부를 평가해 보는 것으로 본 연구를 진행하였다. 그 결과 앞서 제시된 래스터 캐시, NFS 캐시, 분산 처리를 모두 적용할 경우 데이터 처리 시간을 1/8로 단축 시킬 수 있음이 확인되었다. 또한 GPU를 이용한 연산을 적용할 경우 일부 모듈에 대해 매우 큰 폭으로 수행 시간을 단축 시킬 수 있음을 확인하였다. 다만 캐시를 위한 추가적인 디스크, GPU라는 별도의 하드웨어, 추가된 하드웨어 지원을 위한 고출력 전원 장치와 이에 따른 UPS (Uninterruptible power supply, 무정전 전원공급 장치)까지 상대적으로 높은 사양으로 준비해야 하는 비용적인 문제가 발생할 수 있다. 본 연구에서 제시한 네 가지 기법 중 세 가지는 계산 서버 추가를 통한 수평적 성능 확장에 관한 것이다. 하지만 서버의 추가가 처리 속도 향상으로 이어지지 않음은 물론 오히려 저하시키는 경우가 있다. 본 연구에서는 특정 시간 내로 작업을 완료 시키지 못하면 해당 작업을 반환하여 다른 서버가 처리하는 간단한 방식을 이용한다. 하지만 이런 문제를 지속적으로 발생시키는 계산 서버가 발견된다면 정해진 기준에 따라 계산 작업에서 완전히 퇴출 시켜야 성능 향상에 도움이 된다. 따라서 처리 속도에 대한 정확한 원인을 검사하고 이를 실시간으로 반영할 수 있는 기법이 필요하다.

학습, 혁신역량과 혁신성과 간의 관계에 관한 연구 (A Study on the Relationship of Learning, Innovation Capability and Innovation Outcome)

  • 김귀원
    • 기술혁신학회지
    • /
    • 제17권2호
    • /
    • pp.380-420
    • /
    • 2014
  • 오늘날 불확실성이 증가하면서 조직구성원의 전문역량, 즉 혁신역량에 대한 중요성이 커지고 있다. 이러한 실정에도 불구하고, 조직원 개인의 혁신역량에 대해 혁신산출물을 만들기 위한 투입요소, 혁신 활동(혁신역량보유, 발휘, 증진노력 등) 그리고 혁신산출물 간의 관계에 관한 연구는 아직까지 많지 않은 편이다. 이런 원인은 기존 혁신연구단위가 국가단위, 산업단위, 기업단위에서 이루어지는 것이 일반적이기 때문이며, 상대적으로 특정기업의 투입, 산출 및 혁신활동 자체에 대한 분석이 다소 부족한 편이다. 그러므로 이 연구는 기존 혁신연구의 틀과 시각에서 벗어나, 특정조직중심의 개인별 혁신성과와 그 성과와 관련성이 높을 것으로 추정되는 혁신활동들에 대한 네 가지 가설, 즉 첫째는 역량의 차이에 따라 혁신성과는 차이가 있을 것이다. 둘째, 학습시간의 차이에 따라 역량은 차이가 있을 것이다. 셋째, 학습시간의 차이에 따라 혁신성과는 차이가 있을 것이다. 넷째, 학습시간과 혁신성과 간의 관계에는 혁신역량의 매개효과가 있을 것이다(구조모형 검정)는 문제에 대해 정량분석을 시도하여, 조직 경쟁력을 향상시키기 위한 정책적 시사점을 도출하는 것을 연구목적으로 한다.

Dual detector system에서 Brain SPECT의 new reconstruction method의 연구 (The Study of New Reconstruction Method for Brain SPECT on Dual Detector System)

  • 이형진;김수미;이홍재;김진의;김현주
    • 핵의학기술
    • /
    • 제13권1호
    • /
    • pp.57-62
    • /
    • 2009
  • 목적 : 기존의 fan-beam을 이용한 triple detector system에서 parallel collimator를 이용한 dual detector system으로 변화에 있어 acquisition과 processing 부분에서 발생할 수 있는 여러 가지의 변수를 phantom과 volunteer test를 통하여 실험해 보았다. 1 day protocol brain spect를 위하여 parallel collimator에서만 적용되는 OSEM2D와 OSEM3D의 비교 분석을 중점으로 하였고, 모든 연구는 동등한 검사시간으로 fan-beam을 사용하였던 Triple gamma camera보다 parallel을 사용한 dual camera에서 보다 우수한 영상을 구현하고자 하는 목표를 지향하였다. 실험재료 및 방법 : Normal time scan과 short time scan을 실시하였고, collimator 변화에 따른 영상의 변화도 알아보았다. Jaczack performance phantom과 Body IEC phantom을 이용하여 SNR과 contrast를 평가해보았고 Hoffman 3D phantom의 실험을 거쳐 volunteer test를 실시하였다. 결과 : Normal time과 short time의 비교에서는 FLASH3D를 제외한 OSEM2D와 FBP는 분석방법으로 부적합하였다. LEAP는 resolution과 sharpness 등 전체적인 영상의 질이 기존의 fan-beam을 이용한 영상과 유사하였고, LEUHR은 감도의 저하로 1 day protocol을 적용하기 위한 scan time에는 부적합하였다. 재구성법의 비교에서는 Flash-3D를 이용한 결과들이 기존의 FBP와 OSEM-2D보다 월등히 정확함을 정성적으로 확인하였다. 결론 : OSEM3D 재구성법으로 Dual detector system에서의 1 day protocol brain SPECT 시 Fan-beam보다 sensitivity가 떨어지는 parallel collimator의 단점을 보완하면서 영상의 질 또한 de-noising과 scatter correction, resolution recovery 등의 효과를 얻을 수 있으므로 1 day protocol brain SPECT의 검사의 적용에 유용할 것으로 사료된다. 그러나 이러한 half-time method라 제공되는 다양한 프로그램의 임상적용에 대한 광범 위한 연구가 현실적으로 필요하며 향후 계속적인 연구가 기대되는 바이다.

  • PDF