• Title/Summary/Keyword: Machine Accuracy

Search Result 3,157, Processing Time 0.027 seconds

사회문제 해결 연구보고서 기반 문장 의미 식별 데이터셋 구축 (Building Sentence Meaning Identification Dataset Based on Social Problem-Solving R&D Reports)

  • 신현호;정선기;전홍우;권이남;이재민;박강희;최성필
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권4호
    • /
    • pp.159-172
    • /
    • 2023
  • 일반적으로 사회문제 해결 연구는 과학기술을 활용하여 다양한 사회적 현안들에 의미있는 해결 방안을 제시함으로써 중요한 사회적 가치를 창출하는 것을 연구 목표로 한다. 그러나 사회문제와 쟁점을 완화하기 위하여 많은 연구들이 국가적으로 수행되었음에도 불구하고 여전히 많은 사회문제가 남아 있는 상황이다. 사회문제 해결 연구의 전 과정을 원활하게 하고 그 효과를 극대화하기 위해서는 사회적으로 시급한 현안들에 대한 문제를 명확하게 파악하는 것이 중요하다. 사회문제 해결과 관련된 기존 R&D 보고서와 같은 자료에서 중요한 사안을 자동으로 식별할 수 있다면 사회문제 파악 단계가 크게 개선될 수 있다. 따라서 본 논문은 다양한 국가 연구보고서에서 사회문제와 해결방안을 자동으로 감지하기 위한 기계학습 모델을 구축하는 데에 필수적인 데이터셋을 제안하고자 한다. 우선 데이터를 구축하기 위해 사회문제와 쟁점을 다룬 연구보고서를 총 700건 수집하였다. 수집된 연구보고서에서 사회문제, 목적, 해결 방안 등 사회문제 해결과 관련된 내용이 담긴 문장을 추출 후 라벨링을 수행하였다. 또한 4개의 사전학습 언어모델을 기반으로 분류 모델을 구현하고 구축된 데이터셋을 통해 일련의 성능 실험을 수행하였다. 실험 결과 KLUE-BERT 사전학습 언어모델을 미세조정한 모델이 정확도 75.853%, F1 스코어 63.503%로 가장 높은 성능을 보였다.

카드산업에서 휴면 고객 예측 (Prediction of Dormant Customer in the Card Industry)

  • 이동규;신민수
    • 서비스연구
    • /
    • 제13권2호
    • /
    • pp.99-113
    • /
    • 2023
  • 고객 기반의 산업에서 고객 Retention은 기업의 경쟁력이라 할 수 있으며, 고객 Retention을 높이는 것은 기업의 경쟁력을 높이는 것이라 할 수 있다. 따라서, 미래 휴면 고객을 잘 예측하여 관리하는 것은 기업의 경쟁력을 높이는데 무엇보다 중요하다. 왜냐하면, 신규 고객을 유치하는데 필요한 비용이 기존 고객을 Lock-in 시키는데 드는 비용 보다 많은 것으로 알려져 있기 때문이다. 특히, 수 많은 카드사가 존재하는 국내 카드 산업의 휴면 카드를 관리하고자 정부에서 휴면 카드 자동 해지 제도를 도입하고 있으며, 카드 산업에서 휴면 고객을 관리하는 것이 무엇보다 중요한 과제로 떠오르고 있다. 본 연구에서는 카드 산업에서 휴면 고객을 예측하기 위해 Recurrent Neural Network (RNN)방법론을 사용하였으며, RNN방법론 중에서 긴 시간을 효율적으로 학습할 수 있는 Long-Short Term Memory (LSTM)을 활용하였다. 또한, 통합기술수용이론 (UTAUT)을 입각하여 카드 산업에서 휴면 고객을 예측하는데 필요한 변수를 재정의하였다. 그 결과 안정된 모형의 정확도와 F-1 score를 얻을 수 있었으며, Hit-Ratio를 통하여 모형의 안정된 결과를 입증하였다. 기존 연구에서 지적된 통합기술수용이론 (UTAUT)에서 발생 될 수 있는 인구통계학적 정보의 조절 효과도 발생 되지 않은 것을 보였으며, 이로 인해 통합기술수용이론(UTAUT)를 이용한 변수 선정 모형에서 LSTM을 이용한 휴면 고객 예측 모형은 편향되지 않고 안정된 결과를 가져다 줄 수 있다는 것을 입증하였다.

Reliability of mortar filling layer void length in in-service ballastless track-bridge system of HSR

  • Binbin He;Sheng Wen;Yulin Feng;Lizhong Jiang;Wangbao Zhou
    • Steel and Composite Structures
    • /
    • 제47권1호
    • /
    • pp.91-102
    • /
    • 2023
  • To study the evaluation standard and control limit of mortar filling layer void length, in this paper, the train sub-model was developed by MATLAB and the track-bridge sub-model considering the mortar filling layer void was established by ANSYS. The two sub-models were assembled into a train-track-bridge coupling dynamic model through the wheel-rail contact relationship, and the validity was corroborated by the coupling dynamic model with the literature model. Considering the randomness of fastening stiffness, mortar elastic modulus, length of mortar filling layer void, and pier settlement, the test points were designed by the Box-Behnken method based on Design-Expert software. The coupled dynamic model was calculated, and the support vector regression (SVR) nonlinear mapping model of the wheel-rail system was established. The learning, prediction, and verification were carried out. Finally, the reliable probability of the amplification coefficient distribution of the response index of the train and structure in different ranges was obtained based on the SVR nonlinear mapping model and Latin hypercube sampling method. The limit of the length of the mortar filling layer void was, thus, obtained. The results show that the SVR nonlinear mapping model developed in this paper has a high fitting accuracy of 0.993, and the computational efficiency is significantly improved by 99.86%. It can be used to calculate the dynamic response of the wheel-rail system. The length of the mortar filling layer void significantly affects the wheel-rail vertical force, wheel weight load reduction ratio, rail vertical displacement, and track plate vertical displacement. The dynamic response of the track structure has a more significant effect on the limit value of the length of the mortar filling layer void than the dynamic response of the vehicle, and the rail vertical displacement is the most obvious. At 250 km/h - 350 km/h train running speed, the limit values of grade I, II, and III of the lengths of the mortar filling layer void are 3.932 m, 4.337 m, and 4.766 m, respectively. The results can provide some reference for the long-term service performance reliability of the ballastless track-bridge system of HRS.

인공지능 기법을 활용한 한반도 해역의 수질평가지수 예측모델 개발 (Development of a Water Quality Indicator Prediction Model for the Korean Peninsula Seas using Artificial Intelligence)

  • 김성수;손규희;김도연;허장무;김성은
    • 해양환경안전학회지
    • /
    • 제29권1호
    • /
    • pp.24-35
    • /
    • 2023
  • 급격한 산업화와 도시화로 인해 해양 오염이 심각해지고 있으며, 이러한 해양 오염을 실효적으로 관리하기 위해 수질평가지수(Water Quality Index, WQI)를 마련하여 활용하고 있다. 하지만 수질평가지수는 다소 복잡한 계산과정으로 인한 정보의 손실, 기준값 변동, 실무자의 계산오류, 통계적 오류 등의 불확실성(uncertainty)을 내포하고 있다. 이에 따라 국내·외에서 인공지능 기법을 활용하여 수질평가지수를 예측하기 위한 연구가 활발히 이루어지고 있다. 본 연구에서는 해양환경측정망 자료(2000 ~ 2020년)를 활용하여 우리나라 전 해역 즉, 5개의 생태구에 대한 WQI를 추정할 수 있는 가장 적합한 인공지능기법을 도출하기 위해 총 6가지의 기법(RF, XGBoost, KNN, Ext, SVM, LR)을 실험하였다. 그 결과, Random Forest 기법이 다른 기법에 비해 가장 우수한 성능을 보였다. Random Forest 기법의 WQI 점수 예측값과 실제값의 잔차 분석 결과, 모든 생태구에서 시간적 및 공간적 예측 성능이 우수한 것으로 나타났다. 이를 통해 본 연구에서 개발한 Random Forest 기법은 높은 정확도를 바탕으로 우리나라 전해역에 대한 WQI를 예측 가능할 것으로 사료된다.

프로세스 마이닝을 활용한 온라인 교육 오픈 플랫폼 내 학습 패턴 분석 방법 개발 (Toward understanding learning patterns in an open online learning platform using process mining)

  • 김태영;김효민;조민수
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.285-301
    • /
    • 2023
  • 비대면 교육의 중요성 및 필요에 따른 수요가 증가함에 따라 국내외 온라인 교육 오픈 플랫폼이 활성화되고 있다. 본 플랫폼은 대학 등 교육 전문기관과 달리 학습자의 자율성이 높은 특징을 가지며 이에 따라 개인화된 학습 도구를 지원하기 위한 학습 행동 데이터의 분석 연구가 중요시 되고 있다. 실제적인 학습 행동을 이해하고 패턴을 도출하기 위하여 프로세스 마이닝이 다수 활용되었지만 온라인 교육 플랫폼과 같이 자기 관리형(Self-regulated) 환경에서의 학습 로그를 기반한 사례는 부족하다. 또한, 대부분 프로세스 모델 도출 등의 모델 관점에서의 접근이며 분석 결과의 실제적인 적용을 위한 개별 패턴 및 인스턴스 관점에서의 방법 제시는 미흡하다. 본 연구에서는 온라인 교육 오픈 플랫폼 내 학습 패턴을 파악하기 위하여 프로세스 마이닝을 활용한 분석 방법을 제시한다. 학습 패턴을 다각도로 분석하기 위하여 모델, 패턴, 인스턴스 관점에서의 분석 방법을 제시하며, 프로세스 모델 발견, 적합도 검사, 군집화 기법, 예측 알고리즘 등 다양한 기법을 활용한다. 본 방법은 국내 오픈 교육 플랫폼 내 기계학습 관련 강좌의 학습 로그를 추출하여 분석하였다. 분석 결과 온라인 강의의 특성에 맞게 비구조화된 프로세스 모델을 도출할 수 있었으며 구체적으로 한 개의 표준 학습 패턴과 세 개의 이상 학습 패턴으로 세분화할 수 있었다. 또한, 인스턴스별 패턴 분류 예측 모델을 도출한 결과 전체 흐름 중 초기 30%의 흐름을 바탕으로 예측하였을 때 0.86의 분류 정확도를 보였다. 본 연구는 프로세스 마이닝을 활용하여 학습자의 패턴을 체계적으로 분석한다는 점에서 기여점을 가진다.

심층신경망을 활용한 데이터 기반 ESG 성과 예측에 관한 연구: 기업 재무 정보를 중심으로 (Predicting Future ESG Performance using Past Corporate Financial Information: Application of Deep Neural Networks)

  • 김민승;문승환;최성원
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.85-100
    • /
    • 2023
  • 최근 기업의 지속가능경영 역량으로 대변되는 기업 ESG 성과(environmental, social, and corporate governance)가 투자의사 결정에 주요 요인 중 하나로 부각되고 있다. 전통적 ESG 성과 평가 프로세스는 평가기관마다의 고유 기준에 따라 질적 정성적 방식으로 수행되어 그 평가 소요 시간 및 비용이 큰 데 비해 투자의사 결정 시 신뢰성과 예측 가능성 및 적시성에 제약이 존재한다. 이에 본 연구에서는 정량화되고 공개된 기업 재무 정보를 활용하여 머신러닝을 통한 자동화된 기업 ESG 평가 예측을 시도하였다. 심층신경망 기법을 활용해 2019년부터 2021년까지 3년간 한국ESG기준원에서 제공한 1,780건의 ESG 평가에 대하여 총 12종(21,360건)의 시장 공개 재무 정보를 기반으로 예측 모형을 구축한 결과, 제안된 심층신경망 모형은 약 86%의 분류성능을 보여 여타 비교모형 대비 크게 높은 정확도를 나타냈다. 본 연구는 정량적이고 공개된 과거 기업 재무 정보만으로도 자동화된 프로세스를 통해 비교적 정확한 미래 ESG 평가 예측을 달성할 수 있었다는 점에 의의가 크다. 특히 기업 ESG 관련 정보 접근이 상대적으로 불리한 일반 투자자들의 입장에서 볼 때 낮은 비용과 적은 시간 투자로도 기업 ESG 성과 평가에 대한 예측 가능성과 적시성을 향상 시킬 수 있다는 점에 실용적 함의가 있다. 또한 본 연구는 향후 추가적인 국내외 데이터 수집 및 모형 고도화를 통해 기업 ESG 성과 예측 분야에서의 확장이 기대된다.

폼 구조의 유효 기계적 물성 및 열전도율 예측을 위한 균질화 데이터 기반 전이학습 프레임워크의 개발 (Development of Homogenization Data-based Transfer Learning Framework to Predict Effective Mechanical Properties and Thermal Conductivity of Foam Structures)

  • 이원주;김수한;심현종;이주호;안병혁;김유정;정상융;신현성
    • Composites Research
    • /
    • 제36권3호
    • /
    • pp.205-210
    • /
    • 2023
  • 본 연구에서는 폼 구조의 효율적인 유효 기계적 물성 및 열전도율 예측을 위한 균질화 데이터 기반 전이학습 프레임워크를 개발하였다. Eshelby 텐서 기반의 평균장 균질화(Mean-field homogenization, MFH)는 타원체 형태의 공동을 포함하는 다공성 구조의 물성을 효율적으로 예측할 수 있지만, 셀룰러(cellular) 폼 구조의 물성은 정확하게 예측하기 어렵다. 한편, 유한요소 균질화(Finite element homogenization, FEH)는 정확성은 높지만 상대적으로 높은 해석 시간을 동반한다. 본 논문에서는 평균장 균질화와 유한요소 균질화의 장점을 결합한 데이터 기반 전이학습 프레임워크(Framework)를 제안하였다. 구체적으로, 대량의 평균장 균질화 데이터를 도출하여 사전학습 모델(Pre-trained model)을 구축하고, 상대적으로 소량의 유한요소 균질화 데이터를 이용하여 미세 조정(Fine-tuning) 하였다. 제안된 프레임워크를 검증하기 위한 수치 예제를 수행하였으며, 해석 정확도를 확인하였다. 본 연구의 결과는 다양한 폼 구조를 가진 재료의 해석에 적용할 수 있을 것으로 기대한다.

수로의 기계화 시공의 필요성 (The need for mechanization in todays canal building program in korea and overseas)

  • Ha, Gordon P.wkins
    • 한국농공학회지
    • /
    • 제21권2호
    • /
    • pp.21-27
    • /
    • 1979
  • 옛날에는 인력(人力)으로 수로(水路)를 만들었으나 기계(機械)의 발달(發達) 및 임금(賃金)의 상승(上昇)에 따라 기계화(機械化) 시공(施工)이 경제적(經濟的)으로 유리(有利)하게 되었으며 앞으로 이런 현상은 더욱 가속(加速)될 것이다. 수로(水路)의 기계시공(機械施工)은 굴착, 정리(整理), 포장(鋪裝)으로 나누어지며 굴착은 수로(水路)의 단면(斷面)을 대략적인 형태(形態)로 만드는 것이고 정리(整理)는 포장(鋪裝)을 할수 있게 .수로(水路)의 사면(斜面)과 바닥을 정확한 모양으로 다듬는 것이다. 정리(整理)의 정밀도(精密度)에 따라 포장용(鋪裝用) 재료(材料)의 양(量)이 크게 좌우(左右)된다. 자동정리기(自動整理機)는 종래의 것이 $20{\sim}40mm$의 표면(表面) 요철(凹凸)이 생기게 하나 현재(現在)는 ${\pm}6mm$의 정도(程度)까지 가능(可能)하다. 현재(現在)의 자동기계(自動機械)는 1인(人)의 운전원(運轉員)이 1일(日) $1,000{\sim}2,000m^3$까지 굴착 정리(整理)를 할수 있다. 콘크리트 포장(鋪裝)은 인력(人力)비빔으로 할때 1일(日) $2m^3/day$의 양(量)도 어렵고 로타리 믹서를 써도 $20m^3/day$ 정도(程度)이나 콘크리트 뱃치 푸랜트로 하면 $100{\sim}500m^3\day$가 가능하다. 그러나 대형(大型) 포장기(鋪裝機)를 사용(使用)하면 1일(日) 대형(大型) 수로(水路) $300{\sim}1,000m$를 포장(鋪裝)할수 있다. 수로(水路)의 기계시공(機械施工)은 콘크리트 포장(鋪裝) 두께를 균일(均一)하게 하므로써 콘크리트 비용(費用)을 최대(最大)로 절감(節減)하며 포장(鋪裝)의 품질(品質)을 좋게한다. 수로(水路)의 기계시공외(機械施工外)에도 많은 새로운 기계(機械)들이 사용(使用)되고 있으며 이러한 기계(機械)의 활용(活用)이 기술발전(技術發展)에 크게 기여하게 될 것이다.

  • PDF

낙동강권역의 지하수 산출 유망도 평가 (A Groundwater Potential Map for the Nakdonggang River Basin)

  • 유순영;정재훈;박길택;문희선;석희준;김용철;고동찬;고경석;김형찬;문상호;신제현;심병완;최한나;하규철
    • 한국지하수토양환경학회지:지하수토양환경
    • /
    • 제28권6호
    • /
    • pp.71-89
    • /
    • 2023
  • A groundwater potential map (GPM) was built for the Nakdonggang River Basin based on ten variables, including hydrogeologic unit, fault-line density, depth to groundwater, distance to surface water, lineament density, slope, stream drainage density, soil drainage, land cover, and annual rainfall. To integrate the thematic layers for GPM, the criteria were first weighted using the Analytic Hierarchical Process (AHP) and then overlaid using the Technique for Ordering Preferences by Similarity to Ideal Solution (TOPSIS) model. Finally, the groundwater potential was categorized into five classes (very high (VH), high (H), moderate (M), low (L), very low (VL)) and verified by examining the specific capacity of individual wells on each class. The wells in the area categorized as VH showed the highest median specific capacity (5.2 m3/day/m), while the wells with specific capacity < 1.39 m3/day/m were distributed in the areas categorized as L or VL. The accuracy of GPM generated in the work looked acceptable, although the specific capacity data were not enough to verify GPM in the studied large watershed. To create GPMs for the determination of high-yield well locations, the resolution and reliability of thematic maps should be improved. Criterion values for groundwater potential should be established when machine learning or statistical models are used in the GPM evaluation process.

MLOps를 위한 효율적인 AI 모델 드리프트 탐지방안 연구 (A Study on Efficient AI Model Drift Detection Methods for MLOps)

  • 이예은;이태진
    • 인터넷정보학회논문지
    • /
    • 제24권5호
    • /
    • pp.17-27
    • /
    • 2023
  • 오늘날 AI(Artificial Intelligence) 기술이 발전하면서 실용성이 증가함에 따라 실생활 속 다양한 응용 분야에서 널리 활용되고 있다. 이때 AI Model은 기본적으로 학습 데이터의 다양한 통계적 속성을 기반으로 학습된 후 시스템에 배포되지만, 급변하는 데이터의 상황 속 예상치 못한 데이터의 변화는 모델의 성능저하를 유발한다. 특히 보안 분야에서 끊임없이 생성되는 새로운 공격과 알려지지 않은 공격에 대응하기 위해서는 배포된 모델의 Drift Signal을 찾는 것이 중요해짐에 따라 모델 전체의 Lifecycle 관리 필요성이 점차 대두되고 있다. 일반적으로 모델의 정확도 및 오류율(Loss)의 성능변화를 통해 탐지할 수 있지만, 모델 예측 결과에 대한 실제 라벨이 필요한 점에서 사용 환경의 제약이 존재하며, 실제 드리프트가 발생한 지점의 탐지가 불확실한 단점이 있다. 그 이유는 모델의 오류율의 경우 다양한 외부 환경적 요인, 모델의 선택과 그에 따른 파라미터 설정, 그리고 새로운 입력데이터에 따라 크게 영향을 받기에 해당 값만을 기반으로 데이터의 실질적인 드리프트 발생 시점을 정밀하게 판단하는 것은 한계가 존재하게 된다. 따라서 본 논문에서는 XAI(eXplainable Artificial Intelligence) 기반 Anomaly 분석기법을 통해 실질적인 드리프트가 발생한 시점을 탐지하는 방안을 제안한다. DGA(Domain Generation Algorithm)를 탐지하는 분류모델을 대상으로 시험한 결과, 배포된 이후 데이터의 SHAP(Shapley Additive exPlanations) Value를 통해 Anomaly score를 추출하였고, 그 결과 효율적인 드리프트 시점탐지가 가능함을 확인하였다.