• 제목/요약/키워드: statistical models

검색결과 3,039건 처리시간 0.029초

MLOps를 위한 효율적인 AI 모델 드리프트 탐지방안 연구 (A Study on Efficient AI Model Drift Detection Methods for MLOps)

  • 이예은;이태진
    • 인터넷정보학회논문지
    • /
    • 제24권5호
    • /
    • pp.17-27
    • /
    • 2023
  • 오늘날 AI(Artificial Intelligence) 기술이 발전하면서 실용성이 증가함에 따라 실생활 속 다양한 응용 분야에서 널리 활용되고 있다. 이때 AI Model은 기본적으로 학습 데이터의 다양한 통계적 속성을 기반으로 학습된 후 시스템에 배포되지만, 급변하는 데이터의 상황 속 예상치 못한 데이터의 변화는 모델의 성능저하를 유발한다. 특히 보안 분야에서 끊임없이 생성되는 새로운 공격과 알려지지 않은 공격에 대응하기 위해서는 배포된 모델의 Drift Signal을 찾는 것이 중요해짐에 따라 모델 전체의 Lifecycle 관리 필요성이 점차 대두되고 있다. 일반적으로 모델의 정확도 및 오류율(Loss)의 성능변화를 통해 탐지할 수 있지만, 모델 예측 결과에 대한 실제 라벨이 필요한 점에서 사용 환경의 제약이 존재하며, 실제 드리프트가 발생한 지점의 탐지가 불확실한 단점이 있다. 그 이유는 모델의 오류율의 경우 다양한 외부 환경적 요인, 모델의 선택과 그에 따른 파라미터 설정, 그리고 새로운 입력데이터에 따라 크게 영향을 받기에 해당 값만을 기반으로 데이터의 실질적인 드리프트 발생 시점을 정밀하게 판단하는 것은 한계가 존재하게 된다. 따라서 본 논문에서는 XAI(eXplainable Artificial Intelligence) 기반 Anomaly 분석기법을 통해 실질적인 드리프트가 발생한 시점을 탐지하는 방안을 제안한다. DGA(Domain Generation Algorithm)를 탐지하는 분류모델을 대상으로 시험한 결과, 배포된 이후 데이터의 SHAP(Shapley Additive exPlanations) Value를 통해 Anomaly score를 추출하였고, 그 결과 효율적인 드리프트 시점탐지가 가능함을 확인하였다.

딥러닝 기반 영상처리를 이용한 골재 품질 검사 (Examination of Aggregate Quality Using Image Processing Based on Deep-Learning)

  • 김성규;최우빈;이종세;이원곡;최근오;배유석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권6호
    • /
    • pp.255-266
    • /
    • 2022
  • 콘크리트의 주재료인 골재 중 굵은 골재의 품질관리는 현재 샘플링을 통한 통계적 공정관리(SPC) 방법으로 하고 있다. 본 논문은 굵은 골재에 대한 품질관리를 현재의 체거름 방식을 대신 카메라를 통해 획득한 영상을 기반으로 굵은 골재를 검사하게 바꾸어 제조 혁신을 위한 스마트팩토리를 구축하였다. 먼저, 얻은 영상을 전처리 하였고, 딥러닝으로 학습된 HED(Holistically-nested Edge Detection)필터는 각각의 물체를 Segmentation하였다. 이 Segmentation한 결과를 영상 처리하여 각각의 골재를 분석 후 이 결과를 바탕으로 조립률, 입형률을 파악한다. 영상을 통해 얻은 골재들의 조립률, 입형률을 계산하여 골재의 품질을 검사하였고 알고리즘의 정확도는 실제로 체 가름 방식을 통해 골재의 품질을 비교한 것과 90% 이상의 정확도를 보이는 결과가 나왔다. 또한 기존의 방법으로는 골재의 입형률을 검사할 수 없었지만 본문의 내용을 통해 골재의 입형률도 측정할 수 있게 되었다. 입형률의 경우 도형을 사용하여 검증하였는데 이는 ±4.5%의 차이를 보였다. 골재의 길이 측정의 경우 실제 골재의 길이를 비교하였는데 ±6%의 차이를 보였다. 실제 3차원의 데이터를 2차원의 영상에서 분석하다보니 실제 데이터와 차이가 생겼는데 이는 추후 연구가 필요하다.

초 장단기 통합 태양광 발전량 예측 기법 (Very Short- and Long-Term Prediction Method for Solar Power)

  • 윤문섭;임세령;장한승
    • 한국전자통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.1143-1150
    • /
    • 2023
  • 세계적 기후 위기와 저탄소 정책 이행으로 신재생 에너지에 관한 관심이 높아지고 이와 관련된 산업이 증가하고 있다. 이 중에서 태양 에너지는 고갈되지 않고 오염 물질이나 온실가스를 배출하지 않는 대표적인 친환경 에너지로 주목받고 있으며, 이에 따라 세계적으로 태양광 발전 시설 보급이 증가하고 있다. 하지만 태양광 발전은 지리, 날씨와 같은 환경의 영향을 받기 쉬우므로 안정적인 운영과 효율적인 관리를 위해 정확한 발전량 예측이 중요하다. 하지만 변동성이 큰 태양광 발전을 수학적 통계 기술로 정확한 발전량을 예측하는 것은 불가능하다. 이를 위해서 정확하고 효과적인 예측을 위해 딥러닝 기반의 기술에 관한 연구는 필수적이다. 또한, 기존의 딥러닝을 활용한 예측 방식은 장, 단기적인 예측을 나누어 수행하기 때문에 각각의 예측 결과를 얻기 위한 시간이 길어진다는 단점이 있다. 따라서, 본 연구에서는 시계열 특성을 가진 태양광 발전량 데이터를 사용하여 장단기 통합 예측을 수행하기 위해 순환 신경망의 다대다 구조를 활용한다. 그리고 이를 다양한 딥러닝 모델들에 적용하여 학습을 수행하고 각 모델의 결과를 비교·분석한다.

스타트업의 특성이 창업성과에 미치는 영향에 관한 연구: 액셀러레이터 역할의 매개효과 중심으로 (Study on Effects of Startup Characteristics on Entrepreneurship Performance: Focusing on the Intermediary Effects of the Accelerator Role)

  • 김용태;허철무
    • 벤처창업연구
    • /
    • 제18권2호
    • /
    • pp.141-156
    • /
    • 2023
  • 정보통신기술(ICT)의 발달, 정부와 민간의 스타트업 발굴 및 투자 규모의 확대는 혁신적인 아이디어를 기반으로 우수한 성과를 창출하려는 스타트업들의 창업으로 연결되고 있다. 우수한 성과를 창출한 스타트업을 롤모델로 삼고 창업을 준비하는 예비 창업자들도 지속적으로 증가하고 있으나, 성공을 경험으로 연쇄창업을 도전하는 창업자와 달리 초기 스타트업들은 팀원 채용, 기술 개발, 자금 유치 등 다양한 문제에 직면하게 된다. 액셀러레이터는 스타트업들이 직면하게 되는 다양한 문제 해결을 돕기 위해 교육, 멘토링, 컨설팅, 네트워크 연계, 초기 투자 등의 활동을 통해 스타트업이 성장할 수 있도록 멘토와 투자자의 역할을 동시에 수행한다. 본 연구는 스타트업의 특성과 창업성과가 상관관계를 가지고 있는가를 조사하고, 액셀러레이터의 역할이 스타트업의 창업성과에 매개역할을 하는지 분석하였다. 총 11개의 가설을 세우고, 실증연구를 위해 수도권을 비롯한 국내 전 지역에 소재한 스타트업 창업가와 종사자들 302명에게 설문을 받았으며, 통계분석을 위해 SPSS 23.0과 Amos 23.0을 이용하였다. 본 연구를 통해 스타트업의 특성 중 혁신성, 조직문화, 재무적 특성 그리고 학습 지향성 등과 같은 요인들이 창업성과에 직접적인 영향을 미친다기보다 액셀러레이터의 역할을 통해 창업성과로 이어지는 것을 확인할 수 있었다. 본 연구는 스타트업 특성이 창업성과에 미치는 영향요인 분석을 통해 액셀러레이터의 역할에 대한 연구와 제도적인 보완점을 제시함으로써 스타트업이 시장을 선점하고, 시장에 안착하여 안정적으로 성장할 수 있도록 투자와 차별화된 액셀러레이팅 프로그램의 확대에 기여할 것으로 생각한다.

  • PDF

Accuracy of posteroanterior cephalogram landmarks and measurements identification using a cascaded convolutional neural network algorithm: A multicenter study

  • Sung-Hoon Han;Jisup Lim;Jun-Sik Kim;Jin-Hyoung Cho;Mihee Hong;Minji Kim;Su-Jung Kim;Yoon-Ji Kim;Young Ho Kim;Sung-Hoon Lim;Sang Jin Sung;Kyung-Hwa Kang;Seung-Hak Baek;Sung-Kwon Choi;Namkug Kim
    • 대한치과교정학회지
    • /
    • 제54권1호
    • /
    • pp.48-58
    • /
    • 2024
  • Objective: To quantify the effects of midline-related landmark identification on midline deviation measurements in posteroanterior (PA) cephalograms using a cascaded convolutional neural network (CNN). Methods: A total of 2,903 PA cephalogram images obtained from 9 university hospitals were divided into training, internal validation, and test sets (n = 2,150, 376, and 377). As the gold standard, 2 orthodontic professors marked the bilateral landmarks, including the frontozygomatic suture point and latero-orbitale (LO), and the midline landmarks, including the crista galli, anterior nasal spine (ANS), upper dental midpoint (UDM), lower dental midpoint (LDM), and menton (Me). For the test, Examiner-1 and Examiner-2 (3-year and 1-year orthodontic residents) and the Cascaded-CNN models marked the landmarks. After point-to-point errors of landmark identification, the successful detection rate (SDR) and distance and direction of the midline landmark deviation from the midsagittal line (ANS-mid, UDM-mid, LDM-mid, and Me-mid) were measured, and statistical analysis was performed. Results: The cascaded-CNN algorithm showed a clinically acceptable level of point-to-point error (1.26 mm vs. 1.57 mm in Examiner-1 and 1.75 mm in Examiner-2). The average SDR within the 2 mm range was 83.2%, with high accuracy at the LO (right, 96.9%; left, 97.1%), and UDM (96.9%). The absolute measurement errors were less than 1 mm for ANS-mid, UDM-mid, and LDM-mid compared with the gold standard. Conclusions: The cascaded-CNN model may be considered an effective tool for the auto-identification of midline landmarks and quantification of midline deviation in PA cephalograms of adult patients, regardless of variations in the image acquisition method.

다중 입력 딥러닝을 이용한 서리 발생 추정 (Estimation of Frost Occurrence using Multi-Input Deep Learning)

  • 김용석;허지나;김응섭;심교문;조세라;강민구
    • 한국농림기상학회지
    • /
    • 제26권1호
    • /
    • pp.53-62
    • /
    • 2024
  • 본 연구에서는 딥러닝을 이용한 모형을 이용해서 우리나라 지역에 대한 서리 발생 예측 모형을 구축하였다. 딥러닝 모형의 학습 데이터로 다양한 기상인자들(최저기온, 풍속, 상대습도, 구름량, 강수량)을 사용하였으며, 기상인자들에 대한 통계적 분석 결과, 서리가 발생한 날과 서리가 발생하지 않은 날에 대해 각 요소별로 유의한 차이가 있는 것을 볼 수 있었다. 단일 딥러닝 모형 3가지와 다중 입력 딥러닝 모형 3가지를 이용하여 서리발생을 추정한 결과, 평균적으로 MLP가 가장 정확도가 낮았으며, LSTM, GRU 순으로 정확도가 높게 나타났고, 다중 입력 딥러닝 모형의 경우 3가지 모형이 거의 비슷한 결과가 나타났지만 그 중 평균적으로 GRU와 MLP를 이용한 모형이 가장 정확도가 높았다. 또한, 단일 딥러닝이 다중 입력 딥러닝에 비해 샘플에 따라 정확도 편차도 더 컸다. 이에 따라 결과적으로 단일 딥러닝 기반의 서리발생 예측 모형보다 다중 입력 딥러닝 기반의 서리발생 예측 모형이 안정성과 정확도와 재현율 측면에서 다소 우수한 것을 확인할 수 있었다.

2021년 지역사회건강조사를 활용한 지역사회 및 개인 수준의 요인이 자살 생각과 자살 시도에 미치는 영향: 다수준 분석 (The Effect of Community- and Individual-Level Factors on Suicidal Ideation and Attempts: A Multilevel Analysis)

  • 하소영;김진환;박해균;김영수
    • 정신신체의학
    • /
    • 제32권1호
    • /
    • pp.24-33
    • /
    • 2024
  • 연구목적 본 연구는 우리나라 19세 이상 성인을 대상으로 자살 생각과 자살 시도에 미치는 개인 수준 요인과 지역사회 수준의 요인을 분석하는 것을 목적으로 한다. 방 법 2021년 시행한 지역사회건강조사의 자료와 2021년 국가통계포털시스템(KOSIS) 자료를 통해 수집된 성인 225,965명을 연구 대상자로 하였다. 대상자의 일반적 특성, 자살 행위(자살 생각, 자살 시도) 및 지역사회 수준의 특성은 빈도(%)와 평균(표준편차)를 이용하여 분석하였으며, 개인 수준과 지역사회 수준에 대한 자살 생각 및 자살 시도에 대한 연관성은 다수준 로지스틱 회귀분석으로 분석하였다. 결 과 자살 생각과 관련된 지역사회 수준의 요인은 미충족의료였으며(Odds Ratio [OR]=1.053, 95% CI=1.035-1.071), 자살 시도와 관련된 지역사회 수준의 요인은 고령화비율(OR=1.015, 95% CI=1.001-1.030)이었다. 자살 생각과 관련된 주된 개인 수준의 요인은 스트레스 상태(OR=9.388, 95% CI=8.629-10.213), 최근 1년간 우울경험(OR=6.737, 95% CI=6.454-7.032)이었으며, 자살 시도와 관련된 주된 개인 수준의 요인은 스트레스 상태(OR=5.213, 95% CI=3.699-7.347), 최근 1년간 우울경험(OR=13.433, 95% CI:11.247-16.044)이었다. 결 론 본 연구를 통해 자살 생각과 자살 시도에 영향을 미치는 개인 수준의 요인과 지역사회 수준의 요인을 확인하였다. 연구 결과를 통하여 기존에 강조되어진 스트레스, 우울과 같은 개인 수준의 요인에 대한 관리 뿐만 아니라, 미충족의료와 같은 지역사회 수준의 요인을 고려하는 자살예방정책이 요구된다.

Performance of ChatGPT on the Korean National Examination for Dental Hygienists

  • Soo-Myoung Bae;Hye-Rim Jeon;Gyoung-Nam Kim;Seon-Hui Kwak;Hyo-Jin Lee
    • 치위생과학회지
    • /
    • 제24권1호
    • /
    • pp.62-70
    • /
    • 2024
  • Background: This study aimed to evaluate ChatGPT's performance accuracy in responding to questions from the national dental hygienist examination. Moreover, through an analysis of ChatGPT's incorrect responses, this research intended to pinpoint the predominant types of errors. Methods: To evaluate ChatGPT-3.5's performance according to the type of national examination questions, the researchers classified 200 questions of the 49th National Dental Hygienist Examination into recall, interpretation, and solving type questions. The researchers strategically modified the questions to counteract potential misunderstandings from implied meanings or technical terminology in Korea. To assess ChatGPT-3.5's problem-solving capabilities in applying previously acquired knowledge, the questions were first converted to subjective type. If ChatGPT-3.5 generated an incorrect response, an original multiple-choice framework was provided again. Two hundred questions were input into ChatGPT-3.5 and the generated responses were analyzed. After using ChatGPT, the accuracy of each response was evaluated by researchers according to the types of questions, and the types of incorrect responses were categorized (logical, information, and statistical errors). Finally, hallucination was evaluated when ChatGPT provided misleading information by answering something that was not true as if it were true. Results: ChatGPT's responses to the national examination were 45.5% accurate. Accuracy by question type was 60.3% for recall and 13.0% for problem-solving type questions. The accuracy rate for the subjective solving questions was 13.0%, while the accuracy for the objective questions increased to 43.5%. The most common types of incorrect responses were logical errors 65.1% of all. Of the total 102 incorrectly answered questions, 100 were categorized as hallucinations. Conclusion: ChatGPT-3.5 was found to be limited in its ability to provide evidence-based correct responses to the Korean national dental hygiene examination. Therefore, dental hygienists in the education or clinical fields should be careful to use artificial intelligence-generated materials with a critical view.

학술 문헌 내 정의문을 통해 살펴본 디지털 큐레이션 개념 변화 분석 (Analysis of Changes in the Concept of Digital Curation through Definitions in Academic Literature)

  • 김현수;오효정
    • 정보관리학회지
    • /
    • 제41권3호
    • /
    • pp.269-288
    • /
    • 2024
  • 최근 디지털 전환 시대를 맞아 학계뿐 아니라 다양한 영역에서 디지털 큐레이션에 대한 논의가 활발히 진행되고 있다. 본 연구는 시간 흐름에 따른 디지털 큐레이션의 개념 변화를 분석하는 것을 주 목적으로, 특히 학술 문헌에서 저자가 직접 그 의미를 설명하거나 인용한 정의문을 중심으로 개념 구조를 파악하였다. 이를 위해 국내에서 디지털 큐레이션이란 용어가 처음 언급된 2009년부터 최근 2023년까지 출판된 학술 논문을 수집하고 관련 개념을 정리한 문장을 선별, 정의문의 용례 분석을 수행하였다. DMR 토픽 모델링과 워드 네트워크 분석 기법을 통해 주요 주제어들 간의 관계와 시간의 흐름에 따른 중요도 변화를 살펴보았으며, 주요 토픽을 중심으로 디지털 큐레이션의 개념도를 그려보았다. 그 결과 디지털 큐레이션의 개념은 '데이터 보존', '전통적인 큐레이터 역할', '상품 추천 큐레이션' 주제가 중심축을 이루고 있고, 연구자마다 디지털 큐레이션을 활용하고자 하는 방향에 따라 '콘텐츠 유통 및 분류', '정보 이용', '큐레이션 모델' 등으로 확장하여 정의하고 있었다. 본 연구는 디지털 큐레이션의 개념을 학술 연구자의 관점이 투영된 정의문에 기반해 분석했다는 데에 의의가 있으며, 연구 진행 시점에 따른 토픽의 증감 추세를 통해 연구자들이 주안점을 두는 개념의 변화를 구체적으로 파악하였다는 데에 의미가 있다.

MMORPG 게임의 이탈 유저에 대한 인공지능 기반 조기 탐지 (AI-based early detection to prevent user churn in MMORPG)

  • 이민혁;박선우;이성환;김수인;조윤영;송대섭;이문영;정윤서
    • 응용통계연구
    • /
    • 제37권4호
    • /
    • pp.525-539
    • /
    • 2024
  • Massive multiplayer online role playing game (MMORPG)은 국내 게임에서 큰 비중을 차지하는 게임 장르이다. MMORPG에서 유저 이탈 예측은 중요한 과제 중 하나이다. 인게임 결제가 수익 비중이 높기에 유저 잔존율이 서비스 수명 및 수익과 깊이 연관되기 때문이다. 만약, 특정 유저의 이탈을 사전에 예측할 수 있다면 프로모션을 통해 해당 유저의 잔존을 유도할 수 있을 것이다. 따라서, 이탈 예측 문제에서는 예측의 정확도도 중요하지만 이탈의 징후를 얼마나 빠르게 파악할 수 있는지 또한 중요하다. 본 논문에서는 이탈 징후를 조기에 탐지하기 위하여, 유저별 잔존 확률을 일별로 예측하고 이 예측된 확률 값들을 활용하여 유저 이탈 징후를 조기에 파악하는 방법을 제안한다. 이를 위해, 국내 게임사의 유저 로그 데이터로 여러 모형을 학습하고 유저별 잔존 확률을 구하여 잔존 확률의 변화 패턴에 대한 분석을 통해 이탈 가능성이 높은 유저를 조기에 감지할 수 있는 경험적 규칙을 보인다. 최종적으로, 성능 평가 결과를 통해 기존에 접속일을 기반으로 한 규칙보다 제시한 규칙을 이용할 시 이탈 유저를 조기에 감지할 수 있음을 확인한다. 추가적으로, 유저가 이탈하기 전 시점에 게임 접속 중 유저 이탈을 예측하는 방법과 유저의 게임 스타일에 따른 프로모션 방안을 제시한다.