• 제목/요약/키워드: statistical learning

검색결과 1,288건 처리시간 0.129초

Probing Sentence Embeddings in L2 Learners' LSTM Neural Language Models Using Adaptation Learning

  • Kim, Euhee
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권3호
    • /
    • pp.13-23
    • /
    • 2022
  • Prasad et al.는 사전학습(pre-trained)한 신경망 L1 글로다바(Gulordava) 언어모델을 여러 유형의 영어 관계절과 등위절 문장들로 적응 학습(adaptation learning)시켜 문장 간 유사성(sentence similarity)을 평가할 수 있는 통사 프라이밍(syntactic priming)-기반 프로빙 방법((probing method)을 제안했다. 본 논문에서는 한국인 영어학습자가 배우는 영어 자료를 바탕으로 훈련된 L2 LSTM 신경망 언어 모델의 영어 관계절 혹은 등위절 구조의 문장들에 대한 임베딩 표현 방식을 평가하기 위하여 프로빙 방법을 적용한다. 프로빙 실험은 사전 학습한 LSTM 언어 모델을 기반으로 추가로 적응 학습을 시킨 LSTM 언어 모델을 사용하여 문장 임베딩 벡터 표현의 통사적 속성을 추적한다. 이 프로빙 실험을 위한 데이터셋은 문장의 통사 구조를 생성하는 템플릿을 사용하여 자동으로 구축했다. 특히, 프로빙 과제별 문장의 통사적 속성을 분류하기 위해 통사 프라이밍을 이용한 언어 모델의 적응 효과(adaptation effect)를 측정했다. 영어 문장에 대한 언어 모델의 적응 효과와 통사적 속성 관계를 복합적으로 통계분석하기 위해 선형 혼합효과 모형(linear mixed-effects model) 분석을 수행했다. 제안한 L2 LSTM 언어 모델이 베이스라인 L1 글로다바 언어 모델과 비교했을 때, 프로빙 과제별 동일한 양상을 공유함을 확인했다. 또한 L2 LSTM 언어 모델은 다양한 관계절 혹은 등위절이 있는 문장들을 임베딩 표현할 때 관계절 혹은 등위절 세부 유형별로 통사적 속성에 따라 계층 구조로 구분하고 있음을 확인했다.

Two-stream Convolutional Long- and Short-term Memory 모델의 2001-2021년 9월 북극 해빙 예측 성능 평가 (Performance Assessment of Two-stream Convolutional Long- and Short-term Memory Model for September Arctic Sea Ice Prediction from 2001 to 2021)

  • 지준화
    • 대한원격탐사학회지
    • /
    • 제38권6_1호
    • /
    • pp.1047-1056
    • /
    • 2022
  • 지구 온난화의 중요한 지시자인 북극의 바다 얼음인 해빙은 기후 시스템, 선박의 항로 안내, 어업 활동 등에서의 중요성으로 인해 다양한 학문 분야에서 관심을 받고 있다. 최근 자동화와 효율적인 미래 예측에 대한 요구가 커지면서 인공지능을 이용한 새로운 해빙 예측 모델들이 전통적인 수치 및 통계 예측 모델을 대체하기 위해 개발되고 있다. 본 연구에서는 북극 해빙의 전역적, 지역적 특징을 학습할 수 있는 two-stream convolutional long- and short-term memory (TS-ConvLSTM) 인공지능 모델의 북극 해빙 면적이 최저를 보이는 9월에 대해 2001년부터 2021년까지 장기적인 성능 검증을 통해 향후 운용 가능한 시스템으로써의 가능성을 살펴보고자 한다. 장기 자료를 통한 검증 결과 TS-ConvLSTM 모델이 훈련자료의 양이 증가하면서 향상된 예측 성능을 보여주고 있지만, 최근 지구 온난화로 인한 단년생 해빙의 감소로 인해 해빙 농도 5-50% 구간에서는 예측력이 저하되고 있음을 보여주었다. 반면 TS-ConvLSTM에 의해 예측된 해빙 면적과 달리 Sea Ice Prediction Network에 제출된 Sea Ice Outlook (SIO)들의 해빙 면적 중간값의 경우 훈련자료가 늘어나더라도 눈에 띄는 향상을 보이지 않았다. 본 연구를 통해 TS-ConvLSTM 모델의 향후 북극 해빙 예측 시스템의 운용 가능 잠재성을 확인하였으나, 향후 연구에서는 예측이 어려운 자연 환경에서 더욱 안정성 있는 예측 시스템 개발을 위해 더 많은 시공간 변화 패턴을 학습할 수 있는 방안을 고려해야 할 것이다.

머신러닝을 사용한 서리 예측 연구 (A study on frost prediction model using machine learning)

  • 김효정;김삼용
    • 응용통계연구
    • /
    • 제35권4호
    • /
    • pp.543-552
    • /
    • 2022
  • 서리는 표면 근처의 공기의 이슬점 온도가 빙점 이하일 때 수증기가 승화, 응축되어 땅이나 물체에 얼게 되는 작은 얼음 결정체이다. 서리가 내리면 농작물이 직접 피해를 입는다. 농작물이 낮은 온도에 접촉하면 조직이 얼어서 세포막이나 엽록체가 딱딱해지고 파괴되거나 건조한 세포가 죽습니다. 2020년 7월, 세계 최대 커피 생산국인 브라질 미나스제라이스 주에 갑작스러운 영하의 날씨와 서리가 내려 지역 커피 나무의 약 30%가 피해를 입었다. 이로 인해 피해로 커피값이 크게 올랐고, 피해가 심각한 농가는 농작물이 회복되기까지 3년이 걸리기 때문에 2024년에야 커피를 생산할 수 있다. 본 논문에서는 심한 서리가 내리는 것을 방지하기 위해 기상청이 제공하는 서리 발생 데이터와 기상관측 데이터를 이용해 서리를 예측하려고 했다. 관측 지점의 고도 및 풍속, 온도, 습도, 강수량, 흐림 등의 기상 요인을 반영하여 모델을 구축하였다. XGB, SVM, Random Forest, MLP 모델을 사용하여 다양한 하이퍼 파라미터를 학습 데이터로 적용하여 각 모델에 가장 적합한 모델을 선택하였다. 마지막으로, 결과는 테스트 데이터에서 정확도(acc)와 중요 성공 지수(CSI)로 평가되었다. XGB는 90.4%의 acc와 64.4%의 CSI로 다른 모델에 비해 최고의 모델이었고, SVM은 89.7%의 acc와 61.2%의 CSI로 그 뒤를 이었다. 랜덤 포레스트와 MLP는 약 89%의 acc와 약 60%의 CSI로 비슷한 성능을 보였다.

중년기 부모 이해 수업이 중학생의 부모-자녀 관계에 미치는 영향 (Effect of Middle-aged Parent Understanding Education for Middle School Students on Parent-Child Relationships)

  • 정주연;이서연
    • 한국가정과교육학회지
    • /
    • 제34권3호
    • /
    • pp.25-47
    • /
    • 2022
  • 본 연구는 중학생의 부모 이해 향상을 위해 교수·학습과정안을 개발하고 수업에 적용하여 부모 이해 수업이 중학생의 부모-자녀 관계에 미치는 영향을 규명하는 데 목적이 있다. 연구의 목적을 달성하기 위해 2021년 7월 5일부터 7월 15일까지 광주광역시에 있는 S 중학교 2학년 학생을 대상으로 기술·가정 수업 시간에 주당 3시간씩 2주 동안 총 6차시에 걸쳐 부모 이해 수업을 시행하였다. 수업이 부모-자녀 관계에 미치는 영향은 중년 부모에 대한 이해, 부모와의 상호작용 정도, 부모와의 애정도 및 유대감으로 측정하였다. 수업의 영향을 분석하기 위해 본 연구에 동의한 184명의 학생을 대상으로 사전·사후 온라인 설문 조사를 진행하였다. 수집된 양적 자료는 SPSS Ver 22.0 통계 프로그램을 사용하여 기술 통계, 신뢰도 분석, 대응 표본 t-test를 실시하였다. 분석 결과 중년기 부모 이해 수업 이후 중년기 발달 특성에 대한 자녀들의 이해도가 증가하였고 청소년기 자녀와 부모 간 상호작용 정도도 증가하였다. 그리고 어머니에 대한 전반적인 애정도가 유의미하게 증가하였다. 또한 어머니, 아버지와의 전반적 유대감이 모두 유의미하게 향상되었다. 이러한 결과를 바탕으로 청소년기 자녀를 둔 가족의 긍정적인 부모-자녀 관계를 위해서는 기술·가정 교과의 가족 단원에 자녀가 부모를 이해할 수 있는 수업이 필요함을 알 수 있다.

TeGCN:씬파일러 신용평가를 위한 트랜스포머 임베딩 기반 그래프 신경망 구조 개발 (TeGCN:Transformer-embedded Graph Neural Network for Thin-filer default prediction)

  • 김성수;배준호;이주현;정희주;김희웅
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.419-437
    • /
    • 2023
  • 국내 씬파일러(Thin Filer)의 수가 1200만명을 넘어서며, 금융 업계에서 씬파일러의 신용을 정확히 평가하여 우량고객을 선별해 대출을 공급하는 시도가 많아지고 있다. 특히, 차주의 신용정보에 존재하는 비선형성을 반영하여 채무불이행을 예측하기 위해서 다양한 머신러닝 알고리즘을 활용한 연구가 진행되고 있다. 그 중 그래프 신경망 구조(Graph Neural Network)는 일반적인 신용정보 외에 대출자 간의 네트워크 정보를 반영할 수 있다는 점에서 데이터가 부족한 씬파일러의 채무 불이행 예측에서 주목할 만하다. 그러나, 그래프 신경망을 활용한 기존의 연구들은 신용정보에 존재하는 다양한 범주형 변수를 적절히 처리하지 못했다는 한계가 있었다. 이에 본 연구는 범주형 변수의 맥락적 정보를 추출할 수 있는 트랜스포머 메커니즘(Transformer mechanism)과 대출자 간 네트워크 정보를 반영할 수 있는 그래프 합성곱 신경망(Graph Convolutional Network)를 결합하여 효과적으로 씬파일러의 채무 불이행 예측이 가능한 TeGCN (Transformer embedded Graph Convolutional Network)를 제안한다. TeGCN는 일반 대출자 데이터셋과 씬파일러 데이터셋에 대하여 모두 베이스 라인 모델 대비 높은 성능을 보였으며, 특히 씬파일러 채무 불이행 예측에 우수한 성능을 달성했다. 본 연구는 범주형 변수가 많은 신용정보와 데이터가 부족한 씬파일러의 특성에 적합한 모델 구조를 결합하여 높은 채무 불이행 예측 성능을 달성했다는 시사점이 있다. 이는 씬파일러의 금융소외문제를 해결하고 금융업계에서 씬파일러를 대상으로 추가적인 수익을 창출하는데 기여할 수 있을 것이다.

머신러닝을 활용한 기상조건에 따른 공공도서관 도서대출 수요분석 (Analysis of public library book loan demand according to weather conditions using machine learning)

  • 오민기;김건욱;신세영;이진명;장원준
    • 디지털융복합연구
    • /
    • 제20권3호
    • /
    • pp.41-52
    • /
    • 2022
  • 국내 공공도서관은 1, 2차 도서관 발전 종합계획을 토대로 양적 성장을 이루었으나, 질적으로는 다소 부족한 점이 있어 이를 개선하기 위한 다양한 연구가 수행되었다. 대다수 선행연구에서는 사회·경제적 요인과 통계분석에 한정되어 수행된 한계점이 있다. 이에 본 연구에서는 시공간적 개념을 적용하여 강우와 폭염으로 인한 공공도서관 대출 수요 감소를 정량적으로 산출하고, 기상 변화로 도서 대출 수요 감소가 높은 지역과 그렇지 않은 지역을 군집화하여 공공도서관 내·외부 요인들과 결합한 후 기상변화에 따른 공공도서관 대출 수요 변화를 분석하였다. 분석 결과 공공도서관별 기상으로 인한 감소 차이가 존재하였으며, 공공도서관의 특성과 공간적 위치에 따라 일부 다르게 나타났다. 또한, 기온이 35℃ 이상인 폭염일 경우 도서 대출 수요 감소 폭이 많이 증가하였으며, 랜덤포레스트 모형으로 분석한 결과 유의미한 요인이 도출되었다. 내적 요인으로는 좌석 수, 장서 수, 면적이 도출되었으며, 외적 요인으로는 공공도서관 접근 경사로, 카페, 독서실, 10대 유동인구, 30/40대 여성 유동인구가 중요한 변수로 분석되었다. 이러한 분석 결과는 특정 시즌 기상을 고려한 공공도서관 이용 활성화 정책 수립에 이바지할 것으로 판단되며, 연구의 한계점도 제시하였다.

후경부 냉동요법 적용을 통한 대학생의 주의력 수준 평가 (Evaluation of Attention Level on College Students by Application of Cryotherapy in the Posterior Region of Neck)

  • 장지홍
    • 한국정보전자통신기술학회논문지
    • /
    • 제16권5호
    • /
    • pp.272-278
    • /
    • 2023
  • 사람의 인지기능을 구성하는 중요한 요소인 주의력은 감각기관을 통한 다양한 자극에서 필요한 자극에만 의식을 집중하는 중요한 인지기능이다. 다양한 환경 요건이 주의력에 영향을 미친다는 다양한 연구 결과가 있으나 피부에 직접 냉각요법을 적용하는 것이 주의력에 영향을 미치는 바는 많이 연구되지 않았다. 36명의 피평가자를 대상으로 학습 및 휴식 활동 중 냉동요법 적용 시점 및 여부에 따른 주의력의 차이를 살펴보았다. 시각적 주의력 평가도구인 FAIR 주의력 검사를 실시하였으며 해당 평가도구의 주의력 지수인 능력지수, 통제지수, 지속성지수 결과에 대한 통계적 분석을 실시하였다. 휴식 활동을 수행한 피평가자 사이에서는 냉동요법의 적용이 모든 하위지수에 영향을 미치지 않는 것으로 나타났다. 학습 활동을 수행한 피평가자 사이에서는 사전 냉동요법을 적용한 집단(P=469.0, C=435.4))과 사후 냉동요법을 적용한 집단(P=457.4, C=425.4)이 냉동요법을 실시하지 않은 집단(P=335.8, C=301.7)에 비해 능력지수와 지속성지수가 높게 나타났다. 이러한 결과로부터 냉동요법이 제한적으로나마 주의력의 수준을 유지 시켜주고, 주의를 환기해 준다는 결론 도출할 수 있다.

MLOps를 위한 효율적인 AI 모델 드리프트 탐지방안 연구 (A Study on Efficient AI Model Drift Detection Methods for MLOps)

  • 이예은;이태진
    • 인터넷정보학회논문지
    • /
    • 제24권5호
    • /
    • pp.17-27
    • /
    • 2023
  • 오늘날 AI(Artificial Intelligence) 기술이 발전하면서 실용성이 증가함에 따라 실생활 속 다양한 응용 분야에서 널리 활용되고 있다. 이때 AI Model은 기본적으로 학습 데이터의 다양한 통계적 속성을 기반으로 학습된 후 시스템에 배포되지만, 급변하는 데이터의 상황 속 예상치 못한 데이터의 변화는 모델의 성능저하를 유발한다. 특히 보안 분야에서 끊임없이 생성되는 새로운 공격과 알려지지 않은 공격에 대응하기 위해서는 배포된 모델의 Drift Signal을 찾는 것이 중요해짐에 따라 모델 전체의 Lifecycle 관리 필요성이 점차 대두되고 있다. 일반적으로 모델의 정확도 및 오류율(Loss)의 성능변화를 통해 탐지할 수 있지만, 모델 예측 결과에 대한 실제 라벨이 필요한 점에서 사용 환경의 제약이 존재하며, 실제 드리프트가 발생한 지점의 탐지가 불확실한 단점이 있다. 그 이유는 모델의 오류율의 경우 다양한 외부 환경적 요인, 모델의 선택과 그에 따른 파라미터 설정, 그리고 새로운 입력데이터에 따라 크게 영향을 받기에 해당 값만을 기반으로 데이터의 실질적인 드리프트 발생 시점을 정밀하게 판단하는 것은 한계가 존재하게 된다. 따라서 본 논문에서는 XAI(eXplainable Artificial Intelligence) 기반 Anomaly 분석기법을 통해 실질적인 드리프트가 발생한 시점을 탐지하는 방안을 제안한다. DGA(Domain Generation Algorithm)를 탐지하는 분류모델을 대상으로 시험한 결과, 배포된 이후 데이터의 SHAP(Shapley Additive exPlanations) Value를 통해 Anomaly score를 추출하였고, 그 결과 효율적인 드리프트 시점탐지가 가능함을 확인하였다.

딥러닝 기반 영상처리를 이용한 골재 품질 검사 (Examination of Aggregate Quality Using Image Processing Based on Deep-Learning)

  • 김성규;최우빈;이종세;이원곡;최근오;배유석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권6호
    • /
    • pp.255-266
    • /
    • 2022
  • 콘크리트의 주재료인 골재 중 굵은 골재의 품질관리는 현재 샘플링을 통한 통계적 공정관리(SPC) 방법으로 하고 있다. 본 논문은 굵은 골재에 대한 품질관리를 현재의 체거름 방식을 대신 카메라를 통해 획득한 영상을 기반으로 굵은 골재를 검사하게 바꾸어 제조 혁신을 위한 스마트팩토리를 구축하였다. 먼저, 얻은 영상을 전처리 하였고, 딥러닝으로 학습된 HED(Holistically-nested Edge Detection)필터는 각각의 물체를 Segmentation하였다. 이 Segmentation한 결과를 영상 처리하여 각각의 골재를 분석 후 이 결과를 바탕으로 조립률, 입형률을 파악한다. 영상을 통해 얻은 골재들의 조립률, 입형률을 계산하여 골재의 품질을 검사하였고 알고리즘의 정확도는 실제로 체 가름 방식을 통해 골재의 품질을 비교한 것과 90% 이상의 정확도를 보이는 결과가 나왔다. 또한 기존의 방법으로는 골재의 입형률을 검사할 수 없었지만 본문의 내용을 통해 골재의 입형률도 측정할 수 있게 되었다. 입형률의 경우 도형을 사용하여 검증하였는데 이는 ±4.5%의 차이를 보였다. 골재의 길이 측정의 경우 실제 골재의 길이를 비교하였는데 ±6%의 차이를 보였다. 실제 3차원의 데이터를 2차원의 영상에서 분석하다보니 실제 데이터와 차이가 생겼는데 이는 추후 연구가 필요하다.

서포트벡터머신 기반 PVDF 센서의 결함 예측 기법 (Fault Detection Technique for PVDF Sensor Based on Support Vector Machine)

  • 김승욱;이상민
    • 한국전자통신학회논문지
    • /
    • 제18권5호
    • /
    • pp.785-796
    • /
    • 2023
  • 본 연구에서는 구조물 건전성 모니터링에 널리 활용되고 있는 PVDF(: Polyvinylidene fluoride) 센서에 나타날 수 있는 결함을 실시간으로 분류 및 예측하기 위한 방법론을 제안하였다. 센서 부착 환경에 따라 나타나는 센서의 결함 유형을 분류하였고, 임팩트 해머를 이용한 충격 시험을 수행하여 결함 유형에 따른 출력 신호를 획득하였다. 결함 유형에 따른 출력 신호간의 차이를 식별하기 위해 이들의 시간영역 통계 특징을 추출하여 데이터 집합을 구축하였다. 머신러닝 기반 분류 알고리즘들 중 센서 결함 유형 감지에 가장 적합한 알고리즘 선정을 위해 구축한 데이터 집합의 학습 및 이에 따른 결과를 분석하였고, 이들 중 SVM(: Support vector machine)이 가장 높은 성능을 보임을 확인하였다. 선정된 SVM 알고리즘의 추가적인 정확도 향상을 위해 하이퍼 파라미터 최적화 작업을 수행하였으며, 결과적으로 92.5%의 정확도로 센서 결함 유형을 분류하였고 이는 타 분류 알고리즘에 비하여 최대 13.95% 높은 정확도를 보였다. 본 연구에서 제안한 센서 결함 예측 기법은 PVDF 센서뿐만 아니라 실시간 구조물 건전성 모니터링을 위한 다양한 센서의 신뢰성을 확보하기 위한 기반 기술로 활용될 수 있을 것으로 사료된다.