• 제목/요약/키워드: 교차 검증

검색결과 672건 처리시간 0.025초

자연어 추론에서의 교차 검증 앙상블 기법 (Cross-Validated Ensemble Methods in Natural Language Inference)

  • 양기수;황태선;오동석;박찬준;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.8-11
    • /
    • 2019
  • 앙상블 기법은 여러 모델을 종합하여 최종 판단을 산출하는 기계 학습 기법으로서 딥러닝 모델의 성능 향상을 보장한다. 하지만 대부분의 기법은 앙상블만을 위한 추가적인 모델 또는 별도의 연산을 요구한다. 이에 우리는 앙상블 기법을 교차 검증 방법과 결합하여 앙상블 연산을 위한 비용을 줄이며 일반화 성능을 높이는 교차 검증 앙상블 기법을 제안한다. 본 기법의 효과를 입증하기 위해 MRPC, RTE 데이터셋과 BiLSTM, CNN, BERT 모델을 이용하여 기존 앙상블 기법보다 향상된 성능을 보인다. 추가로 교차 검증에서 비롯한 일반화 원리와 교차 검증 변수에 따른 성능 변화에 대하여 논의한다.

  • PDF

시계열 교차검증을 적용한 2,3-BDO 분리공정 온도예측 모델의 초매개변수 최적화 (Application of Time-series Cross Validation in Hyperparameter Tuning of a Predictive Model for 2,3-BDO Distillation Process)

  • 안나현;최영렬;조형태;김정환
    • Korean Chemical Engineering Research
    • /
    • 제59권4호
    • /
    • pp.532-541
    • /
    • 2021
  • 최근 인공지능에 대한 관심이 높아짐에 따라 화학공정분야에서도 인공지능을 활용한 연구가 많아지고 있다. 그러나 인공지능 기반 모델이 충분히 일반화되지 않아 학습에 이용되지 않은 새로운 데이터에 대한 예측률이 떨어지는 과적합 현상이 빈번하게 일어나고 있으며, 교차검증은 과적합을 해결하는 방법 중 하나이다. 본 연구에서는 2,3-BDO 분리 공정 온도 예측 모델의 초매개변수 중에서 배치 개수와 반복횟수를 조정하기 위해 시계열 교차검증을 적용하고 일반적으로 사용되는 K 겹 교차검증과 비교하였다. 결과적으로 K 겹 교차검증을 사용했을 때 보다 시계열 교차검증 방식을 사용했을 때 MAPE는 0.61% 증가한 반면 RMSE는 9.06% 감소하였고 학습 시간은 198.29초 적게 소요되었다.

다표적-다무장 환경에서 무장 궤적 간 교차 검증 및 간섭 배제 알고리즘 (An Intersection Validation and Interference Elimination Algorithm between Weapon Trajectories in Multi-target and Multi-weapon Environments)

  • 윤문형;박준호;이정훈;김갑수;구봉주
    • 한국콘텐츠학회논문지
    • /
    • 제18권9호
    • /
    • pp.614-622
    • /
    • 2018
  • 다표적-다무장 전장 환경에서는 다수의 무장이 동시에 발사되기 때문에 무장 간의 궤적 교차로 인한 충돌이 발생할 가능성이 항시 존재한다. 무장간 충돌은 신속한 작전 수행을 저해할 뿐만 아니라 아군 무장 자산을 무의미하게 손실시킴으로써 아군의 적군에 대한 위협 대응력을 약화시킨다. 본 논문에서는 다표적-다무장전장 환경에서 무장 궤적 간 교차 검증 및 간섭 배제 알고리즘을 제안한다. 제안하는 알고리즘은 무장 궤적 간 교차 분석을 통해 간섭 여부를 확인 한 후, 교차점이 발생할 경우 무장 궤적 간의 상호 간섭을 배제하는 것을 핵심으로 한다. 본 논문에서는 제안하는 알고리즘의 시뮬레이션 및 가시화를 통해 성능 평가 및 검증을 수행하였다. 성능 평가 결과 제안하는 알고리즘은 표적 수 및 무장군 수와 무관하게 교차점이 존재하지 않음을 보여줌으로써 효과적인 간섭 배제를 수행함을 입증하였다.

XGBoost와 교차 검증을 이용한 구문분석 말뭉치에서의 오류 탐지 (Detecting Errors in Dependency Treebank through XGBoost and Cross Validation)

  • 최민석;김창현;천민아;박혁로;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.103-107
    • /
    • 2020
  • 의존구조 말뭉치는 자연언어처리 분야에서 문장의 의존관계를 파악하는데 널리 사용된다. 이러한 말뭉치는 일반적으로 오류가 없다고 가정하지만, 현실적으로는 다양한 오류를 포함하고 있다. 이러한 오류들은 성능 저하의 요인이 된다. 이러한 문제를 완화하려고 본 논문에서는 XGBoost와 교차검증을 이용하여 이미 구축된 구문분석 말뭉치로부터 오류를 탐지하는 방법을 제안한다. 그러나 오류가 부착된 학습말뭉치가 존재하지 않으므로, 일반적인 분류기로서 오류를 검출할 수 없다. 본 논문에서는 분류기의 결과를 분석하여 오류를 검출하는 방법을 제안한다. 성능을 분석하려고 표본집단과 모집단의 오류 분포의 차이를 분석하였고 표본집단과 모집단의 오류 분포의 차이가 거의 없는 것으로 보아 제안된 방법이 타당함을 알 수 있었다. 앞으로 의미역 부착 말뭉치에 적용할 계획이다.

  • PDF

교차로의 특성을 고려한 도로선형최적화 (Alignment Optimization Considering Characteristics of Intersections)

  • KIM, Eungcheol;SON, Bongsoo;CHANG, Myungsoon
    • 대한교통학회지
    • /
    • 제20권4호
    • /
    • pp.109-122
    • /
    • 2002
  • 본 연구에서는 교차로의 비용 및 특성을 고려한 도로선형최적화 모형을 유전자 알고리즘(Genetic Algorithms)을 이용하여 개발하였다. 기존의 도로선형최적화 모형은 교차로 특성을 고려하지 못해서 실제 적용에 심대한 문제점을 내재하고 있다. 본 논문에서는 특정 도로선형에 교차로 건설의 필요가 있을 경우, 민감(Sensitive)하고 지배적인(Dominating) 교차로 비용 항목들 즉, 토공비용, 보상비, 포장비, 사고비용, 지체 및 연료소모비용 등의 산정이 시도되었다. 또한 비교적 우수한 도로선형 대안을 유전자 알고리즘을 이용한 탐색과정 중에서 비효율적으로 강제 퇴화시키는 단점 보완을 위한 교차로 국소 최적화 방법(Local Optimization of Intersections)이 개발되어 기존 모형을 보완하였다. 공간상의 도로선형은 매개변수적 묘사(Parametric Representation)를 통하여 구현하였으며 벡터운영(Vector Manipulation)을 통해 교차로비용 산정의 근간인 교차점과 다른 중요점들의 좌표를 찾을 수 있었다. 개발된 교차로 비용산정 모형이 보다 정밀하게 교차로 비용을 산정함이 증명되었으며 궁극적으로는 기존의 최적화 모형의 단점을 보완할 수 있음이 제시되었다. 또한, 새로이 제시된 교차로 국소 최적화 방법이 최적대안 탐색과정의 유연성을 증대하였으며, 결과적으로 효율적인 교차로의 유지에 기여함을 알 수 있었다. 제시된 교차로 국소 최적화 방법은 추후 단일노선이 아닌 도로망 최적화시의 기초를 제시함은 주목할 만 하다. 두개의 예제에서 도출된 최적노선 및 교차로 비용 등의 검토 결과, 도로상의 교차로 건설비용은 도로선형 최적화에 큰 영향을 미치는 실질적이며 민감한 비용 항목임이 검증되었으며 이는 도로선형최적화 모형이 교차로 비용을 반드시 검토 및 평가할 수 있어야 함을 반증한다.

SVM 교차검증을 활용한 토지피복 ROI 선정 (Region of Interest (ROI) Selection of Land Cover Using SVM Cross Validation)

  • 정종철;윤형진
    • 지적과 국토정보
    • /
    • 제50권1호
    • /
    • pp.75-85
    • /
    • 2020
  • 본 연구는 토지피복 분류에 사용 가능한 ROI 생성 과정에서 기계학습 기반 교차검증을 활용하였다. 연구지역은 세종시를 포함한 2019년 10월 28일 단시기 KOMPSAT-3A 영상을 활용하였다. 연구 과정에서 4개의 밴드(Red, Green, Blue, Near Infra-red)를 독립변수로 교차검증 과정에서 학습시켰다. 또한 SVM의 4가지 기법(Linear, Polynomial, RBF, Sigmoid)을 활용하여 추출된 ROI를 기반으로 토지피복 분류를 실시하였다. 교차검증 과정에서 훈련된 3,500개의 데이터 중 1,813개의 데이터가 추출되었으며 건물, 도로, 그리고 초지에서 약 60%의 데이터가 제거되었다. 추출된 ROI를 기반으로 다른 SVM기법에 비해 SVM Linear 기법이 91.77%로 가장 높은 분류 정확도를 나타냈다. 분류 클래스 중 초지의 경우 산림과의 오분류가 가장 많이 발생하며 79.43%의 생산자 정확도로 가장 낮은 분류 정확도를 보여주었다. 연구 결과에 따라 교차검증에서 추출된 ROI는 산림, 수역, 그리고 농업지역에 대해서는 90%이상의 분류정확도를 보여주며 효과적인 분류결과를 도출할 수 있었으나, 80%의 분류정확도를 보여주는 건물, 도로, 나대지, 그리고 초지 지역을 분류하는 방법에 대해서는 추가적인 연구가 진행되어야 할 필요성이 존재한다.

교차적 연결과 다계층구조의 유용성에 관한 인지적 연구 : 사이버쇼핑몰의 커스터머 인터페이스를 중심으로 (A Cognitive Study on the Usability of Cross-referencing link ad Multiple hierarchies)

  • 이정원;김진우
    • 인지과학
    • /
    • 제10권1호
    • /
    • pp.25-43
    • /
    • 1999
  • 본 연구는 사이버 공간에서 사용자와 시스템간의 상호작용을 도울 수 있는 구조디자인 설계에 초점을 맞추고 있다. 구조디자인이란 인터페이스를 구성하는 개별화면이 어떻게 분류되며 이에 따라서 화면내의 정보가 어떻게 표현되어야 하는지를 결정하는 것이다. 본 연구에서는 사이버 쇼핑몰 안에서 쇼핑만족과 항해 편리성을 높일 수 있는 구조디자인을 설계하기 위한 방안으로 교차적 연결과 다 계층 구조를 제시하였다. 교차적 연결이란 여러 가지 범주화 기준이 적용된 정보공간 사이를 연결시켜주고 것이고, 다 계층 구조란 동일한 정보공간에 대해서 여러 가지 기준을 가지고 각 기준에서 바라본 관점으로 정보공간을 표현해주는 구조이다. 본 연구에서는 교차적 연결과 다 계층 구조의 유용성 검증을 위한 두 단계의 실험을 사이버 쇼핑몰을 대상으로 실시하였다. 제1단계 실험은 사용자의 특정 정보 공간에 대한 인지적 틀, 즉 상품 정보 공간에 대한 사용자 관점에서의 다양한 범주화 기준을 파악함으로써 사이버 쇼핑몰의 기본 상품분류체계를 개발하였으며, 제2단계 실험은 1단계 실험결과를 바탕으로 교차적 연결과 다 계층 구조를 사용한 쇼핑몰 구조에 대한 유용성을 검증하는 것이었다. 그 검증 결과는 교차적 연결 측면에서는 교차적 연결이 제공되는 쇼핑몰이 제공되지 않는 쇼핑몰 보다 항해 편리성이 높은 것으로 나왔다. 그리고 이 교차적 연결이 다 층 구조상에서 제공되는 것보다는 단일 계층 구조상에서 제공되는 것이 항해 편리성을 높이고 있다. 한편, 계층구조측면에서는 단일 계층 구조가 제공되는 쇼핑몰이 다 계층 구조가 제공되는 쇼핑몰보다 항해만족과 항해 편리성이 높은 것으로 나왔다. 이를 기초로 본 연구는 이러한 결과에 대한 토론 및 쇼핑몰 구축상의 시사점을 제시하였다.

  • PDF

스태킹 앙상블 기법을 활용한 고속도로 교통정보 예측모델 개발 및 교차검증에 따른 성능 비교 (Development of Highway Traffic Information Prediction Models Using the Stacking Ensemble Technique Based on Cross-validation)

  • 이요셉;오석진;김예진;박성호;윤일수
    • 한국ITS학회 논문지
    • /
    • 제22권6호
    • /
    • pp.1-16
    • /
    • 2023
  • 정확도가 높은 교통정보 예측은 지능형교통체계(intelligent transport systems, ITS)를 통한 교통 시설 이용자들의 혼잡 경로 회피 안내 등에서 활용되는 중요한 기능이다. 정확한 교통정보예측을 위해 다양한 딥러닝 모델들이 발전되어 왔다. 최근에는 앙상블 기법을 활용하여 다양한 모델들의 장단점을 결합하여 예측 정확도와 안정성을 높이고 있다. 따라서, 본 연구에서는 다양한 딥러닝 모델들을 활용하여 교통정보 예측 모델을 개발하였으며, 개발된 딥러닝 모델들을 스태킹 앙상블(stacking ensemble)하여 성능을 개선하였다. 개별 모델들은 교통량 예측에서 10% 이내의 오차율을, 속도 예측에서 3% 이내의 오차율을 보였다. 앙상블 모델은 교차검증을 수행하지 않았을 때, 타 모델과 비교하여 더욱 높은 정확도를 보였다. 교차검증을 수행한 앙상블 모델은 장기예측에서 타 모델보다 균일한 오차율을 보이는 것으로 나타났다.

순차적 크리깅모델의 평균-분산 정확도 검증기법 (Mean-Variance-Validation Technique for Sequential Kriging Metamodels)

  • 이태희;김호성
    • 대한기계학회논문집A
    • /
    • 제34권5호
    • /
    • pp.541-547
    • /
    • 2010
  • 메타모델의 정확도를 엄밀하게 검증하는 것은 메타모델링에서 중요한 연구주제이다. k 점 선택교차검증기법이 많은 계산시간을 요구하면서도 메타모델의 정확도를 정략적으로 측정하지 못한다. 최근들어, 평균 $_0$ 기준이 메타모델의 정확도를 정량적으로 제공하기 위하여 제안되었다. 그러나 평균 $_0$ 검증 기준은 크리깅 메타모델이 부정확함에도 불구하고 일찍 수렴하는 경향이 있다. 따라서 본 연구에서는 최대엔트로피를 이용한 순차적 실험계획에서 크리깅모델의 평균과 분산을 이용한 정확도 평가기법을 제안한다. 이 제안한 기법은 평균 및 분산을 계산할 때 수치해석으로 구하는 것이 아니라 크리깅메타모델을 직접 적분하여 구하기 때문에 k 점 선택교차검증기법보다 효율적이며 정확하다. 제안한 기준은 실제 응답의 평균제곱오차의 경향과 매우 유사하여 순차적 실험계획의 수렴기준으로 사용할 수 있다.

주성분점수를 이용한 이변량 공간자료에 대한 감도분석 (Sensitivity Analysis for Bivariate Spatial Data Using Principal Component Score)

  • 최승배;강창완
    • 응용통계연구
    • /
    • 제14권2호
    • /
    • pp.415-427
    • /
    • 2001
  • 공간통계학에서는 다변량 공간자료에 대한 예측방법으로서 코크리깅 기법을 이용한다. 본 논문에서는 코크리깅을 위한 첫 번째 단계인 교차베리오그램의 추정에 대한 감도분석 대신에 일반통계학적 측면에서 주성분점수를 이용한 감도분석방법을 제안한다. 변수가 2개인 경우, 교차베리오그램에 대한 감조분석의 결과와 제안된 주성분점수를 이용한 감도분석의 결과를 비교해 본다. 모의실험을 통하여 제안한 방법의 타당을 검증하고, 실제 자료를 이용한 사례분석의 결과로써 재확인해 본다.

  • PDF