• 제목/요약/키워드: 교차검증방법

검색결과 272건 처리시간 0.022초

자연어 추론에서의 교차 검증 앙상블 기법 (Cross-Validated Ensemble Methods in Natural Language Inference)

  • 양기수;황태선;오동석;박찬준;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.8-11
    • /
    • 2019
  • 앙상블 기법은 여러 모델을 종합하여 최종 판단을 산출하는 기계 학습 기법으로서 딥러닝 모델의 성능 향상을 보장한다. 하지만 대부분의 기법은 앙상블만을 위한 추가적인 모델 또는 별도의 연산을 요구한다. 이에 우리는 앙상블 기법을 교차 검증 방법과 결합하여 앙상블 연산을 위한 비용을 줄이며 일반화 성능을 높이는 교차 검증 앙상블 기법을 제안한다. 본 기법의 효과를 입증하기 위해 MRPC, RTE 데이터셋과 BiLSTM, CNN, BERT 모델을 이용하여 기존 앙상블 기법보다 향상된 성능을 보인다. 추가로 교차 검증에서 비롯한 일반화 원리와 교차 검증 변수에 따른 성능 변화에 대하여 논의한다.

  • PDF

XGBoost와 교차 검증을 이용한 구문분석 말뭉치에서의 오류 탐지 (Detecting Errors in Dependency Treebank through XGBoost and Cross Validation)

  • 최민석;김창현;천민아;박혁로;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.103-107
    • /
    • 2020
  • 의존구조 말뭉치는 자연언어처리 분야에서 문장의 의존관계를 파악하는데 널리 사용된다. 이러한 말뭉치는 일반적으로 오류가 없다고 가정하지만, 현실적으로는 다양한 오류를 포함하고 있다. 이러한 오류들은 성능 저하의 요인이 된다. 이러한 문제를 완화하려고 본 논문에서는 XGBoost와 교차검증을 이용하여 이미 구축된 구문분석 말뭉치로부터 오류를 탐지하는 방법을 제안한다. 그러나 오류가 부착된 학습말뭉치가 존재하지 않으므로, 일반적인 분류기로서 오류를 검출할 수 없다. 본 논문에서는 분류기의 결과를 분석하여 오류를 검출하는 방법을 제안한다. 성능을 분석하려고 표본집단과 모집단의 오류 분포의 차이를 분석하였고 표본집단과 모집단의 오류 분포의 차이가 거의 없는 것으로 보아 제안된 방법이 타당함을 알 수 있었다. 앞으로 의미역 부착 말뭉치에 적용할 계획이다.

  • PDF

교차로의 특성을 고려한 도로선형최적화 (Alignment Optimization Considering Characteristics of Intersections)

  • KIM, Eungcheol;SON, Bongsoo;CHANG, Myungsoon
    • 대한교통학회지
    • /
    • 제20권4호
    • /
    • pp.109-122
    • /
    • 2002
  • 본 연구에서는 교차로의 비용 및 특성을 고려한 도로선형최적화 모형을 유전자 알고리즘(Genetic Algorithms)을 이용하여 개발하였다. 기존의 도로선형최적화 모형은 교차로 특성을 고려하지 못해서 실제 적용에 심대한 문제점을 내재하고 있다. 본 논문에서는 특정 도로선형에 교차로 건설의 필요가 있을 경우, 민감(Sensitive)하고 지배적인(Dominating) 교차로 비용 항목들 즉, 토공비용, 보상비, 포장비, 사고비용, 지체 및 연료소모비용 등의 산정이 시도되었다. 또한 비교적 우수한 도로선형 대안을 유전자 알고리즘을 이용한 탐색과정 중에서 비효율적으로 강제 퇴화시키는 단점 보완을 위한 교차로 국소 최적화 방법(Local Optimization of Intersections)이 개발되어 기존 모형을 보완하였다. 공간상의 도로선형은 매개변수적 묘사(Parametric Representation)를 통하여 구현하였으며 벡터운영(Vector Manipulation)을 통해 교차로비용 산정의 근간인 교차점과 다른 중요점들의 좌표를 찾을 수 있었다. 개발된 교차로 비용산정 모형이 보다 정밀하게 교차로 비용을 산정함이 증명되었으며 궁극적으로는 기존의 최적화 모형의 단점을 보완할 수 있음이 제시되었다. 또한, 새로이 제시된 교차로 국소 최적화 방법이 최적대안 탐색과정의 유연성을 증대하였으며, 결과적으로 효율적인 교차로의 유지에 기여함을 알 수 있었다. 제시된 교차로 국소 최적화 방법은 추후 단일노선이 아닌 도로망 최적화시의 기초를 제시함은 주목할 만 하다. 두개의 예제에서 도출된 최적노선 및 교차로 비용 등의 검토 결과, 도로상의 교차로 건설비용은 도로선형 최적화에 큰 영향을 미치는 실질적이며 민감한 비용 항목임이 검증되었으며 이는 도로선형최적화 모형이 교차로 비용을 반드시 검토 및 평가할 수 있어야 함을 반증한다.

주성분점수를 이용한 이변량 공간자료에 대한 감도분석 (Sensitivity Analysis for Bivariate Spatial Data Using Principal Component Score)

  • 최승배;강창완
    • 응용통계연구
    • /
    • 제14권2호
    • /
    • pp.415-427
    • /
    • 2001
  • 공간통계학에서는 다변량 공간자료에 대한 예측방법으로서 코크리깅 기법을 이용한다. 본 논문에서는 코크리깅을 위한 첫 번째 단계인 교차베리오그램의 추정에 대한 감도분석 대신에 일반통계학적 측면에서 주성분점수를 이용한 감도분석방법을 제안한다. 변수가 2개인 경우, 교차베리오그램에 대한 감조분석의 결과와 제안된 주성분점수를 이용한 감도분석의 결과를 비교해 본다. 모의실험을 통하여 제안한 방법의 타당을 검증하고, 실제 자료를 이용한 사례분석의 결과로써 재확인해 본다.

  • PDF

정규화 및 교차검증 횟수 감소를 위한 무작위 풀링 연산 선택에 관한 연구 (A Study on Random Selection of Pooling Operations for Regularization and Reduction of Cross Validation)

  • 류서현
    • 한국산학기술학회논문지
    • /
    • 제19권4호
    • /
    • pp.161-166
    • /
    • 2018
  • 본 논문에서는 컨볼루션 신경망 구조(Convolution Neural Network)에서 정규화 및 교차검증 횟수 감소를 위한 무작위로 풀링 연산을 선택하는 방법에 대해 설명한다. 컨볼루션 신경망 구조에서 풀링 연산은 피쳐맵(Feature Map) 크기 감소 및 이동 불변(Shift Invariant)을 위해 사용된다. 기존의 풀링 방법은 각 풀링 계층에서 하나의 풀링 연산이 적용된다. 이러한 방법은 학습 간 신경망 구조의 변화가 없기 때문에, 학습 자료에 과도하게 맞추는 과 적합(Overfitting) 문제를 가지고 있다. 또한 최적의 풀링 연산 조합을 찾기 위해서는, 각 풀링 연산 조합에 대해 교차검증을 하여 최고의 성능을 내는 조합을 찾아야 한다. 이러한 문제를 해결하기 위해, 풀링 계층에 확률적인 개념을 도입한 무작위 풀링 연산 선택 방법을 제안한다. 제안한 방법은 풀링 계층에 하나의 풀링 연산을 적용하지 않는다. 학습기간 동안 각 풀링 영역에서 여러 풀링 연산 중 하나를 무작위로 선택한다. 그리고 시험 시에는 각 풀링 영역에서 사용된 풀링 연산의 평균을 적용한다. 이러한 방법은 풀링 영역에서 서로 다른 풀링 조합을 사용한 구조의 평균을 한 것으로 볼 수 있다. 따라서, 컨볼루션 신경망 구조가 학습데이터에 과도하게 맞추어지는 과적합 문제를 피할 수 있으며, 또한 각 풀링 계층에서 특정 풀링 연산을 선택할 필요가 없기 때문에 교차 검증 횟수를 감소시킬 수 있다. 실험을 통해, 제안한 방법은 정규화 성능을 향상시킬 뿐만 아니라 및 교차 검증 횟수를 줄일 수 있다는 것을 검증하였다.

시계열 교차검증을 적용한 2,3-BDO 분리공정 온도예측 모델의 초매개변수 최적화 (Application of Time-series Cross Validation in Hyperparameter Tuning of a Predictive Model for 2,3-BDO Distillation Process)

  • 안나현;최영렬;조형태;김정환
    • Korean Chemical Engineering Research
    • /
    • 제59권4호
    • /
    • pp.532-541
    • /
    • 2021
  • 최근 인공지능에 대한 관심이 높아짐에 따라 화학공정분야에서도 인공지능을 활용한 연구가 많아지고 있다. 그러나 인공지능 기반 모델이 충분히 일반화되지 않아 학습에 이용되지 않은 새로운 데이터에 대한 예측률이 떨어지는 과적합 현상이 빈번하게 일어나고 있으며, 교차검증은 과적합을 해결하는 방법 중 하나이다. 본 연구에서는 2,3-BDO 분리 공정 온도 예측 모델의 초매개변수 중에서 배치 개수와 반복횟수를 조정하기 위해 시계열 교차검증을 적용하고 일반적으로 사용되는 K 겹 교차검증과 비교하였다. 결과적으로 K 겹 교차검증을 사용했을 때 보다 시계열 교차검증 방식을 사용했을 때 MAPE는 0.61% 증가한 반면 RMSE는 9.06% 감소하였고 학습 시간은 198.29초 적게 소요되었다.

트위터에서 이슈가 되고 있는 중국어-한국어 교차언어 뉴스 탐지 (Chinese and Korean Cross Lingual News Detection in Twitter)

  • 조승남;촐몽 바야르;이경순;이용석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.658-661
    • /
    • 2012
  • 국제적으로 이슈가 되고있는 사건들의 뉴스는 보도당국의 입장차이에 따라 동일 이슈에 대한 관점의 차이를 나타낸다. 교차언어 연구에서는 번역하는 과정이 중요하다. 본 논문에서는 중-한 어휘번역에서 발생하는 오류 및 모호성을 해결하기 위해 키워드를 중심으로 문맥 어휘를 이용해서 번역한 후 번역결과에서 빈도가 높은 한국어 어휘를 선택하는 방법을 제안한다. 제안 방법의 유효성을 검증하기 위해 소셜 이슈 3 개에 대한 트윗 데이터에서 실험하여 추출된 중-한 이슈 뉴스 결과에서의 정확도 85.8%의 성능을 보였다. 실험을 통해 제안 방법이 중-한 교차언어 트위터 데이터에서 동일한 이슈와 관련된 뉴스를 찾는데 효과적인 방법임을 알 수 있다.

메타프론티어와 교차효율성 모형을 통한 항만 클러스터링의 실증적 검증소고 (A Brief Empirical Investigation of Seaport Clustering by Using Meta-Frontier and Cross-efficiency Models)

  • 박노경
    • 무역학회지
    • /
    • 제41권3호
    • /
    • pp.27-42
    • /
    • 2016
  • 본 논문에서는 아시아 13개 항만의 2009년, 2010년, 2013년의 자료와, 3개의 투입요소(수심, 총면적 크레인 수)와 1개의 산출요소(컨테이너화물 총 처리량)를 이용하여 교차효율성모형과 메타프론티어 분석방법으로 개별효율성과 그룹효율성, 기술 갭을 측정함으로써, 교차효율성모형에 의해서 측정된 클러스터링이 국내항만들의 메타효율성을 증진시켰는지를 실증적으로 검증하였다. 실증분석의 주요한 결과는 다음과 같다. 첫째, 2010년과 2013년의 경우에는 부산, 인천, 광양항만 모두 그룹효율성이 증가하였다. 둘째, 중국의 항만들이 국내 항만들에 비해서 메타효율성과 그룹효율성 측면에서 더 높은 것으로 나타났다. 셋째, 기술갭 측면에서 보았을 때, 광양항의 기술 격차의 왜곡이 부산항이나 인천항에 비해서 작은 것으로 나타났다. 넷째, 광양항은 2009년(닝보, 칭타오, 토쿄, 카오슝항)과 2013년(두바이항)과 클러스터링을 통해서 효율성을 증진시킬 수 있었다. 부산항은 2010년에 2그룹, 2013년에 1그룹항만, 인천항은 2010년과 2013년에 2그룹 항만들과 클러스터링을 통해서 효율성을 증진시킬 수 있었다. 다섯째, 교차효율성 모형과 메타효율성 분석방법을 통해서 부산, 인천, 광양항은 효율성을 증진시킬 수 있다는 것이 실증적으로 검증되었다. 본 논문의 정책적인 함의는 본 연구에서 실증적으로 검증된 아시아 항만들 간의 클러스터링 방법[부산항은 홍콩, 상하이, 싱가포르항, 인천항과 광양항은 칭타오, 나고야, 닝보, 토쿄, 카오슝항과 클러스터링]을 국내항만들이 적극적으로 정책적인 도입을 해야만 한다.

  • PDF

뉴럴 네트워크 구조를 이용한 햅틱 질감 모델링 (Haptic texture modeling using neural network structure)

  • 신성환;최승문
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(C)
    • /
    • pp.382-384
    • /
    • 2012
  • 뉴럴 네트워크 구조를 이용하여 새로운 햅틱 질감 모델링 방법을 제시하고, 실제 측정한 데이터를 이용해 이 방법을 검증하였다. 제시된 방법은 높은 주파수의 가속도 성분까지 성공적으로 모델링 하기 위해서 여러 개의 뉴럴 네트워크를 병렬적으로 이용하여 구현되었으며, 기존 방법에 비해서 새로운 물체의 질감을 모델링 하기가 간편하였다. 실제로 측정한 데이터로 교차 검증을 실시한 결과 물체의 표면에서 생성되는 가속도를 약 75 %의 correlation으로 재생하는 결과를 얻을 수 있었다.

대규모 병렬컴퓨터에 적합한 교차메쉬구조에서의 경로설정 (Routing Strategy on the XMESH Topology for the Massively Parallel Computer Architecture)

  • 김종진;윤성대
    • 한국정보처리학회논문지
    • /
    • 제5권12호
    • /
    • pp.3109-3116
    • /
    • 1998
  • 본 논문에서는 대규모 병렬컴퓨터의 구현에 적합한 위상구조인 교차메쉬구조에서, 균등한 메시지분포를 갖고 메시지의 경쟁이 있는 실제적 상황에서 상호접속망내의 메시지의 경로를 선정하기 위한 방법들을 제안하고, 이의 성능을 검증하기 위해 우회 경로설정 알고리즘을 이용하여 시뮬레이션을 하였다. 교차메쉬의 특성상 최적경로의 수가 다른 구조들에 비해 다양하다는 특징을 이용하여 최적경로의 수를 우선순위에 반영한 우회조건 및 대각방향의 링크를 효율적으로 활용하기 위한 링크선정방법에 따를 교차메쉬의 최대지연(maximum delay), 평균지연(average delay) 및 메시지처리율(throughput)을 구하고 이를 비교 고찰하였다. 메시지 전송시 최적인 경로상의 링크에 경합이 생길 경우 최적 경로의 수가 적은 메시지가 높은 우선순위를 가지며 만약 같은 조건이라면 우회한 횟수가 많은 메시지가 높은 우선순위를 갖는 우회조건 LD를 사용하며 이 우선순위에 따라 경로를 선정할 차례가 된 메시지가 선택할 수 있는 최적경로의 수가 많을 경우 대각방향의 링크로 우선적으로 전송할 경우, 오래된 메시지가 높은 우선순위를 갖는 우회조건 A에 의한 방법에 비해 최대지연, 평균지연 및 메시지처리율에 있어서 각각 이상값에 대한 개선목표치의 약58%, 70% 및 31%의 성능개선이 있었다.

  • PDF