• Title/Summary/Keyword: 고차원

검색결과 465건 처리시간 0.024초

학습 성능 향상을 위한 차원 축소 기법 기반 재난 시뮬레이션 강화학습 환경 구성 및 활용 (The Design and Practice of Disaster Response RL Environment Using Dimension Reduction Method for Training Performance Enhancement)

  • 여상호;이승준;오상윤
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권7호
    • /
    • pp.263-270
    • /
    • 2021
  • 강화학습은 학습을 통해 최적의 행동정책을 탐색하는 기법으로써, 재난 상황에서 효과적인 인명 구조 및 재난 대응 문제 해결을 위해 많이 활용되고 있다. 그러나, 기존 재난 대응을 위한 강화학습 기법은 상대적으로 단순한 그리드, 그래프와 같은 환경 혹은 자체 개발한 강화학습 환경을 통해 평가를 수행함에 따라 그 실용성이 충분히 검증되지 않았다. 본 논문에서는 강화학습 기법을 실세계 환경에서 사용하기 위해 기존 개발된 재난 시뮬레이션 환경의 복잡한 프로퍼티를 활용하는 강화학습 환경 구성과 활용 결과를 제시하고자 한다. 본 제안 강화학습 환경의 구성을 위하여 재난 시뮬레이션과 강화학습 에이전트 간 강화학습 커뮤니케이션 채널 및 인터페이스를 구축하였으며, 시뮬레이션 환경이 제공하는 고차원의 프로퍼티 정보의 활용을 위해 비-이미지 피쳐 벡터(non-image feature vector)에 이미지 변환방식을 적용하였다. 실험을 통해 본 제안 방식이 건물 화재 피해도를 기준으로 한 평가에서 기존 방식 대비 가장 낮은 건물 화재 피해를 기록한 것을 확인하였다.

악성코드 패밀리 분류를 위한 API 특징 기반 앙상블 모델 학습 (API Feature Based Ensemble Model for Malware Family Classification)

  • 이현종;어성율;황두성
    • 정보보호학회논문지
    • /
    • 제29권3호
    • /
    • pp.531-539
    • /
    • 2019
  • 본 논문에서는 악성코드 패밀리 분류를 위한 훈련 데이터의 특징을 제안하고, 앙상블 모델을 이용한 다중 분류 성능을 분석한다. 악성코드 실행 파일로부터 API와 DLL 데이터를 추출하여 훈련 데이터를 구성하며, 의사 결정 트리기반 Random Forest와 XGBoost 알고리즘으로 모델을 학습한다. 악성코드에서 빈번히 사용되는 API와 DLL 정보를 분석하며, 고차원의 훈련 데이터 특징을 저차원의 특징 표현으로 변환시켜, 악성코드 탐지와 패밀리 분류를 위한 API, API-DLL, DLL-CM 특징을 제안한다. 제안된 특징 선택 방법은 데이터 차원 축소와 빠른 학습의 장점을 제공한다. 성능 비교에서 악성코드 탐지율은 Random Forest가 93.0%, 악성코드 패밀리 분류 정확도는 XGBoost가 92.0%, 그리고 정상코드를 포함하는 테스트 오탐률은 Random Forest와 XGBoost가 3.5%이다.

중등예비교사의 창의역량 강화를 위한 융합수업지도안 작성 및 수업시연의 효과 (The Effect of Convergence Lesson Plan and Teaching Demonstration for Enhancing Creative Competency of The Pre-service Teachers')

  • 김은진
    • 한국콘텐츠학회논문지
    • /
    • 제19권3호
    • /
    • pp.466-474
    • /
    • 2019
  • 본 연구는 '교육방법 및 교육공학' 수업에서 중등예비교사에게 요구되는 창의역량 강화와 학업도전 변화를 확인하는데 목적이 있다. 이를 위해 중등예비교사 94명이 한 학기 동안 융합수업지도안 작성 및 수업시연으로 진행되는 프로젝트 학습에 참여하였다. 설문지는 지은림, 주언희(2012)가 개발한 창의적 인재 역량측정도구와 배상훈 외(2015)의 학부교육 실태조사(K-NSSE)의 학업도전 사전-사후 설문을 실시하였다. 데이터 분석은 IBM SPSS 18.0 프로그램을 이용하여 대응표본 t 검정을 수행하였다. 연구결과는 다음과 같다. 창의역량에서는 '고차적 사고력', '문제해결능력', '호기심', '감수성', '과제집착력', '사회 가치추구', '협동 및 배려'가 유의미하였다. 학업도전에서는 '고차원 학습'과 '학습전략'이 유의미하였다. 이를 바탕으로 융합교육, 융합수업을 일반화하여 수업하기 위해서는 다양한 융합수업설계, 지도안 작성, 실천연구와 반복적인 융합수업의 효과를 검증하며 수정 보완 과정의 필요성에 대한 시사점을 논의하였다.

연속 댐 붕괴 해석을 위한 2차원 수리동역학 모형 개발 (Development of 2D hydrodynamic model for successive dam failure analysis)

  • 김병현;한건연
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.67-67
    • /
    • 2016
  • 최근 기후온난화로 인한 이상기후와 지진의 발생가능성으로 인해 직렬 혹은 병렬로 위치한 2개 이상의 댐(저수지)들의 연속 붕괴 가능성도 점점 커지고 있어 연속 댐 붕괴에 대한 비상대처계획도 수립에 대한 관심도 증대되고 있다. 국내에서는 댐(저수지) 붕괴로 인한 극한홍수해석이나 비상대처계획 수립시 국내에서는 DAMBRK, FLDWAV, HEC-RAS와 같은 1차원 수리동역학 모형이 주로 사용되어지고 있다. 하지만 1차원 모형은 흐름을 하나의 방향으로만 한정하여 해석하고, 각각의 적용 횡단면에서 동일 수위를 가지다는 가정으로 홍수범람해석을 수행하므로 정확성뿐만 아니라 실제 적용성에서도 한계를 가질 수밖에 없다. 댐(저수지) 붕괴로 인한 홍수범람해석에서 2차원 이상의 고차원 모형은 앞서 언급한 1차원 모형에 적용된 비현실적인 가정을 포함하지 않으므로 더욱 정교하고 신뢰성 있는 결과를 얻을 수 있다. 하지만, 홍수범람해석을 위한 상용 프로그램들은 단일 댐(저수지) 붕괴의 적용에는 큰 어려움이 없으나, 지형단면을 초기에 한번만 고려하는 문제로 인하여 연속 댐(저수지) 붕괴의 고려에는 한계를 가진다. 따라서 본 연구에서는 댐(저수지)의 연속 붕괴를 해석할 수 있는 2차원 수리동역학 모형을 개발하고자 한다. 각 댐(저수지)의 붕괴 전과 후의 지형 단면을 여러 번 반영할 수 있는 모형을 개발함으로써 시간차를 두고 붕괴되는 댐(저수지)의 연속 붕괴를 해석할 수 있도록 하였다. 개발모형은 2002년 태풍 루사로 인해 실제로 붕괴된 저수지에 적용되었으며, 이 저수지들은 붕괴시 시간차이를 두고 붕괴가 이루어져 개발모형의 적용 유역으로 선택하였다. 저수지의 연속붕괴 모델링을 위해 지형자료로는 저수지 단면, 댐 제체 및 여수로 붕괴 단면, 하천 단면 그리고 홍수터 지형 반영을 위한 수치지도, 경계조건으로는 저수지로의 유입유량과 하류단 조위조건이 고려되었다. 그리고 태풍 루사 당시의 기록적인 강우를 반영하기 위해 연구유역 인근에 관측된 강우를 모형에서 하천 및 홍수터에서 고려할 수 있도록 하였다.

  • PDF

스트림 암호에서 높은 비선형도의 상관면역함수의 설계와 그의 안전성 분석 (The Security analysis and construction of correlation immune function with higher nonlinearity on stream cipher)

  • 양정모
    • 정보보호학회논문지
    • /
    • 제17권4호
    • /
    • pp.89-95
    • /
    • 2007
  • 상관면역함수 f를 만드는 방법으로 Siegenthaler의 방법, Camion의 방법과 Seberry의 방법 등이 있다. 이 중에서 Seberry의 방법은 Hadamard 행렬이론을 이용하여 상관면역함수를 만드는 것으로, 임의의 상관면역도의 균형상관면역함수를 만드는 방법을 제공하였다. 본 논문에서는 저차원의 벡터공간에서 만들어진 여러 개의 상관면역함수를 조합하여 고차원 벡터공간위에서 상당히 비도가 높은 함수를 설계하는 Seberry의 방법들을 연구하였고, 그 함수들의 비선형도를 계산하였다. 즉, 두 개의 함수의 직합으로 설계된 새로운 상관면역함수와 네 개의 함수의 조합으로 설계된 새로운 상관면역함수의 비선형도가 각각의 이전 함수들과 비교하여 더 높은 비선형도를 갖는다는 것을 보였다. 또한 위의 방법을 응용하여 상대적으로 비도가 높은 상관공격으로부터 안전한 스트림암호에서 사용되는 함수들을 설계하였다.

약물유전체학에서 약물반응 예측모형과 변수선택 방법 (Feature selection and prediction modeling of drug responsiveness in Pharmacogenomics)

  • 김규환;김원국
    • 응용통계연구
    • /
    • 제34권2호
    • /
    • pp.153-166
    • /
    • 2021
  • 약물유전체학 연구의 주요 목표는 고차원의 유전 변수를 기반으로 개인의 약물 반응성을 예측하는 것이다. 변수의 개수가 많기 때문에 변수의 개수를 줄이기 위해서는 변수 선택이 필요하며, 선택된 변수들은 머신러닝 알고리즘을 사용하여 예측 모델을 구축하는데 사용된다. 본 연구에서는 400명의 뇌전증 환자의 차세대 염기서열 분석 데이터에 로지스틱 회귀, ReliefF, TurF, 랜덤 포레스트, LASSO의 조합과 같은 여러 가지 혼합 변수 선택 방법을 적용하였다. 선택된 변수들에 랜덤포레스트, 그래디언트 부스팅, 서포트벡터머신을 포함한 머신러닝 방법들을 적용했고 스태킹을 통해 앙상블 모형을 구축하였다. 본 연구의 결과는 랜덤포레스트와 ReliefF의 혼합 변수 선택 방법을 이용한 스태킹 모형이 다른 모형보다 더 좋은 성능을 보인다는 것을 보여주었다. 5-폴드 교차 검증을 기반으로 하여 적합한 최적 모형의 평균 검증 정확도는 0.727이고 평균 검증 AUC 값은 0.761로 나타났다. 또한, 동일한 변수를 사용할 때 스태킹 모델이 단일 머신러닝 예측 모델보다 성능이 우수한 것으로 나타났다.

베이즈 정보 기준을 활용한 분할-정복 벌점화 분위수 회귀 (Model selection via Bayesian information criterion for divide-and-conquer penalized quantile regression)

  • 강종경;한석원;방성완
    • 응용통계연구
    • /
    • 제35권2호
    • /
    • pp.217-227
    • /
    • 2022
  • 분위수 회귀 모형은 변수에 숨겨진 복잡한 정보를 살펴보기 위한 효율적인 도구를 제공하는 장점을 바탕으로 많은 분야에서 널리 사용되고 있다. 그러나 현대의 대용량-고차원 데이터는 계산 시간 및 저장공간의 제한으로 인해 분위수 회귀 모형의 추정을 매우 어렵게 만든다. 분할-정복은 전체 데이터를 계산이 용이한 여러개의 부분집합으로 나눈 다음 각 분할에서의 요약 통계량만을 이용하여 전체 데이터의 추정량을 재구성하는 기법이다. 본 연구에서는 분할-정복 기법을 벌점화 분위수 회귀에 적용하고 베이즈 정보기준을 활용하여 변수를 선택하는 방법에 관하여 연구하였다. 제안 방법은 분할 수를 적절하게 선택하였을 때, 전체 데이터로 계산한 일반적인 분위수 회귀 추정량만큼 변수 선택의 측면에서 일관된 결과를 제공하면서 계산 속도의 측면에서 효율적이다. 이러한 제안된 방법의 장점은 시뮬레이션 데이터 및 실제 데이터 분석을 통해 확인하였다.

희박 공분산 행렬에 대한 베이지안 변수 선택 방법론 비교 연구 (A comparison study of Bayesian variable selection methods for sparse covariance matrices)

  • 김봉수;이경재
    • 응용통계연구
    • /
    • 제35권2호
    • /
    • pp.285-298
    • /
    • 2022
  • 연속 수축 사전분포는 spike and slab 사전분포와 더불어, 희박 회귀계수 벡터 또는 공분산 행렬에 대한 베이지안 추론을 위해 널리 사용되고 있다. 특히 고차원 상황에서, 연속 수축 사전분포는 spike and slab 사전분포에 비해 매우 작은 모수공간을 가짐으로써 계산적인 이점을 가진다. 하지만 연속 수축 사전분포는 정확히 0인 값을 생성하지 않기 때문에, 이를 이용한 변수 선택이 자연스럽지 않다는 문제가 있다. 비록 연속 수축 사전분포에 기반한 변수 선택 방법들이 개발되어 있기는 하지만, 이들에 대한 포괄적인 비교연구는 거의 진행되어 있지 않다. 본 논문에서는, 연속 수축 사전분포에 기반한 두 가지의 변수 선택 방법들을 비교하려 한다. 첫 번째 방법은 신용구간에 기반한 변수 선택, 두 번째 방법은 최근 Li와 Pati (2017)가 개발한 sequential 2-means 알고리듬이다. 두 방법에 대한 간략한 소개를 한 뒤, 다양한 모의실험 상황에서 자료를 생성하여 두 방법들의 성능을 비교하였다. 끝으로, 모의실험으로부터 발견한 몇 가지 사실들을 기술하고, 이로부터 몇 가지 제안을 하며 논문을 마치려 한다.

희박 벡터 자기 회귀 모형의 로버스트 추정 (Robust estimation of sparse vector autoregressive models)

  • 김동영;백창룡
    • 응용통계연구
    • /
    • 제35권5호
    • /
    • pp.631-644
    • /
    • 2022
  • 본 논문은 고차원 시계열 자료에 이상점이 존재하는 경우 희박벡터자기회귀모형(sparse VAR; sVAR)의 모수를 강건하게 추정하는 방법에 대해서 연구하였다. 먼저 Xu 등 (2008)이 독립인 자료에서 밝혔듯이 adaptive lasso 방법이 sVAR 모형에서도 어느 정도의 강건함을 가짐을 모의 실험을 통해 알 수 있었다. 하지만, 이상점의 개수가 증가하거나 이상점의 영향력이 커지는 경우 효율성이 현저히 저하되는 현상도 관찰할 수 있었다. 따라서 이를 개선하기 위해서 최소절대편차(least absolute deviation; LAD)와 Huber 함수를 기반으로 벌점화 시키는 adaptive lasso를 이용하여 sVAR 모형을 추정하는 방법을 본 논문에서는 제안하고 그 성능을 검토하였다. 모의 실험을 통해 제안한 로버스트 추정 방법이 이상점이 존재하는 경우에 모수 추정을 더 정확하게 하고 예측 성능도 뛰어남을 확인했다. 또한 해당 방법론들을 전력사용량 데이터에 적용한 결과 이상점으로 의심되는 시점들이 존재하였고, 이를 고려하여 강건하게 추정하는 제안한 방법론이 더 좋은 예측 성능을 보임을 확인할 수 있었다.

Validation of a tool evaluating MOOCs for higher education from the perspective of education service

  • Sung-Wan, Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권3호
    • /
    • pp.177-187
    • /
    • 2023
  • 이 연구는 교육서비스 관점에서 MOOC의 질 평가를 위한 잠재모형을 도출하고 신뢰롭고 타당한 MOOC 질 평가도구를 개발하고 타당화하는 데 목적이 있다. 연구목적을 달성하기 위해 선행 연구결과에 기초해서, MOOC 평가 잠재모형(4개 요인과 8개 하위요인)을 도출하였다. 이 잠재모형을 토대로 18개 예비 평가문항을 개발한 후, 대학 원격수업 경험이 있는 학습자 138명을 대상으로 문항중요도 설문을 실시하였다. 수집된 136개의 자료를 활용하여 탐색적 요인분석 결과, 수집된 데이터에서 4개의 요인(체제적 학습 경험, 가치 경험, 가치 경험의 공동 창조, 고차원 학습경험)과 7개의 하위요인(실제성, 신뢰성, 확신성, 반응성, 조직환경 체계성, 프로그램 체계성, 학습자 지지의 체계성, 공동주도성)으로 추출되었다. 신뢰도 분석결과, 선정된 문항들은 각 척도를 구성하는 문항으로서 높은 내적합치도를 보였다. MOOC에 대한 평가도구는 타당하고 신뢰할 수 있다는 결론을 내릴 수 있다.