• 제목/요약/키워드: 랜덤변수

검색결과 259건 처리시간 0.036초

통계적 기법을 이용한 악성 소프트웨어 분류 (Malware classification using statistical techniques)

  • 원성민;김현주;송종우
    • 응용통계연구
    • /
    • 제30권6호
    • /
    • pp.851-865
    • /
    • 2017
  • 최근 워너크라이라는 이름의 랜섬웨어가 전 세계적으로 큰 화두에 오르면서, 악성 소프트웨어로 인한 피해를 줄이기 위한 방법들이 재조명 되고 있다. 새로운 악성 소프트웨어가 발생했을 때 피해를 최소화하기 위해서는 해당 소프트웨어가 어떤 공격 유형을 가진 악성 소프트웨어인지 빠르게 분류할 필요가 있다. 본 연구 목적은 다양한 통계적 기법을 이용하여 악성 소프트웨어를 효과적으로 분류할 수 있는 모형을 구축하는 데 있다. 모형 적합 시 다항 로지스틱, 랜덤 포레스트, 그래디언트 부스팅, 서포트 벡터 기계 등의 기법들을 이용하였으며, 본 연구를 통해 악성 소프트웨어를 분류하는 데에 있어 중요한 역할을 하는 변수들이 존재한다는 사실을 발견하였다.

격납건물의 내진안전성 평가 (Seismic Safety Assessment of Containment Building)

  • 이성로;배용귀
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제8권3호
    • /
    • pp.225-233
    • /
    • 2004
  • 본 연구에서는 응답면기법을 이용하여 격납건물의 내진안전성 평가를 하였다. ABAQUS를 이용하여 하중, 저항과 해석에서의 랜덤변수를 고려한 구조해석을 수행하였고 이로부터 변수의 다항식으로 표현되는 구조물의 응답을 얻었다. 그리고 Level II에 의해 신뢰성해석을 하였다. 한계상태함수로는 콘크리트의 2축응력 상태를 고려하기 위해 Drucker-Prager 파괴기준을 이용하였다. 구조물의 수명, 지진의 연발생율과 조건부 파괴확률을 고려하여 격납건물의 파괴확률을 계산하였다. 또한 응답면기법의 안정적인 결과를 얻기 위해 표본점 선정에 대한 민감도해석을 수행하였다.

CUDA 환경에서 CUSUM 검증의 병렬화 (Parallelization of CUSUM Test in a CUDA Environment)

  • 손창환;박우열;김형균;한경숙;표창우
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권7호
    • /
    • pp.476-481
    • /
    • 2015
  • NIST통계적 난수 검증 모음에 속한 누적 합(CUSUM) 검증을 CUDA 환경에서 병렬화하였다. 배열 사유화를 적용하여 스칼라 변수에 저장하던 랜덤 워크(random walk) 값을 배열 변수에 저장하여 데이터 의존성을 제거하였다. 자료 구조 변경에 따라 알고리즘 각 단계에 병렬 스캔, 스캐터 및 병렬 축약 적용이 가능하게 되었다. 또한 CPU를 사용하여 진행되던 부분을 GPU가 담당하게 하여 두 프로세서 사이의 데이터 이동으로 인해 발생하는 직렬화를 해소하였다. 마지막으로 전역 메모리 접근을 최적화하여 전체적으로 순차적 구현 대비 약 23배에 달하는 성능 향상을 달성하였다. 이 결과는 검증 모음의 실행시간 단축과 더불어 암호 키 보안 향상을 위한 난수 연구에 기여할 것으로 예상된다.

조건부 랜덤 포레스트 기반의 설명 가능한 일사량 예측 (Explainable Solar Irradiation Forecasting Based on Conditional Random Forests)

  • 문지훈;황인준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.323-326
    • /
    • 2020
  • 태양광 발전은 이산화탄소 배출로 인한 기후 변화에 대응하는 주요 수단으로 인식되어 수요와 필요성이 급격하게 증가하고 있다. 최적의 태양광 발전 시스템의 운영을 위해서는 정교한 전력수요 및 태양광 발전량 예측 모델이 요구되며, 온도 및 일사량은 태양광 발전량 예측 모델의 필수적인 입력 변수이다. 하지만, 한국 기상청의 동네예보는 일사량에 관한 예측값을 제공하지 않아 정교한 태양광 발전량 예측 모델을 구축하는 것은 어렵다. 이를 위해 일사량 예측 기법에 관한 많은 연구사례가 보고되고 있지만, 다수의 연구들은 충분한 데이터 셋을 이용하여 일사량 예측 모델을 개발하였다. 초기 태양광 발전 시스템 운영을 위해서는 불충분한 데이터 셋을 이용한 예측 모델 개발이 필요하나 이에 대한 사례는 불충분하다. 본 논문은 실제 태양광 발전 시스템에서 수집된 불충분한 데이터 셋을 이용한 단기 일사량 예측 기법을 제안한다. 먼저, 기상청 동네예보의 다양한 기상 요인들을 이용하여 일사량 예측 모델을 위한 입력 변수를 구성한다. 다음으로, 조건부 랜덤 포레스트를 이용하여 일사량 예측 모델을 구성하며, 설명 가능한 일사량 예측뿐만 아니라 더욱더 많은 데이터 셋을 학습하기 위해 시계열 교차검증을 수행한다. 실험 결과, 제안한 기법은 다른 예측 기법들보다 높은 예측 정확도를 보일 뿐만 아니라 설명 가능한 예측 결과를 제시할 수 있음을 보여준다.

통계기법 및 기계학습 기법을 이용한 우리나라 대설피해액 예측 및 적용성 검토 (Predicting and Reviewing the Amount of Snow Damage in Korea using Statistical and Machine Learning Techniques)

  • 이형주;이근우;장현빈;정건희
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.384-384
    • /
    • 2022
  • 과거의 우리나라 대설피해 양상을 살펴보면 지역적으로 집중되어 피해가 발생하는 것이 특징이다. 그러나 현재는 전국적으로 대설피해가 가중되는 추세이며, 이에 따라 대설피해에 대비 가능한 대책의 강구가 필요한 실정이다. 그러나 피해 발생 시 정확한 피해 예측으로 사전에 재난을 대비가 가능한 수준의 연구는 미흡한 실정이다. 따라서 본 연구에서는 다양한 통계기법과 기계학습 기법을 이용하여 대설로 인해 발생한 피해액을 개략적으로 예측이 가능한 모형을 개발하고자 하였다. 대설피해액 예측 모형은 다중회귀분석, 서포트 벡터 머신, 인공신경망 기법, 랜덤포레스트 기법을 이용하여 총 4가지 기법으로 개발하였으며, 독립변수로 사회·경제적 요소, 기상요소를 사용하였고, 종속변수로는 1994년부터 2020년까지 발생한 대설피해 이력의 대설피해액을 사용하였다. 결과적으로 4가지 예측 모형의 예측력 검증 및 기법 간의 예측력을 비교하여 개발한 모형의 적용성을 검토하였다. 본 연구 결과에서 제시한 모형의 개선방안 및 업데이트 방안을 참고하여 후속 연구가 진행된다면 미래에 전국적으로 확대될 대설피해에 대한 대비가 가능할 것으로 기대되며 복구비 및 예방비 투자의 지역적 우선순위를 분석하여 선제적인 대비가 가능할 것으로 판단된다.

  • PDF

Monte-Carlo 방법에 의한 소나배열 소자의 허용오차 규정 (Decision of Error Tolerance in Sonar Array by the Monte-Carlo Method)

  • 김형동;이용범;이준영
    • 한국음향학회지
    • /
    • 제21권3호
    • /
    • pp.221-229
    • /
    • 2002
  • 본 논문에서는 Monte-Carlo 방법으로 빔패턴 오차의 허용범위를 만족하는 개별소자의 허용오차를 규정하였다. 일반적으로 사용되는 통계적인 방법은 불규칙한 특성을 갖는 랜덤오차를 정규분포를 갖는 랜덤 변수로 모델링을 하여 개별소자의 오차범위를 규정하는데, 이러한 방법은 해석하고자 하는 배열소자의 개수증가에 따라 계산량이 지수승으로 늘어나게 되어 많은 소자배열에는 적합하지 않게 된다. 이러한 단점을 보완하기 위해서 이 논문에서는 Monte-Carlo 방법을 사용하여 배열소자의 증가에 따른 계산량의 증가를 줄이는 새로운 알고리즘을 제안하였다. 그리고 이렇게 규정된 오차의 범위를 간단한 모의실험을 통해서 검증하였다.

랜덤 심볼열의 바이어스된 분포를 이용한 정보 포텐셜과 블라인드 알고리즘 (Information Potential and Blind Algorithms Using a Biased Distribution of Random-Order Symbols)

  • 김남용
    • 한국통신학회논문지
    • /
    • 제38A권1호
    • /
    • pp.26-32
    • /
    • 2013
  • 출력 샘플과 수신단에서 랜덤한 순서로 발생된 심볼의 정보 포텐셜을 기반으로 한 블라인드 알고리즘은, 바이어스된 충격성 잡음이 채널에 더해질 때, 정보 포텐셜을 바탕으로 한 비용함수에 바이어스된 신호를 처리할 변수가 포함되어 있지 않아 성능저하를 겪게 된다. 이러한 바이어스된 충격성 잡음에 대한 강건성을 목표로, 이 논문에서는 수정된 정보 포텐셜을 제안하고, 이 제안된 정보 포텐셜에 기반하여 증강된 필터 구조와 랜덤 심볼을 사용한 새로운 블라인드 알고리즘을 도출하였다. 다중 경로 채널의 블라인드 등화에 대한 시뮬레이션 결과로부터, 제안된 정보 포텐셜에 기반한 블라인드 알고리즘이 바이어스된 강한 충격성 잡음 환경에서 탁월한 수렴 성능을 나타냈다.

바이어스 된 충격성 잡음 하에서 랜덤 심볼 열을 이용한 블라인드 알고리듬 (Blind Algorithms using a Random-Symbol Set under Biased Impulsive Noise)

  • 김남용
    • 한국산학기술학회논문지
    • /
    • 제14권4호
    • /
    • pp.1951-1956
    • /
    • 2013
  • 랜덤 순서로 발생된 심볼 열을 기반으로 하는 확률 분포 매칭 타입의 알고리듬들은 그 성능 기준이 바이어스된 신호에 대한 변수를 지니고 있지 않아서 바이어스된 충격성 잡음 하에서는 제한된 성능을 나타낸다. 이 논문에서는 바이어스된 충격성 잡음을 이겨내기 위한 수정된 성능기준을 제안하고, 증강된 필터구조와 랜덤 심볼 열을 사용하는 확률 분포 매칭 방법에 기초한 블라인드 알고리듬을 제안하였다. 시뮬레이션 결과로부터 제안된 성능기준에 의해 만들어진 제안된 알고리듬이 바이어스된 강한 충격성 잡음에 대해 동요됨이 없이 탁월한 수렴성능을 보였다.

Monte-Carlo Simulation 과 Deterministic Simulation의 합성적 방법에 의한 배열소자 가중치에 따른 오차의 규정 (Decision of Error Tolerance in Weighted Array by Hybrid Method of Monte-Carlo Simulation and Deterministic Simulation)

  • 최철민;이용범;김형동
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 학술발표대회 논문집 제19권 2호
    • /
    • pp.333-336
    • /
    • 2000
  • 본 논문에서는 Monte-Carlo simulation과 deterministic simulation을 합성한 방법으로 특성허용 패턴을 만족하는 개별소자의 오차범위를 가중치에 따라 차별적으로 규정을 하였다. 일반적으로 사용되는 통계적인 방법은 불규칙한 특성을 갖는 랜덤오차를 정규분포를 갖는 랜덤변수로 모델링을 하여 허용 패턴으로부터 오차의 범위를 규정하는데, 이렇게 구해진 범위는 개별소자의 가중치의 영향을 고려하지 않고 일률적인 특성을 나타낸다는 단점이 있다. 이에 반해 deterministic simulation을 통해서 얻어진 오차의 범위는 가중치에 따라서 상대적인 범위를 결정할 수 있지만 해석 하고자하는 배열소자의 개수에 따라서 계산량이 지수승으로 증가하는 단점이 있어 10개 이상의 소자를 갖는 배열에는 적합하지 않다. 이러한 단점을 보완하기 위해서는 본 논문에서는 Monte-Carlo simulation과 deterministic simulation의 합성적 방법을 사용해서 배열소자의 증가에 따른 계산량의 증가를 줄이면서 각 가충치에 따라 상대적인 개별오차의 허용범위를 결정하였다. 그리고 이렇게 규정된 오차의 범위를 간단한 모의 실험을 통해서 검증하였다.

  • PDF

국내 예능 시청률과 회차 예측 및 영향요인 분석 (A study on entertainment TV show ratings and the number of episodes prediction)

  • 김미림;임소연;장초희;송종우
    • 응용통계연구
    • /
    • 제30권6호
    • /
    • pp.809-825
    • /
    • 2017
  • 오디션, 육아, 버라이어티 등 다양한 예능 프로그램들의 수가 점점 증가하고 있다. 특히 종합편성채널이 개국한 이후에 예능 시장 경쟁이 심화되고 있다. 그에 따라 시청률과 회차에 대한 연구의 필요성이 대두되고 있다. 본 연구의 목적은 예능 프로그램 시청률과 회차의 예측모형을 제시하고 주요요인을 살펴보는 데 있다. 모형 적합 시 선형회귀모형, 로지스틱 회귀모형, LASSO 회귀모형, 랜덤 포레스트, 그래디언트 부스팅, 서포트 벡터 머신 등과 같은 다양한 분석 방법을 고려하였다. 예능 시청률 예측 모형에서는 첫 회가 방영되기 전과 방영된 후 두 가지 모형을 적합하였고, 회차 예측 모형에서는 예능 시청률 예측 모형의 예측치를 추가 변수로 생성하여 모형을 적합하였다. 그 결과 첫 회 방영 전 예능 시청률 예측에서는 방송사, 이전 시즌 시청률, 시작 연도, 기사 수가 큰 영향을 주는 것으로 나타났다. 첫 회 방영 후 예능 시청률 예측에서는 첫 회 시청률, 방송사, 예능 유형이 중요한 변수로 나타났으며, 두 모형 모두 랜덤 포레스트 모형에서 가장 좋은 결과를 보였다. 예능 회차 예측에서는 평균 시청률 예측치, 시작 연도, 예능유형, 방송국 등이 중요한 변수로 나타났다.