• 제목/요약/키워드: 리스케일링

검색결과 18건 처리시간 0.031초

XGBoost 기반 침입탐지모델을 위한 데이터 스케일링 및 특성선택 기법 연구 (A study on data scaling and feature selection techniques for XGBoost-based intrusion detection model)

  • 김영원;이수진
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.251-254
    • /
    • 2022
  • 본 논문은 XGBoost 알고리즘 기반의 침입탐지모델의 성능을 향상하기 위한 스케일링(scaling) 및 특성선택(feature selection) 기법을 제안한다. 머신러닝 모델 개발 중 전처리 단계에서 스케일링 및 특성선택을 수행하면 데이터세트의 조건수가 감소하여 모델의 성능을 향상할 수 있다. 각 과정별로 다양한 기법이 있지만 기존의 연구에서는 이러한 기법들을 적용한 결과를 비교·분석하지 않고 특정 기법을 적용한 결과만을 나열하였고 스케일링 및 특성선택에 대해 최적의 조합은 제시하지 못하였다. 따라서 본 논문에서는 다양한 전처리 기법들의 적용결과를 비교하고 최적의 조합을 제안한다. 또한 기존의 연구들이 특정 데이터세트에만 적용 가능한 전처리 기법을 제안하는데 비해 본 논문은 다양한 데이터세트에 대해 공통적으로 적용 가능한 전처리 기법을 제안함으로써 제안 기법의 범용성과 실세계 적용 가능성을 증명한다.

  • PDF

수중 표적 분류를 위한 합성곱 신경망의 전처리 성능 비교 (Preprocessing performance of convolutional neural networks according to characteristic of underwater targets )

  • 박경민;김두영
    • 한국음향학회지
    • /
    • 제41권6호
    • /
    • pp.629-636
    • /
    • 2022
  • 본 논문은 합성곱 신경망 기반 수중 표적 분류기의 성능 향상을 위한 최적의 전처리 기법을 제시한다. 실제 선박 수중신호를 수집한 데이터 세트의 주파수 분석을 통해 강한 저주파 신호로 인한 특성 표현의 문제점을 확인하였다. 이를 해결하기 위해 다양한 스펙트로그램 기법과 특성 스케일링 기법을 조합한 전처리 기법들을 구현하였다. 최적의 전처리 기법을 확인하기 위해 실제 데이터를 기반으로 합성곱 신경망을 훈련하는 실험을 수행하였다. 실험 결과, 로그 멜 스펙트로그램과 표준화 및 로버스트정규화 스케일링 기법의 조합이 높은 인식 성능과 빠른 학습 속도를 보임을 확인하였다.

시간축 스케일링에 의한 화자 식별 개선에 관한 연구 (A Study on Improvement of Speaker Identification with Time axis Scaling)

  • 정형교
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.123-126
    • /
    • 1998
  • 기존의 DTW를 이용한 화자 인식 시스템은 DTW의 단점이라 할 수 있는 과다한 계산량을 갖는다는 문제점을 갖고 있다. 따라서 본 논문은 텍스트 종속 화자 인식 시스템에서 피치 분포도를 갖는 개별 화자의 lDTW를 수행하기 전에 시간축 스케일링을 이용한 전처리로 인식시의 계산량을 감소시키는 과정을 미리 수행할 후 감소된 기준패턴들의 입력신호에 대해서만 DTW를 수행하는 방법을 제안하고자 한다. 제안한 방법을 실험하였을 경우 87.5%의 평균 처리 시간이 감소하였고, 더불어 인식률 감소는 거의 없었다.

  • PDF

경사 투영을 사용한 컬러 이미지 스케일링 (Color Image Scaling Using Oblique Projection)

  • 김준목;정원용
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2000년도 추계종합학술대회논문집
    • /
    • pp.53-56
    • /
    • 2000
  • 본 논문에서는 컬러이미지의 스케일링(scaling)을 위해 경사투영방법을 사용하여 기본적인 보간방법, 최소자승근사(least square approximation)의 결과들과 비교하여 보았다. 경사투영방법은 최소의 근사오차(approximation error)를 제공하는 수직투영(orthogonal projection)방법과 유사한 결과를 제공하며 전처리 필터 디자인에 자유성을 부여하고, 좀 더 일반화된 형태의 보간 방법이다. 사용된 방법을 기본적인 보간법들과 비교하여 보았을 때 더 좋은 PSNR의 결과를 얻을 수 있었으며 최소자승근사 방법과 유사한 결과들을 얻을 수가 있었다.

  • PDF

오디오 전처리 방법에 따른 콘벌루션 신경망의 환경음 분류 성능 비교 (Comparison of environmental sound classification performance of convolutional neural networks according to audio preprocessing methods)

  • 오원근
    • 한국음향학회지
    • /
    • 제39권3호
    • /
    • pp.143-149
    • /
    • 2020
  • 본 논문에서는 딥러닝(deep learning)을 이용하여 환경음 분류 시 전처리 단계에서 사용하는 특징 추출 방법이 콘볼루션 신경망의 분류 성능에 미치는 영향에 대해서 다루었다. 이를 위해 환경음 분류 연구에서 많이 사용되는 UrbanSound8K 데이터셋에서 멜 스펙트로그램(mel spectrogram), 로그 멜 스펙트로그램(log mel spectrogram), Mel Frequency Cepstral Coefficient(MFCC), 그리고 delta MFCC를 추출하고 각각을 3가지 분포로 스케일링하였다. 이 데이터를 이용하여 4 종의 콘볼루션 신경망과 이미지넷에서 좋은 성능을 보였던 VGG16과 MobileNetV2 신경망을 학습시킨 다음 오디오 특징과 스케일링 방법에 따른 인식률을 구하였다. 그 결과 인식률은 스케일링하지 않은 로그 멜 스펙트럼을 사용했을 때 가장 우수한 것으로 나타났다. 도출된 결과를 모든 오디오 인식 문제로 일반화하기는 힘들지만, Urbansound8K의 환경음이 포함된 오디오를 분류할 때는 유용하게 적용될 수 있을 것이다.

기계학습 분석을 위한 차원 확장과 차원 축소가 적용된 지진 카탈로그 (Application of Dimensional Expansion and Reduction to Earthquake Catalog for Machine Learning Analysis)

  • 장진수;소병달
    • 지질공학
    • /
    • 제32권3호
    • /
    • pp.377-388
    • /
    • 2022
  • 최근, 다수의 연구가 지수적으로 증가하는 지진 자료를 효율적이고 정확하게 처리하기 위해 기계학습을 활용하고 있다. 본 연구는 지진의 발생 시간, 위치, 규모의 정보를 확장하여 기계학습에 적용 가능한 자료를 제작한 후, 주성분 분석을 통해 추출한 자료의 주요 성분으로 자료의 차원을 축소하였다. 차원이 확장된 자료는 36,699개의 지진 사건을 포함하는 Global Centroid Moment Tensor 카탈로그로부터 얻은 지진 정보의 통계량으로 구성되었다. 표준화와 최대-최소화 스케일링을 활용하여 자료 전처리를 수행하였으며, 스케일링이 완료된 자료에 주성분 분석을 적용하여 자료의 주요 특징을 추출하였다. 스케일링은 상이한 단위로 인한 특징 값의 차이를 현저히 감소시켰으며, 그 중 표준화는 다른 전처리에 비해서 각 특징의 중앙값을 더 균등하게 변환하였다. 주성분 분석이 스케일링이 적용되지 않은 자료로부터 추출한 여섯 개의 주성분은 원본 자료의 정보를 99% 설명하였다. 표준화와 최대-최소 스케일링이 적용된 자료로부터 추출한 열여섯 개의 주성분은 원본 자료의 정보의 98%를 재구성하였다. 이는 특징 값의 분포가 균등한 자료의 정보를 보존하기 위해서는 더 많은 주성분이 필요함을 지시한다. 본 연구는 지진 데이터와 지진 거동과의 관계를 분석하는 효율적이고 정확한 기계 학습 모형을 훈련시키기 위한 데이터 처리 방법을 제안하였다.

CMOS 이미지 센서용 효과적인 인터폴레이션 구현 (Implementation of an Efficient Interpolation for CMOS Image Sensor)

  • 이동훈;손승일
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 춘계종합학술대회
    • /
    • pp.353-357
    • /
    • 2005
  • 본 논문에서는 영상 입력 장치 또는 카메라 이미지 센서로부터 얻은 Bayer Data입력 포맷을 우리가 디스플레이 장치로 보는 영상으로 출력하기 위해 전처리 작업을 수행한다. 먼저 들어오는 Bayer Data Format은 인터폴레이션을 수행하여 컬러영상을 표현하기위한 한 픽셀 표현 R, G, B값을 구한다. 본 논문에서는 연산량과 필요한 레지스터의 수를 줄이고 칩의 성능을 향상시키기 위해 기존 3${\times}$3라인 쓰지 않고 2${\times}$2라인을 이용한 인터폴레이션을 수행한다. 또한 Bayer Data입력에 대한 이미지 스케일링 작업과 인터폴레이션 수행 작업을 동시에 수행한다. 이를 구현하기위해 원본 이미지 사이즈를 640${\times}$480으로 입력 데이터를 사용하고, 소프트웨어로 전처리하여 이미지 결과를 확인한 후, 최적화된 알고리즘를 적용하여 VHDL설계언어를 이용한 하드웨어 설계후, ModelSim 6.0a를 이용하여 데이터를 검증한다.

  • PDF

NFV 플랫폼에서 VNFM의 실행 시간에 기반한 자동 자원 조정 메커니즘 (Autoscaling Mechanism based on Execution-times for VNFM in NFV Platforms)

  • 메흐무드 아시프;디아즈 리베라 하비에르;칸 탈하 애흐마드;송왕철
    • KNOM Review
    • /
    • 제22권1호
    • /
    • pp.1-10
    • /
    • 2019
  • 필요한 자원 수를 결정하는 과정은 여러 가지 요인에 따라 달라진다. 자동스케일링은 광범위한 요인에 기초하여 결정하는 메커니즘 중 하나이며 NFV에서 중요한 과정이다. SDN의 출현 이후 네트워크가 클라우드로 전환되고 있기 때문에, 앞으로 더 나은 자원 관리 필요하다. 이 문제를 해결하기 위해; 네트워크 기능의, 하이퍼스레딩 오버헤드, 요청 수, 실행 시간 등의 요인에 따라 VNFM이 가상 시스템 리소스를 자동 스케일링할 수 있는 솔루션을 제안한다. 하이퍼스레드 가상 코어가 물리적 코어처럼 완전히 작동하지 않는다는 것은 알려진 사실이다. 또한, 다양한 코어의 유형이 다르기 때문에 코어 수를 계산하는 프로세스는 정확하고 정밀하게 측정할 필요가 있다. 플랫폼 독립성은 API를 통해 모니터링 마이크로서비스 솔루션을 제안함으로써 달성된다. 따라서 본 논문에서는 오토스케일링 애플리케이션과 모니터링 마이크로 서비스를 사용하여 네트워크의 기준을 충족하기 위해 리소스 프로비저닝 프로세스를 강화하는 메커니즘을 제안한다.

Low-rate TCP 공격 탐지를 위한 스케일링 기반 DTW 알고리즘의 성능 분석 (Performance Evaluation of Scaling based Dynamic Time Warping Algorithms for the Detection of Low-rate TCP Attacks)

  • 소원호;심상헌;유경민;김영천
    • 대한전자공학회논문지TC
    • /
    • 제44권3호
    • /
    • pp.33-40
    • /
    • 2007
  • 본 논문에서는 최근 새롭게 발견된 low-rate TCP (LRT) 공격과 이 공격을 감지하기 위한 DTW (Dynamic Time Warping) 알고리즘을 분석하고 공격 검출에 대한 성능 향상을 위한 스케일링 기반 DTW (Scaling based DTW; S-DTW) 알고리즘을 소개한다. Low-rate TCP 공격은 대용량 트래픽을 사용한 기존 서비스 거부 공격과는 다르게 공격 트래픽의 평균 트래픽 양이 적어서 기존 DoS 공격에 대한 감지 방식으로는 검출되지 않는다. 그러나 LRT 공격은 주기적이고 짧은 버스트 트래픽으로 TCP 연결의 최소 재전송 타임아웃 (Retransmission Timeout; RTO)에 대한 취약성을 공격하기 때문에 패턴 매칭으로 공격 감지가 가능하다. 기존 메커니즘에 의한 감지 기법은 공격 패턴의 입력 샘플 템플릿을 기준으로 입력 트래픽이 정상 트래픽인지 또는 공격 트래픽인지를 판별한다. 이 과정에서 입력 트래픽의 특성에 따라서 DTW 알고리즘은 정상 트래픽을 공격 트래픽으로 오판하는 문제점을 갖는다. 따라서 본 논문에서는 이러한 오판을 줄이기 위하여 기존 DTW 알고리즘의 전처리 과정인 자기상관 (auto-correlation) 처리를 분석하여 오판을 규명한다. 또한 스케일링 기반으로 자기상관 처리 결과를 수정하여 공격 트래픽과 정상 트래픽의 특성의 차이를 증가시킴으로써 DTW 알고리즘에 의한 공격 감지 능력을 향상시킨다 마지막으로 다양한 스케일링 방식과 표준편차에 의한 트래픽 분석 방법도 논의된다.

시·도별 사회재난 중점유형 선정에 관한 연구 (A Study on the Selection of Types of Social Disasters by Region)

  • 이효진;윤홍식;한학
    • 한국재난정보학회 논문집
    • /
    • 제17권2호
    • /
    • pp.206-217
    • /
    • 2021
  • 연구목적: 최근 대형 사회재난이 잇따라 발생하면서 자연재난 뿐만 아니라 사회재난을 예방하고 피해를 저감하기 위해 많은 연구가 진행되고 있다. 하지만 연구 중 대부분이 일부 사회재난만을 다루고 있기 때문에 본 논문에서는 지자체에서 중점적으로 다루어야 할 사회재난 유형을 선정하여 효과적인 대책 마련을 위한 기초자료를 만들고자 하였다. 연구방법: 행정안전부에서 고시하고 있는 43종 재난 중 중복 또는 발생 이력이 없는 재난 등을 제외한 후 중점유형을 선정하기 위해 11종의 재난유형을 선정하여 데이터를 수집하였으며 위험지도로 지역별 위험유형을 도출하였다. 위험지도를 도출하기 위해서 각 세부지표를 리스케일링하여 0 ~ 1로 정규화를 하였으며 엔트로피 기법을 통해 가중치를 결정하였다. 연구결과: 그 결과 행정안전부에서 고시하고 있는 중점재난과 약 41%가 일치하였으며 나머지 중점 유형은 원자력사고, 공동구 사고 등 정보를 취득할 수 없거나 최근 20년 동안 발생하지 않은 재난이었다. 결론: 따라서 본 연구를 통해 사회재난의 효과적인 예방 및 복구계획을 수립하기 위해 지자체별 사회재난 중점재난을 제시하고자 하였다.