• 제목/요약/키워드: High-dimensional datasets

검색결과 46건 처리시간 0.029초

MQTT 기반 IoT 환경에서의 PCA와 LightGBM을 이용한 공격 탐지 및 분류 방안 (Attack Detection and Classification Method Using PCA and LightGBM in MQTT-based IoT Environment)

  • 이지구;이수진;김영원
    • 융합보안논문지
    • /
    • 제22권4호
    • /
    • pp.17-24
    • /
    • 2022
  • 최근 머신러닝 기반의 사이버 공격 탐지 및 분류 연구가 활발히 이루어지고 있으며, 높은 수준의 탐지 정확도를 달성하고 있다. 그러나 저 사양 IoT 기기, 대규모의 네트워크 트래픽 등은 IoT 환경에서 머신러닝 기반의 탐지모델 적용을 어렵게 하고 있다. 따라서 본 논문에서는 국방분야에서도 활용되고 있는 MQTT(Message Queuing Telementry Transport) IoT 프로토콜 환경에서 수집된 데이터세트를 대상으로, 차원축소 기법인 PCA(Principal Component Analysis)와 LightGBM(Light Gradient Boosting Model)을 이용하여 IoT 공격을 효울적으로 탐지 및 분류하는 방안을 제안하였다. 실험을 통해 제안하는 분류모델의 성능을 확인한 결과 원본 데이터세트를 약 15%로 축소하였음에도 원본 전체를 모두 사용한 모델과 거의 유사한 성능을 나타냈으며, 본 논문에서 선정한 4가지 차원축소기법과의 비교 평가에서도 가장 우수한 성능을 나타냈다.

저고도 근접 항공영상을 이용한 현장정보관리 (Management of Construction Fields Information Using Low Altitude Close-range Aerial Images)

  • 조영선;임노열;정우수;정성혁;최석근
    • 한국측량학회지
    • /
    • 제32권5호
    • /
    • pp.551-560
    • /
    • 2014
  • 다른 산업현장에 비해 토목 시공현장은 작업 공정이 길고 복잡하여 준공시까지 종합관리 및 공정관리, 품질관리가 어렵고 많은 문제점이 발생하고 있다. 본 연구는 토목 시공현장의 상황을 종합적으로 관리하고 현장정보를 상시 모니터링하기 위하여 무인항공사진측량, GPS측량 등을 활용하여 3차원 공간정보를 신속, 정확하게 처리하고, 주요설계, 시공도면 및 공정, 공사비 등을 언제, 어디서든 관리 및 분석하며 시공현장을 종합적으로 관리, 파악할 수 있는 자료를 제공하는데 목적이 있다. 토목 시공현장의 계획에서 준공까지 공정관리, 공사진행 확인 등 빠른 의사결정을 위한 최신의 정보를 제공할 수 있고, 고해상도 3차원 공간정보와 설계도면을 중첩하여 객관적으로 현장상황을 판단할 수 있으며, 현황도, 종 횡단면도를 제작하여 토적표, 내역서, 지반고 변화 등 각종 자료를 신속하게 제공하였다.

특징 변환과 은닉 마코프 모델을 이용한 팔 제스처 인식 시스템의 설계 (Design of an Arm Gesture Recognition System Using Feature Transformation and Hidden Markov Models)

  • 허세경;신예슬;김혜숙;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권10호
    • /
    • pp.723-730
    • /
    • 2013
  • 본 논문에서는 Kinect 센서를 이용한 팔 제스처 인식 시스템의 설계에 대해 소개한다. 제스처 인식을 위한 기존의 연구들에서는 동적 시간 왜곡(DTW)에서 은닉 마코프 모델(HMM)에 이르기까지 다양한 방법들이 적용되어 왔다. 본 논문에서 제안하는 제스처 인식 시스템은 Kinect 센서를 통해 얻을 수 있는 순차적인 팔 관절 위치 데이터로부터 각 제스처 별 고유한 은닉 마코프 모델을 학습한다. 동일한 제스처를 수행하더라도 Kinect 센서에 포착되는 각 관절의 위치 좌표 값들은 팔의 길이와 방향에 따라 크게 달라질 수 있다는 문제점이 있다. 본 논문에서 제안하는 시스템에서는 다양한 환경 조건에서도 높은 제스처 인식 성능을 얻기 위해, 팔 관절들의 좌표 값으로 구성된 특징 벡터를 팔 관절들 간의 각도 값으로 변환하는 특징 변환 과정을 수행한다. 또한, 본 시스템에서는 은닉 마코프 모델의 학습과 적용의 효율성을 높이기 위해, 고차원 실수 관측 벡터들에 k-평균 군집화를 적용하여 이산 은닉 마코프 모델들을 위한 1차원 정수 시퀀스들을 구한다. 이와 같은 차원 축소와 이산화를 통해, 실시간 환경에서도 은닉 마코프 모델들을 효율적으로 제스처 인식에 이용할 수 있다. 끝으로, 서로 다른 두 가지 데이터 집합을 이용한 실험을 통해, 본 논문에서 제안한 시스템의 높은 인식 성능을 입증해 보인다.

CNN을 적용한 한국어 상품평 감성분석: 형태소 임베딩을 중심으로 (Sentiment Analysis of Korean Reviews Using CNN: Focusing on Morpheme Embedding)

  • 박현정;송민채;신경식
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.59-83
    • /
    • 2018
  • 고객과 대중의 니즈를 파악하기 위한 감성분석의 중요성이 커지면서 최근 영어 텍스트를 대상으로 다양한 딥러닝 모델들이 소개되고 있다. 본 연구는 영어와 한국어의 언어적인 차이에 주목하여 딥러닝 모델을 한국어 상품평 텍스트의 감성분석에 적용할 때 부딪히게 되는 기본적인 이슈들에 대하여 실증적으로 살펴본다. 즉, 딥러닝 모델의 입력으로 사용되는 단어 벡터(word vector)를 형태소 수준에서 도출하고, 여러 형태소 벡터(morpheme vector) 도출 대안에 따라 감성분석의 정확도가 어떻게 달라지는지를 비정태적(non-static) CNN(Convolutional Neural Network) 모델을 사용하여 검증한다. 형태소 벡터 도출 대안은 CBOW(Continuous Bag-Of-Words)를 기본적으로 적용하고, 입력 데이터의 종류, 문장 분리와 맞춤법 및 띄어쓰기 교정, 품사 선택, 품사 태그 부착, 고려 형태소의 최소 빈도수 등과 같은 기준에 따라 달라진다. 형태소 벡터 도출 시, 문법 준수도가 낮더라도 감성분석 대상과 같은 도메인의 텍스트를 사용하고, 문장 분리 외에 맞춤법 및 띄어쓰기 전처리를 하며, 분석불능 범주를 포함한 모든 품사를 고려할 때 감성분석의 분류 정확도가 향상되는 결과를 얻었다. 동음이의어 비율이 높은 한국어 특성 때문에 고려한 품사 태그 부착 방안과 포함할 형태소에 대한 최소 빈도수 기준은 뚜렷한 영향이 없는 것으로 나타났다.

CT Based 3-Dimensional Treatment Planning of Intracavitary Brachytherapy for Cancer of the Cervix : Comparison between Dose-Volume Histograms and ICRU Point Doses to the Rectum and Bladder

  • Hashim, Natasha;Jamalludin, Zulaikha;Ung, Ngie Min;Ho, Gwo Fuang;Malik, Rozita Abdul;Ee Phua, Vincent Chee
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제15권13호
    • /
    • pp.5259-5264
    • /
    • 2014
  • Background: CT based brachytherapy allows 3-dimensional (3D) assessment of organs at risk (OAR) doses with dose volume histograms (DVHs). The purpose of this study was to compare computed tomography (CT) based volumetric calculations and International Commission on Radiation Units and Measurements (ICRU) reference-point estimates of radiation doses to the bladder and rectum in patients with carcinoma of the cervix treated with high-dose-rate (HDR) intracavitary brachytherapy (ICBT). Materials and Methods: Between March 2011 and May 2012, 20 patients were treated with 55 fractions of brachytherapy using tandem and ovoids and underwent post-implant CT scans. The external beam radiotherapy (EBRT) dose was 48.6Gy in 27 fractions. HDR brachytherapy was delivered to a dose of 21 Gy in three fractions. The ICRU bladder and rectum point doses along with 4 additional rectal points were recorded. The maximum dose ($D_{Max}$) to rectum was the highest recorded dose at one of these five points. Using the HDRplus 2.6 brachyhtherapy treatment planning system, the bladder and rectum were retrospectively contoured on the 55 CT datasets. The DVHs for rectum and bladder were calculated and the minimum doses to the highest irradiated 2cc area of rectum and bladder were recorded ($D_{2cc}$) for all individual fractions. The mean $D_{2cc}$ of rectum was compared to the means of ICRU rectal point and rectal $D_{Max}$ using the Student's t-test. The mean $D_{2cc}$ of bladder was compared with the mean ICRU bladder point using the same statistical test. The total dose, combining EBRT and HDR brachytherapy, were biologically normalized to the conventional 2 Gy/fraction using the linear-quadratic model. (${\alpha}/{\beta}$ value of 10 Gy for target, 3 Gy for organs at risk). Results: The total prescribed dose was $77.5Gy{\alpha}/{\beta}10$. The mean dose to the rectum was $4.58{\pm}1.22Gy$ for $D_{2cc}$, $3.76{\pm}0.65Gy$ at $D_{ICRU}$ and $4.75{\pm}1.01Gy$ at $D_{Max}$. The mean rectal $D_{2cc}$ dose differed significantly from the mean dose calculated at the ICRU reference point (p<0.005); the mean difference was 0.82 Gy (0.48-1.19Gy). The mean EQD2 was $68.52{\pm}7.24Gy_{{\alpha}/{\beta}3}$ for $D_{2cc}$, $61.71{\pm}2.77Gy_{{\alpha}/{\beta}3}$ at $D_{ICRU}$ and $69.24{\pm}6.02Gy_{{\alpha}/{\beta}3}$ at $D_{Max}$. The mean ratio of $D_{2cc}$ rectum to $D_{ICRU}$ rectum was 1.25 and the mean ratio of $D_{2cc}$ rectum to $D_{Max}$ rectum was 0.98 for all individual fractions. The mean dose to the bladder was $6.00{\pm}1.90Gy$ for $D_{2cc}$ and $5.10{\pm}2.03Gy$ at $D_{ICRU}$. However, the mean $D_{2cc}$ dose did not differ significantly from the mean dose calculated at the ICRU reference point (p=0.307); the mean difference was 0.90 Gy (0.49-1.25Gy). The mean EQD2 was $81.85{\pm}13.03Gy_{{\alpha}/{\beta}3}$ for $D_{2cc}$ and $74.11{\pm}19.39Gy_{{\alpha}/{\beta}3}$ at $D_{ICRU}$. The mean ratio of $D_{2cc}$ bladder to $D_{ICRU}$ bladder was 1.24. In the majority of applications, the maximum dose point was not the ICRU point. On average, the rectum received 77% and bladder received 92% of the prescribed dose. Conclusions: OARs doses assessed by DVH criteria were higher than ICRU point doses. Our data suggest that the estimated dose to the ICRU bladder point may be a reasonable surrogate for the $D_{2cc}$ and rectal $D_{Max}$ for $D_{2cc}$. However, the dose to the ICRU rectal point does not appear to be a reasonable surrogate for the $D_{2cc}$.

전이학습 기반 다중 컨볼류션 신경망 레이어의 활성화 특징과 주성분 분석을 이용한 이미지 분류 방법 (Transfer Learning using Multiple ConvNet Layers Activation Features with Principal Component Analysis for Image Classification)

  • 바트후 ?바자브;주마벡 알리하노브;팡양;고승현;조근식
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.205-225
    • /
    • 2018
  • Convolutional Neural Network (ConvNet)은 시각적 특징의 계층 구조를 분석하고 학습할 수 있는 대표적인 심층 신경망이다. 첫 번째 신경망 모델인 Neocognitron은 80 년대에 처음 소개되었다. 당시 신경망은 대규모 데이터 집합과 계산 능력이 부족하여 학계와 산업계에서 널리 사용되지 않았다. 그러나 2012년 Krizhevsky는 ImageNet ILSVRC (Large Scale Visual Recognition Challenge) 에서 심층 신경망을 사용하여 시각적 인식 문제를 획기적으로 해결하였고 그로 인해 신경망에 대한 사람들의 관심을 다시 불러 일으켰다. 이미지넷 첼린지에서 제공하는 다양한 이미지 데이터와 병렬 컴퓨팅 하드웨어 (GPU)의 발전이 Krizhevsky의 승리의 주요 요인이었다. 그러므로 최근의 딥 컨볼루션 신경망의 성공을 병렬계산을 위한 GPU의 출현과 더불어 ImageNet과 같은 대규모 이미지 데이터의 가용성으로 정의 할 수 있다. 그러나 이러한 요소는 많은 도메인에서 병목 현상이 될 수 있다. 대부분의 도메인에서 ConvNet을 교육하기 위해 대규모 데이터를 수집하려면 많은 노력이 필요하다. 대규모 데이터를 보유하고 있어도 처음부터 ConvNet을 교육하려면 많은 자원과 시간이 소요된다. 이와 같은 문제점은 전이 학습을 사용하면 해결할 수 있다. 전이 학습은 지식을 원본 도메인에서 새 도메인으로 전이하는 방법이다. 전이학습에는 주요한 두 가지 케이스가 있다. 첫 번째는 고정된 특징점 추출기로서의 ConvNet이고, 두번째는 새 데이터에서 ConvNet을 fine-tuning 하는 것이다. 첫 번째 경우, 사전 훈련 된 ConvNet (예: ImageNet)을 사용하여 ConvNet을 통해 이미지의 피드포워드 활성화를 계산하고 특정 레이어에서 활성화 특징점을 추출한다. 두 번째 경우에는 새 데이터에서 ConvNet 분류기를 교체하고 재교육을 한 후에 사전 훈련된 네트워크의 가중치를 백프로퍼게이션으로 fine-tuning 한다. 이 논문에서는 고정된 특징점 추출기를 여러 개의 ConvNet 레이어를 사용하는 것에 중점을 두었다. 그러나 여러 ConvNet 레이어에서 직접 추출된 차원적 복잡성을 가진 특징점을 적용하는 것은 여전히 어려운 문제이다. 우리는 여러 ConvNet 레이어에서 추출한 특징점이 이미지의 다른 특성을 처리한다는 것을 발견했다. 즉, 여러 ConvNet 레이어의 최적의 조합을 찾으면 더 나은 특징점을 얻을 수 있다. 위의 발견을 토대로 이 논문에서는 단일 ConvNet 계층의 특징점 대신에 전이 학습을 위해 여러 ConvNet 계층의 특징점을 사용하도록 제안한다. 본 논문에서 제안하는 방법은 크게 세단계로 이루어져 있다. 먼저 이미지 데이터셋의 이미지를 ConvNet의 입력으로 넣으면 해당 이미지가 사전 훈련된 AlexNet으로 피드포워드 되고 3개의 fully-connected 레이어의 활성화 틀징점이 추출된다. 둘째, 3개의 ConvNet 레이어의 활성화 특징점을 연결하여 여러 개의 ConvNet 레이어의 특징점을 얻는다. 레이어의 활성화 특징점을 연결을 하는 이유는 더 많은 이미지 정보를 얻기 위해서이다. 동일한 이미지를 사용한 3개의 fully-connected 레이어의 특징점이 연결되면 결과 이미지의 특징점의 차원은 4096 + 4096 + 1000이 된다. 그러나 여러 ConvNet 레이어에서 추출 된 특징점은 동일한 ConvNet에서 추출되므로 특징점이 중복되거나 노이즈를 갖는다. 따라서 세 번째 단계로 PCA (Principal Component Analysis)를 사용하여 교육 단계 전에 주요 특징점을 선택한다. 뚜렷한 특징이 얻어지면, 분류기는 이미지를 보다 정확하게 분류 할 수 있고, 전이 학습의 성능을 향상시킬 수 있다. 제안된 방법을 평가하기 위해 특징점 선택 및 차원축소를 위해 PCA를 사용하여 여러 ConvNet 레이어의 특징점과 단일 ConvNet 레이어의 특징점을 비교하고 3개의 표준 데이터 (Caltech-256, VOC07 및 SUN397)로 실험을 수행했다. 실험결과 제안된 방법은 Caltech-256 데이터의 FC7 레이어로 73.9 %의 정확도를 얻었을 때와 비교하여 75.6 %의 정확도를 보였고 VOC07 데이터의 FC8 레이어로 얻은 69.2 %의 정확도와 비교하여 73.1 %의 정확도를 보였으며 SUN397 데이터의 FC7 레이어로 48.7%의 정확도를 얻었을 때와 비교하여 52.2%의 정확도를 보였다. 본 논문에 제안된 방법은 Caltech-256, VOC07 및 SUN397 데이터에서 각각 기존에 제안된 방법과 비교하여 2.8 %, 2.1 % 및 3.1 %의 성능 향상을 보였다.