• 제목/요약/키워드: feature target

검색결과 632건 처리시간 0.033초

Analyzing Factors Contributing to Research Performance using Backpropagation Neural Network and Support Vector Machine

  • Ermatita, Ermatita;Sanmorino, Ahmad;Samsuryadi, Samsuryadi;Rini, Dian Palupi
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권1호
    • /
    • pp.153-172
    • /
    • 2022
  • In this study, the authors intend to analyze factors contributing to research performance using Backpropagation Neural Network and Support Vector Machine. The analyzing factors contributing to lecturer research performance start from defining the features. The next stage is to collect datasets based on defining features. Then transform the raw dataset into data ready to be processed. After the data is transformed, the next stage is the selection of features. Before the selection of features, the target feature is determined, namely research performance. The selection of features consists of Chi-Square selection (U), and Pearson correlation coefficient (CM). The selection of features produces eight factors contributing to lecturer research performance are Scientific Papers (U: 154.38, CM: 0.79), Number of Citation (U: 95.86, CM: 0.70), Conference (U: 68.67, CM: 0.57), Grade (U: 10.13, CM: 0.29), Grant (U: 35.40, CM: 0.36), IPR (U: 19.81, CM: 0.27), Qualification (U: 2.57, CM: 0.26), and Grant Awardee (U: 2.66, CM: 0.26). To analyze the factors, two data mining classifiers were involved, Backpropagation Neural Networks (BPNN) and Support Vector Machine (SVM). Evaluation of the data mining classifier with an accuracy score for BPNN of 95 percent, and SVM of 92 percent. The essence of this analysis is not to find the highest accuracy score, but rather whether the factors can pass the test phase with the expected results. The findings of this study reveal the factors that have a significant impact on research performance and vice versa.

네트워크 침입 탐지를 위해 CICIDS2017 데이터셋으로 학습한 Stacked Sparse Autoencoder-DeepCNN 모델 (Stacked Sparse Autoencoder-DeepCNN Model Trained on CICIDS2017 Dataset for Network Intrusion Detection)

  • 이종화;김종욱;최미정
    • KNOM Review
    • /
    • 제24권2호
    • /
    • pp.24-34
    • /
    • 2021
  • 엣지 컴퓨팅을 사용하는 서비스 공급업체는 높은 수준의 서비스를 제공한다. 이에 따라 다양하고 중요한 정보들이 단말 장치에 저장되면서 탐지하기 더욱 어려운 최신 사이버 공격의 핵심 목표가 됐다. 보안을 위해 침입 탐지시스템과 같은 보안 시스템이 자주 활용되지만, 기존의 침입 탐지 시스템은 탐지 정확도가 낮은 문제점이 존재한다. 따라서 본 논문에서는 엣지 컴퓨팅에서 단말 장치의 더욱 정확한 침입 탐지를 위한 기계 학습 모델을 제안한다. 제안하는 모델은 희소성 제약을 사용하여 입력 데이터의 중요한 특징 벡터들을 추출하는 stacked sparse autoencoder (SSAE)와 convolutional neural network (CNN)를 결합한 하이브리드 모델이다. 최적의 모델을 찾기 위해 SSAE의 희소성 계수를 조절하면서 모델의 성능을 비교 및 분석했다. 그 결과 희소성 계수가 일 때 96.9%로 가장 높은 정확도를 보여주었다. 따라서 모델이 중요한 특징들만 학습할 경우 더 높은 성능을 얻을 수 있었다.

Machine Learning Methods to Predict Vehicle Fuel Consumption

  • Ko, Kwangho
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권9호
    • /
    • pp.13-20
    • /
    • 2022
  • 본 연구에서는 주행 차량의 실시간 연료소모량을 예측할 수 있는 머신러닝 기법을 제안하고 그 특성을 분석하였다. 머신러닝 학습을 위해 실도로 주행을 실시하여 주행 속도, 가속도, 도로 구배와 함께 연료소모량을 측정하였다. 특성 데이터로 속도, 가속도, 도로구배를, 타깃으로 연료소모량을 지정하여 다양한 머신러닝 모델을 학습시켰다. 회귀법에 해당하는 K-최근접이웃회귀 및 선형회귀와 함께, 분류법에 해당하는 K-최근접이웃분류, 로지스틱회귀, 결정트리, 랜덤포레스트, 그래디언부스팅을 사용하였다. 실시간 연료소모량에 대한 예측 정확도는 0.5 ~ 0.6 수준으로 전반적으로 낮았고, 회귀법의 경우 분류법보다 정확도가 떨어졌다. 총연료소모량에 대한 예측 오차는 0.2 ~ 2.0% 수준으로 상당히 정확했고, 분류법보다 회귀법의 오차가 더 낮았다. 이는 예측 정확도의 기준으로 결정계수(R2)를 사용했기 때문인데, 이 값이 작을수록 타깃의 평균 부근에 예측치가 좁게 분포하기 때문이다. 따라서 실시간 연료소모량 예측에는 분류법이, 총연료소모량 예측에는 회귀법이 적합하다고 할 수 있다.

블랙 박스 모델의 출력값을 이용한 AI 모델 종류 추론 공격 (Model Type Inference Attack Using Output of Black-Box AI Model)

  • 안윤수;최대선
    • 정보보호학회논문지
    • /
    • 제32권5호
    • /
    • pp.817-826
    • /
    • 2022
  • AI 기술이 여러 분야에 성공적으로 도입되는 추세이며, 서비스로 환경에 배포된 모델들은 지적 재산권과 데이터를 보호하기 위해 모델의 정보를 노출시키지 않는 블랙 박스 상태로 배포된다. 블랙 박스 환경에서 공격자들은 모델 출력을 이용해 학습에 쓰인 데이터나 파라미터를 훔치려고 한다. 본 논문은 딥러닝 모델을 대상으로 모델 종류에 대한 정보를 추론하는 공격이 없다는 점에서 착안하여, 모델의 구성 레이어 정보를 직접 알아내기 위해 모델의 종류를 추론하는 공격 방법을 제안한다. MNIST 데이터셋으로 학습된 ResNet, VGGNet, AlexNet과 간단한 컨볼루션 신경망 모델까지 네 가지 모델의 그레이 박스 및 블랙 박스 환경에서의 출력값을 이용해 모델의 종류가 추론될 수 있다는 것을 보였다. 또한 본 논문이 제안하는 방식인 대소 관계 피쳐를 딥러닝 모델에 함께 학습시킨 경우 블랙 박스 환경에서 약 83%의 정확도로 모델의 종류를 추론했으며, 그 결과를 통해 공격자에게 확률 벡터가 아닌 제한된 정보만 제공되는 상황에서도 모델 종류가 추론될 수 있음을 보였다.

딥 러닝 기반의 이기종 무선 신호 구분을 위한 데이터 수집 효율화 기법 (An Efficient Data Collection Method for Deep Learning-based Wireless Signal Identification in Unlicensed Spectrum)

  • 최재혁
    • 전기전자학회논문지
    • /
    • 제26권1호
    • /
    • pp.62-66
    • /
    • 2022
  • 최근 데이터 기반의 딥러닝 기술을 적용하여 비면허 대역의 다양한 통신 신호를 분류하는 연구가 활발히 수행되고 있다. 하지만, 복잡한 신경망 모델 사용을 기반으로 이뤄진 이러한 접근법은 높은 연산 능력을 필요로 하게 되어, 자원 제약적인 무선 인터페이스 및 사물인터넷(Internet of Things) 장비에서는 사용이 제약된다. 본 연구에서는 비면허 대역의 무선 이기종 기술을 인지하기 위한 데이터 기반의 접근 방법을 살펴보고, 신호의 특징 추출 및 데이터화의 효율화 문제를 다룬다. 구체적으로, 비면허 대역의 다른 종류의 무선 통신 기술을 구분하기 위해 수신 신호 강도 측정을 기반으로 한 시계열 데이터를 이용해 합성곱 신경망(Convolutional Neural Network, CNN) 모델을 학습시켜 신호를 분류하는 방법을 살펴본다. 이 과정에서 동일한 구조의 신경망 모델의 경량화를 위한 효율적 신호의 시계열 데이터 정보 수집시 주파수 대역의 특징을 함께 특징화하는 방법을 제안하고, 그 효과를 평가한다. Bluetooth 호환의 Ubertooth 장비를 이용한 실측 기반의 실험 결과는 제안된 샘플링 기법이 동일한 신경망에 대해서 10% 수준의 샘플링 데이터 이용만으로도 동일한 정확도를 유지함을 보여준다.

데이터 증강을 통한 기계학습 능력 개선 방법 연구 (Study on the Improvement of Machine Learning Ability through Data Augmentation)

  • 김태우;신광성
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.346-347
    • /
    • 2021
  • 기계학습을 위한 패턴인식을 위해서는 학습데이터의 양이 많을수록 그 성능이 향상된다. 하지만 일상에서 검출해내야하는 패턴의 종류 및 정보가 항상 많은 양의 학습데이터를 확보할 수는 없다. 따라서 일반적인 기계학습을 위해 적은데이터셋을 의미있게 부풀릴 필요가 있다. 본 연구에서는 기계학습을 수행할 수 있도록 데이터를 증강시키는 기법에 관해 연구한다. 적은데이터셋을 이용하여 기계학습을 수행하는 대표적인 방법이 전이학습(transfer learning) 기법이다. 전이학습은 범용데이터셋으로 기본적인 학습을 수행한 후 목표데이터셋을 최종 단계에 대입함으로써 결과를 얻어내는 방법이다. 본 연구에서는 ImageNet과 같은 범용데이터셋으로 학습시킨 학습모델을 증강된 데이터를 이용하여 특징추출셋으로 사용하여 원하는 패턴에 대한 검출을 수행한다.

  • PDF

텍스트 마이닝을 활용한 대학도서관과 공공도서관의 장서개발 정책 키워드 분석 (A Keyword Analysis of Collection Development Policies of University and Public Libraries Using Text Mining)

  • 이다현;신동희
    • 한국문헌정보학회지
    • /
    • 제58권1호
    • /
    • pp.285-302
    • /
    • 2024
  • 장서개발 정책은 도서관 서비스의 근간이며, 도서관의 성격과 정체성이 드러나는 성문화된 문서이다. 본 연구에서는 국립중앙도서관에서 원문 추출이 가능한 장서개발 정책 관련 원문 11개를 대상으로 빈도분석, 토픽 모델링, 네트워크 분석을 수행하였다. 장서개발 정책과 관련된 주요 키워드를 추출하고, 해당 키워드 간의 관계를 분석하였다. 그 후 대학도서관과 공공도서관의 관종별 장서개발 정책의 특징을 도출하기 위해 파이 계수 분석을 수행하였다. 분석 결과 '자료', '도서관', '장서개발', '이용자', '수집' 등의 키워드가 빈도 분석과 네트워크 중심성에서 주요 키워드로 나타났으며, 파이 계수 분석 결과 대학도서관은 '대학(0.73)', '구축', '학생', '대상', '비용' 등의 키워드가 나타나므로, 이용자의 학술적 요구와 디지털 자원에 대한 논의가, 공공도서관은 '성인', '설문조사', '특징', '종교' 등 다양한 이용자계층의 정보 요구와 관련된 키워드가 주요 쟁점으로 드러났다.

The Impact of Social Media Functionality and Strategy Alignment to Small and Medium Enterprises (SMEs) Performance: A Case Study in Garment SME in East Java

  • Mahendrawathi ER;Nanda Kurnia Wardati
    • Asia pacific journal of information systems
    • /
    • 제30권3호
    • /
    • pp.568-589
    • /
    • 2020
  • Recently, Social media has become a concern for businesses, including Small and Medium Enterprises (SMEs). SMEs began to adopt social media to support their performance. To benefit from the application of social media, SMEs must implement the right strategy. This study aims to analyze the factors that influence the use of social media in SMEs. Furthermore, alignment between social media functionalities and strategies and their effect on SME's performance are investigated. A case study is conducted in Gymi, a garment SMEs in East Java, Indonesia. The data collection includes interviews with the owner of SMEs, observations, and document analysis. Data analysis is performed by pattern matching, which matches the patterns from the literature with data from the case study. The results of this study show that cost-effectiveness, interactivity, and compatibility are factors that influence the use of social media in Gymi. The social media used by Gymi are Instagram, Facebook, YouTube, WhatsApp, and LINE. However, the main social media used to support Gymi's functions is Instagram. Gymi has a relatively good social media strategy as it has defined a specific goal, target audience, and channel selection for social media (Instagram). It also has specific resources and policies to handle social media. Gymi monitors and evaluates their social media content activities. These strategies are aligned with the Instagram feature used to support Gymi's function, particularly marketing, sales, customer service, and to some extent, internal operation. The alignment contributes to Gymi's performance measured by the increase in reputation (number of Instagram followers) and sales.

Cell clusters in intervertebral disc degeneration: an attempted repair mechanism aborted via apoptosis

  • Polly Lama;Jerina Tiwari;Pulkit Mutreja;Sukirti Chauhan;Ian J Harding;Trish Dolan;Michael A Adams;Christine Le Maitre
    • Anatomy and Cell Biology
    • /
    • 제56권3호
    • /
    • pp.382-393
    • /
    • 2023
  • Cell clusters are a histological hallmark feature of intervertebral disc degeneration. Clusters arise from cell proliferation, are associated with replicative senescence, and remain metabolically, but their precise role in various stages of disc degeneration remain obscure. The aim of this study was therefore to investigate small, medium, and large size cell-clusters. For this purpose, human disc samples were collected from 55 subjects, aged 37-72 years, 21 patients had disc herniation, 10 had degenerated non-herniated discs, and 9 had degenerative scoliosis with spinal curvature <45°. 15 non-degenerated control discs were from cadavers. Clusters and matrix changes were investigated with histology, immunohistochemistry, and Sodium dodecyl sulphate polyacrylamide gel electrophoresis (SDS-PAGE). Data obtained were analyzed with spearman rank correlation and ANOVA. Results revealed, small and medium-sized clusters were positive for cell proliferation markers Ki-67 and proliferating cell nuclear antigen (PCNA) in control and slightly degenerated human discs, while large cell clusters were typically more abundant in severely degenerated and herniated discs. Large clusters associated with matrix fissures, proteoglycan loss, matrix metalloproteinase-1 (MMP-1), and Caspase-3. Spatial association findings were reconfirmed with SDS-PAGE that showed presence to these target markers based on its molecular weight. Controls, slightly degenerated discs showed smaller clusters, less proteoglycan loss, MMP-1, and Caspase-3. In conclusion, cell clusters in the early stages of degeneration could be indicative of repair, however sustained loading increases large cell clusters especially around microscopic fissures that accelerates inflammatory catabolism and alters cellular metabolism, thus attempted repair process initiated by cell clusters fails and is aborted at least in part via apoptosis.

합성곱 신경망을 이용한 종 수준의 동물플랑크톤 분류기 및 시각화 (Species-level Zooplankton Classifier and Visualization using a Convolutional Neural Network)

  • 정만기;서호영;정희택
    • 한국전자통신학회논문지
    • /
    • 제19권4호
    • /
    • pp.721-732
    • /
    • 2024
  • 동물플랑크톤의 종 동종은 해양 생태계의 이해 및 지구온난화를 연구하는데 가장 기본이다. 본 연구에서는 3종의 동물플랑크톤을 종 수준에서 암컷과 수컷을 분류할 수 있는 합성곱 신경망 모델을 제안한다. 첫째 연구자들이 획득하는 현미경 이미지를 기반으로 형태적 특징을 포함하는 학습데이터를 구축한다. 학습데이터의 구축에 있어 대상 종의 형태적 특징 정보를 보존하는 데이터 확대 방법을 적용한다. 둘째 구축된 학습데이터로부터 종 특징들이 학습될 수 있는 합성곱 신경망 모델을 제안한다. 제안한 모델은 높은 해상도를 고려하여 학습 이미지 정보 손실을 최소화하였고 완전 연결 층 대신에 전역 평균 폴링 층을 사용하여 학습 매개 변수 개수를 최소화하였다. 제안한 모델의 일반성을 제시하기 위해 새로이 획득한 데이터를 기반으로 성능을 제시하였다. 마지막으로 개발된 모델에서 추출된 특징들의 시각화를 통해, 분류 모델의 중요 특징을 제시하였다.