• 제목/요약/키워드: feature models

검색결과 1,096건 처리시간 0.028초

거대언어모델 기반 특징 추출을 이용한 단기 전력 수요량 예측 기법 (Large Language Models-based Feature Extraction for Short-Term Load Forecasting)

  • 이재승;유제혁
    • 한국산업정보학회논문지
    • /
    • 제29권3호
    • /
    • pp.51-65
    • /
    • 2024
  • 스마트 그리드에서 전력 시스템을 효과적으로 운영하기 위해서는 전력 수요량을 정확히 예측하는 것이 중요하다. 최근 기계학습 기술의 발달로, 인공지능 기반의 전력 수요량 예측 모델이 활발히 연구되고 있다. 하지만, 기존 모델들은 모든 입력변수를 수치화하여 입력하기 때문에, 이러한 수치들 사이의 의미론적 관계를 반영하지 못해 예측 모델의 정확도가 하락할 수 있다. 본 논문은 입력 데이터에 대하여 거대언어모델을 통해 추출한 특징을 이용하여 단기 전력 수요량을 예측하는 기법을 제안한다. 먼저, 입력변수를 문장 형식의 프롬프트로 변환한다. 이후, 가중치가 동결된 거대언어모델을 이용하여 프롬프트에 대한 특징을 나타내는 임베딩 벡터를 도출하고, 이를 입력으로 받은 모델을 학습하여 예측을 수행한다. 실험 결과, 제안 기법은 수치형 데이터에 기반한 예측 모델에 비해 높은 성능을 보였고, 프롬프트에 대한 거대언어모델의 주의집중 가중치를 시각화함으로써 예측에 있어 주요한 영향을 미친 정보를 확인하였다.

사용자의 False belief를 이용한 새로운 기능 선택방식에 대한 연구 (Development of a feature selection technique on users' false beliefs)

  • 이장선;최경현;김지은;류호경
    • 한국HCI학회논문지
    • /
    • 제9권2호
    • /
    • pp.33-40
    • /
    • 2014
  • 신제품/서비스를 설계함에 있어 해당 제품 혹은 서비스가 제공하여야 할 기능을 선정하는 것(feature selection)은 디자이너의 매우 어려운 의사결정 문제이지만, 기존 방법론들은 특정 제품-서비스에 대한 사용자의 니즈를 효과적으로 파악하기에는 한계점이 있다. 특히 기존의 선호도 서베이를 통한 방법은 사용자의 멘탈모델에 대한 분석에 기반하지 않기에 기능과부화(feature creep) 현상의 한 원인으로 지적되고 있다. 본 연구는 사용자에게 새로운 기능을 제공할 경우(혹은 제공된 기능을 제거해야 할 경우), 그 기능으로부터 추론되는 제품-서비스의 멘탈모델을 탐지하는 새로운 기법인 'False belief technique'을 제안하고, 이를 통해 디자이너의 기능 선정(feature selection) 의사결정에 활용될 수 있도록 하고자 한다.

전정 유모세포 통합 모델을 이용한 반강성 기전 기반 섬모번들 특성 추정에 관한 연구 (A study on Hair Bundle Feature Estimation Based on Negative Stiffness Mechanism Using Integrated Vestibular Hair Cell Model)

  • 김동영;홍기환;김규성;이상민
    • 대한의용생체공학회:의공학회지
    • /
    • 제34권4호
    • /
    • pp.218-225
    • /
    • 2013
  • In this paper hair bundle feature model and integration method for hair cell models were proposed. The proposed hair bundle feature model was based on spring-damper-mass model. Input of integrated vestibular hair cell model was frequency and output was interspike interval of hair cell that was reflected the feature of hair bundles. Irregular afferents that had a great gain variation showed reduction of negative stiffness section. Regular afferents that had a small gain variation, however, showed same feature with base negative stiffness feature. As a result, integrated vestibular hair cell model showed almost the same modeling data with experimental data in the modeled eleven frequency bands. It is verified that the proposed model is a good model for hair bundle feature modeling.

CNN-based Android Malware Detection Using Reduced Feature Set

  • Kim, Dong-Min;Lee, Soo-jin
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권10호
    • /
    • pp.19-26
    • /
    • 2021
  • 딥러닝 기반 악성코드 탐지 및 분류모델의 성능은 특성집합을 어떻게 구성하느냐에 따라 크게 좌우된다. 본 논문에서는 CNN 기반의 안드로이드 악성코드 탐지 시 탐지성능을 극대화할 수 있는 최적의 특성집합(feature set)을 선정하는 방법을 제안한다. 특성집합에 포함될 특성은 기계학습 및 딥러닝에서 특성추출을 위해 널리 사용되는 Chi-Square test 알고리즘을 사용하여 선정하였다. CICANDMAL2017 데이터세트를 대상으로 선정된 36개의 특성을 이용하여 CNN 모델을 학습시킨 후 악성코드 탐지성능을 측정한 결과 이진분류에서는 99.99%, 다중분류에서는 98.55%의 Accuracy를 달성하였다.

암 예후를 효과적으로 예측하기 위한 Node2Vec 기반의 유전자 발현량 이미지 표현기법 (A Node2Vec-Based Gene Expression Image Representation Method for Effectively Predicting Cancer Prognosis)

  • 최종환;박상현
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권10호
    • /
    • pp.397-402
    • /
    • 2019
  • 암 환자에게 적절한 치료계획을 제공하기 위해 암의 진행양상 또는 환자의 생존 기간 등에 해당하는 환자의 예후를 정확히 예측하는 것은 생물정보학 분야에서 다루는 중요한 도전 과제 중 하나이다. 많은 연구에서 암 환자의 유전자 발현량 데이터를 이용하여 환자의 예후를 예측하는 기계학습 모델들이 많이 제안되어 오고 있다. 유전자 발현량 데이터는 약 17,000개의 유전자에 대한 수치값을 갖는 고차원의 수치형 자료이기에, 기존의 연구들은 특징 선택 또는 차원 축소 전략을 이용하여 예측 모델의 성능 향상을 도모하였다. 그러나 이러한 접근법은 특징 선택과 예측 모델의 훈련이 분리되어 있어서, 기계학습 모델은 선별된 유전자들이 생물학적으로 어떤 관계가 있는지 알기가 어렵다. 본 연구에서는 유전자 발현량 데이터를 이미지 형태로 변환하여 예후 예측이 효과적으로 특징 선택 및 예후 예측을 수행할 수 있는 기법을 제안한다. 유전자들 사이의 생물학적 상호작용 관계를 유전자 발현량 데이터에 통합하기 위해 Node2Vec을 활용하였으며, 2차원 이미지로 표현된 발현량 데이터를 효과적으로 학습할 수 있도록 합성곱 신경망 모델을 사용하였다. 제안하는 모델의 성능은 이중 교차검증을 통해 평가되었고, 유전자 발현량 데이터를 그대로 이용하는 기계학습모델보다 우월한 예후 예측 정확도를 가지는 것이 확인되었다. Node2Vec을 이용한 유전자 발현량의 새로운 이미지 표현법은 특징 선택으로 인한 정보의 손실이 없어 예측 모델의 성능을 높일 수 있으며, 이러한 접근법이 개인 맞춤형 의학의 발전에 이바지할 것으로 기대한다.

웨이블릿 신경망을 이용한 패턴 분류 시스템 설계 및 EEG 신호 분류에 대한 연구 (A Study of Pattern Classification System Design Using Wavelet Neural Network and EEG Signal Classification)

  • 임성길;박찬호;이현수
    • 전자공학회논문지CI
    • /
    • 제39권3호
    • /
    • pp.32-43
    • /
    • 2002
  • 본 논문에서는 신경망에 기반한 디지털 신호를 위한 패턴분류 시스템을 제안한다. 제안하는 시스템은 두 가지 신경망 모델로 구성된다. 첫 번째 부분은 특징 추출의 역할을 하는 웨이블릿 신경망이다. 이 부분을 위해 기존의 웨이블릿 신경망 모델들을 비교한 후, 특징 추출을 위한 새로운 웨이블릿 신경망 모델을 제안한다. 다른 부분은 패턴 분류를 위한 웨이블릿 신경망이다. 패턴 분류에 적용하기 위해 기존의 웨이블릿 신경망 구조를 수정하고 학습 방법을 제안한다. 패턴 분류 웨이블릿 신경망의 입력은 특징 추출 신경망의 은닉노드의 연결강도, 확장 및 이동 파라미터로 구성되었다. 또 출력은 특징 추출 신경망의 입력 신호가 속한 부류를 나타낸다. 제안한 시스템을 EEG 신호를 주파수에 따라서 분류하는 문제에 적용하였다.

기계학습 기반 랜섬웨어 공격 탐지를 위한 효과적인 특성 추출기법 비교분석 (Comparative Analysis of Dimensionality Reduction Techniques for Advanced Ransomware Detection with Machine Learning)

  • 김한석;이수진
    • 융합보안논문지
    • /
    • 제23권1호
    • /
    • pp.117-123
    • /
    • 2023
  • 점점 더 고도화되고 있는 랜섬웨어 공격을 기계학습 기반 모델로 탐지하기 위해서는, 분류 모델이 고차원의 특성을 가지는 학습데이터를 훈련해야 한다. 그리고 이 경우 '차원의 저주' 현상이 발생하기 쉽다. 따라서 차원의 저주 현상을 회피하면서 학습모델의 정확성을 높이고 실행 속도를 향상하기 위해 특성의 차원 축소가 반드시 선행되어야 한다. 본 논문에서는 특성의 차원이 극단적으로 다른 2종의 데이터세트를 대상으로 3종의 기계학습 모델과 2종의 특성 추출기법을 적용하여 랜섬웨어 분류를 수행하였다. 실험 결과, 이진 분류에서는 특성 차원 축소기법이 성능 향상에 큰 영향을 미치지 않았으며, 다중 분류에서도 데이터세트의 특성 차원이 작을 경우에는 동일하였다. 그러나 학습데이터가 고차원의 특성을 가지는 상황에서 다중 분류를 시도했을 경우 LDA(Linear Discriminant Analysis)가 우수한 성능을 나타냈다.

특징 융합을 이용한 농작물 다중 분광 이미지의 의미론적 분할 (Semantic Segmentation of Agricultural Crop Multispectral Image Using Feature Fusion)

  • 문준렬;박성준;백중환
    • 한국항행학회논문지
    • /
    • 제28권2호
    • /
    • pp.238-245
    • /
    • 2024
  • 본 논문에서는 농작물 다중 분광 이미지에 대해 특징 융합 기법을 이용하여 의미론적 분할 성능을 향상시키기 위한 프레임워크를 제안한다. 스마트팜 분야에서 연구 중인 딥러닝 기술 중 의미론적 분할 모델 대부분은 RGB(red-green-blue)로 학습을 진행하고 있고 성능을 높이기 위해 모델의 깊이와 복잡성을 증가시키는 데에 집중하고 있다. 본 연구는 기존 방식과 달리 다중 분광과 어텐션 메커니즘을 통해 모델을 최적화하여 설계한다. 제안하는 방식은 RGB 단일 이미지와 함께 UAV (unmanned aerial vehicle)에서 수집된 여러 채널의 특징을 융합하여 특징 추출 성능을 높이고 상호보완적인 특징을 인식하여 학습 효과를 증대시킨다. 특징 융합에 집중할 수 있도록 모델 구조를 개선하고, 작물 이미지에 유리한 채널 및 조합을 실험하여 다른 모델과의 성능을 비교한다. 실험 결과 RGB와 NDVI (normalized difference vegetation index)가 융합된 모델이 다른 채널과의 조합보다 성능이 우수함을 보였다.

3차원 CAD에서 STEP Part111을 통한 AP224 특징형상 데이터 번역 (AP224 based Feature Translation from 3D CAD through STEP Part111)

  • 김준환
    • 한국CDE학회논문집
    • /
    • 제11권4호
    • /
    • pp.303-314
    • /
    • 2006
  • The exchange of CAD (Computer Aided Design) models between different CAD systems and to downstream applications such as manufacturing has become very important to modem industry. One serious current issue is that the process cannot automatically import existing 3-D solid models in a variety of commercial CAD formats into the process without manually re-mastering the model in current standard including "SIEP AP(Application Protocol) 203 Edition 1" To fully integrate technical data from the design agency to the shop floor, design intent and validated 3D geometry of feature based parametric CAD model should be brought into the standardized processes. To overcome this limitation, AP203 Edition 2 (Ed.2) and its related STEP parts such as Part55, Part108, Part109, Part111 and Part112 are starting to be available to handle this problem. The features in Part111 are harmonized with the machining features available in AP224. This paper is focused on two mapping technologies: CAD to Part111 mapping and Pat111 to AP224 mapping including case studios and it will provide the guideline about what should be done next in the AP203 Ed.2 to AP224 mapping. The final goal of this project is to integrate technical data from CAD to AP224 based manufacturing information through AP203 Ed.2.

Centroid and Nearest Neighbor based Class Imbalance Reduction with Relevant Feature Selection using Ant Colony Optimization for Software Defect Prediction

  • B., Kiran Kumar;Gyani, Jayadev;Y., Bhavani;P., Ganesh Reddy;T, Nagasai Anjani Kumar
    • International Journal of Computer Science & Network Security
    • /
    • 제22권10호
    • /
    • pp.1-10
    • /
    • 2022
  • Nowadays software defect prediction (SDP) is most active research going on in software engineering. Early detection of defects lowers the cost of the software and also improves reliability. Machine learning techniques are widely used to create SDP models based on programming measures. The majority of defect prediction models in the literature have problems with class imbalance and high dimensionality. In this paper, we proposed Centroid and Nearest Neighbor based Class Imbalance Reduction (CNNCIR) technique that considers dataset distribution characteristics to generate symmetry between defective and non-defective records in imbalanced datasets. The proposed approach is compared with SMOTE (Synthetic Minority Oversampling Technique). The high-dimensionality problem is addressed using Ant Colony Optimization (ACO) technique by choosing relevant features. We used nine different classifiers to analyze six open-source software defect datasets from the PROMISE repository and seven performance measures are used to evaluate them. The results of the proposed CNNCIR method with ACO based feature selection reveals that it outperforms SMOTE in the majority of cases.