• 제목/요약/키워드: Feature selection

검색결과 1,076건 처리시간 0.029초

다중 애플리케이션 처리를 위한 경량 인공지능 하드웨어 기반 통합 프레임워크 연구 (A Study of Unified Framework with Light Weight Artificial Intelligence Hardware for Broad range of Applications)

  • 전석훈;이재학;한지수;김병수
    • 한국전자통신학회논문지
    • /
    • 제14권5호
    • /
    • pp.969-976
    • /
    • 2019
  • 경량 인공지능 하드웨어는 다양한 문제의 해결을 위해 멀티모달 센서 데이터를 입력받아 특징 선택, 추출, 차원축소, 정규화 과정을 수행한 후 인공지능 엔진으로 예측 결과를 도출한다. 다양한 애플리케이션에서 높은 성능을 달성하기 위해서는 이러한 경량 인공지능 하드웨어의 초 매개변수와 전체적인 전처리 시스템의 구성을 데이터에 맞춰 최적화할 필요가 있다. 본 논문에서는 경량 인공지능 하드웨어의 효율적인 제어 및 최적화를 위한 통합 프레임워크를 제안한다. 제안된 통합 프레임워크는 데이터 전처리 및 뉴로모픽 기반 경량 인공지능 엔진을 유연하게 재구성할 수 있으며, 최적의 모델을 생성할 수 있다. 기능검증을 위해 손글씨 이미지 데이터 세트와 관성 센서 데이터 기반의 낙상 검출 데이터 세트를 사용하였으며, 실험 결과 제안하는 통합 프레임워크가 각각의 데이터 세트에서 90% 이상의 정확도를 갖는 최적의 모델을 생성함을 확인하였다.

뇌 기억-학습 원리를 적용한 중등영어교사 임용시험 준비용 어플 (An Exam Prep App for the Secondary English Teacher Recruitment Exam with Brain-based Memory and Learning Principles)

  • 이혜진
    • 한국콘텐츠학회논문지
    • /
    • 제21권1호
    • /
    • pp.311-320
    • /
    • 2021
  • 현재 국내 국·공립 중등교사가 되기 위한 유일한 등용문은 중등교원 임용시험이며 2014학년도 개정 이후 임용시험의 모든 문항이 서답형으로 전환되었기 때문에 더 완성도 높고 정확하고 견고한 답안 작성이 요구된다. 재인기억을 측정하는 선택형 문항과 비교하면 회상기억을 측정하는 서답형 문항의 경우 정보 인출을 위해 더 많은 인지적 노력이 요구된다. 이 때문에 지속적인 암기 및 인출 연습이 필요하지만 이를 수행할 수 있는 학습 도구가 충분하지 않다. 이러한 맥락에서 본고는 중등영어교사 임용시험 준비용 모바일 어플인 ONE PASS를 구현하였다. 본 어플에서는 특히 인지작용의 근간이 되는 뇌의 작용기제를 반영하여 학습용 콘텐츠를 구현하였으며 학습계획 설정 및 동기측정, 마인드맵, 브레인스토밍, 기출문제 등 다양한 기능을 구안하였다. 본 연구는 학습용 어플 콘텐츠 개발 관련 연구에 이바지함과 동시에 임용시험 수험자들에게 조금이나마 도움이 될 수 있기를 기대한다.

다중소스 데이터 융합 기반의 가스 누출 예측을 위한 선형 보간 및 머신러닝 기법 (Linear interpolation and Machine Learning Methods for Gas Leakage Prediction Base on Multi-source Data Integration)

  • 홍고르출;조겨리;김미혜
    • 한국융합학회논문지
    • /
    • 제13권3호
    • /
    • pp.33-41
    • /
    • 2022
  • 본 논문에서는 다중 요인을 고려한 천연 가스 누출 정도 예측을 위해 관련 요인을 포함하는 기상청 자료와 천연가스 누출 자료를 통합하고, 요인 분석을 기반으로 중요 특성을 선택하는 머신러닝 기법을 제안한다. 제안된 기법은 3단계 절차로 구성되어 있다. 먼저, 통합 데이터 셋에 대해 선형 보간법을 수행하여 결측 데이터를 보완하는 전처리를 수행한다. 머신러닝 모델 학습 최적화를 위해 OrdinalEncoder(OE) 기반 정규화와 함께 요인 분석을 사용하여 필수 특징을 선택하며, 데이터 셋은 k-평균 클러스터링으로 레이블을 지정한다. 최종적으로 K-최근접 이웃, DT(Decision Tree), RF(Random Forest), NB(Naive Bayes)의 네 가지 알고리즘을 사용하여 가스 누출 수준을 예측한다. 제안된 방법은 정확도, AUC, 평균 표준 오차(MSE)로 평가되었으며, 테스트 결과 OE-F 전처리를 수행한 경우 기존 기법에 비해 성공적으로 개선되었음을 보였다. 또한 OE-F 기반 KNN(OE-F-KNN)은 95.20%의 정확도, 96.13%의 AUC, 0.031의 MSE로 비교 알고리즘 중 최고 성능을 보였다.

학습자를 위한 웹듀이의 사용성 증진 방안 연구 (A Study on Improving Usability of Webdewey for Learners)

  • 백지원
    • 한국비블리아학회지
    • /
    • 제33권2호
    • /
    • pp.75-95
    • /
    • 2022
  • 본 연구는 분류 학습의 기본 도구가 된 웹듀이의 발전 및 기능 변화를 분석하고, 이를 학습자를 위한 사용성의 측면에서 분석하여, 웹듀이의 사용성 증진을 위한 구체적인 방안을 제안하는 목적을 가지고 수행되었다. 이러한 연구 목적을 달성하기 위하여 먼저 UI와 사용성의 개념과 원칙을 정리하고, 웹듀이의 구성 및 주요 기능을 분석하였다. 또한, 웹듀이의 매체 변화 및 시기별 기능 변화를 고찰하였다. 이후 웹듀이를 학습 과정에서 사용한 학습자들을 대상으로 웹듀이 사용성에 관한 의견 조사를 수행하고, 여기서 도출된 시사점과 개선 방향성을 바탕으로 웹듀이의 사용성 증진 방안을 제안하였다. 사용성 증진 방안은 UI의 측면과 합성 기능의 측면으로 나누어 제안되었다. UI의 측면에서는 디스플레이 방식, 시각화 장치, 인쇄본의 장점 도입, 한국어 버전 개발 등의 제안이 이루어졌다. 번호 자동 합성 기능의 측면에서는 기본 번호 선택, 합성 경로 안내 및 오류 메시지 제공, 참고 주기 및 경로 신설, 화면과 버튼 설계, 합성 내역 안내 등의 측면에서 사용성 증진 제안이 이루어졌다.

데이터 마이닝을 이용한 한의비만변증 설문지 재평가: 실제 임상에서 수집한 설문응답 기반으로 (Re-evaluation of Obesity Syndrome Differentiation Questionnaire Based on Real-world Survey Data Using Data Mining)

  • 오지홍;왕징화;최선미;김호준
    • 한방비만학회지
    • /
    • 제21권2호
    • /
    • pp.80-94
    • /
    • 2021
  • Objectives: The purpose of this study is to re-evaluate the importance of questions of obesity syndrome differentiation (OSD) questionnaire based on real-world survey and to explore the possibility of simplifying OSD types. Methods: The OSD frequency was identified, and variance threshold feature selection was performed to filter the questions. Filtered questions were clustered by K-means clustering and hierarchical clustering. After principal component analysis (PCA), the distribution patterns of the subjects were identified and the differences in the syndrome distribution were compared. Results: The frequency of OSD in spleen deficiency, phlegm (PH), and blood stasis (BS) was lower than in food retention (FR), liver qi stagnation (LS), and yang deficiency. We excluded 13 questions with low variance, 7 of which were related to BS. Filtered questions were clustered into 3 groups by K-means clustering; Cluster 1 (17 questions) mainly related to PH, BS syndromes; Cluster 2 (11 questions) related to swelling, and indigestion; Cluster 3 (11 questions) related to overeating or emotional symptoms. After PCA, significant different patterns of subjects were observed in the FR, LS, and other obesity syndromes. The questions that mainly affect the FR distribution were digestive symptoms. And emotional symptoms mainly affect the distribution of LS subjects. And other obesity syndrome was partially affected by both digestive and emotional symptoms, and also affected by symptoms related to poor circulation. Conclusions: In-depth data mining analysis identified relatively low importance questions and the potential to simplify OSD types.

머신러닝 기반 생애주기별 고혈압 위험 요인 분석 (Analysis of Hypertension Risk Factors by Life Cycle Based on Machine Learning)

  • 강성안;김소희;류민호
    • 한국산업정보학회논문지
    • /
    • 제27권5호
    • /
    • pp.73-82
    • /
    • 2022
  • 고혈압과 같은 만성질환은 발병의 원인은 다양한 요인들이 복합적으로 작용하기 때문에 생애주기에 따라 차별화된 관리가 필요하다. 본 연구는 머신러닝을 이용해 고혈압 발병에 영향을 미치는 요인들의 생애주기별로 차이를 분석한다. 이를 위해, 질병관리청의 국민건강영양조사 데이터에 대한 전처리 및 변수 선택 과정을 거쳐 총 35개의 변수를 활용했다. 분석결과, 트리기반 머신러닝 모델 중 XGBoost가 중년과 노년 모두 예측 성능이 높은 모델로 나타났다. 변수중요도를 통해 도출된 생애주기별 고혈압 위험요인을 살펴보면 중년의 경우 개인특성 요인, 유전적 요인, 영양섭취 요인이 고혈압 위험요인으로 나타났고, 노년의 경우 영양섭취 요인, 식생활 요인, 생활습관 요인이 고혈압 위험요인으로 도출되었다. 본 연구 결과는 생애주기별 고혈압 관리에 유용한 기초자료로 사용될 수 있을 것으로 기대된다.

라디오믹스 기반 직장암 수술 위험도 예측을 위한 MRI 반자동 선택 바이오마커 검증 연구 (A Study on MRI Semi-Automatically Selected Biomarkers for Predicting Risk of Rectal Cancer Surgery Based on Radiomics)

  • 백영서;김영재;전영배;황태식;백정흠;김광기
    • 대한의용생체공학회:의공학회지
    • /
    • 제44권1호
    • /
    • pp.11-18
    • /
    • 2023
  • Currently, studies to predict the risk of rectal cancer surgery select MRI image slices based on the clinical experience of surgeons. The purpose of this study is to semi-automatically select and classify 2D MRI image slides to predict the risk of rectal cancer surgery using biomarkers. The data used were retrospectively collected MRI imaging data of 50 patients who underwent laparoscopic surgery for rectal cancer at Gachon University Gil Medical Center. Expert-selected MRI image slices and non-selected slices were screened and radiomics was used to extract a total of 102 features. A total of 16 approaches were used, combining 4 classifiers and 4 feature selection methods. The combination of Random Forest and Ridge performed with a sensitivity of 0.83, a specificity of 0.88, an accuracy of 0.85, and an AUC of 0.89±0.09. Differences between expert-selected MRI image slices and non-selected slices were analyzed by extracting the top five significant features. Selected quantitative features help expedite decision making and improve efficiency in studies to predict risk of rectal cancer surgery.

A Detecting Technique for the Climatic Factors that Aided the Spread of COVID-19 using Deep and Machine Learning Algorithms

  • Al-Sharari, Waad;Mahmood, Mahmood A.;Abd El-Aziz, A.A.;Azim, Nesrine A.
    • International Journal of Computer Science & Network Security
    • /
    • 제22권6호
    • /
    • pp.131-138
    • /
    • 2022
  • Novel Coronavirus (COVID-19) is viewed as one of the main general wellbeing theaters on the worldwide level all over the planet. Because of the abrupt idea of the flare-up and the irresistible force of the infection, it causes individuals tension, melancholy, and other pressure responses. The avoidance and control of the novel Covid pneumonia have moved into an imperative stage. It is fundamental to early foresee and figure of infection episode during this troublesome opportunity to control of its grimness and mortality. The entire world is investing unimaginable amounts of energy to fight against the spread of this lethal infection. In this paper, we utilized machine learning and deep learning techniques for analyzing what is going on utilizing countries shared information and for detecting the climate factors that effect on spreading Covid-19, such as humidity, sunny hours, temperature and wind speed for understanding its regular dramatic way of behaving alongside the forecast of future reachability of the COVID-2019 around the world. We utilized data collected and produced by Kaggle and the Johns Hopkins Center for Systems Science. The dataset has 25 attributes and 9566 objects. Our Experiment consists of two phases. In phase one, we preprocessed dataset for DL model and features were decreased to four features humidity, sunny hours, temperature and wind speed by utilized the Pearson Correlation Coefficient technique (correlation attributes feature selection). In phase two, we utilized the traditional famous six machine learning techniques for numerical datasets, and Dense Net deep learning model to predict and detect the climatic factor that aide to disease outbreak. We validated the model by using confusion matrix (CM) and measured the performance by four different metrics: accuracy, f-measure, recall, and precision.

머신러닝 기반 악성 URL 탐지 기법 (Machine Learning-Based Malicious URL Detection Technique)

  • 한채림;윤수현;한명진;이일구
    • 정보보호학회논문지
    • /
    • 제32권3호
    • /
    • pp.555-564
    • /
    • 2022
  • 최근 사이버 공격은 지능적이고 고도화된 악성코드를 활용한 해킹 기법을 활용하여 재택근무 및 원격의료, 자동산업설비를 공격하고 있어서 피해 규모가 커지고 있다. 안티바이러스와 같은 전통적인 정보보호체계는 시그니처 패턴 기반의 알려진 악성 URL을 탐지하는 방식이어서 알려지지 않은 악성 URL을 탐지할 수 없다. 그리고 종래의 정적 분석 기반의 악성 URL 분석 방식은 동적 로드와 암호화 공격에 취약하다. 본 연구에서는 악성 URL 데이터를 동적으로 학습하여 효율적으로 악성 URL 탐지하는 기법을 제안한다. 제안한 탐지 기법에서는 머신러닝 기반의 특징 선택 알고리즘을 사용해 악성 코드를 분류했고, 가중 유클리드 거리(Weighted Euclidean Distance, WED)를 활용하여 사전처리를 진행한 후 난독화 요소를 제거하여 정확도를 개선한다. 실험 결과에 따르면 본 연구에서 제안한 머신러닝 기반 악성 URL 탐지 기법은 종래의 방법 대비 2.82% 향상된 89.17%의 정확도를 보인다.

한국 영화의 산업의 흥행 극대화를 위한 AutoML 기반의 박스오피스 유형 분류 및 예측 모델 (A Box Office Type Classification and Prediction Model Based on Automated Machine Learning for Maximizing the Commercial Success of the Korean Film Industry)

  • 임수빈;문지훈;노승민
    • Journal of Platform Technology
    • /
    • 제11권3호
    • /
    • pp.45-55
    • /
    • 2023
  • 본 논문은 한국 영화 산업의 의사 결정자들이 온라인상에서의 영화의 흥행을 극대화할 수 있도록 지원하는 데 도움을 주고자 역대 박스오피스 영화를 수집하여 영화를 유형별로 군집화하고, 유형별 온라인 박스오피스를 예측하는 모델을 제시한다. 이를 위해 먼저 다양한 특성을 고려하여 영화의 흥행 요인을 식별하고, 계산 효율성을 고려하여 특성 차원을 줄인다. 다음으로 영화의 유형을 체계적으로 분류하고, 유형별 온라인 박스오피스를 예측하며 흥행에 이바지한 요소를 분석한다. 이때, AutoML (Automated Machine Learning) 기법을 활용함으로써 다양한 기계학습 알고리즘을 자동으로 구성하고, 문제에 최적화된 알고리즘을 선택함으로써 여러 알고리즘을 쉽게 시도 및 선택한다. 이를 통해 정보화된 판단을 내릴 수 있는 기반을 제공하고, 영화 산업의 더 나은 성과를 도모하는 데 이바지할 것으로 기대할 수 있다.

  • PDF