• 제목/요약/키워드: 피처모델

검색결과 24건 처리시간 0.024초

에너지 빅데이터를 활용한 머신러닝 기반의 생산 예측 모형 연구 (A Study on Production Prediction Model using a Energy Big Data based on Machine Learning)

  • 강미영;김석
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.453-456
    • /
    • 2022
  • 전력망의 역할은 안정적인 전력공급이 최우선이다. 예고 없는 불안정한 상황에 대한 여러 가지 대비에 대한 방안이 필요하다. 기상 데이터를 활용하여 탐구적 데이터 분석을 통한 피처 간의 관계를 파악하여 머신러닝 기반의 에너지 생산 예측 모형을 모델링한다. 본 연구에서는 주성분분석을 사용하여 에너지 생산 예측 시 영향을 미치는 피처를 추출하였으며 머신러닝 모델에 적용함으로써 예측 신뢰도를 높였다. 제안한 모형을 사용하여 특정 기간을 대상으로 생산 에너지를 예측하고 해당 시점의 실제 생산 값과 비교함으로써 주성분분석을 적용한 에너지 생산 예측에 대한 성능을 확인하였다.

  • PDF

기계 학습을 활용한 논증 수준 자동 채점 및 논증 패턴 분석 (Automated Scoring of Argumentation Levels and Analysis of Argumentation Patterns Using Machine Learning)

  • 이만형;유선아
    • 한국과학교육학회지
    • /
    • 제41권3호
    • /
    • pp.203-220
    • /
    • 2021
  • 이 연구는 과학적 논증 담화에 대한 자동 채점의 성능 개선 방향을 탐색하였으며, 자동 채점 모델을 활용하여 논증 담화의 양상과 패턴을 분석하였다. 이를 위해 과학적 논증 수업에서 발생한 학생 발화를 대상으로 논증 수준을 평가하는 자동 채점을 수행하였다. 이 자동 채점의 데이터셋은 4가지 단위의 논증 피처와 논증 수준 평가틀로 구성되었다. 특히, 자동 채점에 논증 패턴을 반영하기 위하여 논증 클러스터와 n-gram을 활용하였다. 자동 채점 모델은 3가지의 지도 학습 기법으로 구성되었으며, 그 결과 총 33개의 자동 채점 모델이 구성되었다. 자동 채점의 결과, 최대 85.37%, 평균 77.59%의 채점 정확도를 얻었다. 이 과정에서 논증 담화의 패턴이 자동 채점의 성능을 개선하는 주요한 피처임을 확인하였다. 또한, 의사결정 나무와 랜덤 포레스트의 모델을 통하여 과학적 논증 수준에 따른 논증의 양상과 패턴을 분석하였다. 이를 통하여 주장, 자료와 함께 정당화가 체계적으로 구성된 과학적 논증과 자료에 대한 활발한 상호작용이 이루어진 과학적 논증이 논증 수준의 발달을 이끈다는 점 등을 확인하였다. 이와 같은 자동 채점 모델의 해석은 논증 패턴을 분석하는 새로운 연구 방법을 제언하는 것이다.

설명 가능한 인공지능(XAI)을 활용한 침입탐지 신뢰성 강화 방안 (The Enhancement of intrusion detection reliability using Explainable Artificial Intelligence(XAI))

  • 정일옥;최우빈;김수철
    • 융합보안논문지
    • /
    • 제22권3호
    • /
    • pp.101-110
    • /
    • 2022
  • 다양한 분야에서 인공지능을 활용한 사례가 증가하면서 침입탐지 분야 또한 다양한 이슈를 인공지능을 통해 해결하려는 시도가 증가하고 있다. 하지만, 머신러닝을 통한 예측된 결과에 관한 이유를 설명하거나 추적할 수 없는 블랙박스 기반이 대부분으로 이를 활용해야 하는 보안 전문가에게 어려움을 주고 있다. 이러한 문제를 해결하고자 다양한 분야에서 머신러닝의 결정을 해석하고 이해하는데 도움이 되는 설명 가능한 AI(XAI)에 대한 연구가 증가하고 있다. 이에 본 논문에서는 머신러닝 기반의 침입탐지 예측 결과에 대한 신뢰성을 강화하기 위한 설명 가능한 AI를 제안한다. 먼저, XGBoost를 통해 침입탐지 모델을 구현하고, SHAP을 활용하여 모델에 대한 설명을 구현한다. 그리고 기존의 피처 중요도와 SHAP을 활용한 결과를 비교 분석하여 보안 전문가가 결정을 수행하는데 신뢰성을 제공한다. 본 실험을 위해 PKDD2007 데이터셋을 사용하였으며 기존의 피처 중요도와 SHAP Value에 대한 연관성을 분석하였으며, 이를 통해 SHAP 기반의 설명 가능한 AI가 보안 전문가들에게 침입탐지 모델의 예측 결과에 대한 신뢰성을 주는데 타당함을 검증하였다.

Hadoop에서 SQL 기반 질의언어를 지원하는 공간 빅데이터 질의처리 시스템 (Spatial Big Data Query Processing System Supporting SQL-based Query Language in Hadoop)

  • 주인학
    • 한국정보전자통신기술학회논문지
    • /
    • 제10권1호
    • /
    • pp.1-8
    • /
    • 2017
  • 본 논문에서는 Hadoop에 공간 데이터를 저장하고 SQL 기반 질의언어에 의하여 공간 데이터를 질의할 수 있는 공간 빅데이터 질의처리 시스템을 제시한다. 제안한 시스템은 대용량의 공간 빅데이터를 HDFS 기반의 저장 시스템에 저장하고 공간 데이터 처리기능이 추가확장된 SQL 기반 질의언어로 질의를 할 수 있도록 지원하며 OGC 심플 피처모델 기반의 공간 데이터 표준 데이터타입과 함수를 지원한다. 본 논문에서는 질의언어 파싱, 질의언어 검증, 질의계획 생성, 저장시스템 연동 등 질의처리의 주요 기능 개발을 제시하였다. 제안한 시스템의 성능을 기존 시스템과 비교하였으며, 실험에서는 Hadoop에 저장된 공간 데이터에 대한 영역질의의 질의실행시간에 있어서 비교 시스템 대비 약 58%의 성능향상을 나타냄을 보였다.

임상 문서에서 서로 떨어진 개체명 간 전이 관계 표현을 위한 조건부무작위장 내 라벨 유도 기법 연구 (A label induction method in the conditional random fields expressing long distance transition between separate entities in clinical narratives)

  • 이왕진;최진욱
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.172-175
    • /
    • 2018
  • 환자의 병력을 서술하는 임상문서에서 임상 개체명들은 그들 사이에 개체명이 아닌 단어들이 위치하기 때문에 거리상으로 서로 떨어져 있고, 임상 개체명인식에 많이 사용되는 조건부무작위장(conditional random fields; CRF) 모델은 Markov 속성을 따르기 때문에 서로 떨어져 있는 개체명 라벨 간의 전이 정보는 모델의 계산에서 무시된다. 본 논문에서는 라벨링 모델에 서로 떨어진 개체명 간 전이 관계를 표현하기 위하여 CRF 모델의 구조를 변경하는 방법론을 소개한다. 제안된 CRF 모델 디자인에서는 모델의 계산효율성을 빠르게 유지하기 위하여 Markov 속성을 유지하는 1차 모델 구조를 유지한다. 모델은 선행하는 개체명의 라벨 정보를 후행하는 개체명 엔터티에게 전달하기 위하여 선행 개체명의 라벨을 뒤 따르는 비개체명 라벨에 전이시키고 이를 통해 후행하는 개체명은 선행하는 개체명의 라벨 정보를 알 수 있게 된다. 라벨의 고차 전이 정보를 전달함에도 모델의 구조는 1차 전이 구조를 유지함으로 n차 구조의 모델보다 빠른 계산 속도를 유지할 수 있게 된다. 모델의 성능 평가를 위하여 서울대학교병원 류머티즘내과에서 퇴원한 환자들의 퇴원요약지에 병력과 관련된 엔터티가 태깅된 평가 데이터와 i2b2 2012/VA 임상자연어처리 shared task의 임상 개체명 추출 데이터를 사용하였고 기본 CRF 모델들(1차, 2차)과 비교하였다. 피처 조합에 따라 모델들을 평가한 결과 제안한 모델이 거의 모든 경우에서 기본 모델들에 비하여 F1-score의 성능을 향상시킴을 관찰할 수 있었다.

  • PDF

차량용 경량화 침입 탐지 시스템을 위한 데이터 전처리 기법 (Data Preprocessing Method for Lightweight Automotive Intrusion Detection System)

  • 박상민;임형철;이성수
    • 전기전자학회논문지
    • /
    • 제27권4호
    • /
    • pp.531-536
    • /
    • 2023
  • 본 논문에서는 차량 내 네트워크에서 즉각적인 공격 탐지를 위해 프레임 피처 삽입이 적용된 슬라이딩 윈도우 기법을 제안한다. 이 방법은 현재 프레임의 공격 여부에 따라 라벨링을 진행하기 때문에 공격 탐지의 실시간성을 보장할 수 있다. 또한 이 방법이 CNN 연산에서 현재 프레임에 대한 가중치를 주어 성능을 향상시킬 수 있음을 실험을 통해 확인하였다. 제안하는 모델은 경량화된 LeNet-5 구조 기반으로 설계되었으며 DoS 공격 탐지 성능에서 100%를 달성하였다. 또한 기존 연구의 모델들과 복잡성을 비교했을 때 제안하는 모델이 ECU와 같이 리소스가 제한된 장치에 더 적합함을 확인하였다.

블록체인 미디어 적용 가능성과 블록체인 아키텍처 분석

  • 금창섭
    • 방송과미디어
    • /
    • 제23권3호
    • /
    • pp.85-91
    • /
    • 2018
  • 최근 미디어 산업 분야에서 블록체인에 대한 관심이 점차 고조되고 있다. 본 고에서는 초연결 사회에서 믿음을 만들어주는 신뢰 인프라인 블록체인 기술의 미디어 산업 적용 가능성을 알아보고자 한다. 이를 위해 4차 산업혁명 시대에 블록체인이 신뢰 기술로 각광 받게 된 이유를 고찰하고, 미디어 산업 분야에서 활용된 사례를 살펴본다. 실제로 블록체인을 미디어 산업에 도입하기 위해서는 기술성숙도에 대한 분석이 필요하다. 현재는 블록체인에 대한 전체적인 시각의 부재로 인한 미디어와 블록체인의 만남에 대해 지나친 낙관 혹은 비관이 난무하고 있다. 이러한 문제에 대한 돌파구로 대표적인 오픈소스 블록체인 플랫폼인 이더리움과 하이퍼레저 패브릭 아키텍처를 재구축하고 분석했다. 아키텍처 분석결과 미디어 산업계에서 요구하는 피처를 충족하기에는 현재의 블록체인 플랫폼이 아직 부족함을 발견하였다. 블록체인 기술이 마치 인터넷 초창기 시절과 유사하다는 점을 인지할 필요가 있다. 중장기적으로 블록체인 기반의 직거래 비즈니스 모델 연구와 함께 이를 실현해줄 블록체인 미디어 서비스플랫폼 연구개발이 수반된다면 미래의 미디어 산업은 블록체인에 의해 크게 요동칠 것으로 예측된다.

CMDNet: 클릭 가능한 모바일 화면 객체 탐지를 위한 싱글 샷 아키텍처 (CMDNet: Single Shot Architecture for Clickable Mobile Screen Object Detection)

  • 조민석;한성수;정창성
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.418-421
    • /
    • 2021
  • 모바일 디바이스 화면에 대하여 클릭 가능한 객체를 인식하기 위한 Object detection network architecture 를 제안한다. DSSD 를 Baseline 으로 SE block 이 추가된 Backbone network 와 SSD layer, FPN 구조를 사용한다. 기존의 1:1 비율의 네트워크의 Input resolution 을 모바일 화면과 유사한 1:2 비율로 변경하여 효율적으로 피처를 추출한다. 또한 해당 모델을 학습하기 위한 효율적인 데이터셋을 구축한다. 모바일 화면에서 클릭 가능한 객체를 기준으로 데이터를 수집하여 총 24,937 개의 Annotation data 를 Text, Image, Button, Region 등 8 개의 카테고리로 세분화하였다.

실내 공간 분석을 위한 보행 공간관계 모델 (Navigable Space-Relation Model for Indoor Space Analysis)

  • 이슬지;이지영
    • Spatial Information Research
    • /
    • 제19권5호
    • /
    • pp.75-86
    • /
    • 2011
  • 실세계의 도시에 대한 3차원 모델링은 도시계획과 의사결정을 하기 위하여 필수적인 작업이다. 또한 무선인터넷 발달과 함께 이용자의 위치를 파악하여 정보를 제공하는 위치기반서비스에 대한 소비자 증가로 많은 3차원 도시모델이 개발되고 있다. 특히 우리나라 도심지역의 경우에는 초고층 건물들의 밀집으로 실외뿐만 아니라 실내공간 모델링에 대한 연구가 필요하며, 공간 모델을 통해서 최단경로 등의 공간 분석이 통한 위치기반서비스가 제공될 수 있어야 한다. 지금까지 많은 연구가 진행된 3차원 도시모델들은 피처 모델로, 기본요소들(primitives)을 조합하여 공간을 표현하고, 관계성은 공유하는 기본요소들을 찾아야지만 표현할 수 있기 때문에 복잡한 3차원 공간 객체들 사이에서는 관계성을 정의하기 힘들다. 따라서 최단경로와 같이 공간간의 관계성을 기반으로 도출되는 공간 분석을 하기 위해서는 공간간의 관계성 표현이 필요하다. 본 연구에서는 복잡한 3차원 실내공간간의 관계성을 효율적으로 표현하는 네트워크 기반의 위상학적 데이터 모델인 보행 공간 관계 모델을 개발하였다.

N-gram Opcode를 활용한 머신러닝 기반의 분석 방지 보호 기법 탐지 방안 연구 (A Study on Machine Learning Based Anti-Analysis Technique Detection Using N-gram Opcode)

  • 김희연;이동훈
    • 정보보호학회논문지
    • /
    • 제32권2호
    • /
    • pp.181-192
    • /
    • 2022
  • 신종 악성코드의 등장은 기존 시그니처 기반의 악성코드 탐지 기법들을 무력화시키며 여러 분석 방지 보호 기법들을 활용하여 분석가들의 분석을 어렵게 하고 있다. 시그니처 기반의 기존 연구는 악성코드 제작자가 쉽게 우회할 수 있는 한계점을 지닌다. 따라서 본 연구에서는 악성코드 자체의 특성이 아닌, 악성코드에 적용될 수 있는 패커의 특성을 활용하여, 단시간 내에 악성코드에 적용된 패커의 분석 방지 보호 기법을 탐지하고 분류해낼 수 있는 머신러닝 모델을 구축하고자 한다. 본 연구에서는 패커의 분석 방지 보호 기법을 적용한 악성코드 바이너리를 대상으로 n-gram opcode를 추출하여 TF-IDF를 활용함으로써 피처(feature)를 추출하고 이를 통해 각 분석 방지 보호 기법을 탐지하고 분류해내는 머신러닝 모델 구축 방법을 제안한다. 본 연구에서는 실제 악성코드를 대상으로 악성코드 패킹에 많이 사용되는 상용 패커인 Themida와 VMProtect로 각각 분석 방지 보호 기법을 적용시켜 데이터셋을 구축한 뒤, 6개의 머신러닝 모델로 실험을 진행하였고, Themida에 대해서는 81.25%의 정확도를, VMProtect에 대해서는 95.65%의 정확도를 보여주는 최적의 모델을 구축하였다.