• 제목/요약/키워드: Machine Learning

검색결과 5,378건 처리시간 0.027초

사장교 케이블의 장력 추정을 위한 인공신경망 모델 개발 (Development of Artificial Neural Network Model for Estimation of Cable Tension of Cable-Stayed Bridge)

  • 김기중;박유신;박성우
    • 한국산학기술학회논문지
    • /
    • 제21권3호
    • /
    • pp.414-419
    • /
    • 2020
  • 본 연구에서는 사장교의 케이블 가속도계로부터 확보한 방대한 계측데이터의 활용을 확대하고자 인공지능 기반의 케이블 장력 추정 모델을 개발하였다. 케이블 장력 추정 모델은 진동법에 따른 장력 추정 과정에서 고유진동수를 판정할 수 있는 알고리즘을 핵심으로 하며 학습데이터 구성에 적합하고 판정 결과에 대한 성능이 확보될 수 있도록 입력층, 은닉층, 출력층으로 구성되는 인공신경망(Artificial Neural Network)을 적용하였다. 인공신경망의 학습데이터는 케이블 가속도 계측데이터를 진동수로 변환 후 구성하였으며 고유진동수를 중심으로 일정한 패턴을 갖는 특성을 활용하여 기계학습을 진행하였다. 학습데이터 구성 시 다수 패턴의 고유진동수를 대표할 수 있도록 다양한 크기의 진폭을 갖는 진동수를 사용하고 일정 수준으로 진동수를 누적하여 사용할 경우 고유진동수에 대한 판정 성능이 개선됨을 확인하였다. 장력 추정 모델의 성능을 판단하기 위해 계측분석 기술자에 의해 추정한 장력의 관리기준과 비교하였다. 케이블 가속도계로부터 확보한 139개의 진동수를 입력값으로 사용하여 검증을 수행한 결과 실제 정답과 유사하게 고유진동수를 판정하였고 고유진동수에 의해 케이블의 장력을 추정한 결과는 96.4%의 수준으로 관리기준에 부합하는 결과를 보여주고 있다.

영상처리기법을 이용한 CNN 기반 리눅스 악성코드 분류 연구 (A Study on Classification of CNN-based Linux Malware using Image Processing Techniques)

  • 김세진;김도연;이후기;이태진
    • 한국산학기술학회논문지
    • /
    • 제21권9호
    • /
    • pp.634-642
    • /
    • 2020
  • 사물인터넷(IoT) 기기의 확산으로 인해 다양한 아키텍처가 존재하는 Linux 운영체제의 활용이 증가하였다. 이에 따라 Linux 기반의 IoT 기기에 대한 보안 위협이 증가하고 있으며 기존 악성코드를 기반으로 한 변종 악성코드도 꾸준히 등장하고 있다. 본 논문에서는 시각화한 ELF(Executable and Linkable Format) 파일의 바이너리 데이터를 영상처리 기법 중 LBP(Local Binary Pattern)와 Median Filter를 적용하여 CNN(Convolutional Neural Network)모델로 악성코드를 분류하는 시스템을 제안한다. 실험 결과 원본 이미지의 경우 98.77%의 점수로 가장 높은 정확도와 F1-score를 보였으며 재현율도 98.55%의 가장 높은 점수를 보였다. Median Filter의 경우 99.19%로 가장 높은 정밀도와 0.008%의 가장 낮은 위양성률을 확인하였으며 LBP의 경우 전반적으로 원본과 Median Filter보다 낮은 결과를 보였음을 확인하였다. 원본과 영상처리기법별 분류 결과를 다수결로 분류했을 경우 원본과 Median Filter의 결과보다 정확도, 정밀도, F1-score, 위양성률이 전반적으로 좋아졌음을 확인하였다. 향후 악성코드 패밀리 분류에 활용하거나 다른 영상처리기법을 추가하여 다수결 분류의 정확도를 높이는 연구를 진행할 예정이다.

인공 신경망 기반의 고시간 해상도를 갖는 전력수요 예측기법 (An Electric Load Forecasting Scheme with High Time Resolution Based on Artificial Neural Network)

  • 박진웅;문지훈;황인준
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권11호
    • /
    • pp.527-536
    • /
    • 2017
  • 최근 스마트 그리드 산업의 발달과 더불어 효과적인 에너지 관리 시스템의 필요성이 커지고 있다. 특히, 전기 부하 및 에너지 요금 감소를 위해서는 정확한 전력수요 예측과 그에 따른 효과적인 스마트 그리드 운영 전략이 필요하다. 본 논문에서는 보다 정확한 전력수요 예측을 위하여, 수요 시한 기준으로 수집된 전력 사용 데이터를 고시간 해상도로 분할하고, 이에 적합한 인공 신경망 기반의 전력수요 예측 모델을 구축하고자 한다. 예측 모델의 정확도를 향상시키기 위하여 우선, 수열 형태의 시계열 데이터가 가지는 주기성을 제대로 반영하지 못하는 기계 학습 모델의 문제점을 해결하고자, 시계열 데이터를 2차원 공간의 연속적인 데이터로 변환한다. 더욱이, 고시간 해상도에 따른 온도나 습도 등 외부 요인들의 보다 정확한 반영을 위해 이들에 대해서도 선형 보간법을 사용하여 세분화된 시점에서의 값을 추정하여 반영한다. 마지막으로, 구성된 특성 벡터에 대해 주성분 분석 수행을 통하여 불필요한 외부 요인을 제거한다. 예측 모델의 성능을 평가하기 위해서 5겹 교차 검증을 수행하였다. 실험 결과 모든 고시간 해상도에서 성능 향상을 보였으며, 특히 3분 해상도의 경우 3.71%의 가장 낮은 오차율을 보였다.

노인 운전자의 공격적인 운전 상태 검출 기법 (A Method of Detecting the Aggressive Driving of Elderly Driver)

  • 고동우;강행봉
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권11호
    • /
    • pp.537-542
    • /
    • 2017
  • 공격적인 성향의 운전은 자동차 사고의 주요한 원인이 된다. 기존 연구에서는 공격적 성향의 운전을 검출하기 위해, 주로 청년을 대상으로 연구가 이뤄졌으며 기계학습의 순수한 Clustering 또는 Classification 기법을 통해 이뤄졌다. 그러나 노인들은 취약한 신체적 조건에 의해 젊은 운전자와는 다른 운전 강도를 가지고 있어 기존의 방식으로는 검출이 불가능 하며, 데이터를 보정하는 등의 새로운 방법이 필요하다. 그리하여, 본 연구에서는 기존의 클러스터링 기법(K-means, Expectation - maximization algorithm)에, 새롭게 제안하는 ECA(Enhanced Clustering method for Acceleration data)기법을 추가하여, 주행 차량에 위치한 스마트폰으로부터 수집된 가속도 데이터를 분석하고 공격적인 운전 형태를 검출해 낸다. ECA는 모든 피험자의 데이터에서 K-means와 EM을 통해 검출된 군집군의 데이터 중 높은 강도의 데이터를 선별하여, 특징을 스케일링한 값을 통해 모델링한다. 본 방식을 통해 기존의 연구의 순수한 클러스터링 방식과는 달리, 모든 청장년 및 노인 실험 참가자 개인들의 공격적인 운전 데이터가 검출되었으며, 클러스터링 기법간의 비교를 통해 K-means 기법이 보다 높은 검출 효율을 갖고 있음을 확인했다. 또한, K-means 방식을 검출한 공격적인 운전 데이터에서는 젊은 운전자가 노인운전자에 비해 1.29배의 높은 운전 강도를 가지고 있음을 발견했다. 이와 같이 본 연구에서 제안된 방식은 낮은 운전 강도를 갖고 있는 노인의 데이터에서 공격적인 운전을 검출 가능하게 되었으며, 특히. 제안된 방법은 노인 운전자를 위한 맞춤형 안전운전 시스템을 구축이 가능하며, 추후 다양한 연구을 통해 이상 운전 상태를 검출하고 조기 경보하는데 활용이 가능할 것이다.

시계열 데이터와 랜덤 포레스트를 활용한 시간당 초미세먼지 농도 예측 (Hourly Prediction of Particulate Matter (PM2.5) Concentration Using Time Series Data and Random Forest)

  • 이득우;이수원
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권4호
    • /
    • pp.129-136
    • /
    • 2020
  • 최근 환경 문제에서 중요한 화두로 떠오른 초미세먼지(PM2.5)는 미세먼지(PM10)보다도 작은 부유물질이다. PM2.5는 안구나 호흡기 질환을 일으키며 뇌혈관에까지 침투할 수 있어서 시간별로 수치를 예측하여 대비하는 것이 중요하다. 그러나 PM2.5의 생성과 이동에 관한 명확한 설명이 아직까지는 제시되지 않고 있어서 예측에 어려움이 따른다. 따라서 PM2.5 예측뿐만 아니라 예측 결과에 대한 설명력을 갖는 예측 방법이 제시될 필요가 있다. 본 연구에서는 서울시의 시간당 PM2.5를 예측하고자 하며, 이를 위해 각기 다른 지상관측 데이터를 시계열로 전처리하고 부트스트랩수를 조정한 랜덤 포레스트(Random Forest)를 데이터 학습 및 예측에 사용하는 방법을 제안한다. 이 방법은 예측 모델이 입력 데이터의 시각별 정보를 균형 있게 학습하게 하며 예측 결과에 대한 설명이 가능하다는 장점을 갖는다. 예측 정확도 평가를 위해 기존 모델과의 비교실험을 수행한 결과 제안 방법은 모든 레이블에서 가장 뛰어난 예측 성능을 보였으며, PM2.5의 생성과 관련된 변수와 중국의 영향과 관련된 변수가 예측 결과에 중요한 영향을 미치는 것을 보여주었다.

위치정보 및 사용자 경험을 반영하는 모바일 PA에이전트의 설계 (Designing mobile personal assistant agent based on users' experience and their position information)

  • 강신봉;노상욱
    • 인터넷정보학회논문지
    • /
    • 제12권1호
    • /
    • pp.99-110
    • /
    • 2011
  • 급변하는 모바일 환경에서 스마트폰을 비롯한 모바일 기기는 엔터테인먼트, 비즈니스, 정보서비스 등 사용자들의 삶의 방식을 직접적으로 변화시키는 핵심 도구로써의 역할을 하고 있다. 모바일 서비스 중 특히 사용자의 위치정보를 활용하여 서비스를 제공하는 위치기반 서비스(Location Based Service)는 검색, 증강현실, 모바일 SNS(Social Network Service), 게임 등의 다른 서비스 및 콘텐츠와 결합하여 사용자의 다양한 요구를 충족시키며 주요 서비스로 자리 잡아 가고 있다. 본 논문에서는 모바일 서비스가 갖는 잠재적 가능성을 이용하여 모바일 기기의 사용성을 증대시키며, 서비스의 복잡성을 해결하기 위하여 복잡한 태스크를 숨기고 사용자를 대신하여 프로세스를 수행시킬 수 있는 방안에 중점을 둔다. 사용자의 의도 혹은 선호도를 파악하여 사용자에게 개인화된 서비스를 제공하는 PA(Personal Assistant) 에이전트의 개념을 모바일 환경에 적용하기 위한 기법을 제시한다. 사용자의 선호도를 파악하고 개인화된 서비스를 제공하기 위하여 클러스터링 알고리즘과 데이터 분류 알고리즘을 사용하였다. 실험을 통하여 사용자 패턴별로 생성한 클러스터에 분류 알고리즘을 적용한 결과에 대한 분류정확도를 측정하였으며, 제안한 기법의 클러스터별 분류 정확도는 기존의 기법과 비교하여 17.42% 증가하였다.

신경망을 이용한 다중 심리-생체 정보 기반의 부정 감성 분류 (Classification of Negative Emotions based on Arousal Score and Physiological Signals using Neural Network)

  • 김아영;장은혜;손진훈
    • 감성과학
    • /
    • 제21권1호
    • /
    • pp.177-186
    • /
    • 2018
  • 감성은 복잡하고 다양한 요인들에 의해 영향을 받기 때문에 다각적인 측면에서 고려되어야 한다. 본 연구에서는 심리 평가 척도의 하나인 각성(arousal) 지표와 다중 생체신호에서 추출된 생체지표 반응을 이용하여 중립 및 부정 감성(슬픔, 공포, 놀람)의 분류하였다. 이를 위하여 감성에 따른 생체지표 반응의 차이를 확인하였고, 다중 신경망 알고리즘 기반의 감성 인식기를 적용하여 이들 감성이 얼마나 정확하게 분류되는가를 확인하였다. 총 146명의 실험 참가자(평균 연령 $20.1{\pm}4.0$, 남성 41%)를 대상으로 감성 유발 자극을 제시하고 동시에 생체신호(심전도, 혈류맥파, 피부전기활동)를 측정하였다. 또한 감성 유발 자극에 대한 심리 반응을 감성 평가 척도로 평가하였다. 측정된 생체신호에서 심박률(HR), NN 간격의 표준편차(SDNN), 혈류량(BVP), 맥파전달시간(PTT), 피부전도수준(SCL), 피부전도반응(SCR)을 추출하였다. 결과 분석을 위하여 감성 자극에 대한 각성도와 안정 상태와 감성 상태의 생체지표 반응을 활용하였다. 또한 감성 분류를 위하여 다중 신경망 기반의 감성 인식기를 활용하였다. 그 결과, 감성에 따른 생체지표 반응의 차이를 확인하였고, 이들 감성의 분류 성능은 각성도와 모든 생체지표 특징들을 조합하였을 때 정확도가 가장 높음(86.9%)을 확인하였다. 본 연구는 심리 및 생체지표 추출과 기계학습 기술의 적용을 통하여 부정 감성을 분류할 수 있음을 제안하며, 이는 인간의 감성을 탐지하는 감성 인식 기술을 확립하는데 기여할 것으로 예상한다.

119 신고 데이터를 이용한 자연어처리 기반 재난안전 상황 분류 알고리즘 분석 (Analysis of Disaster Safety Situation Classification Algorithm Based on Natural Language Processing Using 119 Calls Data)

  • 권수정;강윤희;이용학;이민호;박성호;강명주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권10호
    • /
    • pp.317-322
    • /
    • 2020
  • 인공지능의 발달로 인하여 재난 분야에서는 재난대응 지원 시스템으로 이용되고 있다. 재난은 언제 어디서든지 발생할 수 있으며, 재난 발생 시 소방청 119 신고접수대에 접수되는 신고는 크게 화재, 구조, 구급, 기타 신고 등 4가지로 구분된다. 119 신고에 따른 재난 대응도 그 종류 및 상황에 따라 다르게 대응된다. 본 논문에서는 119 신고 데이터 1280개 문서를 학습 데이터 셋을 이용하여 SVM, NB, k-NN, DT, SGD, RF 상황 분류 기계학습 알고리즘을 3 클래스로 테스트한 분류 성능은 최고 92%, 최소 77%의 성능을 보였다. 인공지능의 발달로 인하여 재난 분야에서는 재난 대응 지원 시스템으로 이용되고 있다. 재난은 언제 어디서든지 발생할 수 있으며, 재난 발생 시 소방청 119 신고접수대에 접수되는 신고는 크게 화재, 구조, 구급, 기타 신고 등 4가지로 구분된다. 119 신고에 따른 재난대응도 그 종류 및 상황에 따라 다르게 대응된다. 본 논문에서는 119 신고 데이터 1280개 문서를 학습 데이터 셋을 이용하여 SVM, NB, k-NN, DT, SGD, RF 상황 분류 알고리즘을 3 클래스로 테스트한 분류 성능은 최고 92%, 최소 77%의 성능을 보였다. 앞으로 다양한 분야의 재난별 데이터 셋을 확보하여 효율적인 재난 대응 연구가 필요하다.

주식 투자자의 의사결정 지원을 위한 데이터마이닝 도구 (Data Mining Tool for Stock Investors' Decision Support)

  • 김성동
    • 한국콘텐츠학회논문지
    • /
    • 제12권2호
    • /
    • pp.472-482
    • /
    • 2012
  • 주식시장에는 많은 투자자들이 참여하고 있으며 점점 더 많은 사람이 주식투자에 관심을 가지고 있다. 주식시장에서 위험을 회피하고 수익을 얻기 위해서는 다양한 정보를 바탕으로 정확한 의사결정을 해야한다. 즉 수익을 얻을 수 있는 종목 선택, 적절한 매수-매도 가격의 결정, 그리고 적절한 보유기간 등을 결정해야 한다. 본 논문에서는 개인 주식 투자자의 의사결정 지원을 위한 데이터마이닝 도구를 제안한다. 즉, 개인 투자자가 직접 기계학습 방법을 적용하여 주가예측 모델을 생성할 수 있게 하고, 적절한 매수-매도 가격과 보유기간 등을 결정하는 것을 도와주는 도구를 제안한다. 제안하는 도구는 과거 데이터를 이용하여 투자자 자신의 성향에 맞는 투자에서의 의사결정을 할 수 있도록 지원하는 도구로서 주가데이터 관리, 기계학습 적용을 통한 주가예측 모델 생성, 투자 시뮬레이션 등의 기능을 제공한다. 사용자는 스스로 주가에 영향을 미칠 수 있다고 판단하는 기술적 지표를 선정하고 이를 이용하여 주가예측 모델을 만들고 테스트 할 수 있으며, 적절한 예측모델을 적용하여 시뮬레이션을 수행해 봄으로써 실제로 어느 정도 수익을 얻을 수 있는지 평가하고 적절한 매매 정책을 수립할 수 있다. 제안하는 도구를 이용하여 주식 투자자는 기존의 감정적 판단에 의한 투자가 아닌 객관적 데이터에 의해 검증을 거친 주가예측 모델과 매매정책에 따라 주식투자를 할 수 있어 이전 보다 나은 수익을 기대할 수 있다.

Gradient Boosting 모형을 이용한 중소기업 R&D 지원금 결정요인 분석 (Who Gets Government SME R&D Subsidy? Application of Gradient Boosting Model)

  • 강성원;강희찬
    • 한국전자거래학회지
    • /
    • 제25권4호
    • /
    • pp.77-109
    • /
    • 2020
  • 본 논문에서는 그래디언트 부스팅 모형을 활용하여 정부의 중소기업 연구개발 지원 결정에 영향을 미치는 요인들을 파악하였다. 기존 연구가 사후적으로 정부의 연구개발 지원이 수혜 기업에 미친 영향을 분석하는 것에 중점을 두었다면, 본 논문은 정부의 연구개발 지원 결정 방식을 파악하고, 그 방식이 기업에게 제공하는 유인을 분석하고자 하였다. 이를 위하여 본 논문은 지원금 결정에 영향을 미치는 다양한 잠재적 요인들을 선택하고, 기계학습 접근법을 활용하여 추정오차 축소효과가 큰 요인들을 선별하였다. 구체적으로 본 논문은 한국과학기술평가원이 구축한 국가연구개발조사분석 자료와 한국신용평가자료를 연결한 자료에 그래디언트 부스팅(Gradient Boosting) 모형을 적용하여 지원금 추정모형을 구축하였다. 본 논문에서 구축한 그래디언트 부스팅 모형은 선형회귀분석 응용모형에 비해 평균제곱근오차를 7.20% 축소할 수 있었다. 각 변수의 순열 중요도(permutation importance)를 분석한 결과 연구성과지표 및 연구개발비가 추정오차 축소에 기여가 큰 것으로 파악되었다. 그리고 각 변수의 부분의존도(Partial Dependence Plot: PDP) 및 SHAP 값(SHAP value: SHapley Additive exPlanation value)을 분석한 결과 연구성과지표가 좋고 연구개발비 지출이 큰 기업이 많은 연구개발 지원금을 받는 반면, 영업이익이 크고 자기자본회전율이 높은 기업은 적은 지원금을 받는 경향이 발견되었다. 본 연구의 결과는 현재 중소기업 연구개발 지원금 배분 방식이 연구성과지표 제고 및 연구개발투자 증가 유인은 제공하나, 기업 경영성과 제고 유인은 취약함을 시사한다.