• 제목/요약/키워드: 서포트 벡터 머신

검색결과 268건 처리시간 0.043초

미세먼지의 영향을 고려한 머신러닝 기반 태양광 발전량 예측 (Prediction of Photovoltaic Power Generation Based on Machine Learning Considering the Influence of Particulate Matter)

  • 성상경;조영상
    • 자원ㆍ환경경제연구
    • /
    • 제28권4호
    • /
    • pp.467-495
    • /
    • 2019
  • 태양광 발전과 같은 신재생에너지의 불확실성은 전력계통의 유연성을 저해하며, 이를 방지하기 위해서는 정확한 발전량의 사전 예측이 중요하다. 본 연구는 미세먼지 농도를 포함한 기상자료를 이용하여 태양광 발전량을 예측하는 것을 목적으로 한다. 본 연구에서는 2016년 1월 1일부터 2018년 9월 30일까지의 발전량, 기상자료, 미세먼지 농도 자료를 이용하고 머신러닝 기반의 RBF 커널 함수를 사용한 서포트 벡터 머신을 적용하여 태양광 발전량을 예측하였다. 예측변수에 미세먼지 농도 반영 유무에 따른 태양광 발전량 예측 모델의 성능을 비교한 결과 미세먼지 농도를 반영한 발전량 예측 모델의 성능이 더 우수한 것으로 나타났다. 미세먼지를 고려한 예측 모형은 미세먼지를 고려하지 않은 예측 모형 대비 6~20시 예측 모형에서는 1.43%, 12~14시 예측 모형에서는 3.60%, 13시 예측 모형에서는 3.88%만큼 오차가 감소하였다. 특히 발전량이 많은 주간 시간대에 미세먼지 농도를 반영하는 모형의 예측 정확도가 더 뛰어난 것으로 나타났다.

머신러닝을 이용한 3차원 도로객체의 분류 (Classification of 3D Road Objects Using Machine Learning)

  • 홍송표;김의명
    • 한국측량학회지
    • /
    • 제36권6호
    • /
    • pp.535-544
    • /
    • 2018
  • 급변하는 주변상황이나 대형차량과 같은 큰 지형지물에 센서가 가려질 경우에는 센서만을 이용한 완전 자율주행에는 한계가 따른다. 이에 자율주행을 위해서 센서를 이용한 한계점을 극복할 수 있도록 정밀한 도로지도를 부가적으로 이용하는 방법이 사용되고 있다. 본 연구는 국토지리정보원에서 제공하는 지상 MMS(Mobile Mapping System)로 취득된 3차원 점군자료를 이용하여 도로 객체를 분류하는 연구를 수행하였다. 본 연구를 위해서 원본 3차원 점군자료를 전처리 하고, 지면과 비지면점을 분리하기 위한 필터링 기법을 선정하였다. 또한 차선, 가로등, 안전펜스 등에 해당하는 도로객체를 초기 분할한 후 분할된 객체를 머신러닝의 종류인 서포트 벡터 머신을 이용하여 학습시킨 후 분류하였다. 학습데이터는 분할된 도로객체에서 추출한 고유값을 이용한 기하학적 요소와 높이정보만을 사용하였으며 분류결과 전체정확도는 87%, 카파계수는 0.795로 나타났다. 향후 도로객체의 분류를 위하여 기하학적인 요소 뿐만 아니라 다양한 항목을 추가한다면 분류정확도가 높아질 것으로 예상된다.

앙상블 머신러닝 모델 기반 유튜브 스팸 댓글 탐지 (Ensemble Machine Learning Model Based YouTube Spam Comment Detection)

  • 정민철;이지현;오하영
    • 한국정보통신학회논문지
    • /
    • 제24권5호
    • /
    • pp.576-583
    • /
    • 2020
  • 이 논문은 최근 엄청난 성장을 하고 있는 유튜브의 댓글 중 스팸 댓글을 판별하는 기법을 제안한다. 유튜브에서는 광고를 통한 수익 창출이 가능하기 때문에 인기 동영상에서 자신의 채널이나 동영상을 홍보하거나 영상과 관련 없는 댓글을 남기는 스패머(spammer)들이 나타났다. 유튜브에서는 자체적으로 스팸 댓글을 차단하는 시스템을 운영하고 있지만 여전히 제대로 차단하지 못한 스팸 댓글들이 있다. 따라서, 유튜브 스팸 댓글 판별에 대한 관련 연구들을 살펴 보고 인기 동영상인 싸이, 케이티 페리, LMFAO, 에미넴, 샤키라의 뮤직비디오 댓글 데이터에 6가지 머신러닝 기법(의사결정나무, 로지스틱 회귀분석, 베르누이 나이브 베이즈, 랜덤 포레스트, 선형 커널을 이용한 서포트 벡터 머신, 가우시안 커널을 이용한 서포트 벡터 머신)과 이들을 결합한 앙상블 모델로 스팸 탐지 실험을 진행하였다.

SVM-기반 제약 조건과 강화학습의 Q-learning을 이용한 변별력이 확실한 특징 패턴 선택 (Variable Selection of Feature Pattern using SVM-based Criterion with Q-Learning in Reinforcement Learning)

  • 김차영
    • 인터넷정보학회논문지
    • /
    • 제20권4호
    • /
    • pp.21-27
    • /
    • 2019
  • RNA 시퀀싱 데이터 (RNA-seq)에서 수집된 많은 양의 데이터에 변별력이 확실한 특징 패턴 선택이 유용하며, 차별성 있는 특징을 정의하는 것이 쉽지 않다. 이러한 이유는 빅데이터 자체의 특징으로써, 많은 양의 데이터에 중복이 포함되어 있기 때문이다. 해당이슈 때문에, 컴퓨터를 사용하여 처리하는 분야에서 특징 선택은 랜덤 포레스트, K-Nearest, 및 서포트-벡터-머신 (SVM)과 같은 다양한 머신러닝 기법을 도입하여 해결하려고 노력한다. 해당 분야에서도 SVM-기반 제약을 사용하는 서포트-벡터-머신-재귀-특징-제거(SVM-RFE) 알고리즘은 많은 연구자들에 의해 꾸준히 연구 되어 왔다. 본 논문의 제안 방법은 RNA 시퀀싱 데이터에서 빅-데이터처리를 위해 SVM-RFE에 강화학습의 Q-learning을 접목하여, 중요도가 추가되는 벡터를 세밀하게 추출함으로써, 변별력이 확실한 특징선택 방법을 제안한다. NCBI-GEO와 같은 빅-데이터에서 공개된 일부의 리보솜 단백질 클러스터 데이터에 본 논문에서 제안된 알고리즘을 적용하고, 해당 알고리즘에 의해 나온 결과와 이전 공개된 SVM의 Welch' T를 적용한 알고리즘의 결과를 비교 평가하였다. 해당결과의 비교가 본 논문에서 제안하는 알고리즘이 좀 더 나은 성능을 보여줌을 알 수 있다.

머신러닝을 이용한 급성 뇌졸중 퇴원 환자의 중증도 보정 사망 예측 모형 개발에 관한 연구 (A study on the development of severity-adjusted mortality prediction model for discharged patient with acute stroke using machine learning)

  • 백설경;박종호;강성홍;박혜진
    • 한국산학기술학회논문지
    • /
    • 제19권11호
    • /
    • pp.126-136
    • /
    • 2018
  • 본 연구는 머신러닝을 활용하여 급성 뇌졸중 퇴원 환자의 중증도 보정 사망 예측 모형 개발을 목적으로 시행하였다. 전국 단위의 퇴원손상심층조사 2006~2015년 자료 중 한국표준질병사인분류(Korean standard classification of disease-KCD 7)에 따라 뇌졸중 코드 I60-I63에 해당하는 대상자를 추출하여 분석하였다. 동반질환 중증도 보정 도구로는 Charlson comorbidity index(CCI), Elixhauser comorbidity index(ECI), Clinical classification software(CCS)의 3가지 도구를 사용하였고 중증도 보정 모형 예측 개발은 로지스틱회귀분석, 의사결정나무, 신경망, 서포트 벡터 머신 기법을 활용하여 비교해 보았다. 뇌졸중 환자의 동반질환으로는 ECI에서는 합병증을 동반하지 않은 고혈압(hypertension, uncomplicated)이 43.8%로, CCS에서는 본태성고혈압(essential hypertension)이 43.9%로 다른 질환에 비해 가장 월등하게 높은 것으로 나타났다. 동반질환 중중도 보정 도구를 비교해 본 결과 CCI, ECI, CCS 중 CCS가 가장 높은 AUC값으로 분석되어 가장 우수한 중증도 보정 도구인 것으로 확인되었다. 또한 CCS, 주진단, 성, 연령, 입원경로, 수술유무 변수를 포함한 중증도 보정 모형 개발 AUC값은 로지스틱 회귀분석의 경우 0.808, 의사결정나무 0.785, 신경망 0.809, 서포트 벡터 머신 0.830로 분석되어 가장 우수한 예측력을 보인 것은 서포트 벡터머신 기법인 것으로 최종 확인되었고 이러한 결과는 추후 보건의료정책 수립에 활용될 수 있을 것이다.

인공 신경망과 서포트 벡터 머신을 사용한 태양 양성자 플럭스 예보

  • 남지선;문용재;이진이;지은영;박진혜;박종엽
    • 천문학회보
    • /
    • 제37권2호
    • /
    • pp.129.1-129.1
    • /
    • 2012
  • 서포트 벡터 머신(Support Vector Machine, SVM)과 인공신경망 모형(Neural Network, NN)을 사용하여 태양 양성자 현상(Solar proton event, SPE)의 플럭스 세기를 예측해 보았다. 이번 연구에서는 1976년부터 2011년까지 10MeV이상의 에너지를 가진 입자가 10개 cm-1 sec-1 ster -1 이상 입사할 경우를 태양 양성자 현상으로 정의한 NOAA의 태양 고에너지 입자 리스트와 GOE위성의 X-ray 플레어 데이터를 사용하였다. 여기에서 C, M, X 등급의 플레어와 관련있는 178개 이벤트를 모델의 훈련을 위한 데이터(training data) 89개와 예측을 위한 데이터(prediction data) 89개로 구분하였다. 플러스 세기의 예측을 위하여, 우리는 로그 플레어 세기, 플레어 발생위치, Rise time(플레어 시작시간부터 최대값까지의 시간)을 모델 입력인자로 사용하였다. 그 결과 예측된 로그 플럭스 세기와 관측된 로그 플럭스 세기 사이의 상관계수는 SVM과 NN에서 각각 0.32와 0.39의 값을 얻었다. 또한 두 값 사이의 평균 제곱근 오차(Root mean square error)는 SVM에서 1.17, NN에서는 0.82로 나왔다. 예측된 플럭스 세기와 관측된 플럭스 세기의 차이를 계산해 본 결과, 오차 범위가 1이하인 경우가 SVM에서는 약 68%이고 NN에서는 약 80%의 분포를 보였다. 이러한 결과로부터 우리는 NN모델이 SVM모델보다 플럭스 세기를 잘 예측하는 것을 알 수 있었다.

  • PDF

마케팅 데이터를 대상으로 중요 통계 예측 기법의 정확성에 대한 비교 연구 (A Comparative Study on the Accuracy of Important Statistical Prediction Techniques for Marketing Data)

  • 조민호
    • 한국전자통신학회논문지
    • /
    • 제14권4호
    • /
    • pp.775-780
    • /
    • 2019
  • 미래를 예측하는 기법은 통계에 기반을 둔 것과 딥러닝에 기반을 둔 기술로 분류할 수 있다. 그중 통계에 기반을 둔 것이 간단하고 정확성이 높아서 많이 사용된다. 하지만 실무자들은 많은 분석기법의 올바른 사용에 어려움이 많다. 이번 연구에서는 마케팅에 관련된 데이터에 다항로지스틱회귀, 의사결정나무, 랜덤포레스트, 서포트벡터머신, 베이지안 추론을 적용하여 예측의 정확성을 비교하였다. 동일한 마케팅 데이터를 대상으로 하였고, R을 활용하여 분석을 진행하였다. 마케팅 분야의 데이터 특성을 반영한 다양한 기법의 예측 결과가 실무자들에게 좋은 참고가 될 것으로 생각한다.

통계기법 및 기계학습 기법을 이용한 우리나라 대설피해액 예측 및 적용성 검토 (Predicting and Reviewing the Amount of Snow Damage in Korea using Statistical and Machine Learning Techniques)

  • 이형주;이근우;장현빈;정건희
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.384-384
    • /
    • 2022
  • 과거의 우리나라 대설피해 양상을 살펴보면 지역적으로 집중되어 피해가 발생하는 것이 특징이다. 그러나 현재는 전국적으로 대설피해가 가중되는 추세이며, 이에 따라 대설피해에 대비 가능한 대책의 강구가 필요한 실정이다. 그러나 피해 발생 시 정확한 피해 예측으로 사전에 재난을 대비가 가능한 수준의 연구는 미흡한 실정이다. 따라서 본 연구에서는 다양한 통계기법과 기계학습 기법을 이용하여 대설로 인해 발생한 피해액을 개략적으로 예측이 가능한 모형을 개발하고자 하였다. 대설피해액 예측 모형은 다중회귀분석, 서포트 벡터 머신, 인공신경망 기법, 랜덤포레스트 기법을 이용하여 총 4가지 기법으로 개발하였으며, 독립변수로 사회·경제적 요소, 기상요소를 사용하였고, 종속변수로는 1994년부터 2020년까지 발생한 대설피해 이력의 대설피해액을 사용하였다. 결과적으로 4가지 예측 모형의 예측력 검증 및 기법 간의 예측력을 비교하여 개발한 모형의 적용성을 검토하였다. 본 연구 결과에서 제시한 모형의 개선방안 및 업데이트 방안을 참고하여 후속 연구가 진행된다면 미래에 전국적으로 확대될 대설피해에 대한 대비가 가능할 것으로 기대되며 복구비 및 예방비 투자의 지역적 우선순위를 분석하여 선제적인 대비가 가능할 것으로 판단된다.

  • PDF

다중 랜덤 워커를 이용한 객체 추적 기법 (Visual Object Tracking by Using Multiple Random Walkers)

  • 문주혁;김한울;김창수
    • 방송공학회논문지
    • /
    • 제21권6호
    • /
    • pp.913-919
    • /
    • 2016
  • 본 논문에서는 다중 랜덤 워커(multiple random walkers)에 기반한 객체 추적 기법을 제안한다. 우선 서포트 벡터 머신(support vector machine)을 이용한 분류기 기반 객체 추적 기법을 소개한다. 다음으로 영상의 영역에 대한 특징 벡터 중 배경으로부터 추출된 특징 벡터를 억제하는 기법을 제안한다. 영역에서 배경 요소를 찾기 위해 다중 랜덤 워커를 이용한 전경 및 배경 추출 방법을 제시한다. 배경 요소가 억제된 특징 벡터를 이용하여 학습된 서포트 벡터 머신은 객체와 배경이 유사한 영상, 객체가 다른 물체에 의해 가려지는 영상 등에서 객체와 배경을 확실하게 구분하고, 추적 알고리즘은 정확한 객체 추적을 수행한다. 또한, 객체 추적 알고리즘의 응용에서 중요한 속도 문제를 크게 개선하는 방법을 제안한다. 마지막으로 실험을 통해 제안하는 기법이 높은 처리 속도를 유지하면서 동시에 기존 기법보다 우수한 추적 성능을 보임을 확인한다.