• 제목/요약/키워드: 서포트벡터머신

검색결과 269건 처리시간 0.028초

통계기법 및 기계학습 기법을 이용한 우리나라 대설피해액 예측 및 적용성 검토 (Predicting and Reviewing the Amount of Snow Damage in Korea using Statistical and Machine Learning Techniques)

  • 이형주;이근우;장현빈;정건희
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.384-384
    • /
    • 2022
  • 과거의 우리나라 대설피해 양상을 살펴보면 지역적으로 집중되어 피해가 발생하는 것이 특징이다. 그러나 현재는 전국적으로 대설피해가 가중되는 추세이며, 이에 따라 대설피해에 대비 가능한 대책의 강구가 필요한 실정이다. 그러나 피해 발생 시 정확한 피해 예측으로 사전에 재난을 대비가 가능한 수준의 연구는 미흡한 실정이다. 따라서 본 연구에서는 다양한 통계기법과 기계학습 기법을 이용하여 대설로 인해 발생한 피해액을 개략적으로 예측이 가능한 모형을 개발하고자 하였다. 대설피해액 예측 모형은 다중회귀분석, 서포트 벡터 머신, 인공신경망 기법, 랜덤포레스트 기법을 이용하여 총 4가지 기법으로 개발하였으며, 독립변수로 사회·경제적 요소, 기상요소를 사용하였고, 종속변수로는 1994년부터 2020년까지 발생한 대설피해 이력의 대설피해액을 사용하였다. 결과적으로 4가지 예측 모형의 예측력 검증 및 기법 간의 예측력을 비교하여 개발한 모형의 적용성을 검토하였다. 본 연구 결과에서 제시한 모형의 개선방안 및 업데이트 방안을 참고하여 후속 연구가 진행된다면 미래에 전국적으로 확대될 대설피해에 대한 대비가 가능할 것으로 기대되며 복구비 및 예방비 투자의 지역적 우선순위를 분석하여 선제적인 대비가 가능할 것으로 판단된다.

  • PDF

다중 랜덤 워커를 이용한 객체 추적 기법 (Visual Object Tracking by Using Multiple Random Walkers)

  • 문주혁;김한울;김창수
    • 방송공학회논문지
    • /
    • 제21권6호
    • /
    • pp.913-919
    • /
    • 2016
  • 본 논문에서는 다중 랜덤 워커(multiple random walkers)에 기반한 객체 추적 기법을 제안한다. 우선 서포트 벡터 머신(support vector machine)을 이용한 분류기 기반 객체 추적 기법을 소개한다. 다음으로 영상의 영역에 대한 특징 벡터 중 배경으로부터 추출된 특징 벡터를 억제하는 기법을 제안한다. 영역에서 배경 요소를 찾기 위해 다중 랜덤 워커를 이용한 전경 및 배경 추출 방법을 제시한다. 배경 요소가 억제된 특징 벡터를 이용하여 학습된 서포트 벡터 머신은 객체와 배경이 유사한 영상, 객체가 다른 물체에 의해 가려지는 영상 등에서 객체와 배경을 확실하게 구분하고, 추적 알고리즘은 정확한 객체 추적을 수행한다. 또한, 객체 추적 알고리즘의 응용에서 중요한 속도 문제를 크게 개선하는 방법을 제안한다. 마지막으로 실험을 통해 제안하는 기법이 높은 처리 속도를 유지하면서 동시에 기존 기법보다 우수한 추적 성능을 보임을 확인한다.

시간적 근접성 향상을 통한 효율적인 SVM 기반 음성/음악 분류기의 구현 방법 (Efficient Implementation of SVM-Based Speech/Music Classifier by Utilizing Temporal Locality)

  • 임정수;장준혁
    • 대한전자공학회논문지SP
    • /
    • 제49권2호
    • /
    • pp.149-156
    • /
    • 2012
  • 서포트벡터머신 (support vector machine)을 이용한 음성/음악 분류기는 높은 분류 정확도로 주목받고 있으나 많은 계산 량과 저장 공간을 요구하므로 특히 임베디드 시스템과 같이 자원이 제한 적인 경우에는 효율적인 구현이 필수적이다. 특히, 서포트벡터 (support vector)의 차원과 개수에 의해 결정되는 서포트벡터의 저장 공간의 크기는 일반적으로 임베디드 프로세서의 캐시 (cache)의 크기보다 훨씬 크므로 캐시에 존재하지 않는 서포트벡터를 메인 메모리로부터 읽어야 하는 경우가 많다. 메모리에서 데이터를 가져오는 데는 캐시나 레지스터와 비교했을 때 상대적으로 긴 시간과 많은 에너지가 소비되어 분류기의 실행시간과 에너지 소비를 증가시키는 요인이 된다. 본 논문에서는 분류기의 데이터 접근 양식을 보다 시간적 근접성을 가지게 변환하여 일단 프로세서 칩으로 불려진 데이터를 최대한 활용함으로써 메모리의 접근 횟수를 줄여 전체적인 서포트벡터의 실행시간의 단축시키는 기법을 제안한다. 실험을 통해 메모리로의 접근 회수의 감소와 이에 따른 실행시간 그리고 에너지 소비의 감소를 확인하였다.

세포독성 자료를 이용한 분류 알고리즘 성능 비교 (Comparison of the performance of classification algorithms using cytotoxicity data)

  • 윤여창;정의배;조나래;주수인;이성덕
    • 응용통계연구
    • /
    • 제31권3호
    • /
    • pp.417-426
    • /
    • 2018
  • 최근 동물실험의 대체방법 중 하나로 쥐의 줄기세포 유래 배상체를 이용하여 독성을 시험하는 방법이 개발되었다. 이는 동물에 직접 약물을 주입하는 것이 아닌 배상체 세포에 약물을 투입하여 세포의 변화에 따른 측정값들을 얻는 방법이다. 본 연구에서는 다범주 세포독성 자료를 이용해 통계적 기법인 판별분석(discriminant analysis)과 머신러닝 기법인 서포트 벡터 머신(support vector machine), 인공신경망(artificial neural network), k-인접이웃분류(k-nearest neighbor)의 성능을 비교하였다. 알고리즘의 성능은 분류 정확도(accuracy)와 가중카파계수(weighted Cohen's kappa coefficient)로 비교하였다.

퍼지 원 클래스 서포트 벡터 머신 (Fuzzy One Class Support Vector Machine)

  • 김기주;최영식
    • 인터넷정보학회논문지
    • /
    • 제6권3호
    • /
    • pp.159-170
    • /
    • 2005
  • OC-SVM(One Class Support Vector Machine)은 주어진 전체 데이터의 분포를 측정하는 대신에. 데이터 분포의 서포트(support)를 측정하는 기술로서 주어진 데이터를 가장 잘 설명할 수 있는 최적의 서포트 벡터(support vector)를 구하는 기술이다. OC-SVM은 데이터 분포의 표현에 아주 뛰어난 접근 방법이지만, 사람의 주관적인 중요도를 반영하는 것은 힘들다. 본 논문에서는 각 데이터에 퍼지 맴버쉽(fuzzy membership)을 적용하여 기존의 OC-SVM에 사용자의 주관적인 중요도를 표현할 수 있는 FOC-SVM(Fuzzy One class Support Vector Machine)을 유도 하였다. FOC-SVM은 데이터들을 동등하게 다루는 것이 아니라, 데이터 객체의 중요도에 따라 데이터를 다룬다. 즉, 덜 중요한 데이터의 특징 벡터는 OC-SVM의 처리과정에 덜 기여하도록 하기 위하여, 객체의 중요도에 따라 특징 벡터의 크기를 조정하였다. 이를 증명하기 위하여 가상의 데이터를 가지고 실험을 하였고, 실험 결과는 예측된 결과를 보여 주었다.

  • PDF

영상정보만을 이용한 사람과 로봇간 실시간 상대위치 추정 알고리즘 (Real-Time Algorithm for Relative Position Estimation Between Person and Robot Using a Monocular Camera)

  • 이정욱;선주영;원문철
    • 대한기계학회논문집A
    • /
    • 제37권12호
    • /
    • pp.1445-1452
    • /
    • 2013
  • 본 논문에서는 단안 카메라를 이용하여 사람과 로봇(카메라)간의 상대위치를 실시간으로 추정하는 알고리즘을 제안한다. HOG(기울기 히스토그램) 특징벡터와 SVM(서포트 벡터 머신) 분류기를 이용하여 사람의 두부 및 어깨영역을 검출한다. 검출된 영역의 크기와 위치를 이용하여 사람과 로봇(카메라)간의 상대 위치 및 각도를 계산한다. 또한 알고리즘 수행속도를 향상시키기 위하여 본 논문에서는 NVIDIA의 GPU와 CUDA 라이브러리를 사용하였다. 그 결과 알고리즘 수행속도는 초당 15 프레임의 영상데이터를 처리할 수 있다. 알고리즘의 정확도 비교를 위해서 SICK 레이저 스캐너 출력과 비교하였다.

속도 향상을 위한 서포트 벡터 머신의 파라미터 탐색 방법론 (Parameter search methodology of support vector machines for improving performance)

  • 이성보;김재영;김철홍;김종면
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제7권3호
    • /
    • pp.329-337
    • /
    • 2017
  • 본 논문에서는 서포트 벡터 머신의 중요한 파라미터인 C와 σ값을 빠르고 정확하게 찾는 탐색 방법론을 제안한다. 기존에 알려진 격자 탐색 방식은 모든 경우를 비교하기 때문에 탐색속도가 느리다. 이러한 문제점을 개선하기 위해 본 논문에서는 탐색속도 향상을 위한 딥 서치 방식을 제안한다. 1단계에서는 C-σ 정확도지표를 4등분 한 뒤 각 영역의 중간 값을 탐색하여 가장 정확도 값이 높은 지점을 시작 지점으로 선택한다. 2단계에서는 선정된 시작지점을 다시 4등분한 뒤 정확도 값이 가장 큰 지점을 새로운 탐색지점으로 지정한다. 3단계에서는 탐색지점에 이웃한 8개의 지점들을 탐색하여 정확도 값이 가장 높은 곳을 새로운 시작 지점으로 선정한 뒤 해당 지점을 4등분하여 정확도 값을 계산한다. 마지막 단계에서는 이웃 지점의 값들보다 탐색지점의 정확도지표 값이 최댓값이 될 때까지 진행한다. 최댓값을 만족하지 않을시 2단계에서부터 반복하며 입력된 레벨 값만큼 반복을 진행한다. 베어링의 결함 및 정상 데이터를 사용하여 비교한 결과, 제안한 Deep search 알고리즘은 기존 알고리즘 보다 성능 및 탐색시간에서 우수성을 보였다.

머신러닝 기법과 TBM 시공정보를 활용한 토압식 쉴드TBM 굴진율 예측 연구 (A Study on Prediction of EPB shield TBM Advance Rate using Machine Learning Technique and TBM Construction Information)

  • 강태호;최순욱;이철호;장수호
    • 터널과지하공간
    • /
    • 제30권6호
    • /
    • pp.540-550
    • /
    • 2020
  • 최근 AI 기술의 발전과 정립으로 자동화 분야에서 머신러닝 기법의 활용이 활발하게 이루어지고 있다. 머신러닝 기법의 활용에 있어 중요한 점은 데이터 특성에 따라 적합한 알고리즘이 존재한다는 점이며, 머신러닝 기법 적용을 위한 데이터세트의 분석이 필요하다. 본 연구에서는 다양한 머신러닝 기법을 기반으로 하천 하부의 토사지반을 통과하는 토압식 쉴드TBM 터널 구간의 지반정보와 굴진정보를 사용하여 토압식 쉴드TBM의 굴진율을 예측하였다. 선형회귀모델에서 모델의 통계적인 유의성과 다중공선성에서는 문제가 없었으나 결정계수가 0.76으로 나타났고 앙상블 모델과 서포트 벡터 머신에서는 0.88이상의 예측성능을 보여, 분석한 데이터세트에서 토압식 쉴드TBM 굴진성능예측에 적합한 모델은 서포트 벡터 머신임을 알 수 있었다. 현재 도출된 결과로 볼 때, 토압식 쉴드TBM의 기계데이터와 지반정보가 포함된 데이터를 활용한 굴진성능 예측 모델의 적합성은 높다고 판단된다. 추가적으로 지반조건의 다양성과 데이터양을 늘리는 연구가 필요한 것으로 판단된다.

머신러닝 기반 KOSDAQ 시장의 관리종목 지정 예측 연구

  • 윤양현;김태경;김수영;박용균
    • 한국벤처창업학회:학술대회논문집
    • /
    • 한국벤처창업학회 2021년도 추계학술대회
    • /
    • pp.185-187
    • /
    • 2021
  • 관리종목 지정 제도는 상장 기업 내 기업의 부실화를 경고하여 기업에게는 회생 기회를 주고, 투자자들에게는 투자 위험을 경고하기 위한 시장규제 제도이다. 본 연구는 관리종목과 비관리종목의 기업의 재무 데이터를 표본으로 하여 관리종목 지정 예측에 대한 연구를 진행하였다. 분석에 쓰인 분석 방법은 로지스틱 회귀분석, 의사결정나무, 서포트 벡터 머신, 소프트 보팅, 랜덤 포레스트, LightGBM이며 분류 정확도가 82.73%인 LightGBM이 가장 우수한 예측 모형이었으며 분류 정확도가 가장 낮은 예측 모형은 정확도가 71.94%인 의사결정나무였다. 대체적으로 앙상블을 이용한 학습 모형이 단일 학습 모형보다 예측 성능이 높았다.

  • PDF

약물유전체학에서 약물반응 예측모형과 변수선택 방법 (Feature selection and prediction modeling of drug responsiveness in Pharmacogenomics)

  • 김규환;김원국
    • 응용통계연구
    • /
    • 제34권2호
    • /
    • pp.153-166
    • /
    • 2021
  • 약물유전체학 연구의 주요 목표는 고차원의 유전 변수를 기반으로 개인의 약물 반응성을 예측하는 것이다. 변수의 개수가 많기 때문에 변수의 개수를 줄이기 위해서는 변수 선택이 필요하며, 선택된 변수들은 머신러닝 알고리즘을 사용하여 예측 모델을 구축하는데 사용된다. 본 연구에서는 400명의 뇌전증 환자의 차세대 염기서열 분석 데이터에 로지스틱 회귀, ReliefF, TurF, 랜덤 포레스트, LASSO의 조합과 같은 여러 가지 혼합 변수 선택 방법을 적용하였다. 선택된 변수들에 랜덤포레스트, 그래디언트 부스팅, 서포트벡터머신을 포함한 머신러닝 방법들을 적용했고 스태킹을 통해 앙상블 모형을 구축하였다. 본 연구의 결과는 랜덤포레스트와 ReliefF의 혼합 변수 선택 방법을 이용한 스태킹 모형이 다른 모형보다 더 좋은 성능을 보인다는 것을 보여주었다. 5-폴드 교차 검증을 기반으로 하여 적합한 최적 모형의 평균 검증 정확도는 0.727이고 평균 검증 AUC 값은 0.761로 나타났다. 또한, 동일한 변수를 사용할 때 스태킹 모델이 단일 머신러닝 예측 모델보다 성능이 우수한 것으로 나타났다.