• 제목/요약/키워드: 서포트벡터머신

검색결과 268건 처리시간 0.029초

배깅 및 스태킹 기반 앙상블 기계학습법을 이용한 고성능 콘크리트 압축강도 예측모델 개발 (Development of a High-Performance Concrete Compressive-Strength Prediction Model Using an Ensemble Machine-Learning Method Based on Bagging and Stacking)

  • 곽윤지;고채연;곽신영;임승현
    • 한국전산구조공학회논문집
    • /
    • 제36권1호
    • /
    • pp.9-18
    • /
    • 2023
  • 고성능 콘크리트(HPC) 압축강도는 추가적인 시멘트질 재료의 사용으로 인해 예측하기 어렵고, 개선된 예측 모델의 개발이 필수적이다. 따라서, 본 연구의 목적은 배깅과 스태킹을 결합한 앙상블 기법을 사용하여 HPC 압축강도 예측 모델을 개발하는 것이다. 이 논문의 핵심적 기여는 기존 앙상블 기법인 배깅과 스태킹을 통합하여 새로운 앙상블 기법을 제시하고, 단일 기계학습 모델의 문제점을 해결하여 모델 예측 성능을 높이고자 한다. 단일 기계학습법으로 비선형 회귀분석, 서포트 벡터 머신, 인공신경망, 가우시안 프로세스 회귀를 사용하고, 앙상블 기법으로 배깅, 스태킹을 이용하였다. 결과적으로 본 연구에서 제안된 모델이 단일 기계학습 모델, 배깅 및 스태킹 모델보다 높은 정확도를 보였다. 이는 대표적인 4가지 성능 지표 비교를 통해 확인하였고, 제안된 방법의 유효성을 검증하였다.

히스토그램의 최적 높이의 폭에 기반한 3차원 필름 영상 검사 (3D Film Image Inspection Based on the Width of Optimized Height of Histogram)

  • 이재은;김종남
    • 융합신호처리학회논문지
    • /
    • 제23권2호
    • /
    • pp.107-114
    • /
    • 2022
  • 3차원 필름 영상을 양품 또는 불량품으로 분류하기 위해서는 필름의 영상 내 무늬를 검출해야 한다. 하지만 만약 필름 내 화소의 명암이 낮다면 영상 내 무늬가 선명하지 않아서 분류하기가 쉽지 않다. 본 논문에서는 3D 필름 영상들의 히스토그램을 구한 후, 각 히스토그램의 특정 빈도에서의 폭을 비교하여 정품과 불량품으로 분류하는 방법을 제안한다. 실험을 통하여 정품과 불량품의 히스토그램이 뚜렷하게 다르다는 것을 보였으며, 이러한 특징을 반영한 제안 알고리즘을 이용하여 히스토그램의 특정 빈도에서 모든 3D 필름 영상들이 정확하게 분류되는 것을 보였다. 기존에 연구된 방법들인 차영상, 오츠의 이진화 알고리즘, 캐니 엣지, 모폴로지 지오데식 엑티브 컨투어, 그리고 서포트 벡터 머신과의 성능 비교를 통하여 제안한 알고리즘의 성능이 가장 우수함을 검증하였으며, 영상 내 무늬를 검출할 필요 없이도 우수한 분류 정확도를 얻을 수 있다는 것을 보였다.

KOMPSAT-3A 위성영상과 토지피복도를 활용한 산림식생의 임상 분류법 개발 (Development of a Classification Method for Forest Vegetation on the Stand Level, Using KOMPSAT-3A Imagery and Land Coverage Map)

  • 송지용;정종철;이상훈
    • 한국환경생태학회지
    • /
    • 제32권6호
    • /
    • pp.686-697
    • /
    • 2018
  • 오늘날 원격탐지기술의 발달로 인해, 산림지역과 같이 피복 분류작업이 난해한 지역을 비롯한 광범위한 지역에서의 세밀한 변화탐지를 위한 고해상도 위성영상 취득이 가능해졌다. 하지만, 고해상도 영상에 대한 시계열분석의 과정에서 많은 양의 지상 관측 데이터가 요구된다. 본 연구에서는 토지피복도를 지상 관측데이터로 활용한 위성영상 분류 방법의 가능성을 시험하였다. 연구대상지는 강원도 원주시이며, 산림지역과 시가화지역이 공존하는 공간이다. 연구 자료는 2015년 3월에 촬영된 KOMPSAT-3A 영상과 2017년도 토지피복도를 이용하여 분류를 시도하였다. 서포트벡터머신(SVM)과 랜덤포레스트(RF)의 두 가지 상이한 화소기반 분류기법을 적용하여 대상지에 대한 피복분류의 분류정확도를 비교 분석하였으며, SVM 분석의 경우 다수 분석(Majority analysis)을 후속 진행하였다. 분석대상은 산림식생만 포함한 지역과 연구대상지 전지역으로 구분하였고, 대상 면적이 협소한 습지는 분석과정에서 제외하였다. 분류 결과는 오차 행렬의 전체 정확도가 두 가지 분류대상에 대해 RF 기법이 SVM 기법보다 더 나은 것으로 나타났다. 산림지역만을 대상으로 한 경우, RF 기법이 SVM 기법에 비해 18.3% 높은 값을 나타낸 반면, 전체지역을 대상으로 한 경우는 둘 사이의 간격이 5.5%로 줄어들었다. SVM 기법에 다수 분석 (Majority analysis)을 추가로 실시한 경우, 1% 정도의 정확도 향상이 나타났다. RF 기법은 산림지역의 활엽수를 분석해 내는데 상당히 효과적이었지만, 다른 대상에 대해서는 SVM 기법이 더 나은 결과를 나타내었다. 본 연구는 고해상도 단일시기 영상에 대한 화소 기반의 분류기법을 시험한 것으로, 추후 시계열분석 및 객체기반 분류기법의 추가적인 적용으로 향상된 정확도와 신뢰도를 얻을 수 있을 것으로 판단된다. 이 연구의 방법론은 시공간적으로 고해상도 분석결과를 제공함으로써, 대면적의 토지계획에 유용할 것으로 기대된다.

기계학습 분류모델을 이용한 하천퇴적물의 중금속 오염원 식별 (Identifying sources of heavy metal contamination in stream sediments using machine learning classifiers)

  • 반민정;신상욱;이동훈;김정규;이호식;김영;박정훈;이순화;김선영;강주현
    • 한국습지학회지
    • /
    • 제25권4호
    • /
    • pp.306-314
    • /
    • 2023
  • 하천퇴적물은 유역내 다양한 오염원으로부터 발생하는 중금속, 유기물 등 오염물질의 수용체일 뿐만 아니라 수질 오염 및 수생태 악영향을 유발할 수 있는 2차적 오염원이기에 중요한 관리대상이라고 할 수 있다. 오염된 하천퇴적물의 효과적인 관리를 위해서는 오염원에 대한 식별과 이와 연계된 관리대책의 수립이 우선되어야 한다. 본 연구는 하천퇴적물내 측정된 다양한 이화학적 오염항목 분포 특성에 기반하여 퇴적물의 주요 오염원을 식별하기 위한 방법으로서 기계학습모델의 적용성을 평가하였다. 기계학습 모델의 성능 평가를 위해 전국 4대강 수계내 주요 폐금속광산 및 산업단지 인근에서 수집된 총 356개의 하천퇴적물에 대한 중금속 10개 항목(Cd, Cu, Pb, Ni, As, Zn, Cr, Hg, Li, Al)과 토양항목 3개(모래, 실트, 점토 비율) 수질항목 5개(함수율, 강열감량, 총유기탄소, 총질소, 총인)를 포함한 총 18개 오염항목에 대한 분석자료를 활용하였다. 기계학습 분류 모델로서 선형판별분석(linear discriminant analysis, LDA)과 서포트벡터머신(support vector machine, SVM) 분류기를 사용하여 폐금속광산('광산')과 산업단지('산단') 인근에서의 하천퇴적물 시료의 분류 성능을 평가한 결과, 채취 지점 및 시기별 4가지 경우(비강우시 광산, 강우시 광산, 비강우시 산단, 및 강우시 산단)에 대한 퇴적물 시료의 분류 성능이 우수하였으며, 특히 비선형 모델인 SVM(88.1%)이 선형모델인 LDA(79.5%) 보다 퇴적물을 분류하는데 있어 보다 우수한 성능을 나타냈다. SVM 앙상블 기반 비배타적 다중라벨분류기 모델을 이용하여 각 시료채취 지점 상류 유역 1km 반경 내 지배적인 토지이용 및 오염원을 다중 타겟값으로 다중분류 예측을 수행한 결과, 폐금속광산과 산업단지의 분류는 비교적 높은 정확도로 수행하였으나, 도시와 농업지역 등 다른 비점오염원에 대한 분류정확도는 56~60%범위로 비교적 낮게 나타났다. 이는 다중라벨 분류모델의 복잡성에 비해 데이터셋의 크기가 상대적으로 작아서 발생한 과적합에 기인한 것으로 향후 보다 많은 측정자료가 확보될 경우 기계학습 모델을 적용한 오염원 분류의 정확도를 보다 향상시킬 수 있을 것으로 판단된다.

중소기업 기술 유출에 대한 조기경보시스템 개발에 대한 연구 (Development on Early Warning System about Technology Leakage of Small and Medium Enterprises)

  • 서봉군;박도형
    • 지능정보연구
    • /
    • 제23권1호
    • /
    • pp.143-159
    • /
    • 2017
  • 급속한 IT의 발전으로 인해 개인정보뿐만 아니라 기업이 보유하고 있는 핵심 기술 및 정보에 대한 유출 위협이 중요한 이슈로 인식되고 있다. 기업에게 있어서 보유하고 있는 핵심 기술은 기업의 생존 및 지속적으로 경쟁 우위를 차지하기 위해 매우 중요한 부분이다. 최근 기술 침해 사례가 많이 일어나고 있는데, 기술 유출은 기업에게 있어서 주가하락 등의 막대한 재무적인 손실을 가져올 뿐만 아니라, 기업의 신뢰에 손상을 입게 되고, 기업의 발전을 지연시키게 되는 악영향을 미치게 된다. 특히, 대기업에 비해 핵심기술이 기업 내 중요한 많은 부분을 차지하는 중소기업에 있어서 기술 유출에 대한 대비는 기업의 존립에 있어서 필수적인 요소로 볼 수 있다. 이처럼 정보 보안 관리의 필요성과 중요성이 대두되면서 기업 입장에서 조기에 기술 침해 위협에 대해 확인하고 대비할 필요가 있다. 본 연구에서는 기술 유출에 영향을 미치는 요인들을 탐색하는 실증 분석을 수행하고, 인공지능 알고리즘을 통해 기술유출 조기경보시스템을 개발하고자 한다. 구체적으로 본 연구에서는 중소기업이 보유한 기술 유출에 영향을 미치는 요인들을 로지스틱 회귀분석을 통해 확인해보고, 통계분석을 통해 검증된 요인들을 기반으로 인공지능 여러 기법들 중 하나인 Support Vector Machine을 활용하여 기술침해 가능성을 조기에 알려주는 모형을 개발하였다. 본 연구에서 제안하는 기술 유출 가능성에 대한 조기 경보 모형을 통해 기업 및 정부 관점에서 기술 유출을 미리 예방할 수 있는 기회를 제공할 수 있을 것으로 기대된다.

하이브리드 인공신경망 모형을 이용한 부도 유형 예측 (Bankruptcy Type Prediction Using A Hybrid Artificial Neural Networks Model)

  • 조남옥;김현정;신경식
    • 지능정보연구
    • /
    • 제21권3호
    • /
    • pp.79-99
    • /
    • 2015
  • 부도 예측은 회계와 재무 분야에서 꾸준히 연구되고 있는 분야이다. 초기에는 주로 다중판별분석(multiple discriminant analysis)와 로짓 분석(logit analysis)과 같은 통계적 방법을 이용하였으나, 1990년대 이후에는 경영 분야의 분류 문제를 위해 많은 연구자들이 인공신경망(back-propagation neural network), 사계기반추론(case-based reasoning), 서포트 벡터 머신(support vector machine) 등과 같은 인공지능을 통한 접근법을 이용하여 통계적 방법보다 분류 성과 측면에서 우수함을 입증해왔다. 기존의 기업의 부도에 관한 연구에서 많은 연구자들이 재무비율을 이용하여 부도 예측 모형을 구축하는 것에 초점을 맞추어왔다. 부도예측에 관한 연구가 꾸준히 진행되고 있는 반면, 부도의 세부적인 유형을 예측하여 제시하는 것에 대한 연구는 미흡한 실정이었다. 따라서 본 연구에서는 수익성, 안정성, 활동성 지표를 중심으로 국내 비외감 건설업 기업들의 부도 여부뿐만 아니라 부도의 세부적인 유형까지 예측 가능한 모형을 개발하고자 한다. 본 연구에서는 부도 유형을 예측하기 위해 두 개의 인공신경망 모형을 결합한 하이브리드 접근법을 제안하였다. 첫 번째 인공신경망 모형은 부도예측을 위한 역전파 인공신경망을 이용한 모형이며, 두 번째 인공신경망 모형은 부도 데이터를 몇 개의 유형으로 분류하는 자기조직화지도(self-organizing map)을 이용한 모형이다. 실험 결과를 통해 정의된 5개의 부도 유형인 심각한 부도(severe bankruptcy), 안정성 부족(lack of stability), 활동성 부족(lack of activity), 수익성 부족(lack of profitability), 회생 가능한 부도(recoverable bankruptcy)는 재무 비율에 따라 유형별로 상이한 특성을 갖는 것을 확인할 수 있었다. 본 연구 결과를 통해 신용 평가 분야의 연구자와 실무자들이 기업의 부도의 유형에 대한 유용한 정보를 얻을 것으로 기대한다.

비대칭 오류 비용을 고려한 XGBoost 기반 재범 예측 모델 (A Recidivism Prediction Model Based on XGBoost Considering Asymmetric Error Costs)

  • 원하람;심재승;안현철
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.127-137
    • /
    • 2019
  • 재범예측은 70년대 이전부터 전문가들에 의해서 꾸준히 연구되어온 분야지만, 최근 재범에 의한 범죄가 꾸준히 증가하면서 재범예측의 중요성이 커지고 있다. 특히 미국과 캐나다에서 재판이나 가석방심사 시 재범 위험 평가 보고서를 결정적인 기준으로 채택하게 된 90년대를 기점으로 재범예측에 관한 연구가 활발해졌으며, 비슷한 시기에 국내에서도 재범요인에 관한 실증적인 연구가 시작되었다. 지금까지 대부분의 재범예측 연구는 재범요인 분석이나 재범예측의 정확성을 높이는 연구에 집중된 경향을 보이고 있다. 그러나 재범 예측에는 비대칭 오류 비용 구조가 있기 때문에 경우에 따라 예측 정확도를 최대화함과 동시에 예측 오분류 비용을 최소화하는 연구도 중요한 의미를 가진다. 일반적으로 재범을 저지르지 않을 사람을 재범을 저지를 것으로 오분류하는 비용은 재범을 저지를 사람을 재범을 저지르지 않을 것으로 오분류하는 비용보다 낮다. 전자는 추가적인 감시 비용만 증가되는 반면, 후자는 범죄 발생에 따른 막대한 사회적, 경제적 비용을 야기하기 때문이다. 이러한 비대칭비용에 따른 비용 경제성을 반영하여, 본 연구에서 비대칭 오류 비용을 고려한 XGBoost 기반 재범 예측모델을 제안한다. 모델의 첫 단계에서 최근 데이터 마이닝 분야에서 높은 성능으로 각광받고 있는 앙상블 기법, XGBoost를 적용하였고, XGBoost의 결과를 로지스틱 회귀 분석(Logistic Regression Analysis), 의사결정나무(Decision Trees), 인공신경망(Artificial Neural Networks), 서포트 벡터 머신(Support Vector Machine)과 같은 다양한 예측 기법과 비교하였다. 다음 단계에서 임계치의 최적화를 통해 FNE(False Negative Error)와 FPE(False Positive Error)의 가중 평균인 전체 오분류 비용을 최소화한다. 이후 모델의 유용성을 검증하기 위해 모델을 실제 재범예측 데이터셋에 적용하여 XGBoost 모델이 다른 비교 모델 보다 우수한 예측 정확도를 보일 뿐 아니라 오분류 비용도 가장 효과적으로 낮춘다는 점을 확인하였다.

네트워크 중심성 척도가 추천 성능에 미치는 영향에 대한 연구 (A Study on the Effect of Network Centralities on Recommendation Performance)

  • 이동원
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.23-46
    • /
    • 2021
  • 개인화 추천에서 많이 사용되는 협업 필터링은 고객들의 구매이력을 기반으로 유사고객을 찾아 상품을 추천할 수 있는 매우 유용한 기법으로 인식되고 있다. 그러나, 전통적인 협업 필터링 기법은 사용자 간에 직접적인 연결과 공통적인 특징을 기반으로 유사도를 계산하는 방식으로 인해 신규 고객 혹은 상품에 대해 유사도를 계산하기 힘들다는 문제가 제기되어 왔다. 이를 극복하기 위하여, 다른 기법을 함께 사용하는 하이브리드 기법이 고안되기도 하였다. 이런 노력의 하나로서, 사회연결망의 구조적 특성을 적용하여 이런 문제를 해결하려는 시도가 있었다. 이는, 직접적으로 유사성을 찾기 힘든 사용자 간에도 둘 사이에 놓인 유사한 사용자 또는 사용자들을 통해 유추해내는 방식으로 상호 간의 유사성을 계산하는 방식을 적용한 것이다. 즉, 구매 데이터를 기반으로 사용자의 네트워크를 생성하고 이 네트워크 내에서 두 사용자를 간접적으로 이어주는 네트워크의 특성을 기반으로 둘 사이의 유사도를 계산하는 것이다. 이렇게 얻은 유사도는 추천대상 고객이 상품의 추천에 대한 수락여부를 결정하는 척도로 활용될 수 있다. 서로 다른 중심성 척도는 추천성과에 미치는 영향이 서로 다를 수 있다는 점에서 중요한 의미를 갖는다 할 수 있다. 이런 유사도의 계산을 위해서 네트워크의 중심성을 활용할 수 있다. 본 연구에서는 여기서 더 나아가 이런 중심성이 추천성과에 미치는 영향이 추천 알고리즘에 따라서도 다를 수 있다는 데에서 주목하여 수행되었다. 또한, 이런 네트워크 분석을 활용한 추천기법은 신규 고객 혹은 상품뿐만 아니라 전체 고객 혹은 상품으로 그 대상을 넓히더라도 추천 성능을 높이는 데 기여할 것을 기대할 수 있을 것이다. 이런 관점에서 본 연구는 네트워크 모형에서 연결선이 생성되는 것을 이진 분류의 문제로 보고, 추천 모형에 적용할 분류 기법으로 의사결정나무, K-최근접이웃법, 로지스틱 회귀분석, 인공신경망, 서포트 벡터 머신을 선택하고, 온라인 쇼핑몰에서 4년2개월간 수집된 구매 데이터로 실험을 진행하였다. 사회연결망에서 측정된 중심성 척도를 각 분류 기법에 적용하여 생성한 모형을 비교 실험한 결과, 각 모형 별로 중심성 척도의 추천성공률이 서로 다르게 나타남을 확인할 수 있었다.