• 제목/요약/키워드: 서포트 벡터 회귀분석

검색결과 66건 처리시간 0.03초

밀키트 제품 리뷰 데이터를 이용한 텍스트 분석 사례 연구 (A Case Study on Text Analysis Using Meal Kit Product Review Data)

  • 최혜선;연규필
    • 한국콘텐츠학회논문지
    • /
    • 제22권5호
    • /
    • pp.1-15
    • /
    • 2022
  • 본 연구에서는 밀키트 제품 평가에 영향을 미치는 요인을 파악하기 위하여 밀키트 제품 리뷰 데이터에 대한 텍스트 분석을 수행하였다. 분석에 사용된 자료는 네이버 쇼핑 사이트에서 판매되고 있는 밀키트 제품에 대한 리뷰 334,498건을 스크래핑하여 수집하였다. 텍스트 자료에 대한 전처리 과정을 거쳐 제품 리뷰에 빈번히 등장하는 단어를 추출한 후 워드클라우드 및 감성분석을 수행하였다. 감성분석시 제품 리뷰에 대한 긍정 또는 부정의 레이블은 평점을 기준으로 설정하여 반응변수로 활용하였고, 입력변수로는 단어들의 정규화 단어빈도-역문서빈도 (TF-IDF) 값을 구하여 사용하였다. 리뷰의 극성을 판별하는 모형으로는 로지스틱 회귀모형, 서포트 벡터 머신, 랜덤 포레스트 알고리즘을 적용하였으며, 분류 정확도 및 해석가능성을 고려하여 로지스틱 회귀모형을 최종 모형으로 선택한 후 제품 범주별 감성분석 모형으로 사용하였다. 각 제품 범주별로 도출된 로지스틱 회귀모형으로부터 밀키트 제품 구매 후 긍·부정의 감성을 발생시킨 주요 요인들을 밝혀내었다. 결과적으로 텍스트 분석을 통해 밀키트 제품 개발 시 특정 카테고리, 메뉴, 재료에 대한 긍정 요소를 극대화하고 부정적 위험 요소를 제거할 수 있는 기반을 제공할 수 있음을 확인하였다.

전통적인 통계와 기계학습 기반 중국 문화산업 기업의 재무적 곤경 예측모형 연구 (Research on Financial Distress Prediction Model of Chinese Cultural Industry Enterprises Based on Machine Learning and Traditional Statistical)

  • 원도;왕콘;란희;배기형
    • 한국콘텐츠학회논문지
    • /
    • 제22권2호
    • /
    • pp.545-558
    • /
    • 2022
  • 본 연구의 목적은 전통적인 통계과 기계학습(Machine Learning)을 통해 중국 문화산업 기업의 재무적 곤경을 정확하게 예측하는 분석 모형을 탐색하는 데 있다. 예측모형을 구축하기 위하여 중국 128개 문화산업상장 기업의 데이터를 수집하였다. 25개 설명변수로 이뤄진 데이터베이스를 토대로 판별분석과 로지스틱 회귀(Logistic) 등 전통적인 통계 방법과 서포트 벡터 기계(SVM), 결정 트리(Decision Tree)와 랜덤 포레스트(Random Forest) 등 기계학습을 이용한 예측모형을 구축하고 각 모형의 성능 평가를 위해 Python 소프트웨어를 사용한다. 분석 결과, 예측 성능이 가장 좋은 모형은 랜덤 포레스트(Random Forest) 모형으로 95%의 정확도를 보였다. 그 다음은 서포트 벡터 기계(SVM) 모형으로 93%의 정확도를 보였다. 그 다음은 결정 트리(Decision Tree) 모형으로 92%의 정확도를 보였다. 그 다음은 판정분석 모형으로 89%의 정확도를 보였다. 예측 효과가 가장 낮은 모형은 로지스틱 회귀(Logistic) 모형으로 88%의 정확도를 보였다. 이는 중국 문화산업 기업의 재무적 곤경을 예측하면서 기계학습 모형이 전통적인 통계 모형보다 더 좋은 예측 효과를 얻을 수 있음을 설명한다.

머신러닝 기반 페로브스카이트 태양전지 광흡수층 박막 최적화를 위한 연구 (A Study on Optimization of Perovskite Solar Cell Light Absorption Layer Thin Film Based on Machine Learning)

  • 하재준;이준혁;오주영;이동근
    • 한국콘텐츠학회논문지
    • /
    • 제22권7호
    • /
    • pp.55-62
    • /
    • 2022
  • 페로브스카이트 태양전지는 4차 산업혁명으로 사물인터넷, 가상환경 등의 증가에 따른 전력 수요가 급증하면서 점진적으로 고갈되어가는 석유, 석탄, 천연가스 등의 화석연료를 대체할 태양에너지, 풍력, 수력, 해양에너지, 바이오에너지, 수소에너지 등의 신재생 에너지 분야에서 연구가 활발한 부분이다. 페로브스카이트 태양전지는 페로브스카이트 구조를 가진 유-무기 하이브리드 물질을 사용하는 태양전지 소자로 고효율, 저가의 용액 및 저온 공정으로 기존의 실리콘 태양전지를 대체할 수 있는 장점들이 있다. 기존의 경험적 방법으로 예측한 광흡수층 박막을 최적화하기 위해서 소자 특성 평가를 통해 신뢰도를 검증해야 한다. 그러나 광흡수층 박막 소자 특성 평가 비용이 많이 소요되므로 시험 횟수에 제약이 따른다. 이러한 문제점을 해결하기 위하여 광흡수층 박막 최적화의 보조 수단으로 머신러닝이나 인공지능 모델을 이용하여 명확하고 타당한 모델의 개발과 적용 가능성이 무한하다고 본다. 이 연구에서는 페로브스카이트 태양전지의 광 흡수층 박막 최적화를 추정하기 위하여 서포트 벡터 머신의 선형 커널, 가우시안 커널, 비선형 다항식 커널, 시그모이드 커널의 회귀분석 모델을 비교하여 커널 함수별 정확도 차이를 검증하였다.

Prediction of drowning person's route using machine learning for meteorological information of maritime observation buoy

  • Han, Jung-Wook;Moon, Ho-Seok
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권3호
    • /
    • pp.1-12
    • /
    • 2022
  • 해양조난사고 발생 시 해상 익수자의 안전과 생명 보장을 위해 구조자산을 활용한 신속한 탐색 및 구조작전은 매우 중요하다. 본 연구는 해양관측부이에서 수집되는 기상정보에 다중선형회귀분석, 의사결정나무, 서포트벡터머신, 벡터자기회귀, 순환신경망의 LSTM을 활용하여 울릉도 북서해역의 표층해류를 분석하고 유향과 유속에 대한 각각의 예측모형을 구축하여 예측된 유향과 유속정보를 통해 해상 익수자의 이동경로를 예측하는 모형들을 제안한다. 본 연구에서 적용한 다양한 기계학습 모형을 MAE와 RMSE의 성능 평가척도로 비교해 볼 때 LSTM이 가장 우수한 성능을 보였다. 또한, 익수자 이동지점과 예측모형의 예측지점 간 거리 차이에 있어서도 LSTM이 다른 모형들에 비해 탁월한 성능을 나타내었다.

머신러닝 기반 BLE 실내측위 성능 개선 (Machine Learning Based BLE Indoor Positioning Performance Improvement)

  • 문준;박상현;황재정
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.467-468
    • /
    • 2021
  • BLE 비콘을 이용한 실내측위 시스템의 성능 개선을 위해 BLE5.1에서 지원하는 방향탐지 기술 중 도래각을 측정하는 수신기를 제작하고 머신러닝으로 분석하여 최적의 위치를 측정하였다. 머신러닝 모델의 생성과 테스트를 위해 k-최근접 이웃 분류 및 회귀, 로지스틱 회귀, 서포트 벡터머신, 결정트리 인공신경망 및 심층신경망 등을 이용하여 학습하고 시험하였다. 결과로서, 연구에서 제작한 테스트 세트 4를 이용하는 경우 최대 99%의 정확도를 보였다.

  • PDF

머신러닝을 이용한 급성심근경색증 환자의 퇴원 시 사망 중증도 보정 방법 개발에 대한 융복합 연구 (Convergence Study in Development of Severity Adjustment Method for Death with Acute Myocardial Infarction Patients using Machine Learning)

  • 백설경;박혜진;강성홍;최준영;박종호
    • 디지털융복합연구
    • /
    • 제17권2호
    • /
    • pp.217-230
    • /
    • 2019
  • 본 연구는 기존 동반질환을 이용한 중증도 보정 방법의 제한점을 보완하기 위해 급성심근경색증 환자의 맞춤형 중증도 보정방법을 개발하고, 이의 타당성을 평가하기 위해 수행되었다. 이를 위하여 질병관리본부에서 2006년부터 2015년까지 10년간 수집한 퇴원손상심층조사 자료 중 주진단이 급성심근경색증인 한국표준질병사인분류(KCD-7) 코드 I20.0~I20.9의 대상자를 추출하였고, 동반질환 중증도 보정 도구로는 기존 활용되고 있는 CCI(Charlson comorbidity index), ECI(Elixhauser comorbidity index)와 새로이 제안하는 CCS(Clinical Classification Software)를 사용하였다. 이에 대한 중증도 보정 사망예측모형 개발을 위하여 머신러닝 기법인 로지스틱 회귀분석, 의사결정나무, 신경망, 서포트 벡터 머신기법을 활용하여 비교하였고 각각의 AUC(Area Under Curve)를 이용하여 개발된 모형을 평가하였다. 이를 평가한 결과 중증도 보정도구로는 CCS 가 가장 우수한 것으로 나타났으며, 머신러닝 기법 중에서는 서포트 벡터 머신을 이용한 모형의 예측력이 가장 우수한 것으로 확인되었다. 이에 향후 의료서비스 결과평가 등 중증도 보정을 위한 연구에서는 본 연구에서 제시한 맞춤형 중증도 보정방법과 머신러닝 기법을 활용하도록 하는 것을 제안한다.

기계학습을 이용한 돈사 급수량 예측방안 개발 (Prediction of Water Usage in Pig Farm based on Machine Learning)

  • 이웅섭;류종열;반태원;김성환;최희철
    • 한국정보통신학회논문지
    • /
    • 제21권8호
    • /
    • pp.1560-1566
    • /
    • 2017
  • 최근 사물 인터넷 센서가 설치된 스마트 돈사의 보급을 통해 돈사 관련 빅데이터 축적이 가능해졌고, 다양한 기계 학습방안들이 수집된 데이터에 적용되어 축산농가의 생산성을 향상시키고 있다. 본 연구에서는 다양한 기계학습 방안을 이용하여 돈사관리에서 가장 중요한 요소 중 하나인 급수량을 예측하였다. 구체적으로 실제 돈사에서 수집된 데이터에 회귀 방안인 선형회귀, 회귀트리 및 아다부스트 회귀 방안과 분류 방안인 로지스틱 분류, 결정트리 및 서포트 벡터 머신 (SVM) 분류방안을 적용하여 돈사의 온도와 습도를 기반으로 급수량을 예측하였다. 성능 분석을 통해서 제안한 방안이 높은 정확도로 급수량을 예측하는 것을 확인할 수 있었다. 제안한 방안은 돈사의 급수시설 이상을 조기에 파악하는데 활용되어 가축을 폐사를 막고 돈사 생산성을 높이는데 활용될 수 있다.

속성선택방법을 이용한 전기자동차 소셜미디어 데이터의 감성분석 연구 (Exploring the Sentiment Analysis of Electric Vehicles Social Media Data by Using Feature Selection Methods)

  • 프란시스 조셉 코스텔로;이건창
    • 디지털융복합연구
    • /
    • 제18권2호
    • /
    • pp.249-259
    • /
    • 2020
  • 본 연구는 전기자동차(EV)에 대한 소셜미디어 데이터를 기반으로 감성분석 (SA)과 속성선택 (FS)방법을 적용하여 전기자동차에 대한 일반 사람들의 의견을 보다 효과적이고 정확히 예측할 수 있는 새로운 방법론을 제안한다. 구체적인 방법은 다음과 같다. 첫째, 유튜브에 있는 전기자동차에 대한 일반 사람들의 의견을 추출하였다. 둘째, 분석의 효과성을 증대하기 위하여 카이 스퀘어, 정보획득량, 릴리프에프 등 세가지 속성선택 방법을 적용하였다. 그 결과 로지스틱 회귀분석 및 서포트 벡터 머신 분류 기법에서 가장 의미있는 결과를 얻을 수 있다는 것이 확인되었다.

유기화합물의 승화열 예측을 위한 QSPR분석 (QSPR analysis for predicting heat of sublimation of organic compounds)

  • 박유선;이종혁;박한웅;이성광
    • 분석과학
    • /
    • 제28권3호
    • /
    • pp.187-195
    • /
    • 2015
  • 승화열은 대기 유기 오염물질의 확산에 관련된 환경적인 문제를 해결하거나, 위험한 화학 물질의 위해성을 평가하는 데에 중요한 변수이다. 하지만 실험적으로 승화열을 측정하려면 많은 시간과 비용이 소모 되며, 그 실험자체도 복잡하고 위험하다. 따라서 본 연구에서는 유기화합물의 승화열을 간단하게 예측하는 모델을 개발하기 위하여 정량적 구조-물성 상관관계 연구를 이용하였다. 군기반 전진선택방법을 적용하여 다중선형회귀방법과 서포트 벡터 머신과 같은 학습방법에 적합한 분자표현자들을 선택하도록 하였다. 개별 모델과 복합모델들은 부스트래핑 방법과 y-임의추출법에 의해 내부검증이 되었다. 외부 테스트 데이터의 예측 성능은 적용범위를 고려하므로서 개선되었다. 다중선형회귀모델에 따르면, 승화열은 분자간의 분산력, 수소결합, 정전기적 상호작용, 쌍극자-쌍극자 상호작용과 관련이 있는 것을 나타낼 수 있었다.

인공지능과 국토정보를 활용한 노인복지 취약지구 추출방법에 관한 연구 (A Study on the Methodology of Extracting the vulnerable districts of the Aged Welfare Using Artificial Intelligence and Geospatial Information)

  • 박지만;조두영;이상선;이민섭;남한식;양혜림
    • 지적과 국토정보
    • /
    • 제48권1호
    • /
    • pp.169-186
    • /
    • 2018
  • 급속한 고령화 사회에서 노인인구가 갖는 사회적 영향력은 더욱 가속화될 것이다. 본 연구에서는 인공지능 방법론 중 머신러닝, 인공신경망, 국토정보 분석을 통해 노인복지 취약지구를 추출하는 방법론을 정립하는데 목적을 두었다. 분석방향 정립을 위해 65세 이상 노인, 공무원, 노인복지 시설물 담당자와 인터뷰 후 방향을 설정하였다. 경기도 용인시를 대상으로 500 m 공간단위 벡터 기반 격자에 15분 이내 지리적 거리 수용력, 노인복지 향유도, 공시지가, 이동통신 기반 노인활동을 지표로 설정하였다. 10단계 군집형성 후 모의학습 결과 RBF 커널 알고리즘을 활용한 머신러닝 서포트 벡터머신에서 83.2%의 예측정확도가 나타났다. 그리고 역전파 알고리즘을 활용한 인공신경망에서 높은 상관성 결과(0.63)가 나타났다. 변수간 공간적 자기상관성을 분석하기 위해 지리적 가중회귀분석을 수행했다. 분석결과 결정계수가 70.1%로 모형으로 나타나 설명력이 우수한 것으로 나타났다. 변수의 공간적 이상값 여부와 분포패턴을 검토하기 위해 국지적인 공간적 자기상관성 지수인 Moran's I 계수와 Getis-Ord Gi 계수를 분석하였다. 분석결과 용인시 신도시인 수지 기흥구에서 노인복지 취약지구가 발생하는 특성을 보였다. 본 연구의 인공지능 모의방법과 국토정보 분석의 연계는 최근 정부의 지역여건을 고려한 노인복지 불균형을 해결하는데 활용될 수 있을 것이다.