• 제목/요약/키워드: 회귀분석기법

검색결과 1,082건 처리시간 0.033초

근적외선 분광기법과 인공신경망을 이용한 식용유지의 산패 분석 (Rancidity Estimation of Perilla Seed Oil using NIR Spectroscopy and Multi-variate Analysis Techniques)

  • 이아영;홍석주;노신정;박희수;김용노;김기석
    • 한국농업기계학회:학술대회논문집
    • /
    • 한국농업기계학회 2017년도 춘계공동학술대회
    • /
    • pp.98-98
    • /
    • 2017
  • 대부분의 가정과 요식업체, 식품가공업계에서 이용하고 있는 식용유지는 저장 및 가공과정 중에 산패가 빈번하게 일어나게 된다. 기존에는 유지 산패를 측정하기 위해 산가, 과산화물가 등을 측정하는 이화학적인 적정방법을 이용하였는데 실험자의 숙련도에 따라 결과의 오차가 발생할 수 있고, 반복실험으로 인한 시간과 비용이 많이 소모되는 등 여러 제약사항을 포함하고 있어 식용유지의 산패를 실시간 비파괴적으로 분석할 수 있는 기술의 개발에 많은 관심이 모아지고 있다. 따라서, 본 연구에서는 식용유지의 저장조건에 따른 산패정도를 비파괴적으로 평가하기 위한 근적외선 분광분석과 인공신경망 분석기술을 개발하여 그 실효성을 평가하였다. 식물성 식용유지인 들기름을 특정 온도에서 일정한 시간동안 저장하면서 이화학적 적정방법을 통해 산가와 과산화물가를 측정하였으며 동일한 시료의 근적외선 투과스펙트럼을 획득하였다. 수집된 정보를 이용하여 유지 산패 예측 모델을 개발하기 위해 다변량 분석기법 (주성분 회귀분석, 최소자승 회귀분석과 인공신경망 분석)을 적용하였다. 분석 결과, 인공신경망 분석모델이 산가 ($R^2_{tra}:0.9037$, $R^2_{val}:0.8175$, $R^2_{test}:0.8555$)와 과산화물가 ($R^2_{tra}:0.9210$, $R^2_{val}:0.9341$, $R^2_{test}:0.8286$)의 예측 성능이 가장 우수한 것으로 확인되었다. 본 연구의 결과들은 농산물과 식품의 성분 측정뿐만 아니라 다른 산업분야에서도 유용하게 활용될 수 있을 것으로 기대되어진다.

  • PDF

산재보험 부정수급 식별모형에 관한 연구 (A Study on the Fraud Detection of Industrial Accident Compensation Insurance)

  • 함승오;홍정식
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 2008년도 추계학술대회 및 정기총회
    • /
    • pp.342-345
    • /
    • 2008
  • 산재 발생 시 산재근로자는 근로복지공단을 통해서 각종 급여를 받게 된다. 본 논문은 심사 과정과 급여지급 후에 부정수급으로 판명된 산재 청구 건을 데이터 마이닝을 통해서 분석하여 부정수급의 유형을 발견하고자 한다. 이 연구에서는 서울관내 4개 지사에서 8년 동안(2000년$\sim$2007년)의 총 61,536명의 최초요양 신청을 한 산재근로자 자료를 대상으로 하였고, 종속변수에 영향을 미치는 8개의 독립변수를 선택해서 사용한다. 데이터 마이닝을 적용함에 있어서 가장 효율적인 허위 부정 탐지 모델을 만들기 위해 의사결정나무분석(Decision Tree)과 로지스틱 회귀분석(Logistic Regresion)등의 다양한 기법을 적용하여 결과를 비교분석 하고, 오분류 비용을 적용하여, 최적의 분류결정 값을 가지는 모델을 도출한다. 분석결과, 로지스틱 회귀분석이 산재보험 부정수급 유형 발견에 보다 효과적인 모델로 판명되었다. 또한 판별점(Cut-Off) 0.01로 했을 때 4개변수(요양기간, 업종형태, 의료기관, 재해발생형태)가 부정수급에 탐지하는데 영향력이 큰 변수로 선정되었다.

  • PDF

데이터 마이닝을 이용한 교통사고 심각도 분류분석 (Data Mining for Road Traffic Accident Type Classification)

  • 손소영;신형원
    • 대한교통학회지
    • /
    • 제16권4호
    • /
    • pp.187-194
    • /
    • 1998
  • 본 연구는 교통사고 심각도와 관련된 중요변수를 찾고 이들 변수를 바탕으로 신경망, Decision Tree, 로지스틱 회귀분석을 이용하여 사고 심각도 분류 예측모형을 추정하였다. 다수의 범주형 변수로 이루어진 교통사고 통계원표상의 설명변수 들로부터 사고 심각도 변화에 영향력 있는 변수 선택을 위하여 독립성 검정을 위한 $x^2$ test와 Decision Tree를 이용하였고, 선택된 변수들은 신경망과 로지스틱 회귀분석의 기초로 이용되었다. 분석결과 세가지기법간에 분류정확도에는 유의한 차이가 없는 것으로 나타났다. 그러나 Decision Tree가 설명변수 선택능력과 분석수행시간, 사고 심각도 결정요인 식별의 용이함 측면에서 범주형 종속변수인 사고 심각도의 분석에 적합한 것으로 보이며 사고 심각도에는 보호장구가 가장 큰 영향을 미치는 것으로 재입증되었다.

  • PDF

데이터 마이닝을 이용한 교통사고 심각도 분류분석 (Data Mining for Road Traffic Accident Type Classification)

  • 손소영
    • 대한교통학회:학술대회논문집
    • /
    • 대한교통학회 1998년도 Proceedings 제34회 추계 학술발표회
    • /
    • pp.373-381
    • /
    • 1998
  • 본 연구는 교통사고 심각도와 관련된 중요변수를 찾고 이들 변수를 바탕으로 신경망, Decision Tree, 로지스틱 회귀분석을 이용하여 사고 심각도 분류 예측모형을 추정하였다. 다수의 범주형 변수로 이루어진 교통사고 통계원표상의 설명변수 들로부터 사고 심각도변화에 영향력 있는 변수선택을 위하여 $X^2$ 독립성 검정과 Decision Tree를 이용하였고, 선택된 변수들은 신경망과 로지스틱 회귀분석의 기초로 이용되었다. 분석결과 세가지기법간에 분류정확도에는 유의한 차이가 없는 것으로 나타났다. 그러나 decision Tree가 설명변수 선택능력과 분석수행시간, 사고 심각도 결정요인 식별의 용이함 측면에서 범주형 종속변수인 사고 심각도의 분석에 적합합 것으로 보이며 사고 심각도에는 보호장구가 가장 큰 영향을 미치는 것으로 재입증되었다.

  • PDF

비선형 평균 일반화 이분산 자기회귀모형의 추정 (Estimation of nonlinear GARCH-M model)

  • 심주용;이장택
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권5호
    • /
    • pp.831-839
    • /
    • 2010
  • 최소제곱 서포트벡터기계는 비선형회귀분석과 분류에 널리 쓰이는 커널기법이다. 본 논문에서는 금융시계열자료의 평균 및 변동성을 추정하기 위하여 평균의 추정 방법으로는 가중최소제곱 서포트벡터기계, 변동성의 추정 방법으로는 최소제곱 서포트벡터기계를 사용하는 비선형 평균 일반화 이분산 자기회귀모형을 제안한다. 제안된 모형은 선형 일반화 이분산 자기회귀모형 및 선형 평균 일반화 이분산 자기회귀모형보다 더 나은 추정 능력을 가진다는 것을 실제자료의 추정을 통하여 보였다.

K-F기법으로 실업자 수의 소지역추정 - 경제활동인구조사를 중심으로 -

  • 양영춘;이상은;신민웅
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2002년도 추계 학술발표회 논문집
    • /
    • pp.305-309
    • /
    • 2002
  • 소지역에서 직접(direct) 시계열추정을 할 수 있다면, 소지역들 추정에서 최적선형 불편예측량(BLUP)을 일반화 시킬 수 있다. 특히 조사에서 얻어지는 관측 값의 오차가 시간상으로 상관관계가 있다면 Kalman-Filter(K-F)기법이 사용 될 수 있다. 이 연구는 소지역의 실업자 수 추정에서 K-F기법으로 경제활동인구수를 이용하여 현 시점의 소지역 실업자 수를 예측함수(BLUP)를 통해 추정하였다. 그리고 단순 회귀분석 추정치와 비교하였다.

  • PDF

연속형 반응변수를 위한 데이터마이닝 방법 성능 향상 연구 (A study for improving data mining methods for continuous response variables)

  • 최진수;이석형;조형준
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권5호
    • /
    • pp.917-926
    • /
    • 2010
  • 배깅과 부스팅의 기법은 예측력을 향상 시킨다고 알려져 있다. 이는 비교 실험을 통하여 성능이 검증 되었는데, 목표변수가 범주형인 경우에 특정 의사결정나무 알고리즘인 회귀분류나무만 주로 고려되었다. 본 논문에서는 의사결정나무 외에도 다른 데이터마이닝 방법도 고려하여 목표변수가 연속형인 경우에 배깅과 부스팅 기법의 성능 검증을 위한 비교 실험을 실시하였다. 구체적으로, 데이터마이닝 알고리즘 기법인 선형회귀, 의사결정나무, 신경망에 배깅 및 부스팅 앙상블 기법을 결합하여 8개의 데이터를 비교 분석하였다. 실험 결과로 연속형 자료에 대한 여러 데이터마이닝 알고리즘에도 배깅과 부스팅의 기법이 성능 향상에 도움이 되는 것으로 확인되었다.

초분광 영상을 활용한 최대추정가능수심 산정 기법 개발 (Estimation of maximum measurable depth using hyperspectral image)

  • 서영철;김동수;유호준;권영화
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.444-444
    • /
    • 2022
  • 하천 수심 계측은 수심을 사람이 직접 계측하거나 초음파 기반 유속계 (ADCP) 등 최신 계측기기를 이용하여 간접적으로 계측을 실시하고 있다. 하지만 사람이 직접 하천에서 수심을 측정하는 것은 위험이 동반되고, 수심자료의 측정오차가 크게 발생한다. 따라서 수심측정에서 직접 측정 방식의 한계를 극복하기 위해, 초분광 영상의 반사도와 수심이 높은 상관관계를 보이는 것을 활용하여, 초분광 영상 기반 수심 산정 기법을 개발하였다. 초분광 영상 기반 수심 산정 기법은 복수의 파장이 존재하는 초분광영상으로부터 두 개의 파장대의 밴드를 추출하여 모든 경우의 수에 대해 밴드비를 산정한 후, 실측수심과 밴드비 간의 회귀분석을 실시하여 상관계수가 가장 높은 회귀식을 찾아내는 방식이 최적 밴드비 분석법에 기반한다. 최적 밴드비 분석법을 통해 획득된 높은 상관성의 밴드비-수심 관계식을 이용하여 수심을 추정할 수 있다. 이러한 방법은 직접 수심 측정 방식에 비해, 높은 해상도와 밀도, 양질의 데이터를 수집할 수 있는 장점이 있다. 과거 연구에 따르면 저수심부에서의 높은 정확도의 수심추정 결과를 보였지만, 고수심부에서는 실측수심과의 오차도 높아지는 등 정확성이 떨어지는 경향을 보인다. 따라서 본 연구에서는 보다 효율적인 수심계측을 할 수 있도록 최적 밴드비 분석법을 활용한 수심추정에서 신뢰성 있는 수심의 범위를 파악할 수 있는 방법을 제시하고자 한다. 본 연구에서는 대상지역으로 낙동강 본류와 황강 지류 합류부로 선정하였고, 초음파 기반 유속계(ADCP)와 드론을 활용하여 실측수심과 초분광 영상을 취득하였다. 민감도 분석을 위한 수심자료를 0.5m 단위로 분할하였으며, 구간별로 최적 밴드비 분석을 실시하였다. 그 결과, 구간별로 산정된 상관계수와 평균제곱근오차 (RMSE)를 통해 정확도가 높은 구간을 구별할 수 있었다. 또한 해당 구간을 초과하는 수심은 초분광 영상을 통해 추정이 어려운 것으로 판단되며, 분석한 구간까지를 최대 추정 가능 수심으로 정의하였다. 마지막으로 검증을 위해 최대추정가능수심으로 판단된 구간까지의 데이터만 활용하여 최적 밴드비 분석법을 적용하여 상관계수나 평균제곱근오차 결과의 개선여부 확인을 통해, 본 연구에서 제시한 방법이 정확한 최대추정가능수심 구간을 산정할 수 있는지 확인하였다.

  • PDF

로지스틱 회귀분석 기법을 이용한 강원도 산사태 취약성 평가 및 분석 (Evaluation and Analysis of Gwangwon-do Landslide Susceptibility Using Logistic Regression)

  • 연영광
    • 한국지리정보학회지
    • /
    • 제14권4호
    • /
    • pp.116-127
    • /
    • 2011
  • 본 논문에서는 로지스틱 회귀분석 기법을 이용하여 산사태 취약성 분석을 수행하였다. 예측모델의 성능은 모델의 적합도 검증을 통해 사용된 데이터가 모델에 얼마나 잘 반영되어 구축되었는지에 대한 적합도 평가뿐만 아니라 예측성능에 대한 평가가 필요하다. 따라서 이 논문에서는 모델에 대한 객관적인 결과를 얻기 위해 이와 같은 두 가지 측면에 대하여 예측성능 평가를 적용하였다. 연구지역은 2006년도 집중 호우로 많은 산사태가 발생한 강원도 인제 일대를 대상으로 하였다. 산사태 관련인자들은 지형도, 토양도, 임상도로부터 추출하였다. 예측모델에 대한 평가는 누적이득차트 곡선의 하부영역을 계산하였다. 예측모델의 적합도 평가에서는 87.9% 교차검증을 통한 예측정확도 평가 결과 84.8%로 두 평가 결과간의 큰 차이를 보이지 않으며 좋은 성능의 결과를 산출하였다. 이는 산사태와 관련성이 높은 유발인자와 예측모델 성능에서 기인된 결과로 해석 될 수 있다.

학생 중도탈락 예측 모델에 관한 연구 (A Study on the Prediction Model for Student Dropout)

  • 이종혁;김대학;길준민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.37-40
    • /
    • 2018
  • 빅데이터 산업 부상과 함께 교육 데이터 분석 분야가 새롭게 주목받고 있다. 교육 현장에서 학습 데이터의 양과 종류는 꾸준히 증가하고 있고 이를 분석하기 위한 정보기술도 계속 발전하고 있다. 한편, 학교 교육은 사회적 성취와 밀접한 관련이 있어 사회이동의 중요한 수단이 되는 만큼 학교 교육으로부터 이탈할 위험이 있는 학생들을 조기에 발견하여 이탈을 방지하는 것은 매우 중요하다. 본 논문은 대학생의 중도탈락을 예방하기 위해 로지스틱 회귀분석과 다층 퍼셉트론 기법을 이용해 학습 데이터를 분석하여 예측 모델을 생성하고 해당 모델을 평가한다. 평가 결과, 다층 퍼셉트론 모델이 로지스틱 회귀분석 모델에 비해 정확도와 재현율은 우수하였지만 정밀도는 약간 저조하였다.