• 제목/요약/키워드: 사후오차평가

검색결과 20건 처리시간 0.028초

Gradient Boosting 모형을 이용한 중소기업 R&D 지원금 결정요인 분석 (Who Gets Government SME R&D Subsidy? Application of Gradient Boosting Model)

  • 강성원;강희찬
    • 한국전자거래학회지
    • /
    • 제25권4호
    • /
    • pp.77-109
    • /
    • 2020
  • 본 논문에서는 그래디언트 부스팅 모형을 활용하여 정부의 중소기업 연구개발 지원 결정에 영향을 미치는 요인들을 파악하였다. 기존 연구가 사후적으로 정부의 연구개발 지원이 수혜 기업에 미친 영향을 분석하는 것에 중점을 두었다면, 본 논문은 정부의 연구개발 지원 결정 방식을 파악하고, 그 방식이 기업에게 제공하는 유인을 분석하고자 하였다. 이를 위하여 본 논문은 지원금 결정에 영향을 미치는 다양한 잠재적 요인들을 선택하고, 기계학습 접근법을 활용하여 추정오차 축소효과가 큰 요인들을 선별하였다. 구체적으로 본 논문은 한국과학기술평가원이 구축한 국가연구개발조사분석 자료와 한국신용평가자료를 연결한 자료에 그래디언트 부스팅(Gradient Boosting) 모형을 적용하여 지원금 추정모형을 구축하였다. 본 논문에서 구축한 그래디언트 부스팅 모형은 선형회귀분석 응용모형에 비해 평균제곱근오차를 7.20% 축소할 수 있었다. 각 변수의 순열 중요도(permutation importance)를 분석한 결과 연구성과지표 및 연구개발비가 추정오차 축소에 기여가 큰 것으로 파악되었다. 그리고 각 변수의 부분의존도(Partial Dependence Plot: PDP) 및 SHAP 값(SHAP value: SHapley Additive exPlanation value)을 분석한 결과 연구성과지표가 좋고 연구개발비 지출이 큰 기업이 많은 연구개발 지원금을 받는 반면, 영업이익이 크고 자기자본회전율이 높은 기업은 적은 지원금을 받는 경향이 발견되었다. 본 연구의 결과는 현재 중소기업 연구개발 지원금 배분 방식이 연구성과지표 제고 및 연구개발투자 증가 유인은 제공하나, 기업 경영성과 제고 유인은 취약함을 시사한다.

복부 컴퓨터 단층촬영영상에서 다중 확률 아틀라스 기반 형상제한 그래프-컷을 사용한 신실질 자동 분할 (Automatic Segmentation of Renal Parenchyma using Graph-cuts with Shape Constraint based on Multi-probabilistic Atlas in Abdominal CT Images)

  • 이재선;홍헬렌;나군호
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제22권4호
    • /
    • pp.11-19
    • /
    • 2016
  • 본 논문에서는 복부 CT 영상에서 다중 확률 아틀라스 기반 형상제한 그래프-컷을 사용한 신실질 자동 분할 방법을 제안한다. 제안 방법은 다음의 세 단계로 구성된다. 첫째, 신실질의 다양한 형상정보를 이용하기 위해 피질기반 유사정합을 통한 다중 확률 아틀라스를 생성한다. 둘째, 최대사후확률 추정을 통해 그래프-컷의 초기 씨앗을 추출하고, 형상제한 그래프-컷을 통해 신실질을 분할한다. 셋째, 확률 아틀라스의 정합 오차를 줄이고 분할 정확도를 높이기 위해, 정합 및 분할을 반복적으로 수행한다. 제안방법의 성능을 평가하기 위해 정성적 평가 및 정량적 평가를 수행하였다. 실험결과 제안방법이 신실질과 유사한 밝기값을 갖는 주변 영역으로의 누출을 방지하여 개선된 분할 정확도를 보여준다.

이질적 과분산계수가 기대 교통사고건수 추정에 미치는 영향 (Impact of Heterogeneous Dispersion Parameter on the Expected Crash Frequency)

  • 신강원
    • 한국산학기술학회논문지
    • /
    • 제15권9호
    • /
    • pp.5585-5593
    • /
    • 2014
  • 본 연구는 기대 교통사고건수 추정을 위해 사용되는 SPF의 이질적 분산계수의 유의성이 이질적 사전분포에 직접적인 영향을 받는다는 가설을 검증하고, 이질적 사전분포에 대한 모형 오설정이 교통 안전개선 사업의 평가결과에 주는 영향의 특성을 분석하기 위해 수행되었다. 구체적으로 본 연구에서는 이질적 분산계수의 유의성과 이질적 사전분포의 연관성을 검증하기 위해 모의실험을 통해 이질적 사전분포를 발생시킨 후 이를 NB모형과 HNB모형을 이용하여 SPF를 추정하여 이질적 과분산계수가 SPF의 평균함수 및 분산함수에 주는 영향을 분석하였다. 또한 추정된 계수추정치를 이용한 사전분포의 초모수 추정치의 오차특성과 이질적 과분산계수를 고려하지 않았을 경우 발생하는 교통사고감소계수(CRF)의 오차 부호와 크기를 상세 분석하여 제시하였다. 모의실험 자료 분석결과 이질적 분산계수의 오추정은 포아송 사전분포의 평균에는 큰 영향을 주지 않으나 분산의 크기를 변화시켜 궁극적으로는 기대교통사고건수의 추정량인 사후평균의 값에 오차를 발생시킬 수 있으며, 구체적으로 이질적 분산함수를 NB모형으로 오설정할 경우 CRF의 값은 참값에 비해 최대 120%의 오차를 발생시키는 것으로 나타났다.

해부학 가상강의에 따른 가상강의실 활용도, 만족도, 학업성취도 간의 상관관계 (Evaluation of e-learning in the anatomical education : The correlation between utilization frequency, satisfaction and academic achievement)

  • 김광환;김지희;박정현
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2010년도 추계학술발표논문집 2부
    • /
    • pp.901-903
    • /
    • 2010
  • 본 연구에서는 2007-2009년에 간호학과 및 스포츠과학부 해부학 강의에 있어 가상강의를 실시하였고 이에 따른 학생들의 가상강의 컨텐츠의 만족도와 가상강의실 활용빈도에 따른 학업성취도와의 상관관계를 분석하였다. 2007-2009학년도 1학기 해부학 강의를 가상강의 방식으로 수강한 2개 학과 231명을 대상으로 강의 종료 후 가상강의실 게시판 및 컨텐츠 활용 빈도, 개별 설문조사, 학기말 성적을 확보하여 상호간의 상관관계를 분석하였다. 각 학과별 일반 특성을 보기 위하여 연속 변수의 경우 평균과 표준오차를, 범주형 변수의 경우 그 분포 퍼센트를 이용하여 제시하였다. 학과별로 모든 학생들의 총점을 3분위수로 구분하여 낮음, 중간, 높음으로 분류하였으며, 조사된 모든 변수들의 일반 선형성을 GLM 모델을 이용하여 검증하였다. 사후 검증은 최소자승법을 이용하여 실시하였으며, 이를 이용하여 각각의 세부 집단별 점수 차이에 대한 유의성을 평가하였다. 관련 항목들 간 상관성 분석을 위하여 스피어만 상관계수를 이용하여 p 값 0.05를 기준으로 유의성 검증을 실시하였다. 모든 통계분석은 SAS 9.12 버전을 이용하여 분석하였다. 설문 대상자들은 학과와 해부학 성적에 상관없이 가상강의 전반에 대해 높은 만족도를 가졌다. 해부학 성적이 좋을수록 가상강의실 접속횟수가 유의하게 높았다. 아울러 해부학 성적이 좋을수록 난이도가 낮고 흥미도는 높게 나타났다. 또한 평가 요인들 간의 상관관계를 분석한 결과, 가상강의의 만족도는 흥미도와 전공과의 연계성과 밀접한 관련이 있었다. 가상강의 게시판을 통한 과제물 관리, 질의응답에 대한 적절성에 대해서는 성적에 따라 일부 유의한 차이가 나타났으나 높은 만족도를 나타내었다. 결론적으로 건강 및 의료 전공자들을 위한 해부학 강의에 있어 가상강의의 도입과 적용은 성공적이었으며, 이는 해부학 전공 교수진이 매우 부족한 현실에서 해부학 강의의 질적 저하를 막고 효율적인 교육을 위한 대안이 될 것으로 판단된다. 단, 해부학 가상강의 컨텐츠의 개선, 자료 보강 및 가상강의의 접근성 확보는 시급히 개선해야할 과제로 남아 있다.

  • PDF

비선형 회귀분석, 인공신경망, 구조방정식을 이용한 지방부 4지 신호교차로 교통사고 예측모형 성능 비교 연구 (A Comparative Study On Accident Prediction Model Using Nonlinear Regression And Artificial Neural Network, Structural Equation for Rural 4-Legged Intersection)

  • 오주택;윤일수;황정원;한음
    • 대한교통학회지
    • /
    • 제32권3호
    • /
    • pp.266-279
    • /
    • 2014
  • 도로의 안전성을 평가하기 위한 방법으로서 교통사고 자료를 이용하는 방법, 사전-사후평가를 통한 방법 또는 전문가 의견이나 기존 문헌을 통한 방법 등 다양한 방법들이 존재한다. 특히, 교차로 교통 안전성을 평가하는 경우 많은 연구들이 교통사고예측모형 개발을 통하여 교통사고와 관련한 원인과 안전성을 평가하고 있다. 교통사고예측모형 개발에 있어서 모형의 예측력과 전용성을 확보하는 것이 중요하다. 즉, 예측력을 확보함으로써 교통사고 건수나 교통 안전성 판단의 지표를 예측하는데 오차를 줄일 수 있고, 전용성을 확보함으로써 개발된 모형이 다른 지점이나 구간에 적용하더라도 문제없이 적용될 수 있는 대표성을 가질 수 있다. 따라서 본 연구에서는 교통사고예측모형 개발에 주로 사용되는 회귀모형과 인공신경망, 구조방정식을 이용하여 교통사고예측모형을 각각 개발하였으며, 개발될 모형의 예측력과 전용성을 평균절대오차와 평균제곱예측오차를 기준으로 확인하였다. 90개소 신호교차로의 모형개발자료를 이용하여 세 가지 방법으로 교통사고예측모형을 개발 후 개발데이터를 통해 예측력을 비교한 결과 인공신경망이 가장 높은 예측력을 보였다. 또한 모형의 전용성 검증을 위하여 별도로 수집한 33개소 신호교차로의 모형검증자료를 이용하여 개발된 모형을 검증한 결과 비선형 회귀모형이 가장 적합한 것으로 나타났다. 모형개발 과정에서 가장 높은 예측력을 보인 인공신경망의 경우 다른 대상지에서 수집된 모형검증 자료를 적용하였을 때 예측력에 큰 변화를 보여 전용성이 떨어진 것으로 분석되었다.

Bayesian 회귀분석과 변동점 분석을 이용한 수위-유량 관계곡선 불확실성 분석 (Uncertainty Analysis of Stage-Discharge Curve Based on Bayesian Regression Model Coupled with Change-Point Analysis)

  • 권현한;김장경
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2012년도 학술발표회
    • /
    • pp.364-364
    • /
    • 2012
  • 수자원 연구의 주요 목적인 효과적인 홍수 및 가뭄관리를 하기 위해서는 그 연구의 기초가 되는 자료를 관측하고 정도(accuracy, 精度)를 향상시키는 연구 또한 매우 중요한 부분이라고 볼 수 있다. 이러한 점에서 수위-유량측정의 경우, 관측자의 숙련도와 계측기 오차에 따라 관측값에 미치는 영향이 큰 특징을 갖고 있어 유량측정의 정확성을 높이고자 진보된 계측기의 개발 및 분석 방법에 관한 연구는 꾸준히 진행되고 있다. 일반적으로 유량을 추정하기 위해서 특정 단면에서의 수위를 측정하여 이를 수위-유량 관계곡선을 통해서 유량으로 환산하고, 수위-유량 관계를 측정한 후 이를 회귀분석 방법으로 내삽 및 외삽을 실시하여 유량을 측정하게 된다. 그러나 수위-유량 관계곡선에서 저수위와 고수위를 하나의 곡선식으로 하게 되는 경우 정도가 낮아지게 되므로 많은 경우에 있어서 저수위, 고수위를 각각의 곡선으로 구하여 사용하고 있다. 문제는 이러한 경우 정량적으로 변곡점을 구하기보다는 경험적으로 저수위와 고수위를 구분하고 있으며, 수위-유량관계를 회귀식에 의해서 추정하게 되므로 이에 대한 불확실성이 발생하게 된다. 따라서 본 연구에서는 불확실성을 정량화시키기 위한 방법으로 Bayesian MCMC 기법을 활용하며 수위-유량 관계곡선식의 매개변수들의 사후분포를 추정하여 매개변수의 최적화 및 불확실성을 평가하였다. 앞서 언급되었듯이 저수위 및 고수위로 분리하여 수위-유량 곡선식을 도출하고 있으나 저수위 및 고수위를 분리하는 기준이 경험적이기 때문에 신뢰성이 저해되는 문제점이 발생한다. 본 연구에서는 수위-유량 곡선식의 매개변수들을 최적화 하는 동시에 Poisson 분포 기반의 변동점 분석이 연동되어 저수위 및 고수위를 분리할 수 있는 Bayesian 기반 통합 수위-유량 곡선 해석 방법을 개발하고자 한다.

  • PDF

갑상선의 확산강조영상 검사 시 실리콘 이용한 뒤틀림 감소에 관한 연구 (A study on image distortion improvement using silicon device in thyroid diffusion MRI images)

  • 최관우;서대건;이호범;고희진;나사라;한동균
    • 한국산학기술학회논문지
    • /
    • 제15권7호
    • /
    • pp.4380-4386
    • /
    • 2014
  • 본 연구는 갑상선의 확산강조영상 검사 시 조직과 공기 간 자화율차이를 줄임으로서 영상의 뒤틀림을 감소시키고자 하였다. 연구대상은 정상인 23명을 대상으로 하였으며, 공기와 인접해 있고 주변에 후두와 기관이 자리 잡고 있어 뒤틀림이 많이 발생하는 갑상선을 대상으로, 실리콘 적용 전 후 확산강조영상의 뒤틀림과 오차율을 비교평가 하였다. 연구결과 실리콘 적용 전보다 적용 후가 뒤틀림이 감소된 것을 볼 수 있으며, 오차율 또한 30%대에서 10%대로 감소하는 것을 볼 수 있었다. 또한 일원배치분산분석과 Duncan의 사후분석을 통해서도 실리콘 적용 후가 기준영상인 T2 강조영상의 면적과 차이가 없음을 알 수 있었다. 결론적으로 본 연구는 선행연구들의 복잡한 과정 없이 자기공명신호의 대조도에 영향을 주지 않으면서 공기와 맞닿은 굴곡진 부분을 보상함으로써 영상의 뒤틀림을 감소시킬 수 있는 근본적인 개선 방안을 제시하였다는 데에 커다란 의의가 있다.

한·미 FTA 체결 이후 감귤산업 영향 평가 (An Ex-post Impact Assessment of the KOR-USA Free Trade Agreement on the Korean Citrus Industry)

  • 김배성;김만근
    • 한국산학기술학회논문지
    • /
    • 제21권4호
    • /
    • pp.538-545
    • /
    • 2020
  • 한미 FTA 체결 이후 미국산 오렌지의 지속적인 수입증가에 따른 국내 감귤산업 파급영향에 대한 관심이 높다. 이 연구는 한미 FTA 발효 이후 2012-2017년 동안의 감귤산업의 변화를 계측하고, 한미 FTA 도입이 감귤산업에 미치는 사후 영향을 평가하였다. 이 연구는 분석을 위해 감귤류를 노지감귤, 하우스감귤, 만감류 부문으로 구분하고, 각 부문별 수급균형모형을 구축하여 시뮬레이션 분석에 이용하였다. 각 부문내 주요 방정식들은 응용계량경제학 방법을 이용하여 추정하고, 각 부문별 수급구조모형은 동태축차적 시뮬레이션모형으로 구축하여 2012-2017년 동안에 대해 연차별로 정책 시뮬레이션이 가능하도록 하였다. 각 모형은 작물연도를 기준으로 구축되었고, 해당 시기에 수입되는 오렌지, 체리 등에 수입산 대체가능 작물에 대한 효과를 고려할 수 있도록 설계되었다. 시뮬레이션 분석에 앞서 각 부문별 모형에 대한 예측력을 RMSPE, MAPE, Theil의 불균등계수 등을 기준으로 검토하였다. MAPE 기준으로 노지감귤, 하우스감귤, 만감류의 재배면적 1-7%, 생산량 5-9%, 소비량 5-10%, 경락가격 5-10% 내외의 오차율을 보여, 각 부문별 모형의 주요 변수에 대한 추정치들의 예측력이 전반적으로 양호한 수준으로 나타났다. 예측력 검토결과를 바탕으로 시뮬레이션 분석을 실시한 결과, 한미 FTA 발효 이후 2012-2017년 연평균 조수입(실질)이 노지감귤 23.9억 원, 하우스감귤 30.1억원, 만감류 151.1억 원 감소한 것으로 나타났다. 또한 이 논문은 기존에 2018년 정부부문(KREI)에서 실시한 영향평가방법 및 결과의 차이점을 비교 검토하고 해석시 유의사항 및 정책적 함의를 제안하고 있다.

인구총조사의 방법과 평가 (Methods and Evaluation of Korean Population Census)

  • 김태헌
    • 한국인구학
    • /
    • 제20권1호
    • /
    • pp.27-46
    • /
    • 1997
  • 일반적으로 우리나라의 인구 총조사 자료는 질적으로 매우 우수한 것으로 알려져 있다. 조사의 완전성이 최소 97% 이상을 유지하고 있으며 연령보고의 오류도 세계에서 가장 낮은 그룹에 속하고 있다. 그러나 연령계층별 오차율의 차이, 조사방법의 비경제성 등은 앞으로 개선되어야할 분야이다. 그러므로 우리나라의 장래 발전을 위하여 실제 고려 할 수 있는 주요 사항을 다음과 같이 정리하였다. 1. 국민 모두 기초 교육을 받은 우리 사회에서 자계식 조사의 재시도를 적극 검토하여 면접 타계식 조사의 한계를 극복하고, 경비를 절약할수있는 방안을 강구할때이다. 2. 정확한 연령을 파악하기 위하여는 4개의 조사사항(보통나이, 띠, 생년월일,양음력)을 질문하여 연령조사방법은 노력에 비하여 실효성이 높지 않으므로 조사 항목의 단순화를 검토할때이다. 3. 사후 조사를 더욱 연구하여 연령 자료만이 아니라 그외 주요조사항목에 대한 정확한 평가 결과를 공표하여 활용하면 총 조사의 발전과 좋은 결과를 얻을수 있는 계기가 될것이다. 4. 영유아인구와 이동이 많은 연령계층의 순 누락이 많은것은 총조사가 반복되어도 계속나타나는 현상이므로 특히 이 연령계층에 해당되는 인구의 확인을 위한 조사항목을 두어서라도 조사의 정확성을 높이는데 노력하여야 한다. 5. 표본 조사 자료를 중심으로 1995년 총조사 2% 표본 Data File을 조기에 편집하여 일반에 공개함으로써 특성별 자료의 활용가치를 높여야 할것이다. 또한 통계자료의 효율성은 시계열 축적에 있으므로 1985년 이전 총조사 2% 자료의 File화와 시계열의 축적이 가능해질때 우리나라 사회과학연구의 발전에 직접적인 도움이 될것이다.

  • PDF

탄산수의 알칼리도 및 총 탄소 측정방법 비교 연구 (A Comparison Study of Alkalinity and Total Carbon Measurements in $CO_2$-rich Water)

  • 조민기;채기탁;고동찬;유용재;최병영
    • 한국지하수토양환경학회지:지하수토양환경
    • /
    • 제14권3호
    • /
    • pp.1-13
    • /
    • 2009
  • 탄산수를 대상으로 알칼리도 및 총 탄소 측정 방법의 타당성을 평가하기 위하여 산중화 적정법, 역적정법, 침전법, NDIR-TC 측정법 등 다양한 측정방법을 적용하였다. 인공적으로 제조한 탄산수(ACW(Artificial $CO_2$-rich Water): pH = 6.3, alkalinity = 68.8 meq/L, $HCO_3^-$ = 2,235 mg/L)의 알칼리도 및 총 탄소를 측정한 결과, 탄산수 제조와 동시에 측정된 시료에서는 상기한 모든 측정방법에서 비교적 정확한 측정값을 얻어내었다. 이때 퍼센트 오차는 0~12% 수준이었으며, 반복측정 분산분석(repeated measure ANOVA)의 사후 분석 결과 각 측정 방법간 차이는 95% 신뢰수준에서 없는 것으로 판정되었다. 또한 이때 정밀도(분산계수)도 4% 이내로 재현성이 높은 측정 방법이라고 할 수 있다. 탄산수와 같이 $CO_2$가 탈기(脫氣: degassing)되는 경우 각 측정 방법의 정도관리를 위하여 24시간, 48시간 동안 $CO_2$를 탈기시킨 후 각 측정 방법을 적용하였다. 그 결과 산중화 적정법과 NDIR-TC 방법으로 측정된 알칼리도는 $CO_2$의 탈기에 상관없이 일정한 값을 유지하고 있었다. 이는 알칼리도의 보존성에 기인한 결과로 해석된다. 반면, 역적정법과 침전법으로부터 구한 알칼리도는 증가하는 것으로 나타났다. 한편 총 탄소 함량은 꾸준히 감소하여 48시간후에는 최대 약 50%의 $CO_2$가 탈기된 것으로 평가되었다. 역적정법과 침전법으로부터 구한 알칼리도가 높아진 이유는 총 탄소 함량이 다른 방법에 비하여 높게 측정되었고, $CO_2$ 탈기를 모델링 한 결과, 측정된 총 탄소 함량에 평형인 pH보다 측정된 pH가 높기 때문이다. 이는 ACW에 잔류한 $CO_2$ 기포의 영향으로 생각된다. $CO_2$ 탈기에 의해 발생한 $CO_2$ 기포는 pH를 낮추지 못하고 알칼리도에 영향을 주지는 않기 때문에 산중화 적정법과 NDIR-TC 측정에서는 분석되지 않지만 역적정과 침전법을 적용하여 총 탄소를 분석할 경우에는 측정값에 포함된다. 따라서 탄산수에서 알칼리도 및 총 탄소의 측정과 해석을 정확하게 하기 위해서는 역적정법이나 침전법을 이용하여 측정한 결과를 비교 검토하는 것이 필요하다. 이 연구의 결과는 탄산수 연구나 $CO_2$ 지중저장에 관련된 연구에 활용될 수 있다. 특히 $CO_2$ 지중저장 연구에 응용될 경우 탈기되지 않는 $CO_2$ 기포의 함량을 반영할 수 있기 때문에 심부 지중의 pH를 보정하거나 $CO_2$의 지중 거동과 $CO_2$ 저장 용량 평가에 응용될 것으로 기대된다. 이 연구를 기반으로 고온 고압 환경에서 직접 총 탄소를 정확하고 편리하게 측정하기 위한 방법을 개발할 예정이다.