• 제목/요약/키워드: 모형적합도

검색결과 3,259건 처리시간 0.037초

범주형 재무자료에 대한 신용평가모형 검증 비교 (Validation Comparison of Credit Rating Models for Categorized Financial Data)

  • 홍종선;이창혁;김지훈
    • Communications for Statistical Applications and Methods
    • /
    • 제15권4호
    • /
    • pp.615-631
    • /
    • 2008
  • 재무자료에 대한 신용평가모형은 각각의 재무변수를 평활한 예측부도율로 변환하여 사용한다. 본 연구에서는 연속형 재무자료를 변환하여 설정된 신용평가모형의 문제점을 살펴보고, 연속형 재무변수를 다양한 형태로 범주화한 신용평가모형들을 제안한다. 범주형 재무자료를 사용해서 개발한 여러 종류의 신용평가모형들의 성과를 다양한 적합성 검증 방법으로 비교하고, 범주형 재무자료를 이용한 신용평가모형의 유용성을 토론한다.

사서자격제도 개선안 연구 (A Study on the Credential System of Librarian in Korea)

  • 정동열
    • 한국문헌정보학회지
    • /
    • 제41권2호
    • /
    • pp.5-29
    • /
    • 2007
  • 본 연구는 사회 전반적인 환경변화와 대학교육정책의 변화로 야기되어 온 사서자격제도를 중심으로 그 현황과 문제점 제기, 선행연구와 외국의 사례분석, 국내 학계와 도서관 현장의 의견을 종합적으로 분석하여 우리나라실정에 적합한 여러 가지 방안을 제시하는데 목적이 있다. 사서자격제도에 대한 개선 방안을 크게 네 가지로 구분하여 내부 전문성 강화 모형, 전공이수 최소학점제 모형, 자격시험제도 모형, 전문대학원 모형을 제안하고 있다. 본 연구에서 제안한 네 가지 모형을 중심으로 앞으로 학계와 도서관 현장에서 더욱 깊이 있는 연구와 논의를 통하여 보다 적합한 새로운 모형의 사서자격제도 개발이 요구된다.

이변량 포아송분포를 이용한 K-리그 골 점수의 예측 (Prediction of K-league soccer scores using bivariate Poisson distributions)

  • 이장택
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권6호
    • /
    • pp.1221-1229
    • /
    • 2014
  • 30년 동안의 K-리그 자료를 득점과 실점이 서로 상관이 있다는 가정과 R 패키지를 사용하여 12개의 서로 다른 이변량 포아송모형에 적합시켰다. 그 결과 AIC와 BIC 판정기준 아래에서 공변량 효과가 상수인 이변량 포아송모형이 가장 타당하며, 영과잉 및 대각확대 모형은 필요하지 않은 것으로 나타났다. 제안된 모형은 홈경기의 효과, 팀별 공격능력과 수비능력 및 적합도를 구하는 데 사용될 수 있다.

건강검진 데이터 기반 흡연자 분류를 위한 모형별 성능 분석 (Performance Evaluation between Models for Smoker Classification Based on Health Examination Data)

  • 윤지선;유헌창
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.648-651
    • /
    • 2018
  • 흡연여부를 감별하는 지표가 있지만 반감기 등 여러 가지 요인에 따라 결과가 변한다는 단점이 있다. 그렇기 때문에 흡연여부 감별 시 외부요인에 영향을 덜 받는 지표가 필요하게 되었다. 그래서 흡연 여부 감별하는데 적합한 모형을 찾아 외부요인에 영향이 적은 지표를 개발에 도움이 될 것을 기대하며 연구를 진행하였다. 실험은 국민건강보험공단에서 제공한 건강검진정보데이터를 기반으로, SVM, Logistic Regression, KNN 등의 머신러닝 모델을 이용하여 흡연 여부를 감별하는 것을 진행한다. 이 실험은 속성에 따른 모형의 성능변화와 학습데이터 수에 따른 모형의 성능변화에 대한 2가지 측면에서 모델의 성능을 측정하였다. 모델의 평가는 정확도(accuracy), 정밀도(precision), 재현율(recall), 조화 평균(f1-score)으로 진행하였으며, 약 70퍼센트 정도의 정확도와, 60퍼센트 대의 재현율을 보인다. 실험 결과, SVM이 속성에 따른 모형의 성능 변화 실험에서는 63%의 재현율, 학습데이터 수에 따른 성능 변화 실험에서는 68%의 재현율을 보여, 흡연자 판별에 가장 좋은 성능을 보였다. 또한 재현율을 기준으로 실험 차수별로 가장 좋은 성능을 보인 모델과 가장 저조한 성능을 보인 모델의 차이를 비교한 결과, '속성에 따른 모형의 성능 변화 실험'에서는 최고 36%의 차이를 보였으며, '학습데이터 수에 따른 성능 변화 실험'에서 최고 42%의 차이를 보여 주었다. 이에 판별을 위한 속성도 중요하지만, 적합한 모형 선택 또한 중요하다는 것을 확인하였다.

매개변수와 유역특성인자 사이의 상호연관성을 고려한 강우-유출모형 지역화 (Regionalization of Rainfall-Runoff Model Based on Relationship Between Model Parameters and Watershed Characteristics)

  • 김진국;오랑치맥 솜야;김태정;김장경;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.293-293
    • /
    • 2021
  • 자연유량이란 인위적 행위에 의한 하천의 유량 변화가 없는 개발되지 않은 상태의 하천유량을 말하며, 실제 유량을 측정하거나 관측자료를 활용한 장기유출모형을 통해 산정할 수 있다. 미계측 유역에 대한 강우-유출 모형 구축시, 무엇보다 실제 미계측유역에 적용시 나타날 수 있는 문제점을 최소화할 수 있는 방향으로 모형 개발이 이루어지는 것이 필요하다. 강우-유출 모형 매개변수의 수가 많아질수록 과적합(over-fitting)의 발생 소지가 증가하게 되며, 지역화 모형 구축시 불확실성을 더욱 가중시키게 된다. 이러한 이유로, 모형의 검정보다는 검증에 초점이 맞춰져 있어야 하며, 더불어 사용되는 강우-유출 모형의 매개변수가 적어야 한다. 본 연구에서는 대표 강우-유출모형의 선정시 여러 평가 기준 중 예측의 정확성 측면에서 통계적 지표를 통해 모형의 수행능력에 중점을 두었으며, 적은 개수의 매개변수를 갖음에도 불구하고 상대적 우수한 모의결과를 제공하는 GR4J(Ge'nie Rural a 4 parame tres Journalier)모형을 최적 유출모형으로 선정하여 댐 상류유역에 대한 자연유량 재현성능을 평가하였다. 최종적으로 강우-유출모형의 최적매개변수와 유역특성인자 사이의 상호연관성을 고려해 매개변수를 지역화하기 위하여, 본 연구에서는 두 가지 이상의 변량에 대한 상관성을 효과적으로 재현하는데 효과적이며, 자유로운 주변확률분포 선택과 결합확률분포의 추정이 용이한 장점이 있는 Copula 함수를 활용하였다. 제시된 방법론에 대한 적합성을 평가하기 위해 교차검증 관점에서 지역화된 매개변수의 적합성을 검토하였으며, 본 연구에서 도출된 결과는 유역특성에 따른 미계측유역의 자연유량 산정시 지역 매개변수를 강우-유출모형에 활용함으로써 신뢰성 있는 자연유량 산정 결과를 제공할 수 있을 것으로 판단된다.

  • PDF

CART분석을 이용한 교통사고예측모형의 개발 (Developing the Traffic Accident Prediction Model using Classification And Regression Tree Analysis)

  • 이재명;김태호;이용택;원제무
    • 한국도로학회논문집
    • /
    • 제10권1호
    • /
    • pp.31-39
    • /
    • 2008
  • 본 연구는 도로기하구조 요인과 교통사고간의 관계를 규명하기 위하여 CART분석을 이용하여 전국의 4차로 국도를 대상으로 교통사고예측모형을 개발하고, 다중회귀모형, 확률회귀모형과 CART분석모형을 비교 분석하여 개발한 모형의 적합도를 검증하였다. 연구결과로는 첫째, 변수간의 복합적인 상호관계를 설명할 수 있는 CART분석을 이용하여 국도의 교통사고 예측모형을 개발하고 도로기하구조 요인에 따라 표준교통사고율을 의미하는 교통사고발생도표를 제시하였다. 둘째, CART분석모형에 근거하여 교통사고 발생률에 큰 영향을 미치는 도로기하구조 요인이 구간거리(km), 횡단보도폭(m), 횡단길어깨(m), 교통량 순으로 나타났다. 셋째, CART분석모형의 적합도 검증결과, CART분석모형이 실제교통사고율을 타 모형에 비해 전반적으로 잘 묘사하고 있었으나, 각 모형별로 교통사고율의 크기에 따라 교통사고율이 비교적 낮은 구간에서는 다중회귀모형이, 평균이상의 교통사고율을 나타내는 구간에서는 포아송 회귀모형의 예측력이 높았으며, CART분석모형은 교통사고율의 크기와 상관없이 우수한 예측력을 보였다. 넷째, 도출된 교통사고발생도표는 도로기하구조 조건에 따른 표준교통사고율을 제시해주기 때문에 도로설계 시에 안전한 기하구조 설계요소 선정기준을 제시 할 뿐만 아니라, 교통사고 잦은 지점개선사업추진 시 사업의 우선순위를 판단할 수 있는 기준을 제시하는 등 정책적 활용도가 매우 높을 것으로 판단된다.

  • PDF

정규분포기반 두각 혼합모형의 순환적 적합을 이용한 군집분석에서의 변수선택 (Variable Selection in Clustering by Recursive Fit of Normal Distribution-based Salient Mixture Model)

  • 김승구
    • 응용통계연구
    • /
    • 제26권5호
    • /
    • pp.821-834
    • /
    • 2013
  • Law 등 (2004)은 군집분석에서 변수선택을 위해 정규분포기반 "두각 혼합모형(salient mixture model)"의 사용을 제안하였다. 본 논문에서는 이 모형의 적합 상의 문제점과 변수선택의 결함을 지적하고 그 대안을 제시한다. 모의자료와 실자료를 바탕으로 제안된 방법이 기존의 방법보다 유용함을 보였다.

편스플라인 추정량의 편의에 대한 점근 정규성 (Asymptotics Normality for Bias fo Partial Spline Estimator)

  • 추인선;최재룡
    • 응용통계연구
    • /
    • 제13권2호
    • /
    • pp.371-381
    • /
    • 2000
  • 비모수 회귀모형에 있어서 평활스플라인에 대하여 언급하고, 그 간단한 성질을 다룬다. 선형회귀나 다항식회귀에서는 적합하기 나쁜 데이터가 많이 존재한다. 설명변수가 여러 개인 경우에 준모수 회귀모형은 하나 혹은 그 이상의 변수에 대해서는 비모수 함수를 다른 변수에 대하서는 선형함수를 적합시켜 그들의 가법성을 가정한 것이다. 준모수 회귀모형에 있어서 선형부분의 회귀계수의 추정량에 편의가 발생하고, 여기서는 그 편의에 대한 점근 정규성을 다룬다

  • PDF

WMS모형을 이용한 가곡천유역의 유출해석 (Runoff Analysis of Gagok Stream Basin using WMS Model)

  • 최종호;전계원
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.450-450
    • /
    • 2015
  • 우리나라는 최근 기후변화로 인한 이상기후의 영향으로 태풍 및 국지성 집중호우의 발생빈도가 잦아지고 있으며, 이에 따른 풍수해 피해 양상 또한 과거와 비교되지 않을 만큼 대형화 되고 있다. 본 연구대상지역인 가곡천 유역은 강원도 산지로부터 발원하여 동해안으로 유입되는 산지하천 중 하나로 유로연장이 짧고 경사가 급하여 홍수기시 홍수도달시간이 매우 짧은 특징을 가지고 있어 하류부에서의 피해가 증가하고 있는 실정이다. 실제로 대상하천의 경우 2002년 태풍루사와 2003년 태풍매미 등에 의해 피해가 컸던 것으로 조사되었으며, 이러한 피해를 저감하기 위해서 정확한 유역의 유출해석이 필요하다. 따라서 본 연구에서는 가곡천 유역의 치수대책 수립을 위한 설계홍수량을 산정하기 위해 GIS 수문프로그램인 WMS(Watershed Modeling System)를 이용하여 수문해석에 필요한 수문인자들을 추출하고, WMS에 내장되어 있는 HEC-1 모형을 이용하여 유출해석을 수행하였다. 가곡천 유역에 대한 모형의 적합성 여부를 판별하기 위해 실제측정에 의해서 만들어진 수위-유량관계곡선과의 비교를 통해 모형의 적합성 여부를 검토하였다.

  • PDF

청년 취업자의 직무만족도와 이직의사 변화의 잠재계층에 대한 이중 변화형태 모형의 적용 (Dual Trajectory Modeling Approach to Analyzing Latent Classes in Youth Employees' Job Satisfaction and Turnover Intention Trajectories)

  • 노언경;홍세희;이현정
    • 한국조사연구학회지:조사연구
    • /
    • 제12권2호
    • /
    • pp.113-144
    • /
    • 2011
  • 본 연구의 목적은 청년 취업자의 직무만족도와 이직의사의 다양한 변화형태를 추정하여 잠재계층을 분류하고, 두 변수에 영향을 미치는 직무적합도(전공적합도, 교육수준적합도, 기술수준적합도)와의 효과를 밝히는 것이다. 이를 위하여 청년패널 2001의 만 15∼29세 청년 취업자를 대상으로 한 2001년부터 2006년까지의 종단자료를 이용하였다. 직무만족도와 이직의사의 잠재계층을 동시에 도출하기 위해 준모수적 집단중심 접근 방법의 확장모형인 이중 변화형태 모형(dual trajectory model)을 적용하였다. 분석 결과, 직무만족도 변화에 따른 잠재계층은 4개로 분류되었고, 변화형태에 따라 증가집단, 감소집단, 중간수준집단, 고수준집단으로 명명하였다. 이직의사 변화에 따른 잠재 계층은 3개로 분류되었고, 변화형태에 따라 저수준집단, 유지집단, 급감소집단으로 명명하였다. 직무만족도와 이직의사에 시간의존적 변수인 전공적합도, 교육수준적합도, 기술수준 적합도의 영향력을 검증한 결과, 직무만족도가 낮거나 이직의사가 높은 집단에는 교육수준 적합도 또는 기술수준적합도의 영향력이 유의하게 나타났다. 본 연구는 오랜 기간 직무만족도가 낮거나 이직의사를 지속적으로 가지고 있는 청년 취업자들을 위한 대책을 마련하는데 도움을 줄 것이다. 또한 잠재계층 모형을 확장시켜 두 가지 변수의 잠재계층을 동시에 도출하고, 그 잠재계층을 결정짓는 데 미치는 시간의존적 독립변수의 효과를 검증하는 종단연구 방법을 적용했다는 점에서 연구방법론적 측면에서 의의가 있다.

  • PDF