• 제목/요약/키워드: 일반화 교차타당성

검색결과 11건 처리시간 0.03초

비대칭 라플라스 분포를 이용한 분위수 회귀 (Quantile regression using asymmetric Laplace distribution)

  • 박혜정
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권6호
    • /
    • pp.1093-1101
    • /
    • 2009
  • 분위수 회귀모형은 확률변수들 사이에 확률적인 관계구조를 포함한 함수 모형을 좀 더 완벽하게 추정하도록 제공한다. 본 논문에서는 함수 추정에 로버스트하다고 알려져 있는 서포트벡터기계 기법과 이중벌칙커널기계를 이용하여 분위수 회귀모형을 추정하고자 한다. 이중벌칙커널기계는 고차원의 입력변수에 대한 분위수 회귀가 요구될 때 분위수 회귀모형을 잘 추정한다고 알려져 있다. 또한 본 논문에서는 광범위한 형태의 분위수 회귀모형 추정을 위해서 정규분포보다 비대칭 라플라스 분포를 이용한다. 본 논문에서 제안한 모형은 분위수 회귀모형 추정을 위해서 서포트벡터기계 기법에 이중벌칙커널기계를 이용하여 각각의 평균과 분산을 동시에 추정한다. 평균과 분산함수 추정을 위해 사용된 커널함수의 모수들은 최적의 값을 찾기 위해 일반화근사 교차타당성을 이용한다.

  • PDF

가변계수 측정오차 회귀모형 (Varying coefficient model with errors in variables)

  • 손인석;심주용
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권5호
    • /
    • pp.971-980
    • /
    • 2017
  • 가변계수 회귀모형은 회귀계수의 동적변화를 모형화함으로써 종속변수와 입력변수의 관계에 대한 쉬운 해석이 가능하고 회귀계수의 변동성도 추정할 수 있는 장점을 지니고 있으므로, 여러 과학 분야에서 많은 주목을 받고 있다. 본 논문에서 입력변수와 출력변수의 오차를 효과적으로 고려한 가변계수 오차모형을 제안한다. 가변계수가 평활변수의 알려지지 않은 형태의 비선형함수이므로 이를 추정하기 위하여 커널 방법을 사용한다. 제안된 모형의 성능에 영향을 미치는 초모수의 최적값을 구하기 위하여 일반화 교차타당성 방법 또한 제안한다. 제안된 방법은 모의자료와 실제자료를 이용한 수치적 연구를 통하여 평가된다.

인체측정조사에서 측정곤란부위 예측을 위한 의사결정나무 추천 모형 탐지에 관한 연구 (A Study on Exploration of the Recommended Model of Decision Tree to Predict a Hard-to-Measure Mesurement in Anthropometric Survey)

  • 최종후;김선경
    • 응용통계연구
    • /
    • 제22권5호
    • /
    • pp.923-935
    • /
    • 2009
  • 본 연구는 의사결정나무의 추천 모형 선택을 위한 비교실험에 초점을 두고 있다. 의사결정나무 모형은 구축된 모형에 기반을 두고 미래 관측치에 대한 예측 기능을 수행하게 될 것이므로 구축된 모형이 아무리 정치(精緻)하다고 하더라도 일반화의 성질을 충족시키지 못하면 실제성이 없게 된다. 따라서 본 연구는 교차타당성 검토를 통해 일반화의 성질을 충족시키면서 우수한 예측력을 갖는 추천 모형을 탐지하는 절차를 연구하는 데에 초점을 맞추고 있다. 사례 연구로 인체측정자료를 사용하여 측정곤란부위 예측을 위한 의사결정나무 추천 모형을 탐지한다. 그 결과 CART 모형 이 추천 모형으로 탐지되었다.

비선형 평균 일반화 이분산 자기회귀모형의 추정 (Estimation of nonlinear GARCH-M model)

  • 심주용;이장택
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권5호
    • /
    • pp.831-839
    • /
    • 2010
  • 최소제곱 서포트벡터기계는 비선형회귀분석과 분류에 널리 쓰이는 커널기법이다. 본 논문에서는 금융시계열자료의 평균 및 변동성을 추정하기 위하여 평균의 추정 방법으로는 가중최소제곱 서포트벡터기계, 변동성의 추정 방법으로는 최소제곱 서포트벡터기계를 사용하는 비선형 평균 일반화 이분산 자기회귀모형을 제안한다. 제안된 모형은 선형 일반화 이분산 자기회귀모형 및 선형 평균 일반화 이분산 자기회귀모형보다 더 나은 추정 능력을 가진다는 것을 실제자료의 추정을 통하여 보였다.

일반화된 자기 형성 진화 알고리즘의 개발과 제어 문제에 대한 효율적 응용에 대한 연구 (A generalized self organizing evolutionary algorithm and its efficient application to control problems)

  • 정일권;이주장
    • 제어로봇시스템학회논문지
    • /
    • 제3권3호
    • /
    • pp.259-264
    • /
    • 1997
  • 널리 쓰이는 진화 알고리즘은 크게 두가지가 있다. 유전 알고리즘과 진화 기법이 그것이다. 이들 알고리즘은 실행 전에 사용자가 정해주어야 하는 변수들을 가지고 있다. 본 논문에서는 이 두 알고리즘을 일반화시키고 집단의 크기, 교차변이 연산자 적용 확률 그리고 돌연변이 연산자 적용 확률과 같은 변수들을 알고리즘이 수행되는 동안 스스로 정하는 일반화된 자기 형성 진화 알고리즘을 제안한다. 제안된 알고리즘의 타당성과 효용성은 시스템 동정화와 다개체 시스템 제어의 두가지 복잡한 제어 문제에 대한 적용을 통해 보여진다.

  • PDF

커널기계 기법을 이용한 일반화 이분산자기회귀모형 추정 (Estimating GARCH models using kernel machine learning)

  • 황창하;신사임
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권3호
    • /
    • pp.419-425
    • /
    • 2010
  • 커널기계 기법은 최근 대용량 또는 고차원 비선형 자료를 분석하는 방법으로 인기를 많이 얻고 있다. 본 논문에서는 주식시장 수익률의 조건부 변동성을 예측하기 위한 일반화 이분산자기회귀모형을 추정하기 위해 커널기계 기법을 사용한다. 일반화 이분산자기회귀모형은 자료가 정규분포를 따른다고 가정한 후 주로 최대우도법을 사용하여 추정된다. 본 논문에서는 꼬리가 두꺼운 분포를 갖는 금융시계열자료의 변동성을 추정할 때 커널기계 기법이 최대우도법과 서포트벡터기계 보다 더 정확한 예측능력을 가진다는 것을 보이고자 한다.

준지도 커널능형회귀모형에 관한 연구 (A study on semi-supervised kernel ridge regression estimation)

  • 석경하
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권2호
    • /
    • pp.341-353
    • /
    • 2013
  • 데이터마이닝과 기계학습의 응용분야에서는 라벨 없는 자료를 이용하는 연구가 많이 진행되고 있다. 이러한 연구는 분류문제에 집중되었다가 최근에 회귀분석문제로 관심이 모아지고 있다. 본 연구에서는 커널능형회귀모형 형태의 준지도 회귀분석 방법을 제시한다. 제안된 방법은 기존의 전환적 방법과는 달리 라벨 없는 자료의 라벨을 추정하는 과정을 필요로 하지 않기 때문에 선택해야 할 모수의 수도 적고, 계산과정도 단순할 뿐 아니라 일반화에 강점이 있다. 모의실험과 실제 자료 분석을 통해 제안된 방법이 라벨 없는 자료를 잘 활용하여 라벨 있는 자료만 이용하는 방법보다 더 우수한 추정을 하는 것을 볼 수 있었다.

생존자료분석을 위한 혼합효과 최소제곱 서포트벡터기계 (Mixed effects least squares support vector machine for survival data analysis)

  • 황창하;심주용
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권4호
    • /
    • pp.739-748
    • /
    • 2012
  • 최소제곱 서포트벡터기계 (least squares support vector machine)는 분류 및 비선형 회귀분석에서 유용하게 사용되고 있는 통계적 기법이다. 본 논문에서는 각 집단별로 생존자료가 관측된 경우 적용할 수 있는 LS-SVM을 제안한다. 제안된 모형은 임의우측 중도절단자료를 비선형 회귀모형에 적용할 수 있게 Kaplan- Meier의 중도절단분포의 추정값을 이용하여 구해진 가중값을 사용하고, 집단 간의 변동을 나타내기 위하여 임의효과항을 포함한다. 벌칙상수와 커널모수의 최적값을 구하기 위하여 일반화 교차타당성함수가 사용되고 모의실험에서는 임의효과항을 포함하지 않은 LS-SVM과 성능을 비교함으로써 제안된 방법의 우수성을 보이기로 한다.

영화흥행 영향요인 선택에 관한 연구 (A Study for the Drivers of Movie Box-office Performance)

  • 김연형;홍정한
    • 응용통계연구
    • /
    • 제26권3호
    • /
    • pp.441-452
    • /
    • 2013
  • 국내 영화 산업은 투자 배급사 멀티플렉스로 수직 계열화된 대기업 중심으로 온라인 구전 마케팅이 활발히 진행되고 있다, 최근에는 대기업 계열의 멀티플렉스 영화관 중심으로 3D 4D 영화포맷 복합상영을 통해 up-selling을 통한 흥행성과 극대화를 도모하고 있다. 영화산업 기술진보와 흥행여건 변화에 따라, 기존 관객 수 대신 매출액을 흥행성과로 정의하고, 국내 개봉 상업영화를 대상으로 축소추정기법을 포함한 여러 회귀모형을 적용하였다. 특히 LASSO회귀의 경우, 교차타당성 방법을 이용한 예측오차가 가장 적고 흥행성과에 설명력이 높은 변수 순으로 의미 있는 독립변수들을 빠르고 효율적으로 선택할 수 있었다. 2013년도 1분기 개봉 영화를 대상으로 실증분석 결과, 개봉 후 온라인 평점과 빈도 모두 영향력이 높았으나, 개봉 전에는 온라인 평점만 효과적인 것으로 나타났다. 상영포맷 또한 흥행성과에 유의한 영향을 미치는 것으로 나타났다.

"가족관계척도" 활용을 위한 타당도 연구 (The Family Relationship Scale : Re-validation)

  • 양옥경;이민영
    • 한국사회복지학
    • /
    • 제54권
    • /
    • pp.5-33
    • /
    • 2003
  • 본 연구는 가족을 단위로 개입하는 사회복지 실천 및 연구 현장에 적합한 가족관계를 측정하기 위해 개발된 척도의 일반화 가능성을 검증하는 연구이다. 사회복지분야에서 2001년 개발된 "가족관계척도"를 도구로 하여, 이론적, 논리적 고찰을 통한 액면타당도 검증을 하였으며, 기혼자 집단 분석을 통한 실증적 타당도 검증을 하였다. 액면타당도를 위한 내용분석 결과 정서친밀요인은 긍정적 정서표현, 수용존중요인은 공감, 인정책임요인은 자율성과 유연성의 개념으로 타당도를 확인할 수 있었다. 실증타당도를 위한 분석결과는 구성타당도, 기준관련 타당도, 변별력으로 나누어 실시하였으며, 구성타당도를 위한 탐색적 요인분석에서 누적설명량은 54%, 각 하위요인별 문항들은 0.45 이상의 안정된 부하량을 보여주었고, 확인적 요인분석에서도 모형에 대한 부합지수가 높게 나타났다. 기준관련타당도 중 예측타당도를 위한 회귀분석과 판별분석 결과, 가족관계의 점수가 높을수록 가족스트레스 인식이 유의미하게 낮아지며, 가족스트레스 상 하위집단에서 유의미한 판별이 나타남을 확인하였다. 동시타당도를 위한 상관관계분석 결과 "가족관계척도"의 설명변인으로 부부(r=.54) 및 부모자녀간 의사소통(r=.64)이 가장 높은 긍정적 관계를 보인다. 삶의 만족 수준과 정신건강 수준도 가족관계 수준에 유의미한 긍정적 상관관계를 나타내 가족관계척도와의 수렴타당도를 설명하였고, 신체적 건강 수준은 가족관계 수준과 미약한 관계를 보여주어 가족관계척도의 판별타당도를 보여주는 근거로 검토되었다. 마지막으로 인구사회학적 특성에 따른 가족관계척도의 변별력을 살펴본 결과, 연령, 결혼형태, 경제적 수준, 학력에 대한 "가족관계척도"가 유의미한 차이를 보여주었다. 이상과 같은 연구결과는 대학생 집단을 통해 개발된 "가족관계척도"가 기혼자 집단에서 교차타당성(cross validation)이 확보됨을 보여주고 있으며, 이전 연구에서 밝히지 못한 다양한 기준관련 타당도와 인구사회학적 변별력을 통해 타당도의 일반화를 높였음을 보여주는 것이라 할 수 있다. 또한 사회복지분야에서 처음 개발된 "가족관계척도"가 가족을 대상으로 하는 사회복지연구 및 실천현장에서 사회측정도구(sociometric)로 활용되는데 있어 보다 실증적인 가능성을 제시한 것이라 할 수 있다.

  • PDF