• 제목/요약/키워드: 회귀알고리즘

검색결과 556건 처리시간 0.025초

로지스틱회귀모형의 로버스트 추정을 위한 알고리즘 (Algorithm for the Robust Estimation in Logistic Regression)

  • 김부용;강명욱;최미애
    • 응용통계연구
    • /
    • 제20권3호
    • /
    • pp.551-559
    • /
    • 2007
  • 로지스틱회귀에서 일반적으로 사용되는 최대우도추정법은 이상점에 대해 로버스트 하지 않다. 따라서 본 논문에서는 로지스틱회귀모형의 로버스트 추정을 위한 알고리즘을 제안하고자 한다. 이 알고리즘은 V-마스크 형태의 경계기준에 의해 나쁜 지렛점과 수직이상점을 식별하고, 식별 결과를 바탕으로 이상점의 영향력을 감소시키기 위한 효과적인 방안을 모색한다. 이상점의 영향력 감소는 가중치와 조정치를 적절히 선정함으로 가능하며, 그 결과 붕괴점이 높은 추정치를 얻게 된다. 제안된 알고리즘을 다양한 자료에 적용하여 정분류율을 측정하여 비교하였는데, 새로운 알고리즘이 최대우도추정보다 정확한 분류를 해 주는 것으로 평가되었다.

병렬 유전자 프로그래밍을 이용한 Symbolic Regression (Symbolic regression based on parallel Genetic Programming)

  • 김찬수;한근희
    • 디지털융복합연구
    • /
    • 제18권12호
    • /
    • pp.481-488
    • /
    • 2020
  • 기호적 회귀분석 (Symbolic Regression)은 회귀분석에서 주어진 데이터에 대하여 종속변수와 독립변수들 사이의 관계를 설명할 수 있는 함수를 직접 생성하는 분석방법으로서 Genetic Programming 이 본 분야의 연구에 가장 선도적으로 적용되고 있으며, 고정된 모델로부터 매개변수들의 최적화를 추구하는 다른 회귀분석 알고리즘들에 비하여 해석이 가능한 모델을 직접 도출할 수 있다는 장점을 갖는다. 본 연구에서는 Coarse grained 병렬 모델에 기반한 Parellel Genetic Programming 을 이용한 symbolic regression 알고리즘을 제시하고 제시된 알고리즘을 PMLB 데이타에 적용하여 해당 알고리즘의 효용성을 분석하고자 한다.

회귀나무 모형을 이용한 패널데이터 분석 (Panel data analysis with regression trees)

  • 장영재
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권6호
    • /
    • pp.1253-1262
    • /
    • 2014
  • 회귀나무 (regression tree)는 독립변수로 이루어진 공간을 재귀적으로 분할하고 해당 영역에서 종속변수의 최선의 예측값을 찾고자 하는 비모수적 방법론이다. 회귀나무 모형이 제안된 이래 로지스틱 회귀나무모형이나 분위수 회귀나무모형과 같이 유연하고 다양한 모형적합을 위한 연구가 진행되어 왔다. 최근에 들어서는 Sela와 Simonoff (2012)의 RE-EM 알고리즘, Loh와 Zheng (2013)의 GUIDE 등 패널데이터와 관련하여 진일보한 나무모형 알고리즘도 제안되었다. 본 논문에서는 각 알고리즘을 소개하고 특징을 살펴보는 한편, 실험 데이터를 생성하여 평균제곱오차 (mean squared error)를 바탕으로 예측력을 비교하였다. 분석결과, RE-EM 알고리즘의 예측력이 상대적으로 우수하게 나타났다. 이 알고리즘을 통해 기업경기실사지수 업종별 패널자료를 분석한 결과 최근의 업황에 가장 큰 영향을 미치는 요소는 매출 실적으로 나타났으며 매출 상위 그룹의 경우 비제조업이 제조업에 비해 업황에 대한 판단이 긍정적인 것으로 나타났다.

회귀알고리즘을 이용한 우선순위 PC모니터링 시스템 (The Priority PC Monitoring System Using Regression Algorithm)

  • 이영남;김신령;김영곤
    • 한국인터넷방송통신학회논문지
    • /
    • 제12권4호
    • /
    • pp.173-179
    • /
    • 2012
  • 최근 다수의 PC 통합 환경에 맞춰 대규모, 동적 관리 시스템 요구가 증가하고 있다. 하지만 그것에 대한 관리 시스템은 부재상태이다. 본 연구에서는 이상 상태에 즉각 대응하기 위한 회귀알고리즘을 적용하고, 우선 순위 임계 값 처리를 수행하는 모듈 구현, 다중 PC를 관리하는 소프트웨어 설계와 구현을 통해 이러한 문제를 해결하여 시스템의 효율과 최적화를 이루고자 하였다. 이를 가능하게 하기 위해 회귀알고리즘을 사용하였고 그 결과 아무리 규모가 늘어나도 최소한의 인력과 시스템으로 관리가 가능하게 하였다.

감조하천의 홍수위 예측에 있어서 한계자기회귀모형의 응용 (Application of Genetic Threshold Auto-regressive Model to Forecast Flood for Tidal River)

  • ;안선복;고진석;지홍기
    • 한국방재학회:학술대회논문집
    • /
    • 한국방재학회 2007년도 정기총회 및 학술발표대회
    • /
    • pp.587-590
    • /
    • 2007
  • 한계자기회귀모형(TAR)을 응용하여 동시에 해조와 홍수의 영향을 받을 때 삽교천 감조구간의 삽교호수위관측소의 월 최고수위를 예측하는 모형을 구축하였으며, 모형구축과정에서 유전알고리즘으로 한계값과 자기회귀계수의 매개변수를 최적화한다. 계산결과 한계자기회귀모형은 감조하천의 비선형성특성을 모의 할 수 있으며, 예측의 정확도와 예측성능의 안정성을 확보할 수 있다. 연구결과 유전한계자귀회귀모형으로 감조하천구간의 월 최고수위를 예측하는 것이 가능하며, 또한 감조하천구간에서 기타 수문요소의 비선형성 서열예측 중에서도 광범한 실용가치가 있다고 본다.

  • PDF

신경망을 이용한 고신뢰성의 회귀분석 모델 (Regression Model With High Reliability by Using Neural Networks)

  • 조용현
    • 정보처리학회논문지B
    • /
    • 제8B권4호
    • /
    • pp.327-334
    • /
    • 2001
  • 본 논문에서는 기울기하강과 동적터널링이 조합된 학습알고리즘의 다층신경망을 이용한 고신회성의 회귀분석 모델을 제안하였다. 기울기하강은 빠른 수렴속도의 최적화가 가능하도록 하기 위함이고, 동적터널링은 국소최적해를 만났을 때 이를 벗어난 새로운 연결가중치를 설정하여 전역최적해로 수렴되도록 하기 위함이다. 또한 대용량의 입력 데이터를 통계적으로 독립인 특징들의 집합으로 변환시키는 주요성분분석 기법의 속성을 살려 학습데이터의 차원을 감소시킴으로서 고차원의 학습데이터에 따른 회귀분석 모델의 제약도 동시에 해결하였다. 제안된 기법의 신경망을 3개의 독립변수 패턴을 가진 암모니아 제조공정문제와 10개의 독립변수 패턴을 가진 자동차 연비문제에 각각 적용하여 시뮬레이션한 결과, 기존의 역전과 알고리즘의 신경망이나 주요성분분석에 의한 차원을 감소시키지 않은 학습패턴을 이용한 신경망보다 각각 더욱 우수한 학습성능과 회귀성능이 있음을 확인할 수 있었다. 또한 학습패턴의 영평균 정규화로 회귀용 신경망의 성능을 더욱 더 개선하였다.

  • PDF

AVL을 이용한 구간통행시간 산출기법 개발 (A new approach to estimate the link travel time by using AVL technology)

  • 김성인;이영호;남기효
    • 대한교통학회지
    • /
    • 제17권2호
    • /
    • pp.91-103
    • /
    • 1999
  • 이 연구는 자동 차량위치 측정기법(Automatic Vehicle Location, AVL)을 이용해서 수집한 교통상황자료를 가지고 구간 통행시간을 산출하는 알고리즘을 개발한다. AVL기법을 이용하는 경우, 처리해야 할 자료량이 많아서 실시간에 정보를 산출하는 것이 힘들다. 따라서 이 연구는 처리해야 할 자료량을 가능한 한 줄이고 자료량이 적은 경우에도 효율적인 구간통행시간을 산출하는 알고리즘을 제시한다. 이 연구의 방법론은 크게 4가지인데, 첫째, 해석 기법, 둘째, 회귀분석, 셋째, 인공지능 및 전문가 시스템, 넷째, 통계분석이다. 이 방법론을 이용해서 세 단계 알고리즘을 개발하는데, 첫째는 실시간 분석통계 알고리즘, 둘째는 과거자료분석 알고리즘, 셋째는 자료응합 알고리즘이다. 이 알고리즘 가운데 자료융합 알고리즘 결과가 산출하고자 하는 구간 통행시간이다. 실시간 분석통계 알고리즘은 연속하는 세 개 구간의 통행 패턴을 이용해서 가운데 구간의 통행시간을 산출하는 방법을 제시한다. 또 실시간 분석통계 알고리즘으로 산출하지 못한 구간은 인접구간 상관도 정보를 이용해서 구간통행시간을 추정한다. 과거자료분석 알고리즘은 회귀분석을 이용해서 시간대별 통행시간 평균과 분산을 구하고, 이 결과를 바탕으로 인접구간 상관도 정보를 오프라인으로 구하는 알고리즘이다. 자료융합 알고리즘은 2가지 단계를 거치는데, 그것은 실시간 자료융합과 최종 자료융합이다. 실시간 자료융합은 실시간에 가까운 자료원의 실시간 분석통계 알고리즘 결과 패턴과 인접구간 상관도 정보를 이용한 구간통행시간 추정 결과를 이용해서 패턴에 따라 다른 방법으로 융합을 하는 알고리즘을 개발한다. 최종 자료융합은 실시간 자료융합 결과와 회귀분석 결과의 패턴을 이용해서 구간 통행시간을 산출한다. 이 연구를 기존 연구와 비교할 때, 세 가지 독차성이 있다. 첫째는 연속하는 세 구간 통행 패턴을 분석하였기 때문에 기존의 노드의존 방식을 탈피하였다는 점이다. 따라서 자료량이 적은 경우도 믿을만한 통행시간을 산출할 수 있다는 것이다. 둘째는 인접구간 상관도 정보를 구간통행시간 산출에 이용하였기 때문에 자료를 효율적으로 이용할 수 있다는 점이다. 셋째는 자료원 패턴을 분류하고 전문가 시스템을 이용하여 자료융합 하였기 때문에 수행속도가 빠르고, 신뢰성있는 정보를 제공한다는 점이다. 이 연구는 개발한 알고리즘 정확도를 검증하기 위해서 두 가지 검증방법을 이용하였다. 첫째는 시뮬레이션을 이용한 것이고, 둘째는 실제 주행조사 분석을 이용한 것이다. 두 가지 검증 결과는 알고리즘 정확도를 보여준다.

  • PDF

Ordinal Rank 알고리즘을 이용한 자동 PIF 추출 - 변화탐지를 위한 상대방사정규화를 목적으로 (Automatic Extraction of Pseudo Invariant Features using Ordinal Rank Algorithm for Radiometric Normalization)

  • 한유경;김대성;김용일
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2008년도 춘계학술대회 논문집
    • /
    • pp.213-218
    • /
    • 2008
  • 동일 지점을 촬영한 위성영상은 위성의 센서나 영상의 취득 시기, 지형의 상태 등에 따라 그 지점에 나타나는 화소값이 일정하지 않다. 이러한 영상은 영상간 모자이크나 변화 탐지 결과에 영향을 미칠 가능성이 높으므로 방사보정(또는 방사정규화)을 통해 화소값의 차이를 최소화시킬 필요가 있다. 본 연구는 선형회귀식을 적용한 상대 방사정규화에 초점을 맞추고 있으며, 선형회귀식 구성에 필요한 PIF(Pseudo Invariant Feature)를 자동으로 추출하기 위해 Ordinal Rank 알고리즘을 적용하였다. 이 방법을 통해 각 밴드별 후보 PIF를 추출하고, 공통으로 해당되는 최종 PIF를 추출할 수 있었다. RMSE(Root Mean Square Error), Dynamic range, Coefficient of variation 등을 통해 방사보정 후의 결과를 평가해보았다. 영상회귀를 이용한 방사보정알고리즘과의 비교를 통해 제안된 알고리즘이 갖는 장점을 확인하였다.

  • PDF

직선회귀모형을 이용한 차선 검출 알고리즘 (Lane Detection Algorism Using Linear Regression Analysis)

  • 강민석
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2008년도 심포지엄 논문집 정보 및 제어부문
    • /
    • pp.109-110
    • /
    • 2008
  • 이 본문은 자선의 경계가 있는 도로에서 촬영된 흑백영상에서 차선에 관한 정보를 찾아 검출하는 알고리즘을 계안한다. 영상을 블록 단위로 나누고 직선회귀모형(Linear Regression Analysis)을 사용하여 블록내의 기울기와 y절편(y-intercept)을 구한다. 블록의 회귀직선의 기울기에 따라 다음 검출위치를 결정하는 방법을 사용하여 시간석인 부분과 검출의 정확도를 높이고자 하였다.

  • PDF

RHIPE 플랫폼에서 빅데이터 로지스틱 회귀를 위한 학습 알고리즘 (Learning algorithms for big data logistic regression on RHIPE platform)

  • 정병호;임동훈
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권4호
    • /
    • pp.911-923
    • /
    • 2016
  • 빅데이터 시대에 머신러닝의 중요성은 더욱 부각되고 있고 로지스틱 회귀는 머신러닝에서 분류를 위한 방법으로 의료, 경제학, 마케팅 및 사회과학 전반에 걸쳐 널리 사용되고 있다. 지금까지 R과 Hadoop의 통합환경인 RHIPE 플랫폼은 설치 및 MapReduce 구현의 어려움으로 인해 거의 연구가 이루지 지지 않았다. 본 논문에서는 대용량 데이터에 대해 로지스틱 회귀 추정을 위한 두가지 알고리즘 즉, Gradient Descent 알고리즘과 Newton-Raphson 알고리즘에 대해 MapReduce로 구현하고, 실제 데이터와 모의실험 데이터를 가지고 이들 알고리즘 간의 성능을 비교하고자 한다. 알고리즘 성능 실험에서 Gradient Descent 알고리즘은 학습률에 크게 의존하고 또한 데이터에 따라 수렴하지 않는 문제를 갖고 있다. Newton-Raphson 알고리즘은 학습률이 불필요 할 뿐만 아니라 모든 실험 데이터에 대해 좋은 성능을 보였다.