• 제목/요약/키워드: Outlier model

검색결과 212건 처리시간 0.024초

정상 시계열에서의 이상치 발견과 시계열 모형구축 (Outlier detection and time series modelling in the stationary time series)

  • 이종협;최기헌
    • 응용통계연구
    • /
    • 제5권2호
    • /
    • pp.139-156
    • /
    • 1992
  • 최근에 시계열에서의 이상치 발견을 위한 여러 가지 반복적인 방법들이 소개되었으나 이들 대부분은 시계열의 기저모형이 알려져 있거나 식별될 수 있다는 가정하에서 개발되었다. 그 렇지만 실제로 이상치들이 모형식별을 왜곡 시키거나 심지어는 불가능하게 만드는 경우가 발생한다. 본 논문에서는 두 개의 시계열 관측치 사이의 거리에 근거한 새로운 척도를 이용 한 이상치 탐색 방법을 제시하였다. 특히 이방법은 이상치를 발견하는데 시계열 모형에 의 존하지 않는다. 제안된 통계량에 대한 여러 가지 성질을 밝혔으며 이상치의 형태를 구별하 기 위해 전이함수모형을 이용하였다. 그밖에 이상치를 포함하고 있는 시계열의 모형을 구축 하기 위한 반복적인 절차를 제안했다.

  • PDF

수온 관측 자료의 효율적인 이상 자료 탐지 (Efficient Outlier Detection of the Water Temperature Monitoring Data)

  • 조홍연;정신택;고동휘;손경표
    • 한국해안·해양공학회논문집
    • /
    • 제26권5호
    • /
    • pp.285-291
    • /
    • 2014
  • 연안의 수온 모니터링 자료는 이상자료 및 결측을 포함하고 있기 때문에 통계정보를 왜곡할 수 있다. 다양한 이상자료 감지 기법이 제안되고 있으나 결측이 없고 이상자료에 대한 사전정보를 가정하고, 어떤 적용기법은 과도한 계산시간이 소요되기 때문에 적용에 제한이 따른다. 본 연구에서는 방대한 자료에서도 효과적으로 이상자료를 감지할 수 있는 실용적인 Robust 모형을 제안하였다. 이 모형은 계산시간을 크게 저감하는 부분자료 추출기법을 이용한 어림성분 추정과정 및 어림성분으로부터 계산되는 잔차성분으로부터 이상자료를 반복적으로 진단하여 제거하는 부분으로 구성되어 있다. 이 모형의 성능평가는 새만금호에서 5분 간격으로 관측한 2년 동안의 수온 자료를 이용하여 수행하였다. 모형 적용결과, 이상자료가 전체자료에서 차지하는 비율은 1.6-3.7% 정도로 파악되었으며, 전체적으로 대부분의 이상자료가 제거되는 것으로 파악되었다. 또한 어림성분 추정과정의 반복적용은 Long-span 조건을 먼저 적용하는 것이 효과적인 것으로 파악되었다.

분식 적발을 위한 재무이상치 분석시스템 개발 (Development of the Financial Account Pre-screening System for Corporate Credit Evaluation)

  • 노태협
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제18권4호
    • /
    • pp.41-57
    • /
    • 2009
  • Although financial information is a great influence upon determining of the group which use them, detection of management fraud and earning manipulation is a difficult task using normal audit procedures and corporate credit evaluation processes, due to the shortage of knowledge concerning the characteristics of management fraud, and the limitation of time and cost. These limitations suggest the need of systemic process for !he effective risk of earning manipulation for credit evaluators, external auditors, financial analysts, and regulators. Moot researches on management fraud have examined how various characteristics of the company's management features affect the occurrence of corporate fraud. This study examines financial characteristics of companies engaged in fraudulent financial reporting and suggests a model and system for detecting GAAP violations to improve reliability of accounting information and transparency of their management. Since the detection of management fraud has limited proven theory, this study used the detecting method of outlier(upper, and lower bound) financial ratio, as a real-field application. The strength of outlier detecting method is its use of easiness and understandability. In the suggested model, 14 variables of the 7 useful variable categories among the 76 financial ratio variables are examined through the distribution analysis as possible indicators of fraudulent financial statements accounts. The developed model from these variables show a 80.82% of hit ratio for the holdout sample. This model was developed as a financial outlier detecting system for a financial institution. External auditors, financial analysts, regulators, and other users of financial statements might use this model to pre-screen potential earnings manipulators in the credit evaluation system. Especially, this model will be helpful for the loan evaluators of financial institutes to decide more objective and effective credit ratings and to improve the quality of financial statements.

헤드램프용 필라멘트 램프 가속열화데이터 분석을 통한 로버스트 열화모형 연구 (A Study of the Roust Degradation Model by Analyzing the Filament Lamp Degradation Data)

  • 성기우
    • 한국자동차공학회논문집
    • /
    • 제20권6호
    • /
    • pp.132-139
    • /
    • 2012
  • It is generally needed to test durability and lifetime when we develop parts in new technology. In this paper, the accelerated degradation analysis methods are developed to test them. This study is presented robust model estimation method that is less affected by outlier in regresstion model estimation. In addition, the lifetime can be predicted by Degradation-stress relationship in stress level.

선형회귀에서 변수선택, 변수변환과 이상치 탐지의 동시적 수행을 위한 절차 (A procedure for simultaneous variable selection, variable transformation and outlier identification in linear regression)

  • 서한손;윤민
    • 응용통계연구
    • /
    • 제33권1호
    • /
    • pp.1-10
    • /
    • 2020
  • 본 연구에서는 선형회귀모형에서 이상치와 변수변환을 고려한 변수선택 알고리즘을 다룬다. 제안된 방법은 잠재적 이상치를 탐지하여 제거한 후 변수변환 추정을 위해 최소 절사 제곱 추정법을 적용하며 가능한 모든 회귀모형을 비교하여 최종적으로 변수를 선택한다. 정확한 변수 선택과 추정된 모델의 적합도의 맥락에서 방법의 효율성을 보여주기 위해 실제 데이터 분석 및 시뮬레이션 결과가 제시된다.

통행시간 추정을 위한 Voting Rule과 중위절대편차법 기반의 복합 필터링 모형 (Combined Filtering Model Using Voting Rule and Median Absolute Deviation for Travel Time Estimation)

  • 정영제;박현석;김병화;김영찬
    • 한국ITS학회 논문지
    • /
    • 제12권6호
    • /
    • pp.10-21
    • /
    • 2013
  • 본 연구에서는 교통정보시스템에서 통행시간의 이상치 자료를 제거하기 위한 복합 필터링 모형을 제시하였으며, 이는 중위절대편차법과 Voting Rule을 기반으로 하는 이중화된 필터링 모형에 해당한다. 본 모형은 중위절대편차법을 이용해 표본을 정규분포화 시키기 위한 1차 필터링을 수행하며, 이후 Voting Rule을 이용해 중위절대편차법의 적용 이후에도 남아 있는 이상치 자료를 제거하는 방식에 해당한다. 이때 Voting Rule은 표본의 통행시간과 평균통행시간의 차이가 임계치를 초과하는 경우 해당 표본을 이상치로 판정하며, 다수결의 원칙을 이용하여 이상치 자료의 비율에 따라 이상치에 대한 제거 여부를 결정한다. 일반국도 3호선의 경기도 광주시 구간을 대상으로 한 사례분석을 통해 복합 필터링 모형이 이상치 표본 만을 선택적으로 제거하여 통행시간 추정의 정확도 개선에 기여할 수 있음을 확인하였다.

하나의 확실한 이상점을 갖는 지수모형에서 모수에 대한 짹나이프 추정 (Jackknife parametric estimation in the two parameter exponential model with an identified outlier)

  • Jung Soo Woo;Chang Soo Lee
    • 응용통계연구
    • /
    • 제7권2호
    • /
    • pp.313-321
    • /
    • 1994
  • 소표본에서 하나의 확실한 이상점을 갖는 지수모형에서 permanent 이론을 도입하여 표본들의 순서통계량의 분포를 정확한 형태로 유도하고, 이 결과를 이용하여 가정된 지수모형의 위치모수와 측도모수에 대한 최우추정량과 그 짹나이프 추정량을 편의와 평균제곱오차면에서 두 추정량의 소표본 성질을 비교하였다.

  • PDF

다중빔 음향측심기 자료의 이상치 보정에 관한 연구 (A Study on Outlier Adjustment for Multibeam Echosounder Data)

  • 이정숙;김수영;이용국;신동완;주형태;김한준
    • 한국해양학회지:바다
    • /
    • 제6권1호
    • /
    • pp.35-39
    • /
    • 2001
  • 해저면의 지형과 형상을 조사하기 위해 획득되는 다중빔 음향측심자료는 조사선의 움직임과 빔의 위치에 따른 음압의 보정부족 등에 기인하는 이상치를 포함하고 있다. 이 연구에서는 자기회귀이동평균(ARMA)기법을 이용하여 이상치에 의해 왜곡된 자료를 보정해주는 통계학적 절차를 소개하고 이를 동해에서 얻어진 자료에 적용하였다. 이 방법에서는 자료의 자기 상관을 1차 자기회귀모형 AR(1)으로 표현하고 이를 추정한 후 추정된 모형에 현저하게 부합하지 않는 자료(이상치)는 추정된 모형을 인용하여 수정한다. 이러한 방법을 이상치가 발견되지 않을 때까지 반복적으로 되풀이한다. 자료의 처리결과 해저지형을 나타내는 신호에 비해 월등히 큰 이상치들이 대부분 제거되었음을 볼 수 있다.

  • PDF

사분위편차 및 관리도 모형에 의한 GPS 수집기반 구간통행속도 데이터 이상치 제거방안 연구 (The Quartile Deviation and the Control Chart Model of Improvement Confidence for Link Travel Speed from GPS Probe Data)

  • 한원섭;김동효;현철승;이호원;오영태;이철기
    • 한국ITS학회 논문지
    • /
    • 제7권6호
    • /
    • pp.21-30
    • /
    • 2008
  • GPS를 탑재한 프로브차량에 의해 수집되는 교통정보(구간통행속도)는 차량검지기와 같이 특정링크에 대하여 연속적으로 교통정보를 수집하는 방식이 아니다. 따라서 단속교통류 구간에서 신호시간 등의 영향으로 수집되는 정보의 안정성과 대표값 등에 문제점이 있다. 본 연구는 GPS를 장착한 프로브차량에 의해 수집된 구간통행속도 데이터를 필터링하는 방법을 개발하는데 목적이 있다. 시간간격별로 수집되는 데이터에 대하여 사분위편차와 관리도에 의해 이상치를 제거하였다. 사분위편차를 적용한 결과는 제거율이 $0{\sim}3.7%$ 이고, 개별 관리도에 의한 결과는 제거율이 $0.3{\sim}7.2%$ 이었다. 두 방법 모두 교통소통이 원활한 새벽시간 대에 이상치 제거율이 낮고, 낮 시간대에 이상치 제거율이 높은 것으로 나타났다. 문제점으로 지적되는 것은 모형에 충실할 경우 Low Bound에서 이상치의 제거기준이 낮게 설정되는 것이다. 따라서 시스템 운영과정에서 경험적인 사항이 반영되어져야 할 것으로 검토된다.

  • PDF