• 제목/요약/키워드: Outlier

검색결과 657건 처리시간 0.028초

Corner outlier artifacts를 제거하기 위한 비선형 필터 설계 (Simple non-linear filter for reducing coner outlier artifacts)

  • 김원균;김종호;정제창
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2005년도 학술대회
    • /
    • pp.39-42
    • /
    • 2005
  • 블록기반의 비디오 부호화 표준은 비디오 신호의 압축방식으로 가장 널리 쓰이는 구조이지만 무선 환경과 같은 저 비트율 응용에서는 양자화에 의한 고주파 성분의 손실로 인해 블록킹 현상 및 링잉 현상이 두드러져 화질열화의 주된 원인이 된다. 이러한 화질열화를 제거하기 위해서 디블록킹 필터와 디링잉 필터를 사용하지만, 영상에 따라 블륵 경계의 모서리 부분과 대각선 에지가 만나는 부분에서 나타나는 corner outlier 현상으로 인해 화질이 충분히 개선되지 못하는 경우가 발생한다. 본 논문에서는 저 비트율 비디오에서 에지의 방향과 그 에지를 포함하는 블록의 평탄한 정도를 이용하여 corner outlier 현상을 검출하고, 이를 제거할 수 있는 비선형 필터를 제안한다. MPEG-4 호화 영상 및 MPEG-4 디블록킹 필터를 적용한 영상에 대해서 제안한 비선형 필터를 적용하여 주관적 화질이 개선됨을 실험을 통하여 보인다.

  • PDF

A Comparison of Methods for the Detection of Outliers in Multivariate Data

  • Hadi, Ali-S.;Joo, Hye-Seon;Son, Mun-S.
    • Communications for Statistical Applications and Methods
    • /
    • 제3권2호
    • /
    • pp.53-67
    • /
    • 1996
  • Numerous classical as well as robust methods have been proposed in the literature for the detection of multiple outlier in multivariate data. The effectiveness and power of each of these methods have not been thoroughly investigated. In this paper we first reduce the vast number of outlier detection methods to a small number of viable ones. This reduction is based on previous work of other researches and on some theoretical arguments. Then we design and implement a Monte Carlo experiment for comparing these methods. The main goal of our study is to determine which methods are most powerful in the detection of multiple outlier and in dealing with the masking and swamping problems. The results of the Monte Carlo study indicate that two of the methods seem to hace better performances than the others for the detection of multiple outlier in multivariate data.

  • PDF

실제증발산 측정 시 연직 풍속 이상치 탐색 및 대체 (Outlier Detection and Replacement for Vertical Wind Speed in the Measurement of Actual Evapotranspiration)

  • 박천건;임창수;임광섭;채효석
    • 대한토목학회논문집
    • /
    • 제34권5호
    • /
    • pp.1455-1461
    • /
    • 2014
  • 본 연구에서는 2011년 5월, 6월, 7월에 덕유산 덕곡제에서 관측된 플럭스자료를 이용하여 에디공분산방법으로부터 증발산량을 측정하는 경우 발생할 수 있는 연직방향 풍속의 이상치 판별 및 대체에 대한 통계적 분석을 실시하였다. 연직방향 풍속의 이상치를 파악하기 위해 적용된 통계분석방법은 사분위수를 바탕으로 상자그림(boxplot)의 분석결과 중에 이상치를 판별하기 위한 interquartile range (IQR)을 적용하여 이상치를 탐색하였다. 또한 삭제하거나 평균값으로 대체하는 방법을 통하여 보완된 연직방향 풍속자료를 이용하여 증발산량을 측정하였으며, 이를 보완전의 증발산량과 비교분석하였다. 비교분석한 결과에 의하면 이상치를 대체하기 전의 증발산량과 이상치를 대체한 후의 증발산량 사이에 차이를 보였으며, 특히 강우 시에 보다 큰 차이를 보였다. 따라서 증발산량 측정과정에서 발생하는 이상치를 보완하기 위해 이상치를 삭제하거나 대체하여 증발산량을 측정하는 것이 필요하다.

다양한 오정합 제거 알고리즘을 이용한 영상정합의 정확도 향상 (Improving the Accuracy of Image Matching using Various Outlier Removal Algorithms)

  • 이용일;김준철;이영란;신성웅
    • 한국측량학회지
    • /
    • 제27권1호
    • /
    • pp.667-675
    • /
    • 2009
  • 영상정합은 원격 탐사, GIS 등과 같은 영상 활용 분야에서 매우 광범위하게 적용된다. 일반적으로 초기의 정합점 데이터들은 영상정합의 정확도를 떨어뜨리는 오정합을 포함하고 있다. 본 논문의 목적은 영상정합에서 정확도를 유지하기 위해 오정합의 탐색 및 제거를 위한 강건한 접근법을 개발하는 것이다. 본 논문은 자동으로 오정합을 탐색하기 위해 역방향 정합 유사변환, RANSAC 알고리즘을 사용하였으며 빠르고 효율적인 영상정합을 위해 중복영역의 계산, 블록기반 처리 등과 같은 전처리 단계를 사용하였다. 논문에서 제안한 방법을 실제 항공사진 영상쌍에 적용하여 robustness와 효율성 측면에서 그 결과를 분석하였다.

대용량 데이터 분석을 위한 맵리듀스 기반의 이상치 탐지 (Outlier Detection Based on MapReduce for Analyzing Big Data)

  • 홍예진;나은희;정용환;김양우
    • 인터넷정보학회논문지
    • /
    • 제18권1호
    • /
    • pp.27-35
    • /
    • 2017
  • 가까운 미래에는 빅데이터의 많은 부분을 IoT 데이터가 차지할 것이라는 전망이 나오고 있다. 그에 따라, IoT 데이터의 많은 부분을 차치하는 센서 데이터에 관한 관심과 연구 또한 활발하게 진행되고 있다. 여러 분야에서 활용되고 있는 센서 데이터는 분석할 때 실제와는 다른 값인 이상치를 포함하게 되면 정확한 분석이 어려우며, 왜곡된 결과가 도출되어 활용할 수 없는 경우가 생긴다. 따라서 본 논문에서는 정확한 결과를 도출하기 위해 수집된 원자료를 분석하기 전에 이상치 탐지 및 제거를 하였다. 또한, 점점 늘어나고 있는 대용량의 데이터를 빠르게 처리하기 위해 메모리 접근방식인 스파크를 사용한 분산처리환경에서 처리하였다. 맵리듀스 기반의 이상치 탐지 및 제거는 총 4단계로 나누어 구현하였으며, 각 단계를 매퍼와 리듀스로 구현하였다. 제안한 기법의 평가를 위해서 3가지 환경에서 비교하였으며, 그 결과 이상치 탐지 및 제거를 하고자 하는 데이터의 용량이 커질수록 스파크를 이용한 분산처리환경에서의 처리가 가장 빠르다는 결과를 얻었다.

주기 패턴을 이용한 센서 네트워크 데이터의 이상치 예측 (Outlier prediction in sensor network data using periodic pattern)

  • 김형일
    • 센서학회지
    • /
    • 제15권6호
    • /
    • pp.433-441
    • /
    • 2006
  • Because of the low power and low rate of a sensor network, outlier is frequently occurred in the time series data of sensor network. In this paper, we suggest periodic pattern analysis that is applied to the time series data of sensor network and predict outlier that exist in the time series data of sensor network. A periodic pattern is minimum period of time in which trend of values in data is appeared continuous and repeated. In this paper, a quantization and smoothing is applied to the time series data in order to analyze the periodic pattern and the fluctuation of each adjacent value in the smoothed data is measured to be modified to a simple data. Then, the periodic pattern is abstracted from the modified simple data, and the time series data is restructured according to the periods to produce periodic pattern data. In the experiment, the machine learning is applied to the periodic pattern data to predict outlier to see the results. The characteristics of analysis of the periodic pattern in this paper is not analyzing the periods according to the size of value of data but to analyze time periods according to the fluctuation of the value of data. Therefore analysis of periodic pattern is robust to outlier. Also it is possible to express values of time attribute as values in time period by restructuring the time series data into periodic pattern. Thus, it is possible to use time attribute even in the general machine learning algorithm in which the time series data is not possible to be learned.

건설 계측 데이터에 대한 통합 이상치 분석 시스템 개발 (Development of Integrated Outlier Analysis System for Construction Monitoring Data)

  • 전제성
    • 한국지반환경공학회 논문집
    • /
    • 제21권5호
    • /
    • pp.5-11
    • /
    • 2020
  • 구조물의 이상징후 판단 및 장단기 안정성, 장래 거동 등의 판단에 다양한 계측결과가 효율적으로 이용되기 위해서는 계측 데이터 내에 포함한 각종 이상치의 판정 및 제거가 필요하다. 본 연구에서는 장기 시계열 데이터에 대한 이상치 평가를 수행하기 위한 통합 이상치 분석 시스템을 개발하였다. 이상치 평가는 시계열 분석법에 의한 단일 데이터셋 대상의 1차 이상치 분석과 합성신호 기반의 다중 데이터셋에 대한 2차 이상치 분석으로 구분하여 단계별로 수행되었다. 통합 이상치 분석 시스템은 구조물에 대한 종합 안전관리 플랫폼과 실시간 연동되어 구조물의 각종 안전성 평가 및 거동 예측 등을 위한 기초자료를 제공할 수 있도록 개발되었다. 현장 적용을 통해 일정 경향을 보이는 동종의 다수 센서들의 합성신호와 개별 데이터셋 간의 상관성이 크게 증가함을 확인할 수 있었으며, 상관성에 대한 가중치 적용을 통해 차별 거동을 보이는 다양한 센서 계측치들도 모두 통합 이상치 분석에 활용될 수 있음을 확인 할 수 있었다.

고차원 자료의 비지도 부분공간 이상치 탐지기법에 대한 요약 연구 (A survey on unsupervised subspace outlier detection methods for high dimensional data)

  • 안재형;권성훈
    • 응용통계연구
    • /
    • 제34권3호
    • /
    • pp.507-521
    • /
    • 2021
  • 고차원 자료에서 이상치를 탐지하기 위해서는 변수를 선별해야 할 필요성이 있다. 이상치 탐지에 적합한 정보가 종종 일부 변수에만 포함되어 있기 때문이다. 많은 수의 부적합한 변수가 자료에 포함될 경우 모든 관측치의 거리가 비슷해지는 집중효과가 발생하고 이로 인해 모든 관측치의 이상정도가 비슷해지는 문제가 발생하게 된다. 부분공간 이상치 탐지기법은 전체 변수 중 이상치 탐지에 적합한 변수들의 집합을 선별하여 관측치의 이상정도를 측정함으로써 이러한 문제를 극복한다. 본 논문은 대표적인 부분공간 이상치 탐지기법을 부분공간 선정 방식에 따라 세가지 유형으로 분류하고 각 유형에 속한 방법론을 부분공간 선정 기준과 이상 정도 측정 방식에 따라 요약한다. 더하여, 부분공간 이상치 탐지기법들을 적용할 수 있는 컴퓨팅 프로그램을 소개하고 집중효과에 대한 간단한 가상 실험과 자료 분석 결과를 제시한다.

높은 이상점 비율을 갖는 고감도 가이거모드 영상 라이다 데이터로부터 이상점 검출 (Outlier Detection from High Sensitive Geiger Mode Imaging LIDAR Data retaining a High Outlier Ratio)

  • 김성준;이임평;이영철;조민식
    • 대한원격탐사학회지
    • /
    • 제28권5호
    • /
    • pp.573-586
    • /
    • 2012
  • 라이다 센서로 취득된 점군에는 실제 물리적인 표면에 존재하지 않는 이상점이 포함되어 있다. 이러한 이상점들은 활용을 위한 후속처리를 하기 전에 반드시 제거되어야 한다. 특히 민감도가 아주 높은 가이거 모드 검출기를 이용하는 라이다로 취득한 데이터는 높은 비율의 이상점을 포함하고 있다. 이로 인해 기존의 알고리즘은 이러한 데이터로부터 성공적으로 이상점을 검출하는데 어려움이 있었다. 이에 본 연구는 가이거 모드 영상 라이다로 획득된 높은 이상점 비율을 갖는 점군에서 이상점을 제거하는 방법을 제안한다. 제안된 방법은 의미 있는 표적의 표면은 검출기상에서 두 개 이상의 이웃픽셀에 검출되며, 이러한 이웃픽셀들로부터 출력되는 거리값은 유사하다는 점을 이용한다. 개발된 제거 기법은 시뮬레이션으로 생성된 다양한 점밀도와 이상점 비율의 모의 데이터에 적용하여 임계값과 데이터 특성에 따른 성능을 분석하였다. 대부분의 경우에 약 99% 이상의 이상점 검출성능이 나타났으며, 데이터 특성에 강인하고 임계값에 크게 민감하지 않는 검출성능을 확인하였다. 제안된 방법은 향후 가이거 모드 라이다 데이터의 온라인 실시간 처리 또는 후처리에 효과적으로 활용될 것으로 판단된다.

화학적산소요구량의 총유기탄소 변환을 위한 이상자료의 탐지와 처리 (Outlier Detection and Treatment for the Conversion of Chemical Oxygen Demand to Total Organic Carbon)

  • 조범준;조홍연;김성
    • 한국해안·해양공학회논문집
    • /
    • 제26권4호
    • /
    • pp.207-216
    • /
    • 2014
  • 총유기탄소(TOC)는 해양의 탄소순환 연구분야에서 직접적인 생물학적 지표로 이용되는 중요한 인자다. 가용한 TOC 자료가 상대적으로 화학적산소요구량(COD) 자료 보다 부족하기 때문에 COD 자료를 활용하여 TOC 자료를 추정할 수 있다. COD를 TOC 로의 변환 시 TOC 추정에 직접적으로 영향을 미치는 COD 관측자료에 포함된 이상자료의 탐지와 적절한 처리는 합리적이고 객관적으로 수행되어야 한다. 본 연구에서는 국내 연안해역에서 관측된 염분, COD 및 TOC 자료에 대한 최적회귀모형을 제시하였다. 최적회귀모형은 이상자료와 영향자료를 여러 가지 탐색방법으로 진단하여 제거 전 후의 자료 개수 변화, 변동계수 및 RMS 오차를 비교 및 분석하여 선택하였다. 연구수행 결과, Cook의 진단방법과 SIQR의 boxplot 방법을 조합한 방법이 가장 적절한 것으로 파악되었다. 최적 회귀 함수는 TOC(mg/L) = $0.44{\cdot}COD(mg/L)+1.53$ 이고, 결정계수는 0.47 정도로 나타났으며, RMS 오차는 0.85 mg/L이다. RMS 오차와 지레계수(leverage values)의 변동계수는 이상자료 제거 전에 비하여 각각 31%, 80%로 크게 감소되었다. 본 연구에서 제시된 방법을 통해 COD와 TOC 관측자료에 포함된 이상자료와 영향자료의 과도한 영향을 진단 및 제거하였기 때문에 보다 적절한 회귀곡선식을 제시할 수 있었다.