• 제목/요약/키워드: Outlier removal

검색결과 57건 처리시간 0.024초

AVI 수집 자료 분석에 근거한 최적 통행속도 산출에 관한 고찰 (The Consideration on Calculation of Optimal Travel Speeds based on Analysis of AVI Data)

  • 정연탁;정헌영
    • 대한토목학회논문집
    • /
    • 제35권3호
    • /
    • pp.625-637
    • /
    • 2015
  • 본 연구는 연속류에서 수집된 AVI 자료 분석에 근거한 최적의 통행속도 산출을 목표로 하고 있으며, 그 결과는 다음과 같다. 첫째, 개별 프로브 차량의 구간 통행시간 분포를 살펴보았고, 개별 프로브 차량별 구간 통행속도의 차이를 비교하였다. 그 결과, 구간 통행시간의 분포는 이상치를 제거하여야 하는 것으로 나타났다. 둘째, 비 혼잡구간에서는 1종(승용자동차)와 2종(승합자동차)는 4종(특수자동차) 간에는 차이가 있었다. 따라서, 구간 통행속도 산출시 4종(특수자동차)를 제거할 필요가 있는 것으로 나타났다. 셋째, 이러한 결과를 바탕으로 최적의 이상치 제거 절차를 본 연구에 적용하였다. 그 결과, 평균절대오차백분율(MAPE)은 0.3~2.0%이고, 평균제곱근오차(RMSE)는 0.3~2.3로 분석되어, 실제 평균 통행속도와 매우 유사한 값으로 나타났다. 또한 최소 표본수도 신뢰수준 95%에서 만족하였다. 본 연구의 결과는 AVI를 구축하고자 하는 지방자치단체를 위한 유용한 기초자료로 활용될 것으로 기대된다. 향후에는 보다 정확한 교통정보를 위하여 AVI 자료와 다른 자료와의 통합 연구가 필요할 것이다.

쉴드 TBM 기계 데이터 및 머신러닝 기법을 이용한 암석의 일축압축강도 예측 (Prediction of Uniaxial Compressive Strength of Rock using Shield TBM Machine Data and Machine Learning Technique)

  • 김태환;고태영;박양수;김택곤;이대혁
    • 터널과지하공간
    • /
    • 제30권3호
    • /
    • pp.214-225
    • /
    • 2020
  • 쉴드 TBM(Tunnel Boring Machine) 터널 굴착 시 암반의 상태는 굴진 성능을 결정하는 중요한 요소 중 하나이다. 암석 강도는 지반조사 시 실내시험을 통해 얻을 수 있으나, 전체 TBM 굴진 구간에 대해 모두 알 수 없다. TBM 굴진 시 최적 Operation Parameter를 적용하기 위해서는 굴진 속도에 영향을 미치는 암석 강도를 파악하는 것이 매우 중요하다. 이에 본 연구에서는 TBM 굴착 중 생성되는 기계 데이터와 머신러닝(Machine Learning) 기법을 활용하여 암석 강도를 예측하고자 한다. 암석 강도를 예측하기 위해 여러 머신러닝 기법을 사용하여 비교하였고, 가장 예측 성능이 좋은 스태킹 모델을 최종 모델로 선택하였다. 암반 구간 Slurry 쉴드 TBM 굴진 사례에서 지반조사 및 시공 중 조사한 암석 강도와 강도를 획득한 위치에서의 TBM 굴착 데이터를 사용하였다. TBM 굴착 데이터는 Training과 Test용으로 8:2로 분할하였으며, 변수 선택(feature selection), 표준화(scaling), 이상치(outlier) 제거 등 전처리 과정을 수행하였다. 하이퍼파라미터 튜닝까지 마친 후, 스태킹 모델에 대해 평균 제곱근 오차(Root Mean Square Error, RMSE)와 결정 계수(R2)로 모델을 평가한 결과 각각 5.556과 0.943로 나타났으며, TBM 굴착 데이터로 암석 강도를 예측하는 모델로 유용할 것으로 판단된다.

프로브 자료의 특성을 고려한 단속류의 구간 통행속도 산출에 관한 연구 (A Study on Calculation of Sectional Travel Speeds of the Interrupted Traffic Flow with the Consideration of the Characteristics of Probe Data)

  • 정연탁;정헌영
    • 대한토목학회논문집
    • /
    • 제34권6호
    • /
    • pp.1851-1861
    • /
    • 2014
  • 본 연구는 단속류에서 수집된 프로브 자료의 특성을 고려하여 신뢰성 있는 구간 통행속도를 산출하는 것을 목표로 하고 있다. 먼저, 프로브 자료의 특성을 분석하기 위하여 각 프로브 차량의 구간 통행시간 분포를 살펴보았고, 단거리전용통신(DSRC)을 통해 수집된 프로브 차량별 구간 통행속도 차이를 비교하였다. 그 결과, 구간 통행시간의 분포는 이상치를 제거하여야 하는 것으로 나타났다. 하지만, DSRC 프로브 차량의 구간 통행속도는 뚜렷한 차이가 없는 것으로 나타났다. 끝으로, 프로브 차량의 구간 통행속도 분포 특성과 수집 주기 동안에 집계된 대표값을 토대로 본 연구에서는 최적의 이상치 제거 절차를 도출하였고, 추정 오차를 평가하였다. 평가 결과, DSRC 구간 통행속도는 실 주행차량의 관측값과 유사한 값으로 나타났다. 반면에, 시내버스 구간 통행속도의 경우는 DSRC 구간 통행속도보다 덜 정확한 것으로 분석되었다. 향후 BIS 프로세스 개선과 실시간으로 수집되는 시내버스의 운행정보를 이용하여 도로소통정보로도 활용할 수 있는 다양한 방안을 모색할 필요가 있다.

순위 차 확산 필터를 이용한 스페클 잡음 제거 (Speckle Noise Removal by Rank-ordered Differences Diffusion Filter)

  • 예철수
    • 대한원격탐사학회지
    • /
    • 제25권1호
    • /
    • pp.21-30
    • /
    • 2009
  • 본 논문의 목적은 원격 탐사 영상에서 잡음을 제거하기 위해 중심 화소와 통계적으로 유사한 이웃화소들을 선택하늘 방법을 제시하고 이 결과를 평균 곡률 확산과 결합하는 방법을 제시하는데 있다. 균일한 밝기값 영역에 속하는 화소들을 검출하기 위해 이웃 화소들을 순차적으로 선택할 때 그 선택하는 순서에 따라 선택된 영역의 통계적 특성이 달라지므로 이웃 화소의 선택 순서는 매우 중요하다. 본 논문에서는 통계적으로 유사한 특성을 가지는 이웃 화소를 선택하기 위해서 중심 화소와 이웃 화소의 밝기값 차를 계산하고 이를 크기 순으로 정렬하여 얻어지는 순위 차 벡터(rank-ordered differences vector)를 이용하는 효과적인 방법을 제안한다. 순위 차 벡터의 항들을 영역 확장 방법을 이용하여 균일 순위 차 벡터(homogeneous rank-ordered differences vector)와 이상점 순위 차 벡터 (outlier rank-ordered differences vector)로 분할한다. 균일 순위 차 벡터의 항에 속하는 이웃 화소에 대해서만 중심 화소의 밝기값 갱신에 기여하도록 확산 계수를 선택적으로 할당하는 라인 프로세스를 평균 곡률 확산에 결합한다. 제안한 방법은 모든 이웃 화소를 이용하여 중심 화소의 밝기값을 갱신하는 기존의 잡음 제거 필터에 비해 잡음 제거 효과가 뛰어남을 항공 영상 및 TerraSAR-X 위성 영상을 이용한 실험을 통해 확인하였다.

3차원 포인트 클라우드 기반 복셀화에 의한 식생의 물리적 구조 재구현 (Reconfiguration of Physical Structure of Vegetation by Voxelization Based on 3D Point Clouds)

  • 안명희;장은경;배인혁;지운
    • 대한토목학회논문집
    • /
    • 제40권6호
    • /
    • pp.571-581
    • /
    • 2020
  • 하천에 광범위하게 활착되는 식생은 수위 변화 및 흐름 저항에 절대적인 영향을 미칠 뿐만 아니라 하천 시스템 전반에 영향을 미치는 중요 요소이다. 따라서 유입되는 식생의 형태와 규모를 정확하게 파악하는 것이 매우 중요함에도 불구하고 현장에서 이를 파악하기란 쉽지 않은 일이다. 따라서 최근에는 지상 레이저 스캐닝 등을 활용하여 대용량의 식생 정보를 취득하는 연구가 시도되고 있다. 그러나 식생의 복잡한 형상으로 인해 캐노피 영역의 정확한 정보를 획득하기 어려우며, 자연적인 영향에 매우 민감하게 반응한다는 한계가 있다. 본 연구에서는 3차원 지상 레이저 스캐닝을 통해 수집된 고해상도의 포인트 클라우드 데이터를 복셀 형식으로 재구현하여 식생의 물리적 구조를 분석하였다. 먼저 잎이 없는 단순한 형태, 잎이 있는 완전한 형태의 식생 및 패치 규모 식생 조건으로 설정하여 각각의 물리적 구조를 분석하였다. 이를 위해 측정된 데이터의 이상치 제거 및 불필요한 데이터의 필터링을 위해 통계적 이상치 제거 방법을 활용하여 각각 17 %, 26 %, 25 %의 포인트를 제거하였다. 또한 후처리 된 포인트 클라우드로부터 복셀 크기별 식생 형상을 재구현하여 실제 식생의 부피와 비교하였으며, 분석 결과, 오차 범위는 각 조건별로 8 %, 25 %, 63 %로 나타났다. 대상 샘플의 규모가 클수록 더 큰 오차가 발생하였으며, 복셀 크기 조정 시 식생의 표면이 시각적으로 비슷하게 보이지만 전체 식생의 부피는 이러한 변화에 매우 민감한 것으로 나타났다.

Pre-processing of load data of agricultural tractors during major field operations

  • Ryu, Myong-Jin;Kabir, Md. Shaha Nur;Choo, Youn-Kug;Chung, Sun-Ok;Kim, Yong-Joo;Ha, Jong-Kyou;Lee, Kyeong-Hwan
    • 농업과학연구
    • /
    • 제42권1호
    • /
    • pp.53-61
    • /
    • 2015
  • Development of highly efficient and energy-saving tractors has been one of the issues in agricultural machinery. For design of such tractors, measurement and analysis of load on major power transmission parts of the tractors are the most important pre-requisite tasks. Objective of this study was to perform pre-processing procedures before effective analysis of load data of agricultural tractors (30, 75, and 82 kW) during major field operations such as plow tillage, rotary tillage, baling, bale wrapping, and to select the suitable pre-processing method for the analysis. A load measurement systems, equipped in the tractors, were consisted of strain-gauge, encoder, hydraulic pressure, and radar speed sensors to measure torque and rotational speed levels of transmission input shaft, PTO shaft, and driving axle shafts, pressure of the hydraulic inlet line, and travel speed, respectively. The entire sensor data were collected at a 200-Hz rate. Plow tillage, rotary tillage, baling, wrapping, and loader operations were selected as major field operations of agricultural tractors. Same or different farm works and driving levels were set differently for each of the load measuring experiment. Before load data analysis, pre-processing procedures such as outlier removal, low-pass filtering, and data division were performed. Data beyond the scope of the measuring range of the sensors and the operating range of the power transmission parts were removed. Considering engine and PTO rotational speeds, frequency components greater than 90, 60, and 60 Hz cut off frequencies were low-pass filtered for plow tillage, rotary tillage, and baler operations, respectively. Measured load data were divided into five parts: driving, working, implement up, implement down, and turning. Results of the study would provide useful information for load characteristics of tractors on major field operations.

디지털 사이니지의 광고효과 측정을 위한 평균 필터 추적 기반 유동인구 수 측정 시스템 (Pedestrian Counting System based on Average Filter Tracking for Measuring Advertisement Effectiveness of Digital Signage)

  • 김기용;윤경로
    • 방송공학회논문지
    • /
    • 제21권4호
    • /
    • pp.493-505
    • /
    • 2016
  • 컴퓨터 비전이나 감시영상 시스템에서 유동인구 수 측정은 안전, 스케줄링, 광고효과 측면에서 중요한 과제 중 하나이다. 유동인구 수 측정은 조명변화, 부분적인 폐색, 중첩, 사람검출과 같은 다양한 어려움을 겪고 있다. 가장 큰 문제점은 혼잡한 상황에서 추적되는 객체에 대한 폐색과 중첩이다. 정확한 유동인구 수 측정을 위해 폐색과 중첩은 반드시 해결해야 할 과제이다. 본 논문에서는 기존의 보행자 추적 방법을 개선한 효율적인 유동인구 수 측정 시스템을 제안한다. 기존의 보행자 추적과 달리, 제안된 방법은 평균 필터 추적방법을 적용하여 성능을 향상시킬 수 있음을 보인다. 또한 객체 추적의 성능향상을 위한 프레임 보상, 아웃라이어 제거를 통해서 추적을 개선한다. 그와 동시에 제안된 시스템은 추적된 객체의 다양한 정보를 저장한다. 데이터 셋 S6와 데이터 셋 S7에 대하여 유동인구 수 측정 정확도를 향상시키고 에러율을 줄인다. 또한 제안된 방법은 실시간으로 평균 80fps의 검출을 제공한다.

Calibration Update for the Measuring Total Nitrogen Content in Rice Plant Tissue Using the Near Infrared Spectroscopy

  • Kwon, Young-Rip;Song, Young-Eun;Choi, Dong-Chil;Ryu, Jeong
    • 한국작물학회지
    • /
    • 제54권1호
    • /
    • pp.29-35
    • /
    • 2009
  • The aim of the present study was to update the calibration that is used for the measurement of the total nitrogen content in the rice plant samples by using the visible and near infrared spectrum. Before the equation merge, correlation coefficient of calibration equation for nitrogen content on each rice parts was 0.945 (Leaf), 0.928 (Stem), and 0.864 (Whole plant), respectively. In the calibration models created by each part in the rice plant under the various regression method, the calibration model for the leaf was recorded with relatively high accuracy. Among of those, the calibration equation developed by Partial least squares (PLS) method was more accurate than the Multiple linear regression (MLR) method. The calibration equation was sensitive based on variety and location variations. However, we have merged and enlarged various of the samples that made not only to measure the nitrogen content more accurately, but also later sampling populations became more diversified. After merging, $R^2$ value becomes more accurate and significantly to 0.950 (L.), 0.974 (S.), 0.940 (W.). Also, after removal of outlier, R2 values increased into 0.998, 0.995, and 0.997. In view of the results so far achieved, Standard error of prediction (SEP) and SEP (C) were reduced in the stem and whole plant. Biases were reduced in the leaf, stem as well as whole plant. Slopes were high in the stem. Standard deviation reduced in the stem but $R^2$ was high in the stem and whole plant. Result was indicated that calibration equation make update, and updating robust calibration equation from merge function and multi-variate calibration.

EV 충전소의 일별 최대전력부하 예측을 위한 LSTM 신경망 모델 (An LSTM Neural Network Model for Forecasting Daily Peak Electric Load of EV Charging Stations)

  • 이해성;이병성;안현
    • 인터넷정보학회논문지
    • /
    • 제21권5호
    • /
    • pp.119-127
    • /
    • 2020
  • 국내 전기차 (EV: Electric Vehicle) 시장이 성장함에 따라, 빠르게 증가하는 EV 충전 수요에 대응하기 위한 충전설비의 확충이 요구되고 있다. 이와 관련하여, 종합적인 설비 계획을 수립하기 위해서는 미래 시점의 충전 수요량을 예측하고 이를 바탕으로 전력설비 부하에 미치는 영향을 체계적으로 분석하는 것이 필요하다. 본 논문에서는 한국전력공사의 EV 충전 데이터를 이용하여 충전소 단위의 일별최대부하를 예측하는 LSTM(Long Short-Term Memory) 신경망 모델을 설계 및 개발한다. 이를 위해, 먼저 데이터 전처리 및 이상치 제거를 통해 정제된 데이터를 얻는다. 다음으로, 충전소 단위의 일별 특징들을 추출하여 훈련 데이터 집합을 구성하여 일별 최대 전력부하 예측 모델을 학습시킨다. 마지막으로 충전소 유형 별 테스트 집합을 이용한 성능 분석을 통해 예측 모델을 검증하고 이의 한계점을 논의한다.

고해상도 위성영상과 기존 수치표고모델을 이용하여 신뢰성이 향상된 수치표고모델의 자동 생성 (Automatic generation of reliable DEM using DTED level 2 data from high resolution satellite images)

  • 이태윤;정재훈;김태정
    • Spatial Information Research
    • /
    • 제16권2호
    • /
    • pp.193-206
    • /
    • 2008
  • 스테레오 영상으로부터 수치표고모델을 생성하기 위해서는 일반적으로 두 영상 간의 정합을 수행한다. 정합은 초기 정합 후보점으로부터 시작되며, 두 영상 간의 접합점(Tie-points)이 이러한 초기 후보점 역할을 하게 된다. 이 초기 정합 후보점의 개수와 영상 내에서의 분포는 정합결과에 영향을 준다. 정합결과를 바탕으로 생성되는 수치표고모델에는 에러가 포함된다. 이러한 에러를 제거하는 가장 보편적인 방법은 주변값으로 보간하는 것이다. 본 논문에서는 신뢰성 있는 수치표고모델을 자동으로 생성하기 위해서 기존 수치표고모델을 이용하여 자동으로 추출한 접합점(Tie-points)과 영상 피라미드 그리고 정합 결과에서 발생한 이상값(Outlier)을 기존 수치표고모델로 보정하는 방법을 제안한다. 본 논문에서는 IKONOS, QuickBird, SPOTS 스테레오 영상과 DTED level 2 데이터를 이용하여 실험을 수행했으며, 실험결과를 통해서 제안된 방법으로 생성한 수치표고모델에서는 에러가 모두 제거되었음을 보여준다. 또한 기존 DTED level 2를 참값으로 하여 산출된 높이값에 대한 RMSE는 15m 미만으로, 비교적 정확한 수치표고모델을 생성하였음을 보여준다.

  • PDF